이번 뉴스레터에서는 OpenAI o3 모델, 벤치마크 점수 논란부터 퍼플렉시티의 신기능까지 다양한 소식을 전해드립니다.
위클리 Ai트렌드:
- OpenAI o3 모델, 벤치마크 점수 논란... "실제보다 과장됐나?"
- Anthropic, AI가 고유한 도덕 규범을 가졌다는 연구결과 발표
- 6GB VRAM으로도 1분짜리 AI영상 제작 가능, "FramePack"
위클리 Ai활용팁:
- 굿바이 시리..? Perplexity의 iOS용 AI 비서 활용법
- 노트북LM 웹 디스커버리 기능으로 효율적인 리서치하기
OpenAI o3 모델, 벤치마크 점수 논란... "실제보다 과장됐나?"

OpenAI의 o3 모델에 대한 벤치마크 결과가 회사가 처음 발표했던 것보다 낮게 나오면서 투명성에 대한 논란이 일고 있습니다. 지난 12월 OpenAI가 o3를 공개했을 때, 프론티어매스라는 어려운 수학 문제 세트에서 25% 이상의 정답률을 보였다고 주장했는데요. 이는 경쟁 모델들이 2% 미만의 정답률을 보인 것에 비해 압도적인 성과였습니다.
그러나 프론티어매스를 만든 연구소 Epoch AI가 직접 o3를 테스트한 결과, 실제 점수는 10% 정도에 그쳤다고 합니다. OpenAI가 완전히 거짓말을 한 것은 아니지만, 공개 발표 시 가장 높은 성능을 달성한 버전의 점수를 언급했을 가능성이 높습니다.
Epoch AI와 아크 프라이즈 파운데이션의 보고에 따르면:
- 공개된 o3는 내부 테스트 버전과 다른 모델일 가능성이 크며,
- 실사용 목적으로 최적화되면서 벤치마크 성능이 낮아졌으며,
- OpenAI의 기술 담당자도 현재 배포된 o3가 "실제 사용 사례와 속도를 위해 최적화했다"고 인정했다고 합니다.
최근 xAI(일론 머스크의 AI 회사)와 메타도 유사한 논란에 휩싸였는데요. 이번 사례는 AI 벤치마크 결과를 그대로 받아들이지 말아야 한다는 교훈을 다시 한번 상기시켜 주는 것 같습니다.
Anthropic, AI가 고유한 도덕 규범을 가졌다는 연구결과 발표

Anthropic이 자사의 AI 비서 Claude와의 30만 건 이상의 익명 대화를 분석하여 AI의 도덕 규범 체계를 연구한 결과를 발표했습니다. 이번 연구는 AI모델이 가지고 있는 도덕적 가치를 종합적으로 분류한 최초의 시도로 주목받고 있는데요.
연구 결과의 주요 내용은 다음과 같습니다:
- AI의 가치를 실용적, 인식론적, 사회적, 보호적, 개인적 5개 주요 카테고리로 분류
- 가장 세분화된 단계에서는 3,307개의 고유한 가치 식별
- Claude는 일반적으로 앤트로픽이 추구하는의 윤리적 가치(도움이 되고, 정직하고, 해롭지 않은)와 일치하면서도 다양한 상황에 적응하는 모습을 보임
흥미롭게도 연구팀은 Claude가 학습 과정에서 의도하지 않았던 가치를 표현하는 사례도 발견했습니다. "지배력"이나 "도덕성 부재" 같은 가치들이 나타난 것이죠. 연구진은 이러한 사례가 사용자들이 특수한 기법을 사용해 Claude의 안전 가드레일을 우회하려 했기 때문이라고 분석하고 있습니다.
Anthropic은 이러한 새로운 평가 방법이 미래의 잠재적인 "탈옥(jailbreak)" 시도를 식별하고 완화하는 데 도움이 될 것이라고 이야기했는데요. 앤트로픽의 이런 노력이 AI의 탈옥을 완전히 막을 수 있을지 귀추가 주목되네요.🤔
6GB VRAM으로도 1분짜리 AI영상 제작 가능, "FramePack"

AI영상 생성기술이 나날이 발전하고 있습니다. 이번에 공개된 새로운 오픈소스 도구 'FramePack'은 정말 최소한의 VRAM 사양만으로도 일반 소비자용 GPU에서도 빠르고 고품질의 비디오 생성이 가능해졌습니다
FramePack의 주요 특징은 다음과 같습니다:
- 더 효율적인 처리를 통해 더 길고(1분 이상) 고품질의 비디오 생성 가능
- 130억 파라미터 모델이 단 6GB의 비디오 메모리로 60초 클립 생성 가능
6GB VRAM이면 일반 게이밍 PC정도면 AI 비디오 생성이 충분히 원활하게 가능하다는 건데요. 테스트해보고 싶다면, 공식 GitHub를 통해 설치하여 직접 로컬에서 비디오를 생성해볼 수 있습니다. AI 영상 콘텐츠 제작에 관심이 있지만 고사양 PC가 없어 망설이셨던 분들에게 좋은 소식이 될 것 같네요.
Framepack 공식 Github
굿바이 시리..? Perplexity의 iOS용 AI 비서 활용법
Perplexity에서 iOS용 "Perplexity Assistant" 기능을 공개했습니다. 이 기능을 활용하면, AI 앱이 아이폰에서 질문에 답변하는 것을 넘어, 실제 행동까지 수행할 수 있는데요. 현재 가능한 기능으로는 음악 재생, 이메일 초안 작성, 식당 검색, 일정 변경, 식당 예약, 알림 설정 등이 포함되어 있습니다.
iOS 사용자라면 Perplexity 앱을 업데이트하면 해당 기능을 바로 사용해볼 수 있는데요, 직접 테스트해본 결과를 공유합니다:
- 식당 검색 : "서울 종로에 있는 설렁탕 맛집 찾아줘"
설렁탕 맛집 찾기 요청 영상
- 즉시 서울 종로를 주변으로 설렁탕 식당을 찾아 추천해주었습니다.
- 지도를 누르면 지도앱에서 식당위치도 확인할 수 있었습니다.
- 여행 계획 : "6월 벨기에 2박 3일 가족 여행계획을 짜줘. 그리고 그 계획을 메일로 보내줘"
여행 계획 요청 > 메일 작성 요청
- 구체적인 식당과 관광명소를 포함해서 계획을 짜달라고 요청해줬더니 상세하게 짜주었습니다.
- 작성한 여행계획을 메일로 보내달라고 요청하니 메일초안까지 바로 작성해주었습니다.
아직 한국어 인식률이 낮은지 수신자 이름을 제대로 인식하지 못하는 모습을 보였습니다. 사람 이름, 유튜버 이름 등 한국어 고유 명사는 잘 인식하지 못하는 것으로 보입니다.
이밖에도 팟캐스트, 예전에 봤던 영상, 좋아하는 노래까지 뭐든 틀어달라고 할 수 있습니다. 예를 들어, "채권과 금리와의 관계에 대해 설명한 영상 찾아줘", "lady gaga가 최근 출연한 예능 영상을 찾아줘" 라고 부탁하는 것도 가능합니다.
특히 영어 검색시 인식률이 뛰어나 영어권에 거주하시거나, 영어 검색을 자주하시는 분께 더욱 추천드립니다.
노트북LM 소스 "소스 검색"으로 효율적인 리서치하기

Google의 NotebookLM이 새로운 '소스 검색' 기능을 출시했습니다. 이 기능을 사용하면 몇 번의 클릭만으로 노트북에 관련 웹 소스를 찾아 추가할 수 있어 전체 리서치 프로세스를 쉽고 빠르게 만들어 줍니다.
사용법:
- NotebookLM에 방문하여 새 노트북을 만든후, 소스 검색 버튼을 누릅니다.

- 팝업창에서 특정 주제를 입력하고 제출을 누릅니다.

- 표시되는 추천 소스를 검토하고 내가 조사하고 싶은 소스만 선택한 후, "가져오기"를 누릅니다.

- 선택한 자료만을 참고하여 AI가 내용을 요약해줍니다. 채팅을 통해 주제에 대해 좀더 자세히 공부하고 리서치할 수 있습니다.

"구글 검색"과 "AI요약"의 장점만을 합친 것 같은 기능으로 내가 신뢰하는 출처만 추려서 리서치할 수 있다는 점이 매력적인 것 같습니다.
챗GPT에 생성 이미지 모아주는 라이브러리 추가- 챗GPT에서 생성된 이미지를 모아볼 수 있는 라이브러리 기능이 추가되었습니다.
오픈AI의 이미지 생성 모델 "gpt-image-1" API 출시 - 오픈AI의 이미지 생성 모델 "gpt-image-1"이 이제 API를 통해 제공됩니다.
(광고) 강의 오픈 "CS담당자를 위한 노코드 AI업무 자동화 with Make"

Make를 통해 고객문의 자동화를 하는 방법'에 대한 강의를 오픈하게 되었습니다. 제 책 <따라하면 바로되는 AI마케팅 자동화>내 CS파트의 내용을 영상화 + 보강한 내용으로 강의를 통해 CS자동화 플로우를 제대로 배우고 싶은 분들께 추천드립니다:)
혜택 :
- 무제한 온라인 수강
- 실무 템플릿 제공
- 수료 특전 : 100% 완강시 다른 강의 하나도 무료 수강
런칭 기념 50% 할인받고 수강하기 👇
https://class.modulabs.co.kr/courses/1372?p_type=b2c
그 밖의 챗대리 강의와 책 소개 :
강의:
- 클릭을 부르는 AI광고 이미지 제작 입문
- SNS 광고배너 100개 한 번에 만들기
- Claude로 끝내는 상세페이지 AI 자동화
- 실전 사례로 배우는 Make 자동화의 모든 것 (대기자 모집중)
책 :
- 따라하면 바로되는 AI 마케팅 자동화
이번 주 Ai트렌드와 활용팁은 여기까지입니다.
다음 주에 다시 만나요!
챗대리 드림
AI를 활용한 다양한 자동화 방법을 공유하는 오픈채팅방을 운영중입니다.
더 많은 활용법과 AI트렌드를 가까이서 접하고 싶다면 참여해주세요👇
기고 및 협업 문의 chatdaeri@gmail.com
Member discussion: