오픈AI, 고급 추론 AI 모델 '슬롯 사이트' 공개…"내년 초 출시" [Geeks' Briefing]
입력
수정
한국경제신문의 프리미엄 스타트업 미디어 플랫폼 긱스(Geeks)가 21일 스타트업 뉴스를 브리핑합니다.챗GPT 개발사 오픈AI가 향상된 추론 인공지능(AI) 모델 '슬롯 사이트'를 20일(현지시간) 공개했다.'슬롯 사이트'는 지난 9월 오픈AI가 출시한 추론 모델 o1의 업그레이드 버전으로, 오픈AI는 소형 모델인 '슬롯 사이트 미니'도 함께 선보였다. 모델명은 'o2'는 건너뛰고 '슬롯 사이트'으로 정했다. 오픈AI는 "영국 통신 브랜드 'O2'에 대한 존중의 차원에서 붙이지 않기로 결정했다"고 설명했다.
샘 올트먼 최고경영자(CEO)는 "내년 1월 말 '슬롯 사이트 미니'를 먼저 출시하고 곧이어 '슬롯 사이트'를 내놓을 예정"이라고 말했다. 일부 연구원들에게는 이날부터 미리보기 형태로 제공된다.
추론 능력에 초점을 둔 '슬롯 사이트'는 'o1'과 마찬가지로 응답하기 전에 먼저 생각하도록 훈련됐다. 작업을 추론하고 계획할 수 있으며, 오랜 기간에 걸친 작업을 해나가는 데 있어 해결책을 찾는 데 도움이 된다고 오픈AI는 설명했다.'o1'과 마찬가지로 '슬롯 사이트'도 응답하는 데 몇 초∼몇 분 더 걸리지만, 물리학·과학·수학과 같은 분야에서 더 신뢰할 수 있다고 오픈AI는 강조했다.
또 특정 조건에서는 '슬롯 사이트'가 범용인공지능(AGI)에 가까워졌다고 덧붙였다. '슬롯 사이트'는 프롬프트를 받으면 응답 전 잠시 멈추고 관련 프롬프트를 고려해 자신의 추론을 설명한다. 이후 가장 정확하다고 생각되는 응답을 요약한다.
'슬롯 사이트'에서는 '추론 시간 조정'이 새롭게 도입됐다. 이용자는 연산 시간, 즉 '슬롯 사이트'의 사고 시간을 '낮음, 중간, 높음'으로 설정할 수 있는데, 연산 시간이 길수록 성능은 더 좋아진다.오픈AI는 '슬롯 사이트'가 벤치마크에서 다른 모델을 압도한다고 설명했다. 프로그래밍 작업에 초점을 맞춘 벤치마크에서는 'o1'보다 22.8%포인트 높은 성능을 보였다. 코딩 실력 측정 지표에서는 2727점을 기록해 엔지니어 상위 99.2%에 해당하는 2400점을 뛰어넘었다.
올해 미국 초청 수학 시험(AIME)에서는 단 한 문제만 틀려 96.7%의 점수를 기록했다. 대학원 수준의 생물학, 물리학, 화학 문제 테스트(GPQA Diamond)에서는 87.7%의 성과를 거뒀다고 슬롯 사이트 설명했다.
구글과 메타의 슬롯 사이트 모델과의 경쟁도 가속화할 전망이다. 구글은 이달 초 '제미나이 2.0'을 발표했다. "생각하고, 기억하고, 계획하고, 심지어 대신 조치를 취할 수 있다"고 구글은 설명했다. 메타도 내년 '라마 4'를 출시할 예정이다.
고은이 기자 koko@hankyung.com
샘 올트먼 최고경영자(CEO)는 "내년 1월 말 '슬롯 사이트 미니'를 먼저 출시하고 곧이어 '슬롯 사이트'를 내놓을 예정"이라고 말했다. 일부 연구원들에게는 이날부터 미리보기 형태로 제공된다.
추론 능력에 초점을 둔 '슬롯 사이트'는 'o1'과 마찬가지로 응답하기 전에 먼저 생각하도록 훈련됐다. 작업을 추론하고 계획할 수 있으며, 오랜 기간에 걸친 작업을 해나가는 데 있어 해결책을 찾는 데 도움이 된다고 오픈AI는 설명했다.'o1'과 마찬가지로 '슬롯 사이트'도 응답하는 데 몇 초∼몇 분 더 걸리지만, 물리학·과학·수학과 같은 분야에서 더 신뢰할 수 있다고 오픈AI는 강조했다.
또 특정 조건에서는 '슬롯 사이트'가 범용인공지능(AGI)에 가까워졌다고 덧붙였다. '슬롯 사이트'는 프롬프트를 받으면 응답 전 잠시 멈추고 관련 프롬프트를 고려해 자신의 추론을 설명한다. 이후 가장 정확하다고 생각되는 응답을 요약한다.
'슬롯 사이트'에서는 '추론 시간 조정'이 새롭게 도입됐다. 이용자는 연산 시간, 즉 '슬롯 사이트'의 사고 시간을 '낮음, 중간, 높음'으로 설정할 수 있는데, 연산 시간이 길수록 성능은 더 좋아진다.오픈AI는 '슬롯 사이트'가 벤치마크에서 다른 모델을 압도한다고 설명했다. 프로그래밍 작업에 초점을 맞춘 벤치마크에서는 'o1'보다 22.8%포인트 높은 성능을 보였다. 코딩 실력 측정 지표에서는 2727점을 기록해 엔지니어 상위 99.2%에 해당하는 2400점을 뛰어넘었다.
올해 미국 초청 수학 시험(AIME)에서는 단 한 문제만 틀려 96.7%의 점수를 기록했다. 대학원 수준의 생물학, 물리학, 화학 문제 테스트(GPQA Diamond)에서는 87.7%의 성과를 거뒀다고 슬롯 사이트 설명했다.
구글과 메타의 슬롯 사이트 모델과의 경쟁도 가속화할 전망이다. 구글은 이달 초 '제미나이 2.0'을 발표했다. "생각하고, 기억하고, 계획하고, 심지어 대신 조치를 취할 수 있다"고 구글은 설명했다. 메타도 내년 '라마 4'를 출시할 예정이다.
고은이 기자 koko@hankyung.com