오픈AI가 인공지능(AI) 기술의 새로운 이정표를 제시했다. 챗GPT의 개발사인 오픈AI는 4월 16일(현지시간), 복잡한 문제를 다단계로 추론하고 이미지까지 분석할 수 있는 신형 AI 모델 'o3'를 발표했다. ‘생각하는 AI’로 불릴 만큼 고도화된 추론 능력을 갖춘 이번 모델은 텍스트 중심에서 벗어나 시각 정보까지 이해하고 통합할 수 있는 능력을 갖춘 것이 특징이다.
‘o3’는 지난해 9월 공개된 오픈AI의 첫 추론형 모델 ‘o1’의 후속작으로, 수학, 코딩, 과학 등 고차원적인 문제 해결능력을 기반으로 설계되었으며, 시각적 정보 이해 영역까지 능력을 확장했다. 오픈AI는 "단순히 이미지를 보는 것이 아니라, 시각 정보를 추론 과정에 직접 통합할 수 있다"고 강조했다.
사용자는 화이트보드, 도표, 그림 등 다양한 형식의 이미지를 모델에 업로드할 수 있으며, ‘o3’는 흐릿하거나 저화질인 이미지도 해석하고 확대·회전하며 분석을 진행할 수 있다. 이외에도 웹브라우저 내 파이썬 코드 실행, 실시간 웹 검색 기능까지 포함해 다목적 작업 수행이 가능하다.
함께 발표된 ‘o4 미니’는 성능, 속도, 비용 사이에서 균형을 추구한 소형 모델이다. 사용자 선택에 따라 응답의 신뢰도를 높인 ‘o4 미니 하이(high)’ 버전도 제공된다.
현재 ‘o3’와 ‘o4 미니’는 챗GPT의 유료 서비스인 플러스, 프로, 팀 가입자들에게 제공되며, 향후 몇 주 내에 더 높은 성능의 ‘o3-프로’가 프로 가입자 전용으로 출시될 예정이다. 이 모델은 더 많은 컴퓨팅 자원을 활용해 정교한 응답 생성을 목표로 한다.
샘 올트먼 오픈AI CEO는 “o3와 o4 미니는 GPT-5 출시 전까지 마지막 독립형 AI 추론 모델이 될 수 있다”고 언급하며, GPT-4.1과 추론 모델을 통합한 차세대 AI ‘GPT-5’의 등장을 예고했다.
이번 발표는 AI 기술의 진화가 이제 텍스트 이해를 넘어 시각 정보 처리 영역으로 확장되고 있음을 보여주는 사례다. AI가 단순한 ‘도우미’에서 실제 ‘생각하는 파트너’로 거듭나는 전환점이 될 것으로 전망된다.