
오픈AI가 야심차게 선보인 생성형 AI 모델 GPT-5가 시장의 높은 기대를 충족하지 못하며 논란의 중심에 섰다. 샘 올트먼 CEO가 공언했던 '무제한 무료 액세스'가 실제로는 용량 제한으로 구현됐으며, 여전히 높은 환각률은 올트먼이 장담한 '박사급 지식' 수준과는 거리가 있다는 비판이 이어지고 있다.
10일 IT업계에 따르면 올트먼 CEO는 지난 2월 자신의 X 계정을 통해 GPT-5가 "무제한 채팅 액세스를 무료로 제공할 것"이라고 밝힌 바 있다.
그러나 실제 출시된 GPT-5는 이러한 약속과는 달리 무료 사용자에게 용량 제한을 두었다. 오픈AI는 무료 티어에 '비공개 캡'을 적용해 프롬프트 수와 응답 길이를 제한했으며, 이는 올트먼의 '무제한 액세스' 공약과는 거리가 있다.
하지만 실제 성능은 경험한 이용자들 사이에서는 ‘과장됐다’는 평가가 나오고 있다.
김근교 NC AI 글로벌사업실장은 “(GPT-5)가 성능 벤치마크에서는 SWE-bench 등에서 개선됐다고 하는데, 차트 표현이 좀 과장된 느낌이었다”며 “코딩 데모를 많이 밀었지만 현업에서 실제로 어떨지는 더 지켜봐야겠다. 지금 코딩 어시스턴트 시장은 솔직히 클로드가 더 잘하는 것 같다”고 평가했다.
김 실장은 또 “여전히 VLM에서 이미지 인지 능력에 조금 아쉬움 있다”며 “만화 캐릭터 중 국내 만화 같은 걸 물어봐도 제대로 답변이 안나오고, 강점이라 얘기했던 모르는걸 모른다고 말하는 기능도 실제로 볼 수 없다”고 덧붙였다.
환각현상(할루시네이션) 역시 여전히 문제점으로 남았다. 오픈AI에 따르면 GPT-5는 전작 GPT-4o 대비 환각률이 26% 감소했지만, 여전히 10개 중 하나의 질문에는 환각 현상을 보이는 상황이다.
사실 확인 벤치마크(FActScore)에서 GPT-5는 2.8%의 환각률을 기록했으나, 복잡한 주제나 장기 맥락 대화에서는 오류율이 10%대에 달했다 특히, 과학적 질문이나 역사적 사실 관련 쿼리에서 부정확한 답변이 빈번히 관찰됐다.
출시 초기에는 GPT-5는 자신의 출시 사실조차 제대로 인지하지 못하는 오류를 노출했다. 예를 들어, 사용자 질문에 "나는 GPT-5가 아니다"라고 답하거나, 최신 정보를 반영하지 못하는 사례가 다수 보고됐다.
제미나이 3.0, 클로드 4.5, 딥시크 R2 등 올해 하반기 오픈AI의 경쟁상들이 신규 생성형 AI 모델을 출시할 것으로 전망되는 가운데, GPT-5에 대한 기대 이하의 시장 반응이 오픈AI의 경쟁력 저하로 이어질 수 있다는 우려도 제기된다.
©'5개국어 글로벌 경제신문' 아주경제. 무단전재·재배포 금지