IPO 앞둔 앤트로픽, 최상위 AI 출시…위험 질의는 하위 모델이 처리

사진로이터·연합뉴스
[사진=로이터·연합뉴스]
기업공개(IPO)를 준비 중인 앤트로픽이 최상위급 인공지능(AI) 모델을 일반 이용자에게 공개했다. 일반용 모델에는 고위험 질의 차단 장치를 적용하고, 별도 보안 검증용 모델은 승인된 기관에만 제공한다.
 
앤트로픽은 9일(현지시간) 새 AI 모델 ‘클로드 페이블5’와 ‘클로드 미토스5’를 출시했다. 페이블5는 일반 이용자용 모델이다. 미토스5는 보안 협력 프로그램인 프로젝트 글래스윙 등을 통해 검증된 기관에 제한적으로 제공된다.
 
두 모델은 같은 기반 모델을 쓴다. 차이는 안전장치 적용 여부다. 페이블5는 사이버 보안, 생물학·화학 등 악용 가능성이 있는 질의가 들어오면 직접 답변하지 않고 이전 최상위 모델인 클로드 오퍼스4.8이 대신 처리한다. 이용자에게는 해당 사실이 고지된다.
 
제한 대상에는 경쟁 AI 모델의 기능을 추출하는 무단 ‘증류’ 의심 질의도 포함된다. 앤트로픽은 이 안전장치가 평균적으로 전체 세션의 5% 미만에서 작동한다고 밝혔다. 무해한 요청이 일부 차단될 수 있지만 안전한 출시를 위해 보수적으로 설정했다는 설명이다.
 
앤트로픽은 페이블5와 미토스5를 기존 오퍼스 등급보다 높은 ‘미토스급’ 모델로 분류했다. 미토스5는 사이버 보안 평가인 익스플로잇벤치에서 78%를 기록했다. 오픈AI GPT-5.5는 34%, 앤트로픽 오퍼스4.8은 40%, 앞서 공개된 미토스 시험판 모델은 69%였다.
 
박사급 지식 평가인 ‘인류의 마지막 시험’에서는 웹 검색이나 계산기 같은 외부 도구 없이 59%를 기록했다. 미토스 시험판의 56.8%보다 높았다. 터미널 환경 코딩 평가인 터미널-벤치 2.1에서는 88%로 GPT-5.5의 83.4%를 앞섰다.
 
일반 코딩 능력을 측정하는 SWE-벤치 프로에서는 80.3%를 기록했다. GPT-5.5는 58.6%, 구글 제미나이3.1 프로는 54.2%였다. 지식업무 평가인 GDPval-AA에서도 1932점으로 GPT-5.5와 제미나이3.1 프로보다 높은 점수를 냈다.
 
앤트로픽은 페이블5와 미토스5에서 발생하는 사용 데이터를 30일간 보존한다. 해당 데이터는 새로운 공격 탐지와 오탐 식별에 사용된다.
 
페이블5는 이날부터 사용할 수 있다. 오는 22일까지는 기존 유료 구독자에게 추가 비용 없이 제공된다. 23일부터는 별도 사용 크레딧이 필요하다. 앤트로픽은 서버 용량이 충분히 확보되면 페이블5를 다시 일반 구독 요금제에 포함시킬 계획이라고 밝혔다.

©'5개국어 글로벌 경제신문' 아주경제. 무단전재·재배포 금지

컴패션_PC
댓글0
0 / 300

댓글을 삭제 하시겠습니까?

닫기

로그인 후 댓글작성이 가능합니다.
로그인 하시겠습니까?

닫기

이미 참여하셨습니다.

닫기