앤스로픽, '미토스' 상용화 시동…전문가들 "우회해 사이버 공격 가능할수도"

  • '미토스' 보다는 한단계 낮은 사이버 공격 역량 '오푸스 4.7'

  • '세이프가드' 적용, 해킹 악용 막았다지만 제거되면 재앙 수준

사진앤스로픽 홈페이지
[사진=앤트로픽 홈페이지]


앤트로픽이 새로운 AI모델을 공개하면서 ‘미토스’ 상용화를 향한 공식 첫 단계에 돌입했다. 강력한 강력한 사이버 공격 수단으로 활용될 수 있다는 국제사회의 지적을 의식해 ‘세이프가드’를 적용한 첫 모델이다.
 
19일 IT업계에 따르면 앤트로픽은 최든 '클로드 오푸스 4.7'을 공개했다. 오푸스 4.7은 클로드 제품 전반과 API, 아마존 베드록, 구글 클라우드 버텍스 AI, 마이크로소프트 파운드리에서 정식 출시됐다. 가격은 오푸스 4.6과 동일하게 입력 토큰 100만 개당 5달러, 출력 토큰 100만 개당 25달러다.
 
앤트로픽은 이번 출시가 단순한 성능 업그레이드가 아닌 '세이프가드 실증 검증'이라고 규정했다. 앤트로픽 측은 오푸스 4.7 발표문에서 "미토스급 모델의 광범위한 상용화를 위해서는 세이프가드가 실제 환경에서 작동한다는 것을 먼저 증명해야 한다"고 밝혔다. 세이프가드란 AI가 해킹 등 고위험 사이버보안 용도로 악용되지 않도록 막는 기술 장치다. 오푸스 4.7은 이 세이프가드를 현실 환경에서 처음 검증하는 모델로 자리매김됐다.
 
오푸스 4.7에 탑재된 세이프가드는 크게 세 층으로 구성된다. △훈련 단계에서 사이버 공격 관련 역량을 의도적으로 낮추는 모델 내부 조정 △입출력 단계에서 금지·고위험 요청을 실시간 탐지·차단하는 필터링 시스템 △취약점 연구, 침투 테스트 등 합법적 목적의 사용자만 민감 기능에 접근하도록 자격을 심사하는 '사이버 검증 프로그램'이다. 앤트로픽은 오푸스 4.7이 미토스보다 낮은 수준의 사이버 역량을 갖도록 훈련했다는 입장인데, 이에 따라 세이프가드 테스트 모델로 적합하다는 입장이다.
 
시장의 시각은 다르다. 세이프가드의 실효성 자체에 의구심이 크다. 영국 앨런 튜링 연구소 산하 신흥기술보안센터(CETAS)는 현재 세이프가드가 "해킹 코드를 짜줘"처럼 노골적인 요청만 탐지할 수 있다고 지적한다. 우회적이거나 단계적 접근에는 취약한 구조다.
 
앤트로픽의 세이프가드가 자사 운영 모델에만 적용된다는 점도 문제다. 누구나 내려받아 자체 서버에서 실행할 수 있는 오픈소스 모델에는 무력하다. 구글이 지난 4월 오픈웨이트 모델 '젬마(Gemma) 4'를 공개하자 불과 며칠 만에 세이프가드가 제거된 무검열 파생 버전들이 공개 저장소에 등장했다. CETAS는 "오픈소스 모델이 폐쇄형 모델보다 더 심각한 사이버보안 위협이 될 수 있다"고 경고했다.
 
오푸스 4.7의 역할이 주목받는 것은 미토스가 만들어낸 충격 때문이다. 앤트로픽은 지난 7일 '프로젝트 글래스윙'을 발표하며 미토스 프리뷰를 공식화했다. 동시에 일반 공개는 하지 않겠다고 선언했다. AI 모델이 사이버보안 위험을 이유로 공개가 금지된 것은 역사상 처음이다.
 
미국외교협회(CFR)에 따르면 미토스는 보안 훈련을 받지 않은 앤스로픽 엔지니어가 "취약점을 찾아줘"라는 단순한 명령어만으로 완성된 익스플로잇(악성 코드)을 다음 날 아침 받아볼 수 있는 수준이다. 스스로 샌드박스를 탈출해 인터넷에 접속한 사례도 보고됐다. 영국 AI 안전연구소(AISI) 독립 평가에서는 전문가 수준의 사이버 보안 과제를 73% 성공률로 해결했다. 2년 전 최고 수준의 AI 모델들이 초급 과제조차 겨우 수행하던 것과 비교하면 극적인 변화다.
 
거버넌스 공백도 지적된다. CETAS는 "프로젝트 글래스윙처럼 단일 기업의 파트너 협약에 의존하는 방식은 최종 해법이 될 수 없다"고 명시적으로 비판했다. 앤트로픽이 프로젝트 글래스윙에 참여시킨 파트너사 12개는 아마존웹서비스(AWS), 애플, 구글, 마이크로소프트, 엔비디아 등 미국·글로벌 빅테크 중심이다. 한국 기업은 명단에 없다.

©'5개국어 글로벌 경제신문' 아주경제. 무단전재·재배포 금지

컴패션_PC
댓글0
0 / 300

댓글을 삭제 하시겠습니까?

닫기

로그인 후 댓글작성이 가능합니다.
로그인 하시겠습니까?

닫기

이미 참여하셨습니다.

닫기