6일(현지시간) 블룸버그에 따르면 오픈AI, 앤스로픽, 구글은 2023년 마이크로소프트와 함께 만든 비영리 협의체 ‘프런티어 모델 포럼’을 통해 관련 정보를 공유하고 있다.
목적은 서비스 약관을 어기고 최첨단 AI 모델의 답변과 추론 성향을 빼내는 ‘적대적 증류(adversarial distillation)’ 시도를 탐지하고 차단하는 데 있다.
적대적 증류는 선도 모델의 내부 구조를 직접 확보하지 못하더라도 입력과 출력을 대량으로 수집해 성능이 비슷한 후발 모델을 학습시키는 방식이다.
선도 모델의 핵심 역량은 흉내 낼 수 있어도 안전장치는 그대로 옮겨지지 않을 수 있다는 점도 문제로 짚었다. 특히 복잡한 문제를 풀 때 드러나는 추론 과정 정보를 빼내 학습 데이터로 쓰는 방식이 가장 시급한 위협 가운데 하나라고 했다.
이번 공조는 미국 AI 업계가 중국발 추격을 단순한 시장 경쟁을 넘어 안보 성격이 짙은 사안으로 다루는 흐름이 강해졌다는 점도 보여준다.
앤스로픽은 지난해 9월 중국처럼 자사 서비스를 지원하지 않는 지역 기업들이 해외 법인 등을 통해 우회 접근하는 사례를 문제 삼으며 제한 조치를 강화했다. 당시 회사는 이런 접근이 중국 측 AI 개발 고도화와 증류 같은 기술 활용으로 이어질 수 있다고 밝혔다.
앤스로픽은 올해 2월에도 중국에서 클로드 상용 접근을 허용하지 않고 있으며, 일부 연구소들이 프록시(중간 경유 서버) 서비스와 대규모 가짜 계정망을 활용해 접근을 시도하고 있다고 공개했다.
한 프록시 네트워크가 동시에 2만개가 넘는 사기성 계정을 운영한 사례도 확인됐다고 밝혔다. 정상 이용처럼 보이지만 실제로는 특정 능력을 뽑아내기 위한 정교한 프롬프트를 반복 입력하는 패턴이 포착됐다는 설명이다.
©'5개국어 글로벌 경제신문' 아주경제. 무단전재·재배포 금지



![[르포] 중력 6배에 짓눌려 기절 직전…전투기 조종사 비행환경 적응훈련(영상)](https://image.ajunews.com/content/image/2024/02/29/20240229181518601151_258_161.jpg)



