오픈AI, '보이스 엔진' 공개…"사람 음성 15초 만에 똑같이 모방"

기자정보, 기사등록일
구동현 기자
입력 2024-03-30 14:07
    도구모음
  • AI 기사요약
  • * AI기술로 자동 요약된 내용입니다. 전체 맥락과 내용을 이해하기 위해서는 기사 본문 전체를 보시길 권장합니다

    오픈AI가 29일(현지시간) 사람 음성을 학습해 모방 음성을 생성하는 인공지능(AI) 도구를 개발해 공개했다.

    오픈AI는 보이스 엔진을 챗GPT의 음성인식·읽어주기 기능과 텍스트-음성 변환 API(응용프로그램 인터페이스)에서 쓰이는 음성 기능 강화에 사용했다고 설명했다.

    이날 오픈AI가 공개한 실제 사람의 음성 샘플과 이를 이용해 보이스 엔진으로 생성한 음성은 거의 구별이 어려울 정도로 비슷했다.

  • 글자크기 설정
  • '보이스엔진' 출시는 미정…"오용 가능성 있다"

오픈AI가 29일현지시간 사람 음성을 학습해 모방 음성을 생성하는 인공지능AI 도구를 공개했다 사진로이터·연합뉴스
오픈AI가 29일(현지시간) 사람 음성을 학습해 모방 음성을 생성하는 인공지능(AI) 도구를 공개했다. [사진=로이터·연합뉴스]
오픈AI가 29일(현지시간) 사람 음성을 학습해 모방 음성을 생성하는 인공지능(AI) 도구를 개발해 공개했다. 매섭게 진화하는 AI 기술을 통한 혁신 기대감과 동시에 인조 음성 생성물의 부작용에 대한 우려도 나온다.

오픈AI는 이날 자사 블로그에 '보이스 엔진'(Voice Engine) 사전 실험 결과를 발표했다. 회사 측은 15초 분량의 음성 샘플만 있으면 보이스 엔진을 이용해 화자의 목소리와 유사한 음성을 만들어 낼 수 있다고 밝혔다. 오픈AI는 2022년 말 보이스 엔진을 처음 개발했다.

오픈AI는 보이스 엔진을 챗GPT의 음성인식·읽어주기 기능과 텍스트-음성 변환 API(응용프로그램 인터페이스)에서 쓰이는 음성 기능 강화에 사용했다고 설명했다. 이날 오픈AI가 공개한 실제 사람의 음성 샘플과 이를 이용해 보이스 엔진으로 생성한 음성은 거의 구별이 어려울 정도로 비슷했다.

보이스엔진을 다양한 분야에서 긍정적인 기능으로 활용할 수 있다는 게 오픈AI 측 설명이다. 어린이 교육을 위한 음성 해설 콘텐츠나 실시간 개인 맞춤형 응답 생성 기능, 동영상·팟캐스트 등의 콘텐츠를 여러 언어로 번역해 전 세계적으로 서비스하는 사례가 순기능으로 거론된다.

다만 범죄 행위 등에 사용될 가능성이 있어 실제 출시로는 이어지지 않을 전망이다. 오픈AI는 "인조 음성 기능의 오용 가능성 때문에 더 광범위한 출시에 대해서는 조심스럽게 접근하고 있다"며 "현재로서는 이 기술을 미리 보여주기(preview)만 하되 널리 출시하지는 않기로 했다"고 밝혔다.

아울러 "궁극적으로 우리가 이 기술을 널리 배포하든 그렇지 않든, 전 세계 사람들이 이 기술이 어디로 향하고 있는지 이해하는 것은 중요하다"며 "우리는 정책 입안자·연구자·개발자 등과 함께 인조 음성의 도전과 기회에 대한 대화를 계속 이어갈 것을 기대한다"고 부연했다.

블룸버그통신은 "오픈AI가 사람의 목소리를 흉내 낼 수 있는 기능을 공개하며 AI 기술의 새로운 지평을 열었다"며 "이는 딥페이크(AI로 만든 영상이나 이미지·음성 조작물) 위험에 대한 불안감도 일으키고 있다"고 전했다.

©'5개국어 글로벌 경제신문' 아주경제. 무단전재·재배포 금지

컴패션_PC
0개의 댓글
0 / 300

로그인 후 댓글작성이 가능합니다.
로그인 하시겠습니까?

닫기

댓글을 삭제 하시겠습니까?

닫기

이미 참여하셨습니다.

닫기

이미 신고 접수한 게시물입니다.

닫기
신고사유
0 / 100
닫기

신고접수가 완료되었습니다. 담당자가 확인후 신속히 처리하도록 하겠습니다.

닫기

차단해제 하시겠습니까?

닫기

사용자 차단 시 현재 사용자의 게시물을 보실 수 없습니다.

닫기
실시간 인기
기사 이미지 확대 보기
닫기