구글 번역, 말 끝나기 전에 옮긴다…70개 언어 실시간 번역

  • AI가 대화 중 언어 자동 감지해 음성 번역

  • 억양·말투 반영…지연 시간 몇 초 수준

  • 번역 앱부터 적용…구글 미트는 기업 고객 시험 제공

출처구글 연합뉴스
[출처=구글 연합뉴스]
구글이 70개 이상 언어를 실시간으로 통역하는 인공지능(AI) 번역 모델을 공개했다. 상대방의 말을 끝까지 들은 뒤 번역하는 기존 방식보다 지연 시간을 줄이고, 말하는 사람의 억양과 말투까지 살리는 데 초점을 맞췄다.
 
구글은 9일(현지시간) 새 실시간 음성 번역 모델 ‘제미나이 3.5 라이브 트랜슬레이트’를 공개했다. 이 모델은 구글 번역 앱과 화상회의 서비스 구글 미트, 개발자용 제미나이 라이브 API(실시간 음성 기능 연동 도구) 등에 차례로 적용된다.
 
새 모델은 이용자가 번역할 언어를 미리 고르지 않아도 대화 속 언어를 자동으로 알아듣는다. 70개 이상 언어를 음성으로 인식해 다른 언어의 음성으로 바꿔준다. 여러 언어가 섞인 대화에서도 사용할 수 있다.
 
가장 큰 변화는 통역 속도다. 기존 음성 통역은 상대방의 말이 끝난 뒤 번역 음성을 내보내는 경우가 많았다. 새 모델은 상대방이 말하는 동안에도 번역 음성을 이어서 들려준다. 구글은 원래 말과 번역 음성 사이의 차이가 몇 초 수준에 그친다고 설명했다.
 
음성 품질도 개선했다. 단순히 문장의 뜻만 옮기는 것이 아니라, 원래 화자의 억양과 말투, 말의 빠르기, 음높이를 최대한 반영한다. 기계적으로 읽어주는 번역 음성이 아니라 실제 대화에 가까운 음성을 구현하려는 것이다.
 
새 모델은 안드로이드와 iOS용 구글 번역 앱에 모두 적용된다. 이용자는 이어폰을 연결해 실시간 음성 번역을 들을 수 있다. 안드로이드에서는 스마트폰을 귀에 대면 통화하듯 번역 음성을 들을 수 있는 ‘듣기 모드’도 제공된다.
 
이 기능을 이용하면 여행 중에도 현지인과 서로 다른 언어로 대화할 때 스마트폰을 통해 실시간에 가까운 음성 통역을 받을 수 있다.
 
구글 미트에는 일부 기업 고객부터 먼저 적용된다. 구글은 이달 기업용 구글 워크스페이스 고객을 대상으로 새 음성 번역 기능을 시험 제공하고, 연내 적용 대상을 넓힐 계획이다. 다국어 회의에서 발언을 실시간으로 번역해 전달하는 용도다.
 
개발자용은 제미나이 라이브 API와 구글 AI 스튜디오를 통해 시험 공개된다. 개발자들은 이 기능을 활용해 실시간 음성 번역 서비스를 만들 수 있다. 아고라와 라이브킷 등 실시간 미디어 플랫폼도 관련 기능 연동을 지원한다.
 
차량 호출 서비스 그랩은 이 모델을 운전자와 여행객 간 다국어 통화에 활용하는 방안을 테스트하고 있다. 서로 다른 언어를 쓰는 운전자와 승객이 앱 안에서 통화할 때 실시간 번역을 제공하는 방식이다.
 
구글은 AI가 만든 음성임을 식별할 수 있도록 모든 생성 음성에 신스ID 워터마크를 적용한다고 밝혔다. 신스ID 워터마크는 AI로 만들어진 음성에 보이지 않는 식별 표시를 넣는 기술이다.

©'5개국어 글로벌 경제신문' 아주경제. 무단전재·재배포 금지

컴패션_PC
댓글0
0 / 300

댓글을 삭제 하시겠습니까?

닫기

로그인 후 댓글작성이 가능합니다.
로그인 하시겠습니까?

닫기

이미 참여하셨습니다.

닫기