허드슨에이아이, NAB서 'AI 더빙 자동화' 공개…QC 1시간 목표

사진허드슨에이아이
[사진=허드슨에이아이]
미디어 콘텐츠 특화 음성 인공지능 기업 허드슨에이아이가 미국 라스베이거스에서 열린 NAB Show 2026에 참가해 미디어 제작·더빙용 음성 AI 솔루션 ‘허드슨 스튜디오’를 공개했다.

NAB 쇼는 방송·스트리밍·영상 제작 산업 전반의 최신 기술이 공개되는 글로벌 전시회로, 매년 100여 개국 이상에서 수만 명 규모의 업계 관계자가 찾는 행사다. 최근에는 OTT 확산과 함께 AI 기반 콘텐츠 제작 기술이 주요 화두로 떠오르면서 음성 합성, 자동 더빙, 영상 생성 분야 기업들의 참가 비중이 빠르게 늘고 있다.

허드슨에이아이는 이번 전시에서 ‘에이전틱 로컬라이제이션(Agentic Localization)’ 기능을 전면에 내세웠다. 해당 기능은 콘텐츠 현지화 과정에서 기획부터 실행, 품질 검수까지 전 과정을 AI 에이전트가 자율적으로 수행하는 구조다. 단순 번역이나 더빙 생성에 그치지 않고, 결과물을 스스로 평가하고 수정하는 반복 루프를 통해 품질을 끌어올리는 방식이다.

특히 업계에서 가장 큰 비용과 시간이 투입되는 단계로 꼽히는 QC(품질 검수)를 자동화한 점이 핵심이다. 일반적으로 1시간 분량의 드라마나 예능 콘텐츠를 현지화할 경우, 번역·더빙 이후 검수 단계에만 수일이 소요되는 사례가 많다. 허드슨에이아이는 이 과정을 에이전트가 선행 처리하도록 설계해, 사람의 개입을 최종 확인 단계로 축소하는 것을 목표로 하고 있다.

회사 측은 프로젝트별로 축적된 용어, 스타일 가이드, 톤앤매너를 메모리 형태로 활용해 결과물의 일관성을 유지할 수 있다고 설명했다. 여기에 감정 이해 기반의 평가 기능을 적용해 단순 음성 일치 여부를 넘어 연기 톤, 감정 표현, 비언어적 요소까지 분석하고 기준 미달 구간을 자동으로 재작업하는 구조를 갖췄다.

허드슨 스튜디오는 음성 분리, 화자 분리, 음성 인식(STT), 음성 합성(TTS), 음성 변환(VC) 등 기능을 모듈 형태로 제공한다. 이를 통해 영상에서 배경음과 대사를 분리해 자막을 생성하거나, 특정 화자의 음색과 감정을 반영한 더빙 음성을 생성하는 작업이 가능하다. 현재 80개 이상의 언어를 지원해 글로벌 콘텐츠 유통 환경에 대응하고 있다.

최근 글로벌 OTT 플랫폼들이 다국어 더빙 콘텐츠를 확대하면서, 자동 더빙 및 현지화 시장은 빠르게 성장하는 추세다. 업계에서는 콘텐츠 현지화 비용이 전체 제작비의 20~30% 수준까지 차지하는 경우도 있는 것으로 보고 있으며, 특히 대규모 라이브러리를 보유한 플랫폼일수록 자동화 수요가 높아지고 있다.

허드슨에이아이는 이번 NAB 참가를 계기로 북미·남미 지역 미디어 및 플랫폼 기업들과 협업 논의를 확대할 계획이다. 이어 이달 일본 도쿄에서 열리는 SusHi Tech Tokyo 2026에도 참가해 아시아 시장 공략에도 나선다.

신현진 대표는 “AI 더빙을 도입하더라도 실제 운영 단계에서는 품질 검수에서 병목이 발생하는 경우가 많다”며 “에이전틱 로컬라이제이션은 기획부터 실행, 검수까지 전 과정을 자동화해 품질과 비용, 일정 문제를 동시에 개선하는 데 초점을 맞췄다”고 밝혔다.

©'5개국어 글로벌 경제신문' 아주경제. 무단전재·재배포 금지

컴패션_PC
댓글0
0 / 300

댓글을 삭제 하시겠습니까?

닫기

로그인 후 댓글작성이 가능합니다.
로그인 하시겠습니까?

닫기

이미 참여하셨습니다.

닫기