네이버의 기업용 클라우드 기반 인공지능(AI) 번역서비스 '파파고 번역(Papago Translation)'이 문서·웹페이지 번역까지 처리한다. 향후 사진 속 문자를 인식하고 불완전한 문장 구조를 보완해 주는 고성능 이미지 번역 기술도 나올 예정이다.
네이버클라우드는 '네이버클라우드플랫폼'의 AI 서비스를 확장해, 텍스트 추출 없이 문서와 웹페이지 형식을 그대로 번역할 수 있는 '문서 번역 API(Papago Doc Translation API)'와 '웹 번역 API(Papago Website Translation API)'를 출시했다고 2일 밝혔다.
네이버클라우드의 파파고 번역에 추가된 신기술은 다른 글로벌 클라우드서비스의 AI 기반 번역 서비스로는 다룰 수 없는 한글과컴퓨터의 '아래아한글' 워드프로그램으로 작성된 문서 파일까지 다룰 수 있어 눈길을 끈다.
파파고 문서 번역 API는 마이크로소프트 오피스 문서(docx, pptx, xlsx)와 아래아한글 문서(hwp) 번역을 지원하고, 100MB 크기의 파일까지 처리할 수 있다. 문서의 서체 서식(크기·색상·정렬방식 등)과 표 형태를 유지한 채 번역 결과를 출력해 준다.
웹 번역 API는 웹 문서(html)의 소스코드 안에서 태그와 문장을 분리해 발췌된 문장 내용만 번역하고, 완성된 번역 결과를 다시 태그에 조합해 완성된 형태의 웹 문서로 보여 준다. 정적인(static) 웹페이지가 아니라 서버에서 브라우저의 요청에 따라 동적으로 생성되는 내용도 처리할 수 있을 것으로 보인다.
기존 번역서비스는 사용자가 문서와 웹페이지에서 텍스트를 직접 추려 번역하고 결과물을 다시 문서와 웹에 적용해야 했다. 새로 출시된 기능을 활용하면 이런 번거로운 과정 없이 원하는 형태의 결과물에 곧바로 번역 처리만 적용할 수 있어 간편하다.
새로 출시된 두 기능은 한국어, 영어, 일본어, 중국어 간체자 번역을 지원한다. 기업이 이미 구축한 업무시스템에 곧바로 적용할 수 있는 API 방식으로 제공된다. 별도 시스템 구축 없이 쓴 만큼 비용을 지불하고 관련 업무를 간소화할 수 있다.
네이버클라우드는 광학문자인식(OCR) API와 번역 API를 결합해야 했던 기존 이미지 번역 작업을 간소화할 '파파고 이미지 번역' 상품도 출시할 예정이다. 이는 개인용 파파고 서비스에 제공되고 있는 이미지 번역 기능을 기업용으로 선보인다는 뜻이다.
기업용으로 출시될 파파고 이미지 번역은 결과물 품질을 높이기 위해 네이버가 자체 개발한 딥러닝 모델 '위계적 텍스트 구조화(HTS)'를 활용한다. HTS 모델은 이미지에서 인식된 문자의 디자인과 문장 구조를 분석해 번역에 적합한 문장을 찾아낸다.
네이버클라우드 관계자는 "API를 결합해 활용하는 기존 이미지 번역 방식은 각각의 문자를 검출해 번역하는 것으로 문장 구조가 다소 불완전해, 사용자가 선택하는 텍스트 영역에 따라 번역 품질이 고르지 않았다"라며, HTS로 이 문제를 보완했음을 시사했다.
©'5개국어 글로벌 경제신문' 아주경제. 무단전재·재배포 금지