IT

아시아경제

번역 서비스 키우는 카카오.. 번역 챗봇·번역앱 선보인다

한진주 입력 2018. 02. 21. 12:12

기사 도구 모음

음성 기사 옵션 조절 레이어
번역beta

Translated by kakao i

번역할 언어 선택
글자 크기 조절 레이어
번역 챗봇 2월말 출시..연내 음성·사진 번역 지원하는 전용 앱 선보여
배재경 카카오 컨텍스트파트장

[아시아경제 한진주 기자] 카카오가 이달 말 카카오톡 번역 챗봇을 출시하고 연내 음성까지 인식하는 전용 번역 앱을 선보인다.

21일 배재경 카카오 컨텍스트파트장은 한남동 카카오 오피스에서 열린 AI 미디어 스터디에서 "번역 전용 앱에 음성기반 통역을 지원하고 사진 속 문자를 인식하는 기능을 적용할 것"이라며 " 고려하고 있다"며 "이달 말 5000자까지 지원되는 카카오톡 번역 챗봇도 출시할 것"이라고 말했다.

카카오톡 번역 챗봇은 대화창에서 번역하려는 문장을 입력하면 챗봇이 다른 언어로 바꿔주는 서비스다. 번역 챗봇을 친구로 등록해두면 원하는 언어로 번역 서비스를 이용할 수 있다. 라인처럼 대화창 내에서 친구와의 대화에서 바로 번역을 제공하는 형태는 아니다.

카카오는 지난해 9월부터 카카오 아이(I)의 번역 엔진을 적용한 기계 번역 서비스를 제공해왔다. 카카오 번역 웹사이트에서 제공되는 번역은 현재 영어만 지원하지만 이달 말부터 일본어와 중국어도 지원한다는 계획이다. 카카오는 국내 서비스 중 최초로 예사말이나 높임말, 구어체나 문어체를 구분해서 번역해주는 기능도 2분기 중 적용할 예정이다.

연내 '구글 번역' 앱이나 네이버의 '파파고'처럼 전용 번역 앱도 내놓는다. 음성 통역이나 문장, 사진 속 외국어까지 번역할 수 있는 서비스다. 전용 앱에는 카카오 I의 번역 엔진과 시각 엔진이 적용된다. 이밖에도 카카오미니나 카카오TV, 다음 등 카카오의 서비스에도 번역 기술을 접목시킨다는 계획이다.

배 파트장은 "양질의 해외 콘텐츠를 국내 이용자들이 볼 수 있도록 한국어로 번역하거나, 연예 콘텐츠를 영어로 번역하는 것도 가능해진다"며 "카카오TV에서 동영상 자막을 번역하는 서비스도 제공할 것"이라고 말했다.

카카오는 네이버나 구글 등에 비하면 다소 늦게 번역 서비스 개발을 시작했다. 2016년 하반기에 배재정 파트장이 개인적으로 연구를 시작했는데, 카카오의 여러 서비스와 접점을 만들 수 있을 것이라고 판단해 본격적으로 번역 서비스 개발에 나선 것이다.

배 파트장은 "번역서비스를 처음부터 계획적으로 진행한 것은 아니었지만 회사에서 번역 서비스에 대한 고민을 하던 시기가 잘 맞아떨어져서 시작하게 된 것"이라며 "AI에서는 번역 기술이 원천 기술에 해당되는데 번역에 들어가는 모델은 뉴스요약, 대화모델 등 자연어를 다루는 수많은 분야에 적용할 수 있어 여러 업체들이 번역 기술 연구에 집중하고 있는 것"이라고 설명했다.

카카오의 번역 서비스가 가진 강점은 문맥을 잘 이해한다는 점이다. 배 파트장은 "주변 단어 사이의 관계를 잘 학습하고 문장 내에서 멀리 떨어진 단어 사이의 관계까지 학습하며 다의어를 처리하는 데 강하다"며 "문장 수준을 넘는 학습단위를 사용하기 때문에 여러 문장 사이에 나타나는 문맥을 파악한다"고 설명했다.

번역 성능을 높이기 위해서는 많은 데이터를 확보하는 것이 중요하다. 학습에 필요한 데이터는 언어당 일반적으로 300만~400만개 문장이지만 한국어-영어 데이터는 50만개, 한국어-중국어 데이터는 30만개에 불과하다. 카카오는 문장 단위 데이터의 부족함을 메우기 위해 TED의 자막이나 뉴스, 연설문 등 더 큰 단위의 데이터를 활용했다.

이를 위해 카카오는 유사어도 학습하는 자체 번역 툴을 개발해 번역 품질과 정확도를 높였다. 카카카오는 딥러닝 기반으로 학습데이터를 문장 단위로 정렬해주는 툴의 일종인 ‘BLEU align’(블루 얼라인)을 직접 개선한 Advanced BLEU align’(ABLEU align, 에이블루얼라인)을 번역 서비스에 활용하고 있다.

카카오가 내부적으로 블라인드 성능 테스트를 실시한 결과 영한 번역 기술의 정답률은 84%로 경쟁사(78~80%)에 비해 높게 나왔다. 한영 번역의 경우 91%로 경쟁사(85~91%)와 비슷한 수준이었다.

배 파트장은 "번역의 정확도는 모델의 성능에 비례하지만 상한선은 데이터에 좌우된다"며 "일본어는 번역에 강한 경쟁사와 비슷한 수준이었고 점점 나아질 것으로 본다. 더 넓은 문맥정보를 활용해서 정확한 번역을 위한 연구를 이어갈 것"이라고 설명했다.

한진주 기자 truepearl@asiae.co.kr

<ⓒ경제를 보는 눈, 세계를 보는 창 아시아경제 무단전재 배포금지>

포토&TV

    이 시각 추천뉴스