카카오AI 영문법 교정 챌린지서 '2위'..번역 경쟁력 확인

김시소 2019. 5. 7. 10:53
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

카카오가 인공지능(AI)으로 영어문법을 바로 잡는 글로벌 경진대회에서 2위에 올랐다.

카카오에 따르면 카카오 공동 연구팀은 이번 대회에서 문법 교정 시스템을 크게 철자 검사, 훈련, 후처리로 구성했다.

카카오는 이번 대회를 인공지능 번역의 언어학적 지식, 전이 학습에 관한 능숙함, 필요한 딥러닝 모델 구현 경쟁력을 입증했다.

카카오는 이번 성과를 자사 번역 서비스에 어떻게 적용할지는 미정이라고 밝혔다.

음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

카카오가 인공지능(AI)으로 영어문법을 바로 잡는 글로벌 경진대회에서 2위에 올랐다. 세계 상위권 딥러닝 번역 경쟁력을 입증했다.

7일 카카오에 따르면 카카오와 카카오브레인 연합팀은 최근 열린 BEA(Building Educational Application) 2개 과제에서 2위에 올랐다.

BEA는 세계적인 컴퓨터 언어학 전문가 콘퍼런스(ACL)가 주최하는 문법오류수정(GEC) 대회다. 2014년 이후 5년 만에 열렸다.

이 대회는 올해 총 3개 트랙을 운영했다. 원어민과 비원어민 학생이 쓴 에세이 4000문장에서 문법 오류를 교정하는 과제를 제시했다. 주최 측은 비원어민 학생이 작성한 3만3000여개 문장의 훈련 데이터와 4000여 문장으로 구성된 검증 데이터를 공개했다.

카카오는 외부에 공개된 데이터를 활용하는 1번 트랙과 주최 측이 제시한 검증데이터만 사용하는 3번 트랙에서 2위에 올랐다. 양 트랙에서 1위를 기록한 마이크로소프트(MS)와 에딘버러 대학 연구팀과 근소한 차이였다.

GEC 대회는 딥러닝을 활용해 문법적으로 틀린 문장을 옳은 문장으로 바꾸는 것을 겨룬다.

카카오에 따르면 카카오 공동 연구팀은 이번 대회에서 문법 교정 시스템을 크게 철자 검사, 훈련, 후처리로 구성했다.

이 중 철자검사와 후처리에서 문맥에 맞는 수정을 위해 뉴럴 네트워크(신경망) 기반 언어 모델을 활용했다. 인간이 언어를 학습하는 방식을 모방해 인공지능이 스스로 틀린 문장을 고칠 수 있게 훈련했다.

카카오에 따르면 연구팀은 옳은 문장에서 틀린 문장을 생성해 훈련에 활용했다. 제한된 데이터를 가지고도 인공지능에게 문법 오류를 수정 훈련을 시킨 것이다. 활용할 수 있는 데이터가 많지 않아도 번역 정확도를 높일 수 있는 가능성을 발굴했다.

연구팀 관계자는 “틀린 문장과 옳은 문장이 매칭된 데이터는 적지만, 옳은 문장의 데이터는 굉장히 많은 것에 주목했다”로 말했다.

연구팀은 사람이 흔히 저지르는 문법 오류 패턴을 라벨링된 데이터로부터 추출했다. 이후 이 패턴을 활용해 옳은 문장에 대응하는 틀린 문장을 생성했다. 임의로 생성한 옳은 문장과 틀린 문장 데이터를 사전훈련(pre-training)에 활용한 후 전이 학습(transfer learning)을 시켰다.

카카오는 이번 대회를 인공지능 번역의 언어학적 지식, 전이 학습에 관한 능숙함, 필요한 딥러닝 모델 구현 경쟁력을 입증했다.

카카오는 이번 성과를 자사 번역 서비스에 어떻게 적용할지는 미정이라고 밝혔다.

카카오는 2017년부터 '카카오i 번역' 베타테스트를 진행 중이다. 네이버나 구글에 비해 1년 이상 늦었지만 정확도를 계속 높여가며 상용 서비스에 근접했다.

김시소 게임/인터넷 전문기자 siso@etnews.com

Copyright © 전자신문. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?