IT

구글, 자동 자막 생성 앱 공개.."청각 장애인도 쉽게 대화"

이정민 기자 입력 2019.03.14. 13:24

구글이 청각 장애인을 위한 대화 자동 자막 생성 애플리케이션(앱) '라이브 트랜스크라이브'를 공개했다.

사가 사블라 구글 인공지능(AI) 리서치 프로덕트 매니저는 14일 서울 강남구 구글코리아 사무실에서 열린 화상 기자간담회에서 "라이브 트랜스크라이브는 대화를 실시간 자막으로 변환해 청각 장애를 갖고 있는 사람들이 보청기 없이 대화할 수 있게 해주는 앱"이라며 "전 세계 4억6000만 명으로 추정되는 청각 장애인에게 도움을 줄 수 있다"고 했다.

기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다. 전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.
음성 기사 옵션 조절 레이어
번역beta

Translated by kakao i

번역할 언어 선택
글자 크기 조절 레이어

구글이 청각 장애인을 위한 대화 자동 자막 생성 애플리케이션(앱) ‘라이브 트랜스크라이브’를 공개했다. 이 앱은 한국어, 영어를 포함해 70개 언어를 지원한다.

사가 사블라 구글 인공지능(AI) 리서치 프로덕트 매니저는 14일 서울 강남구 구글코리아 사무실에서 열린 화상 기자간담회에서 자동 자막 생성 애플리케이션 ‘라이브 트랜스크라이브’를 설명하고 있다. /이정민 기자

사가 사블라 구글 인공지능(AI) 리서치 프로덕트 매니저는 14일 서울 강남구 구글코리아 사무실에서 열린 화상 기자간담회에서 "라이브 트랜스크라이브는 대화를 실시간 자막으로 변환해 청각 장애를 갖고 있는 사람들이 보청기 없이 대화할 수 있게 해주는 앱"이라며 "전 세계 4억6000만 명으로 추정되는 청각 장애인에게 도움을 줄 수 있다"고 했다.

라이브 트랜스크라이브는 머신러닝 기반 음성 텍스트 변환 기술을 활용한다. 현재 베타 버전 모바일 앱 형태로 출시돼 있다. 안드로이드 운영체제(OS) ‘롤리팝’ 이상 탑재 스마트폰에서 사용할 수 있다. 애플 스마트폰 운영체제인 iOS 출시는 미정이다.

이 서비스는 머신러닝 기반 신경망 기술을 모바일 기기와 구글 클라우드에서 각각 적용해 음성 데이터를 처리한다. 모바일 기기에선 화자가 말을 하는지 여부를 파악한다. 사블라 매니저는 해당 신경망 기술이 소리를 570여 개 종류로 구분해 화자가 대화를 하는지 아니면 주변에서 들리는 소음인지 구분할 수 있다고 했다. 대화로 판명되면 데이터가 구글 클라우드에 있는 음성인식 엔진으로 전송된다.

사블라 매니저는 "정확한 음성인식을 위한 엔진을 모바일 기기에 넣기엔 너무 무겁기 때문에 클라우드를 활용했다"면서 "시끄러운 카페나 자동차 안에서도 음성을 정확하게 텍스트로 변환할 수 있다"고 했다.

라이브 트랜스크라이브의 한국어 변환 수준은 영어 외 다른 언어와 비교해 좋은 편이라는 것이 구글 측 설명이다. 사블라 매니저는 "한국어 인식 오류율은 20% 미만"이라며 "다른 언어에 비해 좋은 수치지만 한국어 데이터를 더 쌓으면서 정확도를 높이기 위해 노력하고 있다"고 했다.

구글은 소음과 사람의 대화를 구분하는 정도를 시각화해 보여주는 장치도 마련했다. 해당 앱의 오른쪽 상단에 보이는 작은 동그라미의 크기가 주변 소음 정도에 따라 바뀐다. 사블라 매니저는 "이 신호는 마이크가 화자의 음성을 잘 인식하고 있는지 즉각적으로 보여 준다"며 "사용자가 신호를 확인해 휴대폰 위치를 조정하면서 대화를 이어나갈 수 있다"고 설명했다.

구글은 이런 기술을 바탕으로 음성 증폭 앱 ‘사운드 앰플리파이어’도 준비하고 있다. 이 앱은 작은 소리를 크게 만드는 동시에 큰 소리는 과도하게 키우지 않는 방식으로 작동한다. 구글 측은 이 앱을 활용하면 청각이 약한 사람들도 보청기 없이 소리를 명확하게 들을 수 있을 것으로 기대하고 있다.

이 시각 추천뉴스