'이루다' 개발사 "조사 성실히 임할 것..민감정보 노출 사과"(종합)

손인해 기자,송화연 기자 2021. 1. 14. 09:42
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

인공지능(AI) 챗봇 '이루다' 개발사 스캐터랩이 계속되는 논란에 사과문을 냈다.

개인정보 처리 논란의 골자는 스캐터랩은 연애의 과학 이용자들의 카카오톡 대화 내용을 제대로 된 고지 없이 수집·활용했다는 사실과 이렇게 공개된 개인정보가 제대로 익명화(비식별화)되지 않았다는 점이다.

스캐터랩은 비식별화 과정을 제대로 거치지 않은 연애의과학 이용자들의 카카오톡 대화를 오픈소스 플랫폼 '깃허브'에 공개했다는 논란에 대해서도 인정하고 사과했다.

음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

실명 노출된 대화 오픈소스에 공개 논란 "걸러내지 못한 부분" 인정
"AI 업계에 누끼치 않길 바라는 마음..사회적 합의 부합 노력하겠다"
인공지능(AI) 챗봇 이루다. © 뉴스1

(서울=뉴스1) 손인해 기자,송화연 기자 = 인공지능(AI) 챗봇 '이루다' 개발사 스캐터랩이 계속되는 논란에 사과문을 냈다. 민감 정보가 포함된 대화 패턴이 오픈소스를 통해 노출된 사실에 대해서도 고개를 숙였다.

스캐터랩은 14일 "개인정보 처리 관련 개인정보보호위원회와 한국인터넷진흥원(KISA) 요청에 따라 성실하게 조사에 임하고 있다"며 "이용자 여러분께 진심으로 사과드린다"고 밝혔다.

이어 "논란이 되는 모든 사항에 대하여 진상조사위원회를 구성해 사내에서도 철저히 조사하는 한편 외부 전문가를 포함한 상시개인정보보호체계를 구축하고, 재발 방지를 위한 강화된 보안 교육을 실시하겠다"고 했다.

개인정보 처리 논란의 골자는 스캐터랩은 연애의 과학 이용자들의 카카오톡 대화 내용을 제대로 된 고지 없이 수집·활용했다는 사실과 이렇게 공개된 개인정보가 제대로 익명화(비식별화)되지 않았다는 점이다.

이루다는 성희롱에 이어 장애인·성소수자 혐오 발언과 개인정보 유출 논란이 이어지면서 출시 3주만인 지난 12일 서비스를 잠정 중단했다.

회사 측은 "이번 사안으로 인해 AI 산업계에 있는 여러 동료 기업, 연구자, 파트너에게도 회사로 인해 조금이라도 누를 끼치지 않기를 바라는 마음"이라며 "AI 윤리에 관한 사회적 합의에 보다 부합할 수 있도록 노력하겠다"고 덧붙였다.

'이루다' 개발업체 스캐터랩이 오픈소스 플랫폼 '깃허브'에 올린 데이터셋 일부. 실명과 함께 "혈당을 뽑아서 측정한다"는 사실로 개인 기저 질환을 유추할 수 있다. 사진에서 등장하는 이름은 이름은 가명 처리했다. © 뉴스1

스캐터랩은 비식별화 과정을 제대로 거치지 않은 연애의과학 이용자들의 카카오톡 대화를 오픈소스 플랫폼 '깃허브'에 공개했다는 논란에 대해서도 인정하고 사과했다.

100여건의 대화 묶음(개별 문장 환산시 1700여건)이 담긴 해당 데이터셋에선 실명이 20여번 이상 필터링 되지 않고 대화 상대방과 관계가 그대로 나온다. 개인 기저 질환을 유추할 수 있는 대화 내용이나 생활 반경, 직장 관련 정보가 등장하기도 한다.

이 데이터셋은 전날 개발자 커뮤니티에서 논란이 되자 삭제됐다.

스캐터랩은 "자체 조사 결과 개발팀은 2019년 깃허브에 오픈 소스로 공개한 'KG-CVAE -인공지능 한국어 자연어처리(NLP) 연구 모델' 내부 테스트 샘플이 포함된 사실이 확인됐다"며 "문제를 발견한 즉시 해당 깃허브 레파지토리는 비공개 처리했다"고 밝혔다.

그러면서 "기본적으로 대화중 실명과 숫자는 자동 비식별 처리했으나 기계적 필터링 과정에서도 미처 걸러지지 못한 부분이 일부 존재했음을 확인했다"며 "데이터 관리에 더 신중하지 못했고 일부 민감할 수 있는 정보가 포함된 대화 패턴이 노출된 점에 대해 진심으로 사과드린다"고 했다.

회사는 "연애의 과학 이용자들 중 AI 학습에 데이터가 활용되길 원하지 않는 분들은 개인정보보호법에 따라 DB 삭제를 비롯해 앞으로 이루다 DB에 활용되지 않도록 적극적인 조치를 진행할 예정"이라고 했다.

'사내 대화방에서 수집된 대화를 직원들끼리 돌려봤다'는 증언에 대해서는 "스캐터랩 전원이 참여하고 있는 카카오톡 대화 당해년도 단체방에서는 해당 내용이 없음을 확인했다"며 "또 다른 사내 메신저 채널인 슬랙에 대해선 다수 대화 채널이 있는 관계로 현재 조사를 진행 중"이라고 했다.

연애의 과학 일부 이용자들은 스캐터랩이 이용자들의 카카오톡 대화 내용 전량을 폐기해야 한다고 주장하며 회사를 상대로 집단소송을 준비하고 있다.

son@news1.kr

Copyright © 뉴스1. All rights reserved. 무단 전재 및 재배포, AI학습 이용 금지.

이 기사에 대해 어떻게 생각하시나요?