전자통신硏, 언어음성 DB 배포
AI스피커·내비·IoT 등에 활용
60여 기관들 550억 비용 절감

▲ 다국어 언어음성DB의 역할 및 활용 방안 개념도. 자료=ETRI

[일간투데이 송호길 기자] 한국전자통신연구원(이하 ETRI)이 인공지능(AI) 스피커·내비게이션·사물인터넷(IoT) 등 음성인식 및 번역 소프트웨어(SW) 개발에 기초가 되는 음성 데이터베이스(DB)와 영어대역문장 DB를 배포한다.

ETRI는 ▲태국어 ▲말레이어 ▲인도네시아어 ▲아랍어 ▲베트남어 '대화체 음성DB 200만 발화(發話)'와 ▲영어–태국어 ▲영어–말레이어 ▲영어–인도네시아어 ▲영어–아랍어 ▲영어–베트남어 '대화체 대역(對譯)문장DB 300만 문장'을 배포한다고 27일 밝혔다.

태국어·말레이어·인도네시아어 자료는 국내 최초로 제공되며 아랍어 및 베트남어는 ETRI 기존 자료에 데이터양을 늘렸다.

ETRI는 음성인식 및 번역엔진 해외 의존도를 줄이고 해당 언어를 활용한 다양한 서비스 개발에 큰 도움이 될 것으로 기대했다.

ETRI에 따르면 해외 업체로부터 외국어 음성 DB를 구입하려면 언어 당 1∼2억원 정도의 비용이 든다. 그마저도 관련 자료가 없는 나라의 언어는 자체적으로 수집해야 했다.

국내 관련 업체들은 ETRI가 제공하는 자료를 받아 DB구축 비용을 대폭 절감할 수 있다. ETRI는 해외 DB 가격 대비 5% 수준에서 제공할 예정이다.

ETRI가 배포할 예정인 언어·음성 DB의 모습. 사진=ETRI

ETRI는 이번 DB에 최대한 많은 사람들의 언어 데이터를 담기 위해 '크라우드 소싱(Crowd sourcing)' 기법을 도입했다. 포인트를 제공해 일반 사용자들의 참여를 유도한 결과, 총 2만5천여명이 발화에 참여했으며 같은 예산으로 기존보다 최대 8배 많은 데이터를 수집할 수 있었다고 설명했다.

데이터 양은 물론 높은 정확도까지 확보했다. 외부 감리 업체 측정 결과 99% 이상의 높은 품질을 인증 받았다.


ETRI 음성지능연구그룹 윤승 박사는 "이 DB를 활용해 언어음성기술을 개발할 경우 다양한 외국 신규시장 진출 및 국가 경쟁력 강화에 큰 기여를 할 것으로 예측한다"고 말했다.


앞서 ETRI는 지난 2011년부터 한국어·영어·일어·중국어 등 다국어 언어음성DB를, 2014년에는 프랑스어, 2015년에는 독일어, 러시아어, 아랍어, 베트남어를 구축 및 배포한 바 있다.

현재까지 삼성전자, LG전자, KT, 네이버, 카카오, 엔씨소프트, 보이스웨어, 셀바스AI, 시스트란 인터내셔널, 솔트룩스 등 국내 60개 기관에 367건의 DB를 배포하며 총 550억원에 해당하는 비용 절감 성과를 얻었다.

이번 DB 역시 국내 10개 기관에 배포할 경우, 최소 150억원의 수입대체 효과를 얻을 수 있다고 ETRI는 설명했다.

향후 연구진은 기존 배포 언어들의 정확도 및 데이터 품질 개선에 나서는 한편, 영어와 중국어, 일본어 음성 데이터 구축을 위해 노력할 예정이다.

한편 이번 연구는 행정안전부가 한국정보화진흥원을 통해 추진한 2018 국가중점데이터 개방 사업의 일환인 '다국어 5종의 음성과 영어대역문장 DB 구축 및 개방' 사업의 일환으로 진행됐다.


저작권자 © 일간투데이 무단전재 및 재배포 금지