키워드
기술개요
○ 소프트웨어콘텐츠연구소 지능정보연구본부 음성지능연구그룹에서는 한국어 음성인식 기술을 개발하였음.
○ 한국어 음성인식 기술은 딥러닝 기술 및 대용량 데이터에 기반하여 실현되는 고난이도 융복합 기술임.
○ 다양한 사업모델 창출을 위하여 기술이전을 통하여 관련업체 및 기관에 적극적으로 보급함으로써 관련 시장확대 촉진 및 글로벌 경쟁력을 제고
기술이전 목적 및 필요성
○ 한국어 음성인식 기술은 지니톡 대국민 시범서비스 및 평창 올림픽 공식 자동통번역 서비스 지원을 통해 실증 검증을 수행하였으며 자동통역서비스, 인공지능 스피커, 음성 챗봇 서비스, 강의용 음성인식, 스마트홈, 스마트 가전, 군사용 음성인식 등 다양한 응용 분야에서 상용화 수준에 이르렀다고 판단하여 기술이전을 실시하고자 함.
○ Google, 뉘앙스 등 글로벌 경쟁기술이 국내 한국어 음성 인식 시장을 선점하기 이전에 기술이전을 실시하여 기술경쟁력을 강화하고 향후에는 국외시장까지 진출하는 것을 목적으로 함
기술의 특징 및 장점
○ 한국어를 대상으로 딥러닝 기술을 활용한 명령어 및 자연어 기반의 대어휘 음성인식 및 대화체 연속 음성을 인식
○ 음향모델링, 언어모델링, 디코딩, 음성검출, 음성특징추출, 문장코퍼스 정제기술, 시스템 통합기술, 부호복원 및 오류수정 기술 등 다양한 요소기술로 구성된 복합기술
○ 대화체 문장 등 일상 생활 영역에 특화되었으며, 높은 정밀도의 음성인식 성능 확보
○ API규격 및 활용예제 코드 제공으로 용도별 클라이언트 응용프로그램 개발 용이
○ ‘지니톡’ 대국민 시범서비스 실시를 통하여 시스템 안정성 및 활용성 확인 완료
기술의 성숙도
활용방안 및 기대성과
○ 다양한 응용업체가 한국어 음성 인식 기술 관련 비즈니스 모델을 개발하게 함으로서 국내외 SW산업 신시장 창출 기대
○ ETRI는 기술이전업체와 공동으로 기술 상용화 시 문제점을 공유하고 해결 노력을 기울임으로써 기술의 완성도를 제고
기술이전 내용 및 범위
○ 한국어 연속 음성인식 엔진 (Cento6.0, Ubunt14.04버전 이상, 엔진 라이브러리, 서버-클라이언트 샘플 바이너리, 16kHz 및 8kHz 지원(단, 샘플링 주파수에 따라 별도 기술이전 계약이 필요함)
- wFST 기반 고속탐색 기술 (최적화된 wFST 이미지를 이용하여 입력 음성을 텍스트로 실시간으로 고속 변환하는 기술) CPU 기반, core당 1채널 지원 최소 사양 : Intel 2세대 샌디브릿지(2011년 말 출시) AVX(Advanced Vector eXtensions) 지원 CPU
- 딥러닝 기반 음향모델 (한국어 음성으로부터 음소단위 발음 특성을 학습한 음향모델. 기본 베이스라인 모델 제공)
- N-gram 기반 언어모델 (한국어 텍스트로부터 단어 간의 문법적 관계를 추출한 통계모델. 기본 베이스라인 모델 제공)
○ 엔진 튜닝 도구 (Centos6.0이상 리눅스 이상, 바이너리 제공)
- 전처리 및 발음변환 기술 (숫자, 심볼 등이 포함된 문장으로부터 한글표현으로 변환하고, 단어의 발음을 추출하는 기술. 단, 특수 코드 등 예외 입력에 대해 별도 처리 필요)
- 언어모델 튜닝 기술 (새로운 영역에서 추출한 문장표현을 기존 언어모델에 튜닝하는 기술. 오픈소스인 SRI toolkit 이용)
- 음향모델 튜닝 기술 (새로운 발성환경에서 수집한 음성데이터를 기존 음향모델에 튜닝하는 딥러닝 학습 기술. 오픈소스인 Kaldi 이용)
- wFST 이미지 최적화 기술 (새로운 음향/언어모델로부터 최적화된 이미지 생성 기술)
○ 한국어 음성인식 소프트웨어(기본 베이스라인 음향모델/언어모델 binary 및 음성인식 엔진 튜닝 도구 포함)
○ 관련 기술문서 및 지적재산권(별도 기재)
관련지적재산권
특허 2건
1) 음성 인식 시스템 및 방법
(출원번호 : 2017-0047408)
2) 음성인식을 위한 텍스트 정규화 장치 및 그 방법
(출원번호 : 2016-0150610)
한국어 음성인식 엔진튜닝 도구 등 프로그램 3 건
한국어 음성인식 후처리 등 기술문서 4건
첨부파일
기술이전조건
실시권 허용범위
비독점적 통상실시권
계약기간
계약체결일로부터 5 년간
기술료조건(부가세별도)
※ 착수기본료(단위:천원)
구분 |
중소기업 |
중견기업 |
대기업 |
착수기본료 |
120,000
|
240,000
|
240,000
|
매출정률사용료(%) |
1.25
|
3.75
|
5
|
※중소기업 또는 중견기업 기술료조건을 적용받고자 하는 경우에는 중소기업확인증 또는 중견기업확인증 제출 필요
기술전수교육
1 개월 / 2,157 천원정(부가세 별도)
기타특기사항
* 기술료 특수조건
○ 샘플링 주파수 추가 계약의 경우
- 상기 착수 기본료는 샘플링 주파수 8kHz 또는 16kHz 1건에 대한 착수 기본료이며 최초 계약 이후 다른 샘플링 주파수를 추가 계약할 경우 해당 착수 기본료를 중소기업 50,000(천원), 중견기업 및 대기업 100,000(천원)으로 계약함.
- 샘플링 주파수 8kHz 및 16kHz 동시 계약의 경우 착수기본료를 중소기업 170,000(천원), 중견기업 및 대기업 340,000(천원)으로 계약함
○ 선행 기술에 대한 추가 계약의 경우
- 선행 기술을 이전 또는 출자 받은 업체의 추가 샘플링 주파수 계약의 경우 해당 착수 기본료를 중소기업 50,000(천원), 중견기업 및 대기업 100,000(천원)으로 계약함.
- 선행 기술의 정의
: 지니톡 대화체 음성인식 기술 2015 - 기술 이전
: 다국어 음성언어처리 기술(2015) - 기술 출자
세부문의
기술관련
기술개발 발표당시 |
음성지능연구그룹 윤승 (042-860-5835, syun@etri.re.kr)
|
현재 |
복합지능연구실 윤승 (042-860-5835, syun@etri.re.kr)
|
계약관련
기술이전실 주명혁 (042-860-5838, mhju@etri.re.kr)