ETRI 기술이전 사이트에 오신걸 환영합니다.
wFST 기반 음성인식 이미지 생성 도구
키워드
기술개요
○ 인공지능연구소 지능정보연구본부 복합지능연구실에서는 다국어 음성인식 기술을 개발하였음.
○ 다국어 음성인식 기술은 딥러닝 기술 및 대용량 데이터에 기반하여 실현되는 고난이도 융복합 기술임.
○ wFST(Weighted Finite State Transducers) 기반 음성인식 이미지 생성 도구는 다국어 음성인식 기술 활용을 위해서 wFST 기반으로 음성인식 이미지를 최적화하여 디코딩하도록 하는 도구임.
기술이전 목적 및 필요성
○ 다국어 음성인식 기술은 지니톡 대국민 시범 서비스 및 평창 올림픽 서비스 지원 및 원어민 테스트 등 실증 검증을 수행하였으며 인공지능 스피커, 음성 챗봇 서비스, 강의용 음성인식, 스마트홈, 스마트 가전, 스마트카, 군사용 음성인식 등 다양한 응용 분야에 대해서 상용화 수준에 이르렀다고 판단하여 기술이전을 실시하고자 함.
○ 본 wFST 기반 이미지 생성 도구는 다국어 음성인식 기술의 다양한 응용이 가능하도록 수요 업체에서 DB 증강 및 성능 개선을 거친 발음 사전, 음향 모델, 언어 모델을 통합하여 최적화된 네트워크를 생성하는 기술임.
기술의 특징 및 장점
○ ETRI의 한국어, 영어, 중국어, 일본어, 프랑스어, 스페인어, 독일어, 러시아어, 아랍어, 베트남어 등 다양한 음성인식 언어를 지원함.
○ Kaldi 기반의 음향 모델 및 Arpa format의 N-Gram기반 언어모델을 지원함.
○ 음향모델, 언어모델, 발음사전을 기반으로 최적화된 wFST 기반의 네트워크를 생성
○ ‘지니톡 대국민 시범서비스’ 및 ‘2018 평창올림픽’ 자동통역 서비스 실시를 통해 검증된 시스템 안정성 및 활용성 확인 완료
○ 수요업체 용도에 따라 ETRI가 보유한 다양한 외국어 음성인식엔진 및 자동번역 기술과 연계 용이
기술의 성숙도
활용방안 및 기대성과
○ 응용업체가 wFST 기반의 다양한 음성 인식 기술 관련 비즈니스 모델을 개발하게 함으로서 국내외 SW산업 신시장 창출 기대
○ ETRI는 기술이전업체와 공동으로 기술 상용화 시 문제점을 공유하고 해결 노력을 기울임으로써 기술의 완성도를 제고
기술이전 내용 및 범위
○ wFST 기반 음성인식 이미지 생성 도구(Cent OS 6.0 이상, 바이너리 제공)
- wFST 기반으로 고속탐색이 가능한 이미지 생성(최적화된 wFST 이미지를 이용하여 입력 음성을 텍스트로 실시간으로 고속 변환하는 음성인식 엔진의 경우 아래의 사양 필요)
* CPU 기반, core당 1채널 지원
* 최소 사양 : Intel 2세대 샌디브릿지(2011년 말 출시) AVX(Advanced Vector eXtensions) 지원 CPU
- 딥러닝 기반 음향모델 (음성으로부터 음소단위 발음 특성을 학습한 음향모델) 및 N-gram 기반 언어모델 (텍스트로부터 단어 간의 문법적 관계를 추출한 통계모델)과 발음사전으로부터 wFST 기반 음성인식 이미지 생성
- 별도 기술이전 받은 언어에 따라 필요한 경우 전처리 및 발음변환 기술 제공(숫자, 심볼 등이 포함된 문장으로부터 한글표현으로 변환하고, 단어의 발음을 추출하는 기술. 단, 특수 코드 등 예외 입력에 대해 별도 처리 필요)
- 별도 기술이전 받은 언어에 대한 언어모델 튜닝 기술 전수(새로운 영역에서 추출한 문장표현을 기존 언어모델에 튜닝하는 기술. 오픈소스인 SRI toolkit 이용)
- 별도 기술이전 받은 언어에 대한 음향모델 튜닝 기술 전수(새로운 발성환경에서 수집한 음성데이터를 기존 음향모델에 튜닝하는 딥러닝 학습 기술. 오픈소스인 Kaldi 이용)
- wFST 기반의 음성인식 이미지 생성 소프트웨어
- 별도 기술이전 받은 언어에 따라 필요한 경우 전처리 및 발음변환 도구 제공(wFST기반의 음성인식 이미지 생성용으로만 용도 제한 - 별도 사용 금지)
- 관련 기술 문서 및 지적재산(기술문서, 프로그램)
관련지적재산권
wFST 기반 음성인식 이미지 생성도구 등 프로그램 2 건
ETRI 이미지 빌딩 툴킷(IBTk-C) 안내서 등 기술문서 2건
첨부파일
기술이전조건
실시권 허용범위
비독점적 통상실시권
계약기간
계약체결일로부터 5 년간
기술료조건(부가세별도)
※ 착수기본료(단위:천원)
구분 중소기업 중견기업 대기업
착수기본료 20,000 40,000 40,000
매출정률사용료(%) 1.25 3.75 5
※중소기업 또는 중견기업 기술료조건을 적용받고자 하는 경우에는 중소기업확인증 또는 중견기업확인증 제출 필요
기술전수교육
1 개월 / 2,157 천원정(부가세 별도)
기타특기사항
ㅇ 평가용으로 기술이전을 받을 경우
- 착수기본료(매출정률사용료) : 중소기업 4,000천원(1.25%), 중견기업 8,000천원(3.75%), 대기업 8,000천원(5%)
- 평가용은 PoC(개념검증), 시범서비스 또는 평가 목적으로 제한적으로 사용 가능하되, 사용 기한은 1년으로 제한함
※ 평가용 기술이전계약 완료 후 본계약 기술이전 시에는 평가용 기술이전의 착수기본료를 차감하고 계약함 (차감후 기술료: 16,000천원/중소기업, 32,000천원/대기업 및 중소기업)
세부문의
기술관련
기술개발 발표당시 복합지능연구실 윤승 (042-860-5835, syun@etri.re.kr)
현재 복합지능연구실 윤승 (042-860-5835, syun@etri.re.kr)
계약관련
기술이전실 주명혁 (042-860-5838, mhju@etri.re.kr)