ETRI 기술이전 사이트에 오신걸 환영합니다.
마이크 이동성 위주의 실생활 음향 이벤트장면 DB
키워드
기술개요
‘마이크 이동성 위주의 실생활 음향 이벤트/장면 DB’는 실내외 환경에서 수집된 다양한 음향 이벤트/장면 신호 데이터 및 어노테이션 관련 메타데이터로 구성되며, 이를 음향 이벤트/장면 인식 모델의 학습 및 성능 평가를 위한 용도로 활용할 수 있음
기술이전 목적 및 필요성
O 통신미디어연구소 미디어연구본부 미디어부호화연구실에서는 "신체기능의 이상이나 저하를 극복하기 위한 휴먼 청각 및 근력 증강 원천 기술 개발” 사업의 일환으로 실생활 음향 이벤트/장면 인식 기술 개발을 위한 “휴먼 청각 증강 기술 개발” 과제를 수행하고 있음
- 신체기능의 이상이나 저하를 극복하기 위한 휴먼 청각 및 근력 증강 원천 기술 개발 (2017.01. ~ 2021.12.)

O 휴먼 청각 증강을 위한 음향 이벤트/장면 인식 기술 개발과 관련하여, 실생활 음향 이벤트/장면 데이터베이스는 딥러닝 기반 음향 이벤트/장면 인식 모델의 학습, 검증, 성능 평가 및 보완에 있어 매우 중요한 요소임

O 특히, 마이크의 이동성 여부, 바이노럴 및 스테레오 녹음 방식 등의 다양한 조건하에 수집된 실생활 음향 데이터는 음향 이벤트/장면 인식 모델의 인식 성능 제고에 매우 유용함

O 본 기술이전 대상은 음향 DB 구축을 위한 신호 녹음 및 어노테이션 처리에 상당한 시간과 비용이 소요되므로, 이를 보유하지 못한 관련 기업에 기술이전 함으로써 음향 인식 관련 시장의 활성화를 도모하기 위한 것임
기술의 특징 및 장점
O 복수의 음향 신호 데이터 녹음 방식 지원
- 바이노럴 및 스테레오
O 다양한 음향 신호 데이터 수집 조건 반영
- 마이크의 이동 및 고정, 음향 이벤트의 이동 혹은 고정
O 음향 신호 데이터 일반화를 위한 다양한 녹음 환경 반영
- 상이한 녹음 장소 및 시간
기술의 성숙도
활용방안 및 기대성과
O 음향 이벤트/장면 인식 시스템
기술이전 내용 및 범위

O 마이크 이동성 위주의 실생활 음향 이벤트/장면 DB
● 실생활 음향 이벤트 DB
● 실생활 음향 장면 DB
O 마이크 이동성 위주의 실생활 음향 이벤트/장면 DB
● 실생활 음향 이벤트 DB
- 음향 이벤트 신호 데이터
* 주요 이벤트 클래스 종류 : 46 종
* 주요 이벤트 클래스 당 평균 인스턴스 개수 : 약 580 개
* 총 녹음 분량 : 1,753 분
- 음향 이벤트 메타데이터
● 실생활 음향 장면 DB
- 음향 장면 신호 데이터
* 총 장면 종류 : 20 종
* 총 녹음 분량 : 1,700분
- 음향 장면 메타데이터
O 마이크 이동성 위주의 실생활 음향 이벤트/장면 DB 요구사항 정의서, 시험절차 및 결과서
O 마이크 이동성 위주의 실생활 음향 이벤트/장면 DB 설명서
관련지적재산권
첨부파일
기술이전조건
실시권 허용범위
비독점적 통상실시권
계약기간
계약체결일로부터 5 년간
기술료조건(부가세별도)
※ 착수기본료(단위:천원)
구분 중소기업 중견기업 대기업
착수기본료 10,000 20,000 20,000
매출정률사용료(%) 1.25 3.75 5
※중소기업 또는 중견기업 기술료조건을 적용받고자 하는 경우에는 중소기업확인증 또는 중견기업확인증 제출 필요
기술전수교육
1 개월 / 1,000 천원정(부가세 별도)
기타특기사항
세부기술 이전가능

1. 1세부기술 : 마이크 이동성 위주의 실생활 음향 이벤트 DB
- 중소 : 5,000,000원 / 중견 : 10,000,000원 / 대기업 : 10,000,000원
* 매출정률사용료율은 동일함

2. 2세부기술 : 마이크 이동성 위주의 실생활 음향 장면 DB
- 중소 : 5,000,000원 / 중견 : 10,000,000원 / 대기업 : 10,000,000원
* 매출정률사용료율은 동일함

세부문의
기술관련
기술개발 발표당시 미디어부호화연구실 정영호 (042-860-6472, yhcheong@etri.re.kr)
현재 미디어부호화연구실 정영호 (042-860-6472, yhcheong@etri.re.kr)
계약관련
기술이전실 김영규 (042-860-, kyk@etri.re.kr)