일본의 NEC는, 영상 및 음성 컨텐츠에 포함되는 음성으로부터 화제의 변화를 검출해, 영상 및 음성 컨텐츠를 화제 마다 분할하는 「토픽 분할 기술」을 개발했다.


디지털 방송망이나 인터넷상에서 대량으로 유통되는 영상 및 음성 컨텐츠를 화제 마다 검색, 시청, 열람할 수 있어 영상 및 음성 컨텐츠의 효율적인 제공과 시청이 가능하게 된다. 토픽 분할 기술은, 자연스러운 회화체를 고정밀 텍스트로 변환하는 음성인식기술과 텍스트를 정리에 분리하는 텍스트 분할 기술에 의해 구현된 것이다.


화제가 다르면 말이나 프레이즈의 경향이 다르다고 하는 「화제간의 차이」에 주목해 토픽을 분류하는 것으로써, 정치, 예능, 스포츠 등, 화제의 구체적 내용에 영향을 받는 일 없이 분할할 수 있다고 한다. 또, 일련의 화제의 변천을 수리적인 모델로 표현해, 화제의 변화점을 컨텐츠 전체로부터 종합적으로 판단하는 것으로, 화제가 바뀌는 빈도에 영향받지 않는 안정된 높은 성능이 구현가능하다.


게다가 인공지능 분야의 최신 학습 알고리즘(변분베이즈법)을 응용하는 것으로써, 많은 어휘를 포함한 복잡한 컨텐츠에 대해서도 높은 수준의 화제 변화를 검출할 수 있다고 한다.


현재, 서비스 이용자가 영상 정보를 효율적으로 취득하기 위한 수단으로서 전자 프로그램표(EPG)나 컨텐츠에 포함되는 자막 등의 메타데이타(관련 정보)를 키워드 검색 하는 것으로써, 시청 하고 싶은 컨텐츠를 찾아내는 기술이 이용되고 있지만, 이러한 기술에서는, 메타데이타 작성에 큰 비용이 드는 것 외에 프로그램의 뉴스 항목과 같은 부분 단위 시청이 용이하지 않은 문제점이 있었다.


이번 개발은, 이러한 과제를 극복하는 것으로, 컨텐츠를 화제 마다 정확하게 분할하여, 사용자가 결정한 화제 단위로 컨텐츠의 관심부분을 시청할 수어 저비용 콘텐츠 제공 서비스가 가능하다고 NEC는 설명하고 있다. NEC는 향후, 컨텐츠 관련 사업 제품화를 목표로 연구 개발을 강화해 나간다고 한다.


Posted by 전설의에로팬더