泉谷知範(いずみたに とものり)

 

日本電信電話株式会社

NTT コミュニケーション科学基礎研究所

メディア情報研究部

メディア認識研究グループ

音響信号を用いた音楽検索

私たちは、何気なく音楽を聴いている時でも、さわりを少し聴いただけでその曲名が分かったりします。あるいは、アレンジされた曲や初めて聞く曲などについても、知っている曲と似ているとか似ていないとか感じたりします。

一方、近年は携帯音楽端末やインターネットを利用して音楽に接することが多くなり、音楽を便利に検索したいというニーズは高まっております。しかし、私たちが日常行っている、「あの演奏とあの演奏は同じ曲である」のような判断を計算機上で行うことは、現在の技術ではなかなか難しいものとなっています。

そこで、私は以下のような研究を進め、音響信号をキーとした音楽の検索を便利にすることをめざしています。

1. 周波数成分の修復
周波数成分は、音色や音の高さなど、音楽の音響信号を特徴づける重要な情報を含んでいますが、雑音や打楽器音などで簡単に消えてしまいます。消えてしまった周波数成分を、確率モデルを使うことで修復するという技術です。

2. 音楽使用区間検出
テレビやラジオなどで流れる音には、音楽が数多く含まれています。音楽音響信号に音楽が含まれているかどうかを検出する技術について研究しています。特に、BGMなど他の音の後ろに隠れた場合にも高い精度で検出することを目的としています。

3. 調や時間の変動に頑健な音楽検索
一つの楽曲が異なる調やテンポで演奏されることがあります。このような音楽が入力された場合にも、高い精度で見つけるための
検索技術の研究を、音響信号の自己類似度に着目して行っています。

角丸四角形: 研究テーマ