INFORMATION

2022-06-24
新しいHPはこちら
2021-05-21
オープンハウスで研究展示します。
NTT コミュニケーション科学基礎研究所オープンハウス2021
日時: 2021年6月3日(木), 12時よりオンライン開催
詳細はこちらをご覧下さい: http://www.kecl.ntt.co.jp/openhouse/2021/
2021-04-14
IJCNN2021に論文が採択されました。
D. Niizumi, D. Takeuchi, Y. Ohishi, N. Harada, K. Kashino,
"BYOL for Audio: Self-Supervised Learning for General-Purpose Audio Representation," IJCNN2021.
2021-3-17
産業技術総合研究所 人工知能セミナーにて講演しました。
大石 康智, "種類の異なるメディア情報を対応付けるクロスモーダル情報処理," Mar. 2021. (PDF)
2020-12-17
日本音響学会2021年春季研究発表会にて3件の共著発表があります。
安田 昌弘,大石 康智,齊藤 翔一郎,小泉 悠馬,
"分散マイク・分散カメラの空間位置情報を活用したマルチモーダルシーン分類," 1-1-24, Mar. 2021.
竹内 博俊, 大石 康智, 柏野 邦夫, 猿渡 洋,
"対象調波畳み込み," 2-1Q-1, Mar. 2021.
竹内 大起,大石 康智,小泉 悠馬, 仁泉 大輔, 原田 登, 柏野 邦夫
"音響説明文生成のためのキーワード推定サブタスクの効果," 3-1P-12, Mar. 2021.
2020-10-10
ICPR2020に論文が採択されました。
Y. Ohishi, Y. Tanaka, K. Kashino,
"Unsupervised Co-Segmentation for Athlete Movements and Live Commentaries Using Crossmodal Temporal Proximity," ICPR2020.
2020-9-1
DCASE2020 Workshopに論文が採択されました。
D. Takeuchi, Y. Koizumi, Y. Ohishi, N. Harada, K. Kashino,
"Effects of Word-Frequency based Pre- and Post- Processings for Audio Captioning," DCASE2020 Workshop.
2020-8-31
日本音響学会2020年秋季研究発表会にて3件の共著発表があります。
安田 昌弘,大石 康智,小泉 悠馬,原田 登,
"弱ラベルで示される特定の共起関係に基づいたクロスモーダル音検索," 2-1-2, Sep. 2020.
竹内 博俊, 柏野 邦夫, 大石 康智, 猿渡 洋,
"調波畳み込みの高速化," 3-U1-3, Sep. 2020.
伊藤 弘章,村田 伸,大石 康智,原田 登,
"非定常音を含む単変量時系列に対する動的モード分解を用いた特徴量抽出及び可視化の検討," 3-U2-8, Sep. 2020.
2020-7-25
Interspeech2020 (2020/10/25~2020/10/29)に主著1件、共著2件の論文が採択されました。
主著論文: Y. Ohishi, A. Kimura, T. Kawanishi, K. Kashino, D. Harwath, and J. Glass,
"Pair Expansion for Learning Multilingual Semantic Embeddings using Disjoint Visually-grounded Speech Audio Datasets,"
共著論文: M. Yasuda, Y. Ohishi, Y. Koizumi, and N. Harada,
"Crossmodal Sound Retrieval based on Specific Target Co-occurrence Denoted with Weak Labels,"
共著論文: H. Takeuchi, K. Kashino, Y. Ohishi, and H. Saruwatari,
"Harmonic Lowering for Accelerating Harmonic Convolution for Audio Signals,"
2020-7-1
音環境認識分野の主要な国際コンペティション「DCASE2020チャレンジ」の「説明文生成部門」にて
我々のNTTチームが世界一位を獲得しました。
Y. Koizumi, D. Takeuchi, Y. Ohishi, N. Harada, K. Kashino,
"The NTT DCASE2020 Challenge Task 6 System: Automated Audio Captioning with Keywords and Sentence Length Estimation (Technical Repor)," in Proc. DCASE 2020 - the Detection and Classification of Acoustic Scenes and Events 2020 Workshop (DCASE).
NTT Topicsもご覧ください。
2020-6-7
音学シンポジウム2020にて副実行委員長を務めました。
WebEXとRemoを利用して,オンライン開催を無事に完走しました。
参加者が約250名の想像以上の盛況ぶりでした。
2020-5-8
ICASSP2020 (オンライン開催)にて発表しました。
Y. Ohishi, A. Kimura, T. Kawanishi, K. Kashino, D. Harwath, and J. Glass,
"Trilingual Semantic Embeddings of Visually Grounded Speech with Self-attention Mechanisms," in Proc. ICASSP 2020 - 2020 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2020, pp. 4352–4356.
2020-3-17
日本音響学会2020年春季研究発表会(開催中止)にて共著発表しました。
竹内博俊, 大石康智, 川西隆仁, 柏野邦夫,
"環境音とラベル情報のデュアルエンコーダに基づくスペクトログラムマスクの生成," 日本音響学会2020年春季研究発表会, 2-P-14, pp. XXX-XXX, Mar. 2020.
2020-1-27
ICASSP2020 (2020/5/4~2020/5/8)に論文が採択されました。
Y. Ohishi, A. Kimura, T. Kawanishi, K. Kashino, D. Harwath, and J. Glass,
"Trilingual Semantic Embeddings of Visually Grounded Speech with Self-attention Mechanisms," 'Signal Processing for Multimedia Applications I', Lecture
2019-9-11
音響学会誌75巻9号 小特集「音環境理解の近年の動向:音響イベント分析及び音響シーン分析」にて、
「環境音分析の研究を促進させる競争型ワークショップ」というタイトルで記事を執筆しました。
2019-6-19
日経エレクトロニクス 2019年7月号にて、
オープンハウス2019の展示内容が2ページの記事で掲載されました。
NTTの「クロスモーダル」 幼児のように世界を理解
2019-5-31
電子情報通信学会 パターン認識・メディア理解研究会にて研究発表しました。
画像を説明する多言語音声データを利用したクロスモーダル探索
 大石康智,木村昭悟,川西隆仁,柏野邦夫,David Harwath,James Glass
発表資料を<国内研究会論文>に公開しました。
2019-05-30, 31
オープンハウスで研究展示しました。
NTT コミュニケーション科学基礎研究所オープンハウス2019
日時: 2019年5月30日(木)12:00-17:30/31日(金)9:30-16:00
会場: NTT京阪奈ビル(京都府相楽郡精華町) 入場無料
詳細はこちらをご覧下さい: http://www.kecl.ntt.co.jp/openhouse/2019/
2017-10-05
10月1日よりCS研に復帰しました。
▼2014年の活動記録
2014-10-01
10月1日よりNTTデータに異動します。
しばらく研究から離れますが今後ともどうぞよろしくお願いいたします。
2014-09-05
日本音響学会 第36回(2014年春季研究発表会)粟屋 潔学術奨励賞を受賞しました。
ひとえに皆様方の日頃よりのご支援ご鞭撻によるものと心から感謝する次第でございます。
ありがとうございました。
2014-09-05
日本音響学会2014年秋季研究発表会にて招待講演をさせていただきました。
スペシャルセッション 音声A/音声B/電気音響 [音によるシーン理解とその進展]
大石康智, "あらゆる音の検出・識別を目指して ~音響イベント検出研究の現在と未来~"
発表資料を<国内大会論文>に公開しました。
2014-08-26
音楽情報科学研究会 第104回研究発表会(夏のシンポジウム)
新博士によるパネルディスカッション IV 「新博士さんいらっしゃい!」にてパネリストをさせていただきました。
発表資料を<研究会論文>に公開しました。
2014-07-15
名古屋大学 大学院情報科学研究科メディア科学専攻 「音声音響行動情報処理特論」にて
音楽情報処理 ~Audio content-based music retrieval~ に関する特別講義をしました。
講義資料を<その他>に公開しました。
2014-06-05,06
NTT コミュニケーション科学基礎研究所オープンハウス2014
日時: 2014年6月5日(木)12:00-17:30/6日(金)9:30-16:00
会場: NTT京阪奈ビル(京都府相楽郡精華町) 入場無料
詳細はこちらをご覧下さい: http://www.kecl.ntt.co.jp/openhouse/2014/
2014-05-25
音学シンポジウム2014 ポスター賞を受賞しました。選出いただき、ありがとうございました。
2014-05-24,25
音学シンポジウム2014の実行委員・プログラム担当になりました。
また、ポスターセッションで研究発表しました。
大石康智, 持橋大地, 亀岡弘和, 柏野邦夫,
"ガウス過程回帰の混合エキスパートモデルを用いた歌声F0軌跡の予測と歌唱表現変換"
たくさんのご来場をありがとうございました。発表資料を<研究会論文>に公開しました。
2014-05-04~09
International Conference on Acoustics, Speech, and Signal Processing (ICASSP) 2014@Florence, Italyで研究発表しました。
Yasunori Ohishi, Daichi Mochihashi, Hirokazu Kameoka, Kunio Kashino,
"Mixture of Gaussian process experts for predicting sung melodic contour with expressive dynamic fluctuations"
Masahiro Nakano, Yasunori Ohishi, Hirokazu Kameoka, Ryo Mukai, Kunio Kashino,
"Mondrian hidden Markov model for music signal processing"
発表資料を<国際会議論文>に公開しました。
2014-03-10,11,12
日本音響学会2014年春季研究発表会にて研究発表しました。
大石康智, 持橋大地, 亀岡弘和, 柏野邦夫
"ガウス過程回帰の混合エキスパートモデルを用いた歌声F0軌跡の予測と生成"
大石康智, 亀岡弘和, 小野順貴, 石本祐一, 松井知子, 板橋秀一
"トピック遷移PLSAに基づくメルスペクトログラム生成モデルを用いた多言語音声分類手法の評価"
門脇健人, 大石康智, 石原達馬, 北条伸克, 亀岡弘和
"音声F0パターン生成過程の確率モデルに基づく非母国語話者音声の韻律補正"
発表資料を<国内大会論文>に公開しました。
2014-02-23,24
第102回情報処理学会 音楽情報科学研究会の
音楽と音楽情報処理の未来 – 第2弾 - 若手研究者によるひな壇トークに出演しました。
トークの様子はUSTREAMにてご覧になれます。
 

▼2013年の活動記録
2013-9-26
日本音響学会2013年秋季研究発表会にて代理で研究発表しました。
音響イベントとトピックを用いた 音響特徴量列の生成モデルに基づく音響シーン分析
 井本桂右, 大石康智, 植松尚, 大室仲
発表資料を<国内大会論文>に公開しました。
2013-9-22
IEEE International Workshop on MACHINE LEARNING FOR SIGNAL PROCESSING (MLSP) 2013@Southampton, United Kingdomで共著発表します。
Keisuke Imoto, Yasunori Ohishi, Hisashi Uematsu, Hitoshi Ohmuro, "Acoustic Scene Analysis Based On Latent Acoustic Topic And Event Allocation"
よろしくお願いします。
2013-9-1
SIGMUS第100回記念シンポジウムのスペシャルセッション「歌声情報処理最前線!!!」
研究発表しました。Ustreamで講演を御覧いただけます。
発表番号(22) 混合ガウス過程に基づく歌声音量軌跡の生成過程モデル
大石康智, 亀岡弘和, 持橋大地, 柏野邦夫
 
発表資料を<研究会論文>に公開しました。
2013-8-31
SIGMUS第100回記念シンポジウムのオープニングセッション「音楽と音楽情報処理の未来」
雑談しました。ありがとうございました。
2013-08-27
Interspeech2013@Lyon, Franceで共著発表します。
Hirokazu Kameoka, Kota Yoshizato, Tatsuma Ishihara, Yasunori Ohishi, Kunio Kashino and Shigeki Sagayama, "Generative modeling of speech F0 contours"
2013-6-6,7
研究発表およびデモシステムを展示しました。たくさんのご来場をありがとうございました!
展示名:知らない音も書き起こす ~ベイジアン半教師あり音響イベント認識~

NTT コミュニケーション科学基礎研究所オープンハウス2013
日時: 2013年6月6日(木)12:00-17:30/7日(金)9:30-16:00
会場: NTT京阪奈ビル(京都府相楽郡精華町) 入場無料
詳細はこちらをご覧下さい: http://www.kecl.ntt.co.jp/openhouse/2013/
2013-05-29
International Conference on Acoustics, Speech, and Signal Processing (ICASSP) 2013@Vancouver, Canadaで研究発表しました。
"Bayesian Semi-supervised Audio Event Transcription based on Markov Indian buffet process"
発表資料を<国際会議論文>に公開しました。
2013-03-13
日本音響学会2013年春季研究発表会で研究発表しました。
・mIBPに基づくベイジアン半教師付き音響イベントダイアライゼーション
・トピック遷移PLSAに基づくメルスペクトログラム生成モデルを用いた多言語音声分類の検討
発表資料を<国内大会論文>に公開しました。
2013-02-25
International Workshop on Digital Media Analysis, Search and Management (DMASM) 2013@UCSDで講演しました。
Yasunori Ohishi, NTT CS Labs
"Extracting Personal Characteristics from Singing Voice,"
講演資料を<その他>に公開しました。
2013-01-01
明けましておめでとうございます。今年もよろしくお願いします。

▼2012年の活動記録
2012-12-01
NTT研究所(R&D)採用2014 100ノ"ハタラク"に載りました。よろしくお願いします!
2012-11-8,9
NTT GROUP COLLECTION2012(名古屋会場)で研究デモしました。
展示タイトルは「歌のうまさ・らしさの見える化技術」でした~Nコレはこれで終了です。
沢山ご来場いただき、ありがとうございました!
2012-10-25,26
NTT GROUP COLLECTION2012(福岡会場)で研究デモしました。
2012-10-16,17
NTTドコモ 東海支社 モバイルエボリューション2012で研究デモしました。
2012-9-26,27
NTT GROUP COLLECTION2012(大阪会場)で研究デモしました。
2012-9-19
音響学会秋季研究発表会@信州大学でポスター発表しました。
論文とポスターを<国内大会論文>に公開しました。
2012-9-10
INTERSPEECH2012@Porland, Oregonで発表しました。
ポスターを<国際会議論文>に公開しました。
2012-8-21
NTT Technical review Digital LibraryにCS研オープンハウス2012のパネルが掲載されました!
2012-8-11
第96回音楽情報科学研究会 スペシャルセッション「音楽情報処理と機械学習」の講演スライドを
<研究会論文>に公開しました!ぜひ御覧ください。
2012-8-9
第96回音楽情報科学研究会(通称:夏シンポ)@金沢のスペシャルセッション「音楽情報処理と機械学習」
パネリストを務めることになりました!Ustream/ニコニコ生放送でも中継されますのでぜひ御覧ください。
2012-8-7
画像の認識・理解シンポジウム(MIRU2012)で共著発表しました。
2012-6-29
電子情報通信学会 パターン認識・メディア理解研究会@早大で口頭発表しました。
論文と講演スライドを<研究会論文>に公開しました!ぜひ御覧ください。
2012-6-12
オープンハウス2012のデモの様子がfacebook NTT Groupで紹介されました。
2012-6-8
オープンハウス2012のデモの様子がテレビ大阪『newsBIZ』で紹介されました。
2012-6-7
歌声の音高軌跡から譜面の要素と歌唱表現の要素を同時に取り出す技術が日経産業新聞で紹介されました。
日経産業新聞 2012年06月04日(月) 11面 「歌声から表現力評価」
2012-6-7
研究発表およびデモシステムを公開しました。ご来場いただき、ありがとうございました。
NTT コミュニケーション科学基礎研究所オープンハウス2012
日時: 2012年6月7日(木)12:00-17:30/8日(金)9:30-16:00
会場: NTT京阪奈ビル(京都府相楽郡精華町) 入場無料
詳細はこちらをご覧下さい: http://www.kecl.ntt.co.jp/openhouse/2012/
2012-3-30
ICASSP2012で共著発表します。よろしくお願いします。
2012-3-14
日本音響学会2012年春季研究発表会で口頭発表します。よろしくお願いします。
2012-2-3
第94回情報処理学会音楽情報科学研究会(SIGMUS)
スペシャルセッション: 歌声情報処理最前線!!で発表しました。ニコ生、USTで研究発表がライブ中継されました!
また論文と講演スライドを<研究会論文>に公開しました。御覧ください。

▼2011年の活動記録
2011-10-21
ホームページ更新

略歴

1981年12月 愛知県生まれ
2000年03月 愛知県立岡崎高等学校 卒業
2004年03月 名古屋大学工学部電気電子情報工学科 卒業
2009年03月 名古屋大学大学院情報科学研究科メディア科学専攻 修了
2009年04月 日本電信電話株式会社 入社
2014年10月 (株)NTTデータ 転籍
2017年09月 日本電信電話株式会社 復帰
現在、NTT コミュニケーション科学基礎研究所
メディア情報研究部 メディア認識研究グループに在籍


研究内容

研究業績

学位論文

学術論文

  1. 井本 桂右, 大石 康智, 植松 尚, 大室 仲, 小野 順貴, "逐次的な観測のための音響シーン分析手法の提案," 日本音響学会誌 72(6) pp. 293-305, 2016.

  2. H. Kameoka, K. Yoshizato, T. Ishihara, K. Kadowaki, Y. Ohishi, and K. Kashino, "Generative Modeling of Voice Fundamental Frequency Contours," IEEE/ACM Trans. Audio, Speech and Language Processing, Vol. 23, No. 6, pp. 1042–1053, 2015.

  3. 大石 康智, 後藤 真孝, 伊藤 克亘, 武田 一哉, "相平面に描かれる歌声の基本周波数軌跡:歌唱者の意図する音高目標値系列の推定とハミング検索への応用," 情報処理学会論文誌, vol. 49, no. 11, pp. 3789-3797, Nov. 2008.

  4. 大石 康智, 後藤 真孝, 伊藤 克亘, 武田 一哉, "スペクトル包絡と基本周波数の時間変化を利用した歌声と朗読音声の識別," 情報処理学会論文誌, vol.47, no. 6, pp. 1822-1830, June 2006.

学術レター

  1. 大石 康智, 伊藤 克亘, 武田 一哉, 藤井 敦, 板倉文忠, "事典コーパスを用いた単語階層関係の統計的解析," 情報科学技術レターズ, FIT2004, LF-001, Sept. 2004. (PDF) (Oral)

国際会議論文(査読あり)

  1. Yasunori Ohishi, Daichi Mochihashi, Hirokazu Kameoka, Kunio Kashino, "Mixture of Gaussian process experts for predicting sung melodic contour with expressive dynamic fluctuations," In Proc. International Conference on Acoustics, Speech and Signal Processing (ICASSP2014), pp.3742-3746, May 2014.  (PDF) (Poster)

  2. Masahiro Nakano, Yasunori Ohishi, Hirokazu Kameoka, Ryo Mukai, Kunio Kashino, "Mondrian hidden Markov model for music signal processing," In Proc. International Conference on Acoustics, Speech and Signal Processing (ICASSP2014), pp.2424-2428, May 2014.

  3. Keisuke Imoto, Yasunori Ohishi, Hisashi Uematsu, Hitoshi Ohmuro, "Acoustic Scene Analysis Based On Latent Acoustic Topic And Event Allocation," In Proc. International Workshop on Machine Learning for Signal Processing (MLSP 2013), Sep. 2013.

  4. Hirokazu Kameoka, Kota Yoshizato, Tatsuma Ishihara, Yasunori Ohishi, Kunio Kashino and Shigeki Sagayama, "Generative modeling of speech F0 contours," In Proc. International Conference on Spoken Language Processing (INTERSPEECH 2013), Aug. 2013.  (PDF)

  5. Yasunori Ohishi, Daichi Mochihashi, Tomoko Matsui, Masahiro Nakano, Hirokazu Kameoka, Tomonori Izumitani, Kunio Kashino, "Bayesian Semi-supervised Audio Event Transcription based on Markov Indian buffet Process," In Proc. International Conference on Acoustics, Speech and Signal Processing (ICASSP2013), June 2013.  (PDF) (Oral)

  6. Yasunori Ohishi, Hirokazu Kameoka, Daichi Mochihashi, Kunio Kashino, "A Stochastic Model of Singing Voice F0 Contours for Characterizing Expressive Dynamic Components," In Proc. International Conference on Spoken Language Processing (INTERSPEECH 2012), Sep. 2012.  (PDF) (Poster)

  7. Masahiro Nakano, Yasunori Ohishi, Hirokazu Kameoka, Ryo Mukai, Kunio Kashino, "Bayesian Nonparametric Music Parser," In Proc. International Conference on Acoustics, Speech and Signal Processing (ICASSP2012), pp. 461-464, Mar. 2012. (PDF) (Poster)

  8. Jun Takagi, Yasunori Ohishi, Akisato Kimura, Masashi Sugiyama, Makoto Yamada, Hirokazu Kameoka, "Automatic Audio Tag Classification via Semi-supervised Canonical Density Estimation," In Proc. International Conference on Acoustics, Speech and Signal Processing (ICASSP2011), pp. 2232-2235, May 2011. (PDF) (Poster)

  9. Yasunori Ohishi, Hirokazu Kameoka, Daichi Mochihashi, Hidehisa Nagano, Kunio Kashino, "Statistical Modeling of F0 Dynamics in Singing Voices Based on Gaussian Processes with Multiple Oscillation Bases," In Proc. International Conference on Spoken Language Processing (INTERSPEECH 2010), pp. 2598-2601, Sept. 2010. (PDF) (Oral)

  10. Hirokazu Kameoka, Jonathan Le Roux, Yasunori Ohishi, "A statistical model of speech F0 contours," ISCA Tutorial and Research Workshop on Statistical And Perceptual Audition (SAPA 2010), pp. 43-48, Sept. 2010. (PDF)

  11. Tatsuya Kako, Yasunori Ohishi, Hirokazu Kameoka, Kunio Kashino and Kazuya Takeda, "Automatic Identification for Singing Style Based on Sung Melodic Contour Characterized in Phase Plane," In Proc. International Conference on Music Information Retrieval, (ISMIR 2009), pp. 393-397, Oct. 2009. (PDF) (Poster)

  12. Yasunori Ohishi, Hirokazu Kameoka, Kunio Kashino, and Kazuya Takeda, "Parameter Estimation Method of F0 Control Model for Singing Voices," In Proc. International Conference on Spoken Language Processing (INTERSPEECH 2008), pp. 139-142, Sept. 2008. (PDF) (Poster)

  13. Ryoei Takahashi, Yasunori Ohishi, Norihide Kitaoka, and Kazuya Takeda, "Building and Combining Document and Music Spaces for Music Query-By-Webpage System," In Proc. International Conference on Spoken Language Processing (INTERSPEECH 2008), pp. 2020-2023, Sept. 2008. (PDF) (Oral)

  14. Ryoei Takahashi, Yasunori Ohishi, and Kazuya Takeda, "Associating document and acoustic spaces for a WEB-BGM system," In Proc. International Conference on Music Communication Science (ICoMCS 2007), Dec. 2007.

  15. Yasunori Ohishi, Masataka Goto, Katunobu Itou, and Kazuya Takeda, "A Stochastic Representation of the Dynamics of Sung Melody," In Proc. International Conference on Music Information Retrieval (ISMIR 2007), pp. 371-372, Sept. 2007. (PDF) (Poster)

  16. Yasunori Ohishi, Masataka Goto, Katunobu Itou, and Kazuya Takeda, "Automatic Discrimination between Singing and Speaking Voices for Flexible Music Retrieval System," The 152th Meeting of the Acoustical Society of America (ASA) / 4th Joint Meeting of the Acoustical Society of America and the Acoustical Society of Japan, Dec. 2006. (Oral)

  17. Yasunori Ohishi, Masataka Goto, Katunobu Itou, and Kazuya Takeda, "On the human capability and acoustic cues for discriminating the singing and the speaking voices," In Proc. International Conference on Music Perception and Cognition (ICMPC 2006), pp. 1831-1837, Aug. 2006. (PDF) (Oral)

  18. Yasunori Ohishi, Katunobu Itou, Kazuya Takeda, and Atsushi Fuji, "Statistical Analysis for Thesaurus Construction using an Encyclopedic Corpus," In Proc. Language Resources and Evaluation Conference (LREC 2006), pp. 1368-1371, May 2006. (PDF) (Poster)

  19. Yasunori Ohishi, Masataka Goto, Katunobu Itou, and Kazuya Takeda, "Discrimination between Singing and Speaking Voices," In Proc. European Conference on Speech Communication and Technology (EUROSPEECH 2005), pp. 1141-1144, Sept. 2005. (PDF) (Oral)

国内大会論文

  1. 大石康智, "あらゆる音の検出・識別を目指して --音響イベント検出研究の現在と未来--," 日本音響学会2014年秋季研究発表会, 3-8-1, pp. 1521-1524, Sep. 2014. (PDF) (Oral)

  2. 大石康智, 持橋大地, 亀岡弘和, 柏野邦夫, "ガウス過程回帰の混合エキスパートモデルを用いた歌声F0軌跡の予測と生成," 日本音響学会2014年春季研究発表会, 3-6-18, pp. 365-368, Mar. 2014. (PDF) (Oral)

  3. 大石康智, 亀岡弘和, 小野順貴, 石本祐一, 松井知子, 板橋秀一, "トピック遷移PLSAに基づくメルスペクトログラム生成モデルを用いた多言語音声分類手法の評価," 日本音響学会2014年春季研究発表会, 2-Q5-13, pp. 483-484, Mar. 2014. (PDF) (Poster)

  4. 門脇健人, 大石康智, 石原達馬, 北条伸克, 亀岡弘和, "音声F0パターン生成過程の確率モデルに基づく非母国語話者音声の韻律補正," 日本音響学会2014年春季研究発表会, 1-R5-23, pp. 431-434, Mar. 2014. (PDF)

  5. 井本 桂右, 大石 康智, 植松 尚, 大室 仲, "音響イベントとトピックを用いた 音響特徴量列の生成モデルに基づく音響シーン分析," 日本音響学会2013年秋季研究発表会, 2-1-11, pp. 647-650, Sep. 2013. (PDF) (Oral)

  6. 大石 康智, 持橋 大地, 松井 知子, 中野 允裕, 亀岡 弘和, 泉谷 知範, 柏野 邦夫, "mIBPに基づくベイジアン半教師付き音響イベントダイアライゼーション," 日本音響学会2013年春季研究発表会, 1-9-6, pp. 19-22, Mar. 2013. (PDF) (Oral)

  7. 大石 康智, 亀岡 弘和, 小野 順貴, 石本 祐一, 松井 知子, 板橋 秀一, "トピック遷移PLSAに基づくメルスペクトログラム生成モデルを用いた多言語音声分類の検討," 日本音響学会2013年春季研究発表会, 1-Q-43c, pp. 445-448, Mar. 2013. (PDF) (Poster)

  8. 大石 康智, 持橋 大地, 松井 知子, 中野 允裕, 亀岡 弘和, 泉谷 知範, 柏野 邦夫, "無限混合モデルを入れ子にしたmIBPに基づく音響イベント検出," 日本音響学会2012年秋季研究発表会, 1-P-22, pp. 775-778, Aug. 2012. (PDF) (Poster)

  9. 高木 潤, 杉山 将, 木村 昭悟, 八谷 大岳, 大石 康智,山田 誠, "簡易半教師付確率的分類器を用いたメディアアノテーション," 画像の認識・理解シンポジウム (MIRU2012) 予稿集, OS8-02, Aug. 2012.

  10. 大石 康智, 亀岡 弘和, 持橋 大地, 柏野 邦夫, "ノート指令と表現指令によって駆動される歌声F0生成過程の統計モデル," 日本音響学会2012年春季研究発表会, 2-11-6, pp. 345-348, Mar. 2012. (PDF) (Oral)

  11. 大石 康智, 亀岡 弘和, 持橋 大地, 永野 秀尚, 柏野 邦夫, "歌声F0系列からの楽譜逸脱成分の抽出 -動特性モデルに基づく楽譜との時間的対応付け-," 日本音響学会2011年秋季研究発表会, 1-8-19, pp. 279-282, Sep. 2011. (PDF) (Oral)

  12. 加古 達也, 大石 康智, 亀岡 弘和, 永野 秀尚, 柏野 邦夫, 武田 一哉, "合唱における歌声の基本周波数軌跡の分析," 日本音響学会2011年春季研究発表会, 1-Q-44, pp. 403-404, Mar. 2011. (PDF)

  13. 大石 康智, 亀岡 弘和, 持橋 大地, 永野 秀尚, 柏野 邦夫, "複数振動基底に基づく歌声のF0動特性の統計的モデリング," 日本音響学会2010年秋季研究発表会, 3-P-31, pp. 401-404, Sept. 2010. (PDF) (Poster)

  14. 加古 達也, 大石 康智, 亀岡 弘和, 永野 秀尚, 柏野 邦夫, 武田 一哉, "相平面確率モデルを利用した歌唱・楽器演奏の基本周波数軌跡の分析," 日本音響学会2010年秋季研究発表会, 3-P-29, pp. 397-398, Sept. 2010. (PDF)

  15. 亀岡 弘和, ルルー・ジョナトン, 大石 康智, "音声F0パターン生成過程の確率モデル," 日本音響学会2010年秋季研究発表会, 1-1-3, pp. 207-210, Sept. 2010. (PDF)

  16. 亀岡 弘和, 大石 康智, 持橋 大地, ルルー・ジョナトン, "マルチカーネル線形予測モデルによる音声分析," 日本音響学会2010年春季研究発表会講演論文集, 2-Q-24, pp. 499-502, Mar. 2010. (PDF)

  17. 平賀 悠介, 大石 康智, 武田 一哉, "楽曲間の主観的類似度と音響的類似度との関連付けに関する検討," 日本音響学会2009年秋季研究発表会講演論文集, 3-5-5, pp. 881-884, Sept. 2009. (PDF)

  18. 加古 達也, 大石 康智, 亀岡 弘和, 柏野 邦夫, 武田 一哉, "相平面確率モデルを用いた歌唱様式の自動分類に関する研究," 日本音響学会2009年秋季研究発表会講演論文集, 3-5-1, pp. 869-870, Sept. 2009. (PDF)

  19. 大石 康智, 亀岡 弘和, 柏野邦夫, 武田 一哉, "Convolutive HMMに基づく歌声の基本周波数制御モデルの提案とそのパラメータ最尤推定," 日本音響学会2008年秋季研究発表会講演論文集, 1-Q-25, pp. 379-382, Sept. 2008. (PDF) (Poster)

  20. 大石 康智, 後藤 真孝, 伊藤 克亘, 武田 一哉, "相平面を利用した歌声のF0軌跡の新しい表現方法," 電子情報通信学会総合大会, AS-5-2, pp. S-51--S-52, Mar. 2008. (PDF) (Oral)

  21. 高橋 量衛, 大石 康智, 北岡 教英, 伊藤 克亘, 武田 一哉, "楽曲のレビューと音響特徴量との関連付けの検討," 日本音響学会2007年春季研究発表会講演論文集,3-7-4, pp. 743-744, Mar. 2007. (PDF)

  22. 大石 康智, 後藤 真孝, 伊藤 克亘, 武田 一哉, "多項式カーネルを利用した歌声と朗読音声の識別特徴の分析," 日本音響学会2006年秋季研究発表会講演論文集, 2-7-9, pp. 595-596, Sept. 2006. (PDF) (Oral)

  23. 大石 康智, 後藤 真孝, 伊藤 克亘, 武田 一哉, "歌声と朗読音声の自動識別のための基本周波数の時間構造のモデル化に関する検討," 日本音響学会2006年春季研究発表会講演論文集, 2-4-14, pp. 289-290, Mar. 2006. (PDF) (Oral)

  24. 大石 康智, 後藤 真孝, 伊藤 克亘, 武田 一哉, "歌声と朗読音声の識別システム構築のための人間の識別能力の調査と考察," 日本音響学会2005年秋季研究発表会講演論文集, 2-7-10, pp. 77-78, Sept. 2005. (PDF) (Oral)

  25. 大石 康智, 宮島 千代美, 西野 隆典, 伊藤 克亘, 武田 一哉, 後藤 真孝, "基本周波数とスペクトル包絡情報を利用した歌声と読み上げ音声の識別に関する検討," 日本音響学会2005年春季研究発表会 講演論文集, 2-Q-9, pp. 115-116, Mar. 2005. (PDF) (Poster)

研究会論文

  1. 大石 康智, 木村 昭悟, 川西 隆仁, 柏野 邦夫, David Harwath, James Glass, "画像を説明する多言語音声データを利用したクロスモーダル探索," 電子情報通信学会技術研究報告, PRMU2019-11, pp. 283-288, May 2019. (PDF) (Oral)

  2. 川西 隆仁, 永野 秀尚, 森 稔, 武 小萌, 大石 康智, 平松 薫, 柏野 邦夫, "デジタルメディアコンテンツ流通を支えるメディア指紋技術とその活用事例," 信学技報, vol. 117, no. 397, IN2017-85, pp. 83-83, Jan. 2018

  3. 竹川 佳成, 平田 圭二, 糸山 克寿, 大石 康智, 橘 秀幸, 寺澤 洋子, 土井 啓成, 平野 砂峰旅, 深山 覚, 松原 正樹, "新博士によるパネルディスカッション IV 「新博士さんいらっしゃい!」," 情報処理学会研究報告, 2014-MUS-104-12, Aug. 2014. (PDF) (Oral)

  4. 大石 康智, 持橋 大地, 亀岡 弘和, 柏野 邦夫, "ガウス過程回帰の混合エキスパートモデルを用いた歌声F0軌跡の予測と歌唱表現変換," 情報処理学会研究報告, 2014-MUS-103-49, May. 2014. (PDF) (Poster)

  5. 亀岡 弘和, 饗庭 絵里子, 大石 康智, 北原 鉄朗, 北村 達也, 佐藤 庄衛, 戸上 真人, 戸田 智基, 吉井 和佳, "音学シンポジウム2014の開催にあたって," 電子情報通信学会技術研究報告, SP2014-1, May 2014. (PDF)

  6. 大石 康智, 持橋 大地, 亀岡 弘和, 柏野 邦夫, "混合ガウス過程に基づく歌声音量軌跡の生成過程モデル," 情報処理学会研究報告, 2013-MUS-100-22, Sep. 2013. (PDF) (Oral)

  7. 大石 康智, "スペシャルセッション「音楽情報処理と機械学習:歌声スタイルモデリング」," 音楽情報科学研究会, Aug. 2012. (Oral)

  8. 大石 康智, 持橋 大地, 松井 知子, 中野 允裕, 亀岡 弘和, 泉谷 知範, 柏野 邦夫, "ノンパラメトリックベイズアプローチに基づく音響イベント検出," 電子情報通信学会技術研究報告, PRMU2012-29, pp.37-42, June 2012. (PDF) (Oral)

  9. 中野 允裕, 大石 康智, 亀岡 弘和, 向井 良, 柏野 邦夫, "モンドリアンHMMによる音楽信号の解析," 電子情報通信学会技術研究報告, PRMU2012-28, pp.31-36, June 2012.

  10. 大石 康智, 亀岡 弘和, 持橋 大地, 柏野 邦夫, "歌唱における表現意図を考慮した歌声F0生成過程とその統計的モデリング," 情報処理学会研究報告, 2012-MUS-94-11, Feb. 2012. (PDF) (Oral) (SampleVideo)

  11. 高木 潤, 大石 康智, 木村 昭悟, 杉山 将, 山田 誠, 亀岡 弘和, "半教師付き正準密度推定法に基づく音響信号の自動タグ付けと検索," 電子情報通信学会技術研究報告, PRMU2010-126, pp.1-6, Dec. 2010. (PDF)

  12. 大石 康智, 亀岡 弘和, 持橋 大地, 永野 秀尚, 柏野 邦夫, "線形2次系を利用した歌声のF0ダイナミクスの統計的モデル化と分析," 電子情報通信学会技術研究報告, vol. 110, no. 297, SP2010-80, pp.65-70, Nov. 2010. (PDF) (Oral)

  13. 高木 潤, 大石 康智, 木村 昭悟, 杉山 将, 亀岡 弘和, "半教師付き正準密度推定法に基づく音響信号の自動タグ付けと検索," 第13回情報論的学習理論ワークショップ(IBIS2010), Sept. 2010.

  14. 大石 康智, 亀岡 弘和, 持橋 大地, 永野 秀尚, 柏野 邦夫, "Vocal Dynamics Controller: 歌声のF0動特性をノート単位で編集し, 合成できるインタフェース," 情報処理学会研究報告, 2010-MUS-86-9, July 2010. (PDF) (Oral)

  15. 亀岡 弘和, ルルー ジョナトン, 大石 康智, 柏野 邦夫, "Music Factorizer: 音楽音響信号をノート単位で編集できるインタフェース," 情報処理学会研究報告, 2009-MUS-81-9, July 2009. (PDF)

  16. 加古 達也, 大石 康智, 亀岡 弘和, 柏野 邦夫, 武田 一哉, "相平面に描かれるF0の動的変動成分を利用した歌唱様式の自動分類," 情報処理学会研究報告, 2009-MUS-81-4, July 2009. (PDF)

  17. 平賀 悠介, 大石 康智, 武田 一哉, "主観評価に基づく楽曲間類似度の算出モデル," 情報処理学会研究報告, 2009-MUS-81-2, July 2009. (PDF)

  18. 大石 康智, 亀岡 弘和, 柏野 邦夫, 武田 一哉, "畳み込みHMMに基づく歌声の基本周波数制御モデルの提案とそのパラメータ学習方法," 情報処理学会研究報告, 2008-MUS-76-16, Aug. 2008. (PDF) (Oral)

  19. 伊藤 弘章, 大石 康智, 宮島 千代美, 北岡 教英, 武田 一哉, "ベイジアンネットワークを用いたバイナリマスキングに基づく音源分離," 情報処理学会研究報告, 2008-SLP-72-10, July 2008. (PDF)

  20. 西村 竜一, 伊藤 丈一, 内村 佳典, 川添 正人, 剣持 秀紀, 浜中 雅俊, 宮本 賢一, 梅本 暁, 森勢 将雅, 中野 倫靖, 大石 康智, 高橋 量衛, 野池 賢二, 戸田 智基, 梶 克彦, "デモンストレーション:音楽・音声言語情報処理の研究紹介," 情報処理学会研究報告, 2008-SLP-74-11, Feb. 2008. (PDF) (Oral)

  21. 高橋 量衛, 大石 康智, 北岡 教英, 伊藤 克亘, 武田 一哉, "Webから収集した楽曲を説明するテキストと楽曲の音響特徴量との関連づけに関する検討," 情報処理学会研究報告, 2007-MUS-72-9, Oct. 2007. (PDF)

  22. 大石 康智, 後藤 真孝, 伊藤 克亘, 武田 一哉, "歌声の旋律と動的変動を特徴付けるための確率的な表現手法に関する検討," 情報処理学会研究報告, 2007-MUS-71-19, Aug. 2007. (PDF) (Oral)

  23. 浜中 雅俊, 竹川 佳成, 岩井 憲一, 高橋 直也, 中野 倫靖, 大石 康智, 糸山 克寿, 北原 鉄朗, 吉井 和佳, "デモンストレーショ ン:若手による研究紹介 IV," 情報処理学会研究報告, 2006-MUS-67-3, Oct. 2006. (PDF) (Oral)

  24. 大石 康智, 後藤 真孝, 伊藤 克亘, 武田 一哉, "音声だけでシームレスにハミング検索と曲名検索が可能な楽曲検索システム," 情報処理学会研究報告, 2006-MUS-67-2, Oct. 2006. (PDF) (Oral)

  25. 大石 康智, 伊藤 克亘, 武田 一哉, 藤井 敦, "単語の共起関係と構文情報を利用した単語階層関係の統計的自動識別," 情報処理学会研究報告, 2006-MUS-61-5, May 2006. (PDF) (Oral)

  26. 大石 康智, 後藤 真孝, 伊藤 克亘, 武田 一哉, "局所的・大局的な特徴を利用した歌声と朗読音声の識別," 情報処理学会研究報告, 2005-MUS-61-1, Aug. 2005. (PDF) (Oral)

その他の記事

  1. 大石 康智(分担執筆), "音響イベント検出," 人工知能学大辞典, 共立出版, July 2017.

  2. 大石 康智(分担執筆), "音響イベント検出," 音響キーワードブック, コロナ社, II-26, Mar. 2016.

  3. 大石 康智, "音楽情報処理 ~Audio content-based music retrieval~," 名古屋大学情報科学研究科メディア科学専攻 音声音響行動情報処理特論, July 2014. (Lecture)

  4. Yasunori Ohishi, "Extracting Personal Characteristics from Singing Voice," Digital Media Analysis, Search and Management (DMASM) 2013, Feb. 2013. (Oral)

  5. Yasunori Ohishi, "Singing style extraction based on singing voice F0 model," NTT Technical review Digital Library, Aug. 2012.

  6. 大石 康智, "研究会推薦博士論文:多様な歌唱様式を予測・説明する歌声音響信号の分析合成モデルとその応用に関する研究," 情報処理学会学会誌, Vol. 52, No. 6, p. 2, May 2011.

  7. 大石 康智, 後藤 真孝, 武田 一哉, "歌声と話声はどう違うか? 人間の"声"を理解するコンピュータの実現を目指して," 寺島情報企画, DTMマガジン2009年3月号, pp.108-109, Feb. 2009.

  8. 大石 康智, "文献紹介:Bonada, J. and Serra, X.: Synthesis of the singing voice by performance sampling and spectral models(副題:初音ミクはどのようにして歌を歌うの? 誰でも使いやすい歌声合成システム「VOCALOID」の舞台裏)," 人工知能学会学会誌, vol. 24, no.2, pp.325-328, Mar. 2009.

受賞

所属学会

趣味

リンク

連絡先

ohishi.yasunori{at}lab.ntt.co.jp