|
|
文献概要
下記印刷物を御利用の方は,該当印刷物の copyright notice を御参照の上,
akisato <at> eye brl ntt co jp まで御一報下さい.
木村昭悟
[特別講演]
"大規模マルチメディア解析コーパスとしてのsocial curationの可能性",
[ presentation material ]
[
copyright notice ]
- Abstract
-
SNSで取り扱われるメディアは,従来から存在するマイクロブログ形式のテキストから,画像・映像等のマルチメディアコンテンツを含むものへ遷移し拡大してきている.これらSNS上のコンテンツは,ユーザ間の関係性や位置情報など,コンテンツの内容を知る上で非常に有用な補助情報が多数含まれている一方で,そのコンテンツがあまりにも膨大かつ多様であるため,自動的に解析することが容易ではない.
本講演では,上記に示した有用性と問題点とのトレードオフを解決しうる1つの可能性として,social curationに着目する.Social curationとは,SNS上のコンテンツを編集して新たなコンテンツを創る手動作業のことである.すなわち,このsocial curation後のコンテンツは,それ以前のコンテンツよりもはるかに洗練され,有用な情報が凝縮され,内容が絞り込まれている.このことは,コンテンツを解析する上でのコーパスとしての可能性を示すものである.上記の議論を踏まえ,本講演では,social curationに関する近年の動向,及びそのマルチメディアコンテンツ解析への利活用について,概観する予定である.
竹内孝, 石黒勝彦, 木村昭悟,澤田宏
"sNMF: 非負値制約下における複数行列の同時分解法 - ソーシャルメディア解析を応用例として -",
電子情報通信学会技術報告, IBISML2012-43, 東京都文京区, 2012年11月
[ poster ]
[
copyright notice ]
- Abstract
-
本稿では、非負制約下における複数行列の同時分解法 (Stacked Non-negative Matrix Factorization: sNMF) を提案する.sNMFは, 行列同士の関係性を利用して複数の非負行列を同時に分解する手法であり, NMFを一般化したモデルとして定式化される.sNMFは, 欠損値有りNMFの特殊な例とも解釈できる.本稿では, データマイニングの分野で関心を集めている, ソーシャルメディアからの話題トピックと話題に関するユーザクラスタの同時抽出問題にsNMFを適用した.NMFと比較して, 定量的にも定性的にもsNMFの利用によって解析精度が向上することが判明した.
坂野鋭,大橋司, 木村昭悟,澤田宏
"自己相関構造を考慮した判別分析",
情報論的学習理論ワークショップ (IBIS2012) ,D-46,東京都文京区,2012年11月
[ poster ]
[ copyright notice: 著作権は著者に帰属します ]
- Abstract
-
To appear.
坂野鋭,大橋司, 木村昭悟,澤田宏
"判別分析における分布記述詳細化の試み",
画像の認識・理解シンポジウム (MIRU2012) 予稿集,IS3-45,
福岡県福岡市,2012年8月
[ PDF ] [ poster ]
[
copyright notice: 著作権は著者に帰属します ]
- Abstract
-
Fisher の線形判別分析は広く使われている識別法,特徴抽出法である
が,抽出できる特徴次元数がクラス数未満であるという制約のために
認識精度の低下を引き起こすことがあった.この問題は判別分析に
於いてクラスの情報が平均値のみに代表されるということに起因する.
この問題に対し,クラスごとの分布の広がりを級間分散行列に反映
させることを検討した.具体的には各クラスの原点から見た分布を
自己相関行列の固有ベクトルで表現し,クラスの異なる固有ベクトル
同士の広がりを級間分散行列と同様の方法で表現し,これを級間分散に
加えた.この方法により原空間から抽出出来る特徴次元数がクラス数を
超えることが可能になる.MNIST 手書き文字データベース及びUCI
Machine Learning Repository から選んだいくつかのデータを用いた
評価により,提案手法の可能性を示すことが出来た.
石黒勝彦, 木村昭悟,竹内孝
"Social curationを用いた画像コンテンツの内容評価モデル - 画像特徴亮を利用しない画像コンテンツ理解 -",
画像の認識・理解シンポジウム (MIRU2012) 予稿集,IS3-23,
福岡県福岡市,2012年8月
[ PDF ] [ poster ]
[
copyright notice: 著作権は著者に帰属します ]
- Abstract
-
Social Network Service(SNS)上で流通する画像・動画像コンテンツは
まったく統制されていないため,最新の画像認識・処理技術を利用
しても各コンテンツの自動内容理解・評価は非常に困難である.そこで,
本論文ではSNSのユーザによる人手のコンテンツ集積・フィルタリング
結果であるSocial Curationサービスのもつ非画像特徴量を利用して
この課題に取り組むことを提案する.Social Curation サービスでは,
各ユーザが個々の目的のためにSNS情報を収集・選択しリストとして
公開する.従って,同一のリストに含まれる画像は,同一の
コンテキストの元で価値があるとユーザによってフィルタリングされた
ことになる.また,そのコンテンツの内容や価値はリスト内の文書
(自然言語) 情報やネットワーク(リンク数など) から推測可能と予測
される.本論文の貢献は2 点ある.まず1 点目は,これまで研究されて
こなかったSocial Curation サービスのデータが画像・動画コンテンツ
についてどのような統計量を持っているかを調査することである.
2点目は,Social Curation データが画像認識の新しいソースとして
有用であるかどうかを検証することである.本論文では,具体的に
コンテンツの期待閲覧回数を予測するタスクにおいて,Social
Curation サービスの情報と従来の画像特徴量の精度を比較検証した.
結果,画像特徴量を用いる場合に比べて平均二乗誤差をおよそ半分
程度にまで低減させることに成功した.
米谷竜, 木村昭悟,坂野鋭,福地賢
"深度画像推定を用いた自動物体セグメンテーション",
画像の認識・理解シンポジウム (MIRU2012) 予稿集,OS14-04,
福岡県福岡市,2012年8月
[ PDF ] [ presentation material ]
[ poster ]
[
copyright notice: 著作権は著者に帰属します ]
- Abstract
-
画像中から所望の物体領域を全自動で切り出す自動物体
セグメンテーションの問題に対して,画像の色情報と深度情報を統合
して用いる新たな枠組みを提案する.深度情報を利用することにより,
物体と類似した色やテクスチャが含まれる背景下においても,物体
のみを安定に切り出すことが可能である.本研究で提案する
セグメンテーション手法は,マルコフ確率場を用いた従来手法を
ベースに,各ピクセルにおける物体・背景らしさに関する尤度の計算に
おいてカラー画像および深度画像から得られた両情報を利用する.
このとき,提案手法は入力されたカラー画像から推定された深度画像を
用いるため,セグメンテーションにおいて実際の深度画像を必要と
しない.評価実験の結果,色情報のみを用いる従来手法に対する提案
手法の有効性を確認した.
高木潤,杉山将, 木村昭悟,八谷大岳,大石康智,山田誠
"簡易半教師付確率的分類器を用いたメディアアノテーション",
画像の認識・理解シンポジウム (MIRU2012) 予稿集,OS8-02,
福岡県福岡市,2012年8月
[ PDF ]
[ presentation material ]
[
copyright notice: 著作権は著者に帰属します ]
- Abstract
-
本論文では,与えられた画像や音楽に適切なテキストラベルを自動的に
付与するメディアアノテーション問題に対して,機械学習的,特に識別
学習に基づくアプローチで取り組む.この問題に対し,本論文では,
半教師的にかつ簡易に分類器を設計できる新しい識別学習手法である,
ラプラシアン最小二乗確率的分類器(L-LSPC),及びその高速学習法を
提案する.このL-LSPC を,少数のラベル付メディアから得られる
メディアとラベルとの共起情報と,大量のラベルなしメディアから
得られる大域的な分布構造との双方を同時に考慮した潜在変数空間に
適用することで,ラベル間の相関を強く考慮しつつ,精度の高い
アノテーションを可能にする.画像・音響データセットを用いた実験
により,ラベル付メディアが少数しかない状況下でも,大量のラベル
なしメディアを活用して認識精度を大幅に向上でき,かつ主要な従来
手法と比較して有意に高い精度を示した.
木村昭悟,数原良彦,高橋寛幸,横山達彦
"画像検索でのユーザ行動を利用した大規模画像アノテーション",
画像の認識・理解シンポジウム (MIRU2012) 予稿集,OS5-02,
福岡県福岡市,2012年8月
(フロンティア論文賞候補)
[ PDF ] [ presentation material ]
[ poster ]
[
copyright notice: 著作権は著者に帰属します ]
- Abstract
-
本研究では,画像検索サーバのログを利用することで,画像そのもの
から得られる特徴量等の情報を一切用いずに,画像及びそれに関連する
テキストタグを大量かつ高精度に収集するための初期検討について
報告する.特に,画像検索のランキング学習などでよく用いられる画像
クリックの情報だけではなく,クエリやページ遷移など検索サーバの
ログから得られる様々な情報を有効活用する.これらの情報を併用する
ことにより,クリックログのみからでは得られなかった,クリックの
重要性やユーザ行動の意図なども推定できると期待される.実データを
用いた初期的な実験として,手動でラベル付けを行った画像に対する
アノテーション精度を評価し,有効性を確認した.
木村昭悟, 米谷竜,平山高嗣
"[サーベイ発表] 人間の視覚的注意の計算モデル",
電子情報通信学会 技術報告, PRMU2011-255,
兵庫県神戸市, 2012年3月
[ presentation material ]
[
copyright notice ]
- Abstract
-
人間は,網膜に映る映像の中から重要と思われる領域を瞬時に判断
することで,効率的に情報を獲得している.この視覚的注意と呼ば
れる機能を計算機上で実現することができれば,人間と同様に重要性
に応じて映像中の情報を能動的に取捨選択でき,数多くの映像処理
システムをより高度化できると期待される.本講演では,人間の視覚
的注意を計算機上で模擬するための数々の方法とその発展について,
心理物理学的な知見を交えながら解説する.
米谷竜, 木村昭悟,坂野鋭,福地賢
"シーンの色情報と深度情報の統合による自動物体セグメンテーション",
電子情報通信学会 技術報告, PRMU2011-158,
大阪府寝屋川市, 2012年1月
[ presentation material ]
[
copyright notice ]
- Abstract
-
画像中から所望の物体領域を抽出する物体セグメンテーション問題に
対して,画像の色情報と画像から推定された深度情報を統合して
用いる手法を提案する.深度情報が物体と背景を分ける重要な手がかり
である一方で,深度画像の空間的な連続性が色画像のものとしばしば
異なる点が問題となる.これに対して提案手法では,グラフカットに
基づく従来のセグメンテーションを応用し,各ピクセルの物体/背景
らしさを,色画像および深度画像から推定された色尤度と深度尤度の
重みづけ和を用いて評価する.このとき色尤度に対して深度尤度の
重みを小さく設定することで,入力画像を色情報に基づいてセグメン
テーションしつつ,補助的に用いられる深度情報によって物体領域と
類似色をもつ背景領域の誤検出が抑制できる.
梶野洸, 木村昭悟,石黒勝彦
"マルチモーダル情報を用いたトピックモデルによる映像分類",
情報論的学習理論ワークショップ (IBIS2011),奈良県奈良市,
2011年11月
[ short talk ]
[ poster ]
[ copyright notice: 著作権は著者本人に帰属します。]
- Abstract
-
本研究では,映像のカテゴリ分類の一実現手法として,トピックモデル
の一つであるLatent Dirichlet Allocation (LDA) を,マルチモーダル
情報を考慮した形に拡張した生成モデルとその推定方法を提案する.
まず,マルチモーダル情報を用いたモデルの性質を考察するために,
画像信号のみを用いたモデル,音響信号のみを用いたモデル,双方
ともに用いたモデルの三つについて,TRECVID Semantic indexing
taskのデータを用いて,比較検証を行った.この検証結果から得られた
知見を基に,画像信号・音声信号それぞれに対するトピックを考慮した
モデルを構築し,そのモデルについて,パラメータ学習及びカテゴリ
分類のためのアルゴリズムを,変分法を用いて導出する.
大橋司, 木村昭悟,坂野鋭,澤田宏
"仮想クラス生成に基づく正準相関分析への特徴追加",
情報論的学習理論ワークショップ (IBIS2011),奈良県奈良市,
2011年11月
[ short talk ]
[ poster ]
[ copyright notice: 著作権は著者本人に帰属します。]
- Abstract
-
画像におけるマルチラベル分類問題において,正準相関分析の有用性が
知られている.マルチラベル分類への正準相関分析の適用は,画像の
特徴ベクトルと2値マルチラベルベクトルの相関を求める意味で自然な
発想である.その一方で,特徴ベクトルは高度に複雑な分布を持ちうる
にもかかわらず,正準相関分析では高々クラス数-1次元の線形判別問題
としてしか扱うことができない.
この問題に対処するために,正準相関分析の特殊例である判別分析に
対しては,従来より様々な特徴追加手法が考案されてきた.例えば,
Gram-Schmidt正規直交化を適用する方法,判別空間の補空間をさらに
判別分析する方法などが知られている.
本研究では,従来とは異なる形での特徴追加方法を提案する.提案手法
の基本的なアイディアは,特徴そのものではなく,「仮想クラス」と
いう形で新しいクラスを追加することにある.これにより,クラス間の
相関をより明示的に扱いうる複雑な識別面を構成することが可能と
なる.発表では,具体的な仮想クラスの生成方法を提案すると共に,
画像のマルチラベル分類データを用いて実験的に評価を行った結果を
議論する.
木村昭悟, 杉山将, 亀岡弘和,
坂野鋭
"拡張ペアワイズ表現を用いた一般化多変量解析",
画像の認識・理解シンポジウム (MIRU2011) 予稿集,
石川県金沢市、2011年7月
[ PDF ] [ presentation material ] [ Copyright notice ]
- Abstract
-
主成分分析(PCA)・Fisher 線形判別分析(FDA)・線形回帰分析(MLR)・正準相関
分析(CCA) など,多変量解析に基づく次元削減手法,及びカーネルトリックを
用いたそれらの非線形拡張が,(一般化)固有値問題を解くことで実現される
ことは広く知られている.本論文では,まず,上記の多変量解析を統一的な
視点で捉えるための枠組として,拡張ペアワイズ表現と呼ぶ共分散行列や
グラム行列に関する新しい表現形式を導入した多変量解析の一般化について
議論する.この枠組は,上記一連の多変量解析だけではなく,L2 ノルム正則化
・graph Laplacian・局所線形判別分析(LFDA) など解に望ましい性質を加える
各種方法や,教師情報が不足している状況下での半教師付き次元削減をも,
その特殊例として含む汎用的かつコンパクトな表現形式となっている.本論文
では,この枠組の中で具体的な解析手法を設計する指針についても提示する.
この指針では,上記の標準的な多変量解析手法やその各種拡張を設計の
テンプレートとして利用し,それを適切に組み合わせるだけで解析手法を設計
できることを示している.さらに,この設計指針に基づいて具体的に生成した
新しい多変量解析手法を提案すると共に,その有効性を一般物体認識を題材と
して示す.
木村昭悟, 亀岡弘和, 柏野邦夫
"音や映像から「部品」を取り出す
メディアシーン学習技術",
NTT技術ジャーナル,
Vol.22, No.9, pp.16-19, 2010年9月
[ PDF ]
- Abstract
-
与えられた音や映像から,その主要な構成要素である「聞こえる音」
「映っているもの」を自動的に取り出す「メディアシーン学習」の
研究を進めています.その中から特に,音の生成過程に着目して
混合音を解析するCARS法と,人間の視覚特性に基づいて映像から
物体領域を抽出するSBIL法について紹介します.
木村昭悟, 南泰浩, 坂野鋭,
前田英作, 杉山弘晃
"対話的映像認識理解における動的学習戦略に関する試み",
電子情報通信学会 技術報告, PRMU2010-135,
山口県山口市, 2010年12月
[ presentation material ]
[
copyright notice ]
- Abstract
-
人間は、特に意識をしなくとも、見た映像を理解し言語化できる。
しかし、これらのタスクを計算機に代行させる映像認識/理解は、
パターン認識分野における早期からの最重要課題の1 つであり
ながら、未だ本質的な解決に至っていない。ただ、人間もこれらの
能力を先天的に兼ね備えているとは考えにくく、その大部分が成長の
過程で後天的に身に付けていくと考えられる。本報告では、認知発達
的アプローチに基づく映像認識理解の枠組について議論した昨年の
報告、及び近年の関連研究の動向などを踏まえた上で、映像認識理解
のための能力や知識を獲得する戦略のあり方について言及する。
特に、戦略構築の過程において必然的に人間がその系の中に取り込ま
れる強化学習としての側面、及びその際に人間のみならず計算機自身
に適応する形で戦略の基本構造が動的に変化する点について、より
具体的に踏み込んだ議論を行う。
木村昭悟
[Invited]
"人間の視覚的注意の確率モデル: 動的ベイジアンネットワークに基づく
最新のアプローチ",
信号処理シンポジウム予稿集,
pp.314--319, 奈良県奈良市, 2010年11月
[ PDF ]
[
Presentation material ]
[ copyright notice: 著作権は著者に帰属します。 ]
- Abstract
-
人間は、網膜に映る映像の中から重要と思われる領域を瞬時に判断
することで、効率的に情報を獲得している。この機能を計算機上で
実現することができれば、人間と同様に重要性に応じて映像中の
情報を能動的に取捨選択でき、数多くの映像処理システムをより高度
化できると期待される。本講演では、人間の映像注視行動を高速かつ
高精度に模擬するための新しい視覚的注意の確率的な計算モデルに
ついて解説すると共に、ここから派生する新たな問題について言及し
議論する。
高木潤、大石康智、 木村昭悟、
杉山将、亀岡弘和
"半教師付き正準密度推定法に基づく音響信号の自動タグ付けと検索",
電子情報通信学会 技術報告, PRMU2010-126,
山口県山口市, 2010年12月
[ presentation material ]
[
copyright notice ]
情報論的学習理論ワークショップ (IBIS2010), P5-27,
東京都世田谷区, 2009年11月
[ short talk ]
[ poster ]
[ copyright notice: 著作権は著者本人に帰属します。]
- Abstract
-
メディア情報へアクセスする方法として最も一般的な方法は、それら
にあらかじめ付与されたメタデータ・キーワードなどのテキストタグ
を活用する方法である。しかし、タグが付与されていないメディア
情報は未だに膨大に存在し、一方でこれらメディア情報に的確なタグ
を手動で付与することは膨大な手間を要する。上記の背景に基づき、
少量のタグ付きメディア情報と多量のタグなしメディア情報とから、
タグなしメディア情報に付与されるべきタグを統計的に推測しつつ、
これらのメディア情報をユーザの問い合わせに応じて提示・検索
する、「半教師型」のメディア情報認識検索技術について検討する。
本研究では、対象とするメディア情報として音響信号を想定し、正準
相関分析(CCA)とカーネル密度推定を組み合わせたトピックモデル
推定を行うことにより、タグ間の共起関係をも考慮できることが本
研究の特徴でもある。約2000曲の音響信号に対して手動でタグ付け
された音楽データベースを用いて評価実験を行ったところ、提案法
が、全て教師ありで学習する従来法と同等以上の自動タグ付け性能を
もつこと、また、これまで我々が提案した半教師型の学習法「Semi
CCA」に比べて、さらにカーネル密度推定を組み合わせた提案法が、
自動タグ付け性能を向上させることを確認した。
中野拓帆, 木村昭悟, 嵯峨山茂樹, 亀岡弘和, 宮部滋樹, 小野順貴,
柏野邦夫, 西本卓也
"モーダル間共起を考慮した階層的トピック軌跡モデルによる
映像認識検索",
電子情報通信学会 技術報告, IBISML2010-**,
東京都世田谷区, 2010年11月
[ short talk ]
[ poster ]
[
copyright notice ]
- Abstract
-
本報告では、与えられた映像に適合するメタ情報を提示する映像認識
(automatic video annotation) と、与えられたメタ情報に適合する
映像を提示する映像検索 (video retrieval) とを、統一的な枠組で
取り扱う映像認識検索問題を取り上げ、そのための統計モデルである
階層的トピック軌跡モデル HTTM を提案する。提案モデルは、各
モーダル及びモーダル間の共起関係を考慮したトピックモデルと、
その時空間的ダイナミクスを表現する状態空間モデルとによって構成
され、映像におけるインスタンス・シーン・コンセプトを階層的に
表現する。このモデルに基づき、モデル推定・映像認識・映像検索
それぞれを簡易に実現できると共に、音響信号や地理情報など
他のモーダルを新規に導入する拡張も容易である。
赤嶺一馬, 福地賢, 木村昭悟, 高木茂
"近実時間での映像顕著領域の自動抽出",
to appear, 画像の認識・理解シンポジウム (MIRU2010) 予稿集,
IS3-4, 北海道釧路市, 2010年7月
[ PDF ] [ Poster ]
[
copyright notice ]
- Abstract
-
映像の中から物体と背景を分割する処理は,物体検出や画像合成など
で重要な技術の一つである.近年,人間の視覚特性に基づいて算出
される映像顕著性を手がかりとして用い,グラフカットにより自動
的に物体と背景の分割を行う手法が各種提案されている.一方で,
これらの手法は,映像顕著性の算出やグラフカットに非常に計算量を
必要とし,比較的低解像度な画像であっても,リアルタイムには程
遠い処理時間を要する点が問題である.しかし,これらの手法の多く
の処理は本質的には多数の画像処理の組み合わせで構成されている
ため,画素ごともしくはそれに類する単位で各部分の処理を並列
演算に展開し,多数のコアをもつハードウェアの上で実行させる
ことにより,手法全体の高速化が期待できる.本研究では,映像
顕著性に基づく物体・背景の自動分割手法をリアルタイム以内の処理
時間で動作させることを目的として,ハードウェアとしてGraphic
Processor Unit(GPU)を用いることを想定した分割手法の並列処理
への展開と,その実装方法について述べる.実映像を用いた実験に
より,並列処理の導入で,処理速度が大幅に改善することを示す.
前川卓也, 木村昭悟, 坂野鋭
"ウェアラブルセンサを用いたお絵かきの記録",
to appear, 画像の認識・理解シンポジウム (MIRU2010) 予稿集,
DS3-3, 北海道釧路市, 2010年7月
[ PDF ] [ Poster ]
[
copyright notice ]
- Abstract
-
本稿では,カメラと加速度センサを搭載する手首装着型センサ
デバイスを用いた手描きの記録システムについて述べる.提案
システムは,手首に装着したセンサデバイスのみでの手描きの記録を
実現するため,特殊なペンや紙,スキャナなどの装置を必要と
しない.つまり,センサデバイスを装着し続けることで,日常生活で
起こるメモ書きや授業中に取ったノートなどを自動的に記録できる.
記録した手描きは,記憶補助,検索可能な記録,他のユーザとの共有
などに利用できるだろう.提案システムでは,手首の内側に装着した
カメラを用いて紙面を撮影する.しかし,カメラは紙面に近い位置
から紙面を撮影するため,その紙面の一部しか捉えられない.そこ
で,手描きの際に撮影した画像の系列を結合することで,紙面全体に
描かれた手描きを再構成する.
木村昭悟, 中野拓帆, 亀岡弘和, 杉山将, 前田英作, 坂野鋭
"SSCDE: 画像認識検索のための半教師付正準密度推定法",
to appear, 画像の認識・理解シンポジウム (MIRU2010) 予稿集,
OS8-1, 北海道釧路市, 2010年7月
[ PDF ] [ Presentation material ]
[
copyright notice ]
- Abstract
-
本論文では、与えられた画像に適切なテキストラベルを自動的に付与
する画像認識(image annotation)と、与えられたテキストラベルから
適切な画像を見つけだす画像検索(image retrievel) とを、統一的な
枠組で取り扱う画像認識検索(image annotation retrieval) 問題を
取り上げる。この問題に対し、我々は、画像とラベルとの関係性を
表現するトピックモデルを半教師的にかつ簡易に獲得できる新しい
機械学習手法 SSCDE (Semi-supervised canonical density
estimation) を提案する。提案手法は以下の2つの要素から構成され
る。(1) 独自に開発した半教師型正準相関分析(SemiCCA) により、
従来の正準相関分析と同等の計算量で、少数のラベル付画像から
得られる画像とラベルとの共起情報と、大量のラベルなし画像から
得られる大域的な分布構造との双方を同時に考慮した線形潜在変数
空間を獲得する。(2) カーネル密度推定を用いた半教師付事後確率
推定法SSKDE を多重ラベル分類問題に適用し、潜在変数空間に内在
する非線形性・非ガウス性を事例ベースに取り込む。本手法は、単
なる半教師付学習手法の提案としての意味だけでなく、一般の画像
認識検索の問題を云わば特定トピック認識問題として捉え直す、
新しいパラダイムをも提供し得る。PASCAL VOC データセットを
用いた実験により、ラベル付画像が少数しかない状況下でも、大量の
ラベルなし画像を活用して認識精度を大幅に向上できることを示す。
福地賢, 宮里洸司, 木村昭悟, 赤嶺一馬, 高木茂, 大和淳司, 柏野邦夫
"グラフコストの逐次更新を用いた映像顕著領域の自動抽出",
to appear, 電子情報通信学会論文誌,
Vol.J93-D, No.8, pp.1-8, 2010年8月
[ PDF ]
[
copyright notice ]
- Abstract
-
本稿では,映像中から顕著な領域を自動的,高速かつ高精度に抽出
するための方法を提案する.提案手法では,以下の2点により高速
かつ高精度な自動抽出を実現している.(1) グラフカットに基づく
画像分割手法に,入力画像の各位置が抽出すべき領域である確率を
示す事前確率を顕著度に基づいて与える処理を導入し,分割の自動化
を実現する.(2) 過去の分割結果に基づいて事前確率と特徴量尤度を
逐次的に更新する処理を導入し,安定性の高い分割を実現する.実験
により,全自動処理である提案手法が,手動・半自動処理に基づく
既存手法と比較して,精度を大きく犠牲にすることなく,かつ圧倒
的に高速に領域を抽出できることを示す.
木村昭悟、柏野邦夫、福地賢、赤嶺一馬、高木茂
"映像認識理解への認知発達的アプローチ"、
電子情報通信学会技術報告、PRMU2009-144、栃木県日光市、2009年12月
[ PDF ]
[ presentation material ]
[
copyright notice ]
- Abstract
-
人間は、特に意識をしなくとも、見た映像を理解し言語化でき、与えられた映像
群の中から自身の思い描く映像を的確に見つけ出すことができる。しかし、
これらのタスクを計算機に代行させる映像認識理解問題や映像検索問題は、
パターン認識分野における早期からの最重要課題の1つでありながら、未だ本質
的な解決に至っていない。ただ、人間も映像認識・理解・検索の能力を先天的に
兼ね備えているとは考えにくく、その大部分が成長の過程で後天的に身に付けて
いく性質のものであると考えられる。本報告では、この点に着目し、認知発達的
アプローチに基づく新しい映像認識理解、特にそのための知識獲得戦略のあり方
を提案する。本報告で提案する枠組において、従来のアプローチと異なる特に
重要な点は、以下の2点である。(1) 映像の認識・理解に必要な知識の能動的
かつ自律的な獲得、(2) 自らの発達段階に応じた知識獲得戦略の動的遷移。本
報告では、このアプローチの初期的な試みとして、発達初期段階における乳
幼児の典型的な行動を参考にして作成した知識獲得システムのプロトタイプに
ついて紹介すると共に、提案する枠組の具体的な方向性とその実現可能性に
ついて議論する。
木村昭悟、亀岡弘和、杉山将、前田英作、坂野鋭、石黒勝彦
"SemiCCA: Efficient semi-supervised learning of canonical
correlations,"
情報論的学習理論ワークショップ (IBIS2009),
福岡県福岡市、2009年10月
[ short talk ]
[ poster ] [ copyright notice: 著作権は著者本人に帰属します。 ]
- Abstract
-
This work deals with an extention of canonical correlation analysis
(CCA), a popular multivariate analysis tool for pairs of co-occuring
multi-dimensional sequences. We propose an efficient method called
semiCCA that enables us to obtain canonical correlations of sequence
pairs even if several sequences are missing. This situation can be
frequently found in multi-label classification such as audio tag
classification and automatic image annotation. In this case, semiCCA can
efficiently extract relationships between features and labels in a
semi-supervised manner. Preliminary experiments with artificially
generated sequence pairs show that our method can accurately extract
canonical correlations of sequence pairs even if distributions of all
the sequences and missing ones are completely different.
福地賢、宮里洸司、木村昭悟、高木茂、大和淳司
”グラフコストの逐次更新を用いた映像顕著領域の自動抽出”、
画像の認識・理解シンポジウム (MIRU2009)予稿集、
OS5-4、島根県松江市、2009年7月
[ PDF ]
[ presentation material ]
[
copyright notice ]
電子情報通信学会技術報告、
PRMU2009-17 (IE2009-26, MI2009-17)、岐阜県岐阜市、2009年5月
[ PDF ]
[ presentation material ]
[
copyright notice ]
- あらまし
-
本稿では,高い精度で映像中から顕著な領域を自動的に抽出するための方法を
提案する.提案手法では,顕著度による事前確率を取り入れた,最大事後確率
推定に基づくグラフカット画像分割手法と,以前の分割結果を参照しながら
事前確率および特徴量尤度などで構成されるグラフコストを逐次更新する方法
を導入している.顕著度を利用した既存手法は,顕著度の揺らぎにより分割
結果が時系列として不安定になる問題があるが,提案手法では,グラフコスト
を逐次的に更新することにより,顕著度のみを頼らない安定した自動抽出が
実現できる. 実験により,提案手法が自動で映像から高精度に顕著領域を
抽出できることを示している.
宮里洸司、木村昭悟、高木茂、大和淳司
”MCMC-based particle filterを用いた人間の映像注視行動の実時間推定”、
画像の認識・理解シンポジウム (MIRU2009)予稿集、
OS5-3、島根県松江市、2009年7月
[ PDF ]
[ presentation material ]
[
copyright notice ]
電子情報通信学会技術報告、
PRMU2009-16 (IE2009-25, MI2009-16)、岐阜県岐阜市、2009年5月
[ PDF ]
[ presentation material ]
[
copyright notice ]
- あらまし
-
人間は、網膜に映る像の中から重要と思われる領域を瞬時に判断することで、
効率的に情報を獲得している。これら高度な視覚機構を計算機上で実現する
ことで、重要性に応じて映像中の情報を能動的に取捨選択でき、数多くの
システムをより高度化できる。本報告では、人間の視覚機構を高精度に模擬する
新しい計算モデル、及び実時間動作を実現するstream processingに基づく実装
方法を提案する。提案法では、新たにマルコフ連鎖モンテカルロ法に基づく
サンプリングと、粒子フィルタに基づく事後確率推定を新たに導入することで、
並列処理を実現可能とした。大規模視線測定データベースを用いた人間の注視
行動との比較実験により、本提案手法が従来手法と比較して、10倍以上高速かつ
ほぼ同精度で人間の映像注視行動を推定できることを示す。
木村昭悟、Derek Pang、竹内龍人、大和淳司、柏野邦夫
”動的ベイジアンネットワークを用いた視覚的注意の確率モデル”、
日本視覚学会2008年夏季大会、
神奈川県横浜市緑区、2008年8月
[ presentation material ]
[ copyright notice: 著作権は著者本人に帰属します。 ]
- あらまし
-
視覚的注意の計算モデルに関して、Koch and Ullman (1985) を始めとして
数多くの研究がなされている。しかし、いずれのモデルも、致命的かつ重大な
問題点を内包している。すなわち、入力される視覚情報に対して、決定論的に
各位置の顕著度が算出され、各時点において顕著度が最も大きな位置に人間の
視線が向けられること仮定している。このことは、同じ映像を見ても視聴する
人によってもしくは視聴するタイミングによって視線の向けられる位置が異なる
とする自然な直感と、明らかに矛盾する。本研究では、上記のような視覚的
注意における確率的な挙動を再現するために、動的ベイジアンネットワークを
用いた新しいbottom-upモデルを提案する。このモデルを用いることにより、
入力された映像のみから、その映像の各時点・各位置に視線が向けられる確率を
直接導出することが可能である。人間の注視点に対する一致性という観点に
おいて、提案のモデルが、従来の決定論的モデルと比較して優位に優れた性能を
示すことを実験により示した。
黒住隆行,木村昭悟,永野秀尚,柏野邦夫
”幾何変換パラメータを特定する縮退生成探索法”,
電子情報通信学会技術報告,
PRMU2006-171,Fukui, Japan, 2006年12月
[ PDF ] [ Presentation Material ]
[
copyright notice ]
- あらまし
-
蓄積信号の中から目的信号と同じ信号を探索する問題において,目的信号と蓄積
信号の間の幾何学的変動を考慮して探索する手法を提案する.本手法の基本的
アイデアは,信号から頑健な特徴を抽出し,複数の特徴間の相対的な関係を
記述した縮退特徴を求め,同一の縮退特徴を持つ目的信号と蓄積信号の箇所を
特定し,目的信号と蓄積信号の間の幾何学的変動パラメータを求め,その変動
パラメータに基づいて蓄積信号を幾何変換し目的信号と照合するものである.
本手法を用いて,音響信号を伸縮させた音の断片を目的信号として8.3 時間の
蓄積信号のどの時刻に対応するかを調べる課題について実験を行ったところ,
縮退生成を行わなかった場合に11.8% であった探索精度が77.2% にまで改善し,
本手法の有効性が確認された.本手法により,幾何変換が行われた信号で
あっても探索することが可能になると考えられる
柏野邦夫,木村昭悟,黒住隆行
”局所的・大域的クラスタリングに基づく音・映像の高速時系列探索法”,
電子情報通信学会技術報告,
PRMU2005-25 (DE2005-3),Sapporo, Hokkaido, Japan, 2005年6月
[
copyright notice ]
- あらまし
-
長時間にわたって蓄積された映像信号や音響信号の特徴時系列において,既知の
映像信号や音響信号の出現箇所を高速に探索する手法を提案する.このような
手法として,これまでに,時系列アクティブ探索法が提案されている.時系列
アクティブ探索法では,類似度のもつ局所的な制約に基づいて枝刈りを行って
いた.本稿で提案する手法は,類似度の局所的な性質と大域的な性質の双方を
枝刈りに利用することで高速化を図る.また,類似度(距離)の定義に
かかわらず全探索と同一の探索結果(つまり時系列アクティブ探索法と同一の
探索結果) が得られるという特徴がある.映像探索を題材として実験を行った
結果,時系列アクティブ探索法に比べ,照合計算回数が約28 % 削減されると
ともに,探索の所要時間も削減された.
木村昭悟,植松友彦
”インデックス検索の情報理論的解析”,
情報理論とその応用シンポジウム(SITA2005)予稿集,
Vol.II, pp.721-724, 2005年11月
- あらまし
-
We present a information-theoretical aspect for similarity-based
retrieval with indexes, and clarify the optimal performance of the
retrieval. The retrieval comprises two stages: pruning data items
based on indexes, and matching surviving items. The first stage is
equivalent to a coding problem such that full side information (i.e.
the query item) is available only at the decoder. The second stage is
considered as a coding problem such that parts of the decoding results
are also available as a partial side information at the encoder.
川西隆仁、久野和樹、木村昭悟、黒住隆行、柏野邦夫、高木茂
”サブテンプレート間距離を用いた適応的ウィンドウスキップによる
高速テンプレートマッチング法”,
電子情報通信学会論文誌 D-II,
Vol.J88-D-II, No.8, pp.1389-1397, August 2005.
Published online in
IEICE Transactions Online
[
copyright notice ]
- あらまし
-
本論文では,サブテンプレート間の距離を用いた高速なテンプレートマッチング
法を提案する.サブテンプレートと入力画像上のウィンドウの一部(サブ
ウィンドウ)とを照合した結果,距離が十分大きい場合に,サブウィンドウを
内部に含むウィンドウすべてに対して距離下限値を計算する.ウィンドウと
テンプレートを照合する前に,そのウィンドウにおける距離下限値としきい値
とを比較し,距離下限値がしきい値より大きい場合に,その照合を省略する.
この照合の省略の結果,探索時間を大幅に削減することができる.実験の結果,
テンプレートのサイズが指定できない場合や,しきい値の初期値を適切に
設定することが難しい場合に従来のテンプレートマッチングの高速化手法と
比べて全く同じ精度を保証して短い時間で探索できることが分かった.
木村昭悟,川西隆仁、柏野邦夫
”SPIRE:スパースなインデキシングを用いた画像中の同一部分領域の検出”,
電子情報通信学会論文誌 D-II,
Vol.J88-D-II, No.8, pp.1712-1719, August 2005.
Published online in
IEICE Transactions Online
[ pdf ]
[
copyright notice ]
- あらまし
-
本稿では,膨大な数の画像の中から目的とする画像に類似する部分画像を
類似度に基づいて検出するための基本的な枠組を提案する.高速検出を
実現するためには,ある種のインデックス構造を導入することが必要となる.
しかし,データベース中の各画像から膨大な量の部分領域を抽出して
インデックス構造に投入する必要があるため,インデックスの保持に必要な
記憶容量が膨大になるという問題点があった.提案法では,データベース中の
画像について,部分領域を間引いて抽出することにより,インデックスの
保持に必要な記憶容量を大幅に削減する.このとき,部分領域の抽出間隔を
適切に設定することにより,総当たり照合と全く同一の検索結果が出力される
ことを理論的に保証することが可能である.
木村昭悟,川西隆仁,大塚和弘,柏野邦夫,
”重み付き特徴点照合に基づく高速画像検索”,
電子情報通信学会技術報告,
PRMU2005-24 (DE2005-2), 2005年6月
[ presentation material ]
[
copyright notice ]
- あらまし
- 類似画像検索に関する新しい手法について報告する.スケール変化や視点
移動などに伴う画像の幾何学変動や,前景や背景の変化に伴う画像周辺領域の
変動などに対応するためには,画像中の部分領域での照合結果を統合する
ことにより画像間の類似性を判断する方法が有効である.これまでに,幾何学
変動に対処するための特徴点抽出や,周辺領域の変動に対処するための注目
領域抽出を用いた手法が数多く提案されている.本報告では,特徴点の
重要度を表現するために,注目領域抽出に利用されていた注目度を用いた,
新しい類似画像検索方法の枠組を提案する.すなわち,特徴点周辺の注目度に
よって特徴点の重み付けを行い,重み付き類似度により画像間の類似性を
判定する.しかし,重み付き類似度を従来のインデキシング手法に適用する
ことが困難である.本報告では,上記枠組における新しいインデックス構築・
検索手法として,重要度に基づくインデックスと重みなし類似度に基づく
インデックスとを段階的に構築し,これらを用いてインデックス検索を行う,
2段階インデックス検索を提案する.提案の方法を用いることにより,重み付き
類似値がある閾値以上となる特徴を漏れなく高速に検出することが可能と
なる.
木村昭悟,川西隆仁,柏野邦夫,
”SPIRE: 総当たり照合と同一の精度を保証する類似部分画像検索”,
画像の認識・理解シンポジウム (MIRU2004)予稿集,
Vol. 2, pp.400-404, 2004年7月
[ pdf ]
[ poster ]
[
copyright notice ]
- あらまし
- 本稿では,膨大な数の画像の中から目的とする画像に類似する部分画像を
画像から抽出した特徴間の類似度に基づいて検出する,類似部分画像検索の
ための基本的な枠組を提案する.高速な検索を実現するためには,ある種の
インデックス構造を導入することが必要となる.しかし,上記部分画像検索に
おいては,データベース中の各画像から膨大な量の部分領域を抽出して
インデックス構造に投入する必要があるため,インデックスの保持に必要な
記憶容量が膨大になるという問題点があった.提案法では,データベース中の
画像について,部分領域を間引いて抽出することにより,インデックス
サイズを大幅に削減する.このとき,部分領域の抽出間隔を適切に設定する
ことにより,総当たり照合と全く同一の検索結果を理論的に保証することが
可能である.
木村昭悟,柏野邦夫,黒住隆行,村瀬洋,
”グローバルな枝刈りを導入した音や映像の高速探索”,
画像ラボ,
Vol.14, No.11, pp.60-67, 2003年11月
- あらまし
- 探したい音や映像が具体的に与えられ,それとほぼ同じ信号の区間が
蓄積された長時間の音や映像の中のどこにあるかを高速に探索する問題に
対する新しい手法について述べる.これまでに,高速探索手法の一つとして,
時系列アクティブ探索法が提案されている.これは,ローカルな枝刈り,
すなわち照合窓周辺の類似度に基づいて探索の必要がない区間の照合を省く
ことにより高速な探索を実現していた.それに対し,本手法は,ローカルな
枝刈りに加え,信号全体の類似性に基づく信号の分類により信号時系列全体を
見て探索の必要がない区間を取り除く,グローバルな枝刈りを導入することに
より,さらに高速な探索を実現する.本手法では,時系列アクティブ探索法に
比べ,事前処理の計算時間が信号時系列の再生時間の1%程度増加するものの,
同程度の精度を保ったまま,探索速度を最大で約9倍にできることを実験に
より示す.
木村昭悟,柏野邦夫,黒住隆行,村瀬洋,
”区分線形写像に基づく音や映像の高速探索
−特徴系列の分割による次元削減の導入− ”,
データ工学ワークショップ (DEWS2003)予稿集,
3-A-1, 2003年3月
[ pdf ]
[ presentation material ]
[
copyright notice ]
- あらまし
- 探したい音や映像が具体的に与えられ,それとほぼ同じ信号の区間が蓄積
された長時間の音や映像の中のどこにあるかを高速に探索するための新しい
手法を提案する.提案法は,特徴系列を分割し分割ごとに異なる写像を用いる
区分線形写像によって特徴の次元削減を実現し,照合に要する時間を
削減する.特徴系列の分割方法は,等分割法と動的分割法について検討する.
動的分割法はより効率的な次元削減を実現可能であるが,事前処理に膨大な
計算を必要とする.本稿では,膨大な計算を回避する動的分割の高速化手法の
提案も併せて行う.実験により,提案法が,提案法の基礎となる時系列
アクティブ探索法に比べて,約2倍高速な探索が実現できることを示す.
木村昭悟,柏野邦夫,黒住隆行,村瀬洋,
”音や映像の高速探索のための動的分割に基づく特徴次元削減法”,
電子情報通信学会技術報告,
PRMU2002-167,2002年12月
[ presentation material ]
[
copyright notice ]
- あらまし
- 近年,大量の音や映像のデータベースの中から目的の音や映像を高速かつ
正確に探し出す技術が強く求められている.音や映像など情報量の多い
メディアを高速に探索するためには,少ない情報量でメディアの特徴を
表現することが重要となる.本稿では,音や映像を高速に探索するための
特徴の次元削減手法を提案する.提案法は,平均次元数を最小にするように
特徴時系列を動的に分割し,セグメントごとに圧縮関数を決定するもので
ある.しかし,動的に最適な分割を求めるためには膨大な計算量が必要と
なるという問題点がある.提案法は,局所探索による準最適解の導出と
次元変化の離散性に基づく解の絞り込みにより,高速な動的分割を実現する.
さらに,セグメント長にしたがって次元が単調に増加していく信号に
おいては,動的分割を行うための最少の計算量を理論的に求めることが
できる.実験により,提案法は,高速化を行わない場合と比較して約10倍
高速な動的分割が実現できることを示す.
木村昭悟,柏野邦夫,黒住隆行,村瀬洋,
”グローバルな枝刈りを導入した音や映像の高速探索”,
電子情報通信学会論文誌 D-II,
Vol.J85-D-II, No.10, pp.1552-1562, October 2002.
Published online in
IEICE Transactions Online
[ pdf ]
[ DOI link ]
[
copyright notice ]
- あらまし
- 探したい音や映像が具体的に与えられ,それとほぼ同じ信号の区間が蓄積
された長時間の音や映像の中のどこにあるかを高速に探索する問題に対する
新しい手法を提案する.これまでに,高速探索手法の一つとして,時系列
アクティブ探索法が提案されている.これは,信号から抽出した
ヒストグラムに基づく信号探索手法であり,ローカルな枝刈り,すなわち
照合窓周辺の類似度に基づいて探索の必要がない区間の照合を省くことにより
高速な探索を実現していた.それに対し,提案手法は,ローカルな枝刈りに
加え,信号全体の類似性に基づくヒストグラムの分類により信号時系列全体を
見て探索の必要がない区間を取り除く,グローバルな枝刈りを導入することに
より,さらに高速な探索を実現する.本論文では,グローバルな枝刈りの
度合と保証される精度との関係を詳しく議論する.例えば提案手法では,
128次元のヒストグラムを1024通りに分類したとき,時系列アクティブ探索法に
比べ,事前処理の計算時間が信号時系列の再生時間の1%程度増加するものの,
同程度の精度を保ったまま,探索速度を約9倍にできることを実験により示す.
木村昭悟,柏野邦夫,黒住隆行,村瀬洋,
”区分線形写像に基づく音響信号の高速探索”,
日本音響学会春季研究発表会予稿集,
3-P-28, 2002年3月
[ pdf ]
[ poster ]
- あらまし
- 探したい音とほぼ同じ信号の区間をデータベースから高速に探索する新しい
手法を提案する.提案法は,区分線形写像に基づく特徴圧縮と精度の良い
距離下限の決定により,探索漏れを起こさずに探索に要する計算量を大幅に
削減する.
木村昭悟,柏野邦夫,黒住隆行,村瀬洋,
”区分線形写像に基づく映像信号の高速探索”,
電子情報通信学会技術報告,
PRMU2001-243, 2002年2月
[ presentation material ]
[
copyright notice ]
- あらまし
- 近年,大量の音や映像のデータベースの中から目的の音や映像を高速かつ
正確に探し出す技術が強く求められている.その一つとして,先に我々は,
信号から抽出したヒストグラムに基づく探索手法である時系列アクティブ
探索法を提案した.本稿では,時系列アクティブ探索法と同一の探索結果を
理論的に保証したまま探索に要する計算量を削減する手法を提案する.
提案法は,区分線形写像に基づくヒストグラム圧縮により照合に要する時間を
削減し,圧縮前後のヒストグラム同士の距離を圧縮特徴に埋め込むことで照合
回数の極端な増加を防ぐものである.実験により,提案法が時系列アクティブ
探索法に比べて,約2倍高速な探索が実現できることを示す.
木村昭悟,柏野邦夫,黒住隆行,村瀬洋,
”グローバルな枝刈りを導入した長時間音響信号の高速探索
−時系列アクティブ探索の高速化−”,
電子情報通信学会技術報告,
PRMU2000-200, 2001年2月
[ presentation material ]
[
copyright notice ]
- あらまし
- 特定の音響信号が,蓄積された長時間音響信号の中のどこにあるかを高速に
探索する問題に対する新しい手法を提案する.従来法である時系列アクティブ
探索法では,信号時系列のローカルな枝刈りにより高速な探索を実現して
いた.これに対し本稿で提案する手法は,ローカルな枝刈りに加え,新たに
グローバルな枝刈りを行うものである.提案法では,時系列アクティブ探索
法に比べ,事前処理量が若干増加するものの,探索時の速度を数倍から
数十倍にすることができた.これにより,1秒で数週間分の音響信号を
探索できる見通しを得た.
CMOSFETを用いた低電圧companding filterに関する研究
学部卒業論文、東京工業大学、1998年3月
[ pdf ]
- あらまし
-
集積回路の低電圧化は,デバイスの微細化により重要な課題である.しかし
従来の電圧信号入力方式では信号振幅の大きさに対して電源電圧が上昇し,
低電圧化が困難である.そこで本研究では低電圧化実現法としてCompanding
Filterを提案し,その構成要素となる積分器をCMOSプロセスで構成する.
Companding Integratorは入力部分において信号振幅を圧縮し,低電圧化を
実現する.出力部分で信号振幅を拡張することで,全体として電流入力に
対して線形な電流出力を得る.提案回路は入力部分をMTL(MOS TransLinear)
principleの応用によって回路を構成し,信号振幅を抑える.出力部分で
MOSFETの自乗特性を利用して信号振幅を拡張し,入力に対して線形な出力を
得る.回路の共通部分の共用等に工夫を施すことで,従来の回路に比べて
FET数をほぼ2/3に減少させている.提案回路の動作をSPICE
シミュレーションによって確認する.電源電圧3.3Vに対して直流利得32dB,
単位利得周波数581khZという良好な特性が得られる.本研究で用いたデバイス
パラメータのしきい電圧は0.8Vと大きく,全てのMOSFETが飽和領域で動作する
ためには電源電圧を3.3Vにしなければならない.しきい電圧が小さい場合には
回路の低電圧かが可能となる.そこで,しきい電圧のみ1/4に小さくした
デバイスパラメータを用いてシミュレーションを行い,電源電圧1.75Vと
設定してもパラメータ変更前とほぼ同様の特性を得て,低電圧化実現の
可能性を示している.
|