ホーム    このサイトについて    論文の投稿について        English    図書館    茨城大学    問合せ

茨城大学機関リポジトリ >
工学部 >
科研等報告書(工学部) >

 
タイトル :縮約類似度行列を用いた大規模文書データに対するスペクトラルクラスタリング
別言語のタイトル :Spectral clustering for large document data using the reduced similarity matrix
著者 :新納, 浩幸
別言語の著者 :SHINNOU, Hiroyuki
作成日 :2011-5-30
要約(Abstract) :本研究では大規模文書クラスタリングにスペクトラルクラスタリングを用いる手法を開発した。基本的には大規模データを k-means で予め小規模クラスタに分割し、そこから信頼度の高いデータを抽出し、それらデータに対して類似度行列を作る。作成された類似度行列は縮約されているので、スペクトラルクラスタリングが実行できる。クラスタリングの更なる精度向上のために、精緻な名詞間距離の測定法や、文書間の距離学習法の開発も行った。
In this research, I proposed the spectral clustering method for large document data. First, large document data is divided into small clusters by k-means. then some reliable data are picked up each clusters. We construct a similarity matrix from these reliable data. This matrix is reduced, so we can use the spectral clustering for it. Furthermore, in order to improve the precision of clustering, I researched the distance measurement of two nouns, and distance learning for documents.
収録種別 :科研等報告書
公開者・出版者 :茨城大学
URI :http://hdl.handle.net/10109/2594
出現コレクション:科研等報告書(工学部)

登録ファイル

ファイル 記述 サイズフォーマット
20110074.pdf225KbAdobe PDF見る/開く