HOME    About Institutional Repository    mypage        Japanese    library    university    Feedback

茨城大学機関リポジトリ >
College of Engineering >
Grants-in-aid for scientific research Report (College of Engineering) >

 
Title :縮約類似度行列を用いた大規模文書データに対するスペクトラルクラスタリング
Title alternative :Spectral clustering for large document data using the reduced similarity matrix
Authors :新納, 浩幸
Authors alternative :SHINNOU, Hiroyuki
Issue Date :30-May-2011
Abstract :本研究では大規模文書クラスタリングにスペクトラルクラスタリングを用いる手法を開発した。基本的には大規模データを k-means で予め小規模クラスタに分割し、そこから信頼度の高いデータを抽出し、それらデータに対して類似度行列を作る。作成された類似度行列は縮約されているので、スペクトラルクラスタリングが実行できる。クラスタリングの更なる精度向上のために、精緻な名詞間距離の測定法や、文書間の距離学習法の開発も行った。
In this research, I proposed the spectral clustering method for large document data. First, large document data is divided into small clusters by k-means. then some reliable data are picked up each clusters. We construct a similarity matrix from these reliable data. This matrix is reduced, so we can use the spectral clustering for it. Furthermore, in order to improve the precision of clustering, I researched the distance measurement of two nouns, and distance learning for documents.
Type Local :科研等報告書
Publisher :茨城大学
URI :http://hdl.handle.net/10109/2594
Appears in Collections:Grants-in-aid for scientific research Report (College of Engineering)

Files in This Item:

File Description SizeFormat
20110074.pdf225KbAdobe PDFView/Open