HOME    About Institutional Repository    mypage        Japanese    library    university    Feedback

茨城大学機関リポジトリ >
College of Engineering >
Article in academic journal (College of Engineering) >

Title :EMアルゴリズムの最適ループ回数の予測を用いた語義判別規則の教師なし学習
Title alternative :Unsupervised learning of word sense disambiguation rules by estimating an optimum iteration number in EM algorithm
Authors :新納, 浩幸 / 佐々木, 稔
Authors alternative :SHINNOU, Hiroyuki / SASAKI, Minoru
Issue Date :17-Sep-2002
Abstract :本論文ではNigamらが文書分類問題に対して提案したEMアルゴリズムを用いた教師なし学習の手法を語義判別問題に適用する.ただし語義判別問題において,彼らの手法は精度が悪化する場合も多い.ここではEMアルゴリズムの最適な繰り返し回数を推定することで精度の低下を防ぐ.この推定のために,交差検定を行い,ラベルなし訓練データが正の情報として働くか,負の情報として働くかに注目することで最適な繰り返し回数を推定する.SENSEVAL2の日本語辞書タスクで課題となった名詞50単語を用いた実験では,ラベル付き訓練データのみから学習した分類器の精度は0.7658であり,その上でNigam らの手法を用いた場合は0.7356となり精度が下がるが,本手法を用いることで0.7856まで締度が向上した.この値は現在公開されている正解率の最高値に匹敵する.また動詞50単語についても本手法の効果を確認できた.
This paper improves an unsupervised learning method using EM algorithm proposed by Nigam et al. for text classification problems. The original method works well, but often causes worse classification for our concerned problems, word sense disambiguation problems. To avoid it, we estimate the optimum iteration number in EM algorithm. The criterion is based on cross validation and judgement that unlabeled training data is used to improve a classification or not. In experiment, we solved 50 noun WSD problems in Japanese Dictionary Task in SENSEVAL2. The classification learned through only labeled training data produces 0.7658 precision. Original unsupervied method got worse 0.7356 precision, but our improved method produced 0.7856 precision. This is a match for the best public score., Furthermore, our method is confirmed to be also effecitve for verb WSD problems.
Type Local :テクニカル・レポート
Publisher :情報処理学会
URI :http://hdl.handle.net/10109/1792
Citation :情報処理学会研究報告. 情報学基礎研究会報告 Vol.2002 no.87 p.51 -58
Appears in Collections:Article in academic journal (College of Engineering)

Files in This Item:

File Description SizeFormat
20100357.pdf799KbAdobe PDFView/Open