語の類義性・対義性を考慮したドメイン特化型辞書構築手法の提案と評価†
著者†
伊藤諒(東京大学), 坂地泰紀(東京大学), 和泉潔(東京大学), 須田 真太郎(株式会社 三菱UFJトラスト投資工学研究所)
概要†
金融・経済分野における新たな分析データとして,非構造化データであるテキスト情報が注目を集める中,本ドメインに対する知識を構造化する事が期待されている.そのような知識の一つとして,各単語に対してポジティブ・ネガティブを表す極性値が紐づいた,極性辞書が挙げられる.極性辞書の構築において,人手で膨大な数の単語に対して極性を付与していく事は,コストを要するものである.そこで本研究では,極性辞書の自動構築を目的とし,とりわけ語の類義性・対義性を考慮した辞書構築モデルを提案する.実験の結果,提案手法のモデルは,先行研究のモデルと比較して,より精度の高い辞書構築モデルとなった.また,提案手法を用いて従来の辞書を拡張し,拡張された辞書を用いてFOMCテキストに対するトピック別センチメントの算出と評価を行なった結果,従来手法よりもより精度の高いモデルを構築する事が出来た.
キーワード†
lexicon creation, sentiment analysis, semi-supervised learning, synonym, antonym