単語の類義性・対義性を考慮したドメイン特化極性辞書構築†
著者†
伊藤諒,坂地泰紀,和泉潔(東京大学), 須田真太郎(三菱UFJトラスト投資工学研究所)
概要†
自然言語処理の根幹を支える資源として,語彙資源が存在し,その中の重要な語彙資源として単語極性辞書が存在する.単語極性辞書は,語彙ベースのセンチメント分析を行う際に必要であるが,単語の極性がドメインに依存するため,ドメインに特化した単語の極性辞書を構築することが求められている.そこで,本研究では,解析対象となるドメインに特化した,センチメント分析のための極性辞書を自動構築することを目的とし,とりわけ対象ドメインの知識,既存の知識ベースに含まれる単語の類義・対義性に関する知識を用いた,半教師あり学習による,SMLSモデルとDLSモデルの二つの,ドメイン特化型極性辞書自動構築手法を提案した.提案手法であるSMLSモデルは,先行研究のSNWELPモデルよりも辞書構築精度が上回る結果となり,提案手法の有効性が確認された.また,SMLSモデルを用いて,人手によって構築された金融政策ドメインに特化した辞書を拡張し,トピック別センチメント分析を行った結果,未拡張の場合の辞書を用いた場合比較して,マクロ変数に対してより良い説明力が得られ,提案手法のモデルの応用可能性が確認された.
キーワード†
lexicon creation,sentiment analysis,semi-supervised learning,synonym,antonym