#author("2022-09-01T19:04:13+09:00","default:admin","admin")
#author("2022-09-21T11:14:23+09:00","default:admin","admin")
[[第29回研究会>029]]
* UFO: 有価証券報告書の表を対象とした情報抽出タスクの提案 [#l002c829]
* 2言語の極性分析を用いた中国市場インデックスの予測 [#d9ffe8bd]
** 著者 [#q17a1fe4]
Yasutomo Kimura(Otaru University of Commerce), Takahito Kondo(Kyoto Sangyo University), Kazuma Kadowaki(The Japan Research Institute, Limited), Makoto P. Kato(University of Tsukuba)
** 著者 [#m07bf441]
Cong Liu, 坂地 泰紀, 和泉 潔(The University of Tokyo), 早川 正亮, 塚本 和哉(みずほ銀行), 加藤 大輔(みずほリサーチ&テクノロジーズ)
**概要 [#j8e6c8fe]
本稿では、表形式のデータや文書から構造化情報を抽出する技術を開発することを目的として、有価証券報告書を対象とした UFO(Unidentified Financial Objects in annual securities reports)タスクを提案する。我々は、有価証券報告書に基づくデータセットを提供し、参加者の共同作業で適切な評価指標と方法論を検討するために、以下2つのサブタスクからなる評価型ワークショップを開催する予定である。(1) 表データ抽出(TDE)サブタスクでは、有価証券報告書の「子会社・関連会社情報」欄の正しい項目と値を抽出する。(2) テキストと表の関係抽出(TTRE)サブタスクでは、表に含まれる数値と、本文中の関連する記述を結びつける。我々はNTCIR-17 UFO タスクのオーガナイザーとして、参加者の研究サイクルを促進・支援するための研究コミュニティを作る予定である。本稿では、UFO タスクの概要およびスケジュールについて述べる。
**概要 [#lc7eb387]
近年、中国経済の躍進に伴い、中国の各国経済に与える影響が高まっている。そのため、米国経済を中心に把握するだけではなく、中国経済の動向を把握することがより重要になっている。しかしながら、中国経済に言及した英語記事は中国語媒体よりも少なく、また、中国語で記載された中国経済に関する膨大な記事から選別してトピックを抽出することは現状難しい。そこで本研究では、中国語記事と英語記事の両方からセンチメントを獲得し、これらを合わせて利用することで、中国市場インデックスを予測する新たなモデルを提案する。
**キーワード [#aa831d12]
"有価証券報告書,
情報抽出,
表データ,
テキストと表の関係抽出,
評価型ワークショップ"
**キーワード [#k4c0c6a0]
"中国市場インデックス,
2言語センチメント,
2言語データ"
**論文 [#ld2bf0df]
**論文 [#p6733077]
//(3月9日以降に公表いたします)
//&ref(06_SIG-FIN-28.pdf);
//&ref(05_SIG-FIN-28.pdf);
(J-Stageにて公開する予定です)