UFO: 有価証券報告書の表を対象とした情報抽出タスクの提案†
著者†
Yasutomo Kimura(Otaru University of Commerce), Takahito Kondo(Kyoto Sangyo University), Kazuma Kadowaki(The Japan Research Institute, Limited), Makoto P. Kato(University of Tsukuba)
概要†
本稿では、表形式のデータや文書から構造化情報を抽出する技術を開発することを目的として、有価証券報告書を対象とした UFO(Unidentified Financial Objects in annual securities reports)タスクを提案する。我々は、有価証券報告書に基づくデータセットを提供し、参加者の共同作業で適切な評価指標と方法論を検討するために、以下2つのサブタスクからなる評価型ワークショップを開催する予定である。(1) 表データ抽出(TDE)サブタスクでは、有価証券報告書の「子会社・関連会社情報」欄の正しい項目と値を抽出する。(2) テキストと表の関係抽出(TTRE)サブタスクでは、表に含まれる数値と、本文中の関連する記述を結びつける。我々はNTCIR-17 UFO タスクのオーガナイザーとして、参加者の研究サイクルを促進・支援するための研究コミュニティを作る予定である。本稿では、UFO タスクの概要およびスケジュールについて述べる。
キーワード†
"有価証券報告書, 情報抽出, 表データ, テキストと表の関係抽出, 評価型ワークショップ"
論文†
(J-Stageにて公開する予定です)