BERTを用いたESG関連文章のGRIスタンダード分類†
著者†
若本亮佑, 鵜飼和渡, 里中裕輔, 高木幸雄, ファイサル ハディプトラ(電通国際情報サービス)
概要†
投資や融資の分野において,各企業が公開するESGの情報が重要な判断材料となり始めている。しかし、今日の日本のESG情報開示は基準やフォーマットが統一されていないため、企業間のESG情報を統一された指標で比較することには時間と労力を要する。ここで,企業が公開するオープンデータを,既存のESG情報を開示する枠組みに則って整理することができれば,投融資におけるESGリスクの判断をより迅速かつ正確に行うことができる。そこで,本研究では,企業が公開しているESGに関連する文章をESG情報開示枠組みの1つであるGRIスタンダード(Global Reporting Initiative standards)に則って分類するモデルを作成する。具体的には,まず,企業が公開するGRIスタンダード対照表と,これらに紐づけられたアニュアルレポートやWebページを基にアノテーションを行うことでESG文章のデータセットを作成する。次に,日本語に特化した独自のBERTを基にファインチューニングを行うことで,GRIスタンダードに準拠した分類モデルを構築する。このとき,GRIスタンダードは項目が複数の粒度で枝分かれしているため,分類する粒度を変えた2つのモデルを併用する手法を提案する。
キーワード†
ESG, 自然言語処理, BERT, GRIスタンダード