第5回研究会
松井藤五郎 (中部大学), 後藤卓, 和泉潔, 陳昱
論文では,国債の金利とデフォルト確率に基づいてN本腕バンディット問題を作成し,その解を複利型強化学習を用いて学習する方法について述べる.
また,実際の金利とデフォルト確率に基づく実験によりその有効性を示す.