近年、ロビンフットなどの投資アプリが急速に普及し、一般の人々も簡単に投資を始めることができるようになりつつあります。
世界中から金融を専門とする研究者が集まるFinNLP-2022では、台湾大学のメンバーを筆頭に個人投資家の意思決定の根拠を推定するコンペが開催されました。
同グループの主張によると、自動取引アルゴリズムは金融市場の変動は投資家の意見の変化によって引き起こされ、これらの背後にある理由は意見と見なすことができると説明しています。
本記事ではこの問題に取り組む研究の一部について紹介します。
アマチュアの投資家が投資決定を下す際の理由や根拠を文書として提供し、それらの文書を解析して評価する、“Evaluating the Rationales of Amateur Investors (ERAI)”というタスクがあります。
今回紹介する論文では、ERAIのペアワイズタスクと教師なしランキングタスクにおいて、複数のアルゴリズムを比較しています。
表1はペアワイズタスクの具体的なデータ例です。文章1と文章2のペアが与えられ、どちらの文章の方が優れているかを予測します。
※ 表1の文章は中国語と、GPT-4を用いて翻訳した日本語です。内容に現地の証券市場や金融関連の内容が含まれているため、翻訳が不十分な点はご了承ください。
文章1 | 文章2 |
中壽可以準備賣給開發金了,除權 息前應該可以完成 訳:中壽は開発金に売る準備ができており、除権利前に完了するはずです | 中壽今天發動攻勢,往34靠攏 訳:中壽は今日攻勢を開始し、34に近づくように動いています |
低接買盤開始浮現,不過近期也應該 是盤整(除非有新的進度消息) 訳:低い取引所での買い注文が現れ始めましたが、近い将来も市場は横ばいになるでしょう(新しい進展のニュースがなければ) | 宏和一開盤,一路往上衝,漲的有點 太高,希望能穩穩漲就好 訳:宏和は市場開始と同時に上昇し続け、少し上昇しすぎている感じですが、安定して上昇してくれることを願っています |
一組のアマチュア投資家の投資理由が与えられ、それらを比較してどちらの理由が優れているかを判断するタスクです。具体的な基準は書かれていませんでしたが、一般的には投資理由の論理性、根拠の強さ、具体性、投資戦略の質などが考慮されている可能性が高いです。
複数のアマチュア投資家の投資理由が与えられ、それらを比較してどの理由が優れいているかをランキングするタスクです。ペアワイズ比較と同様に具体的な基準は書かれていませんでしたが、投資理由の論理性、根拠の強さ、具体性、投資戦略の質などが考慮されていると考えられます。
ペアワイズタスクでは、T5に比べてInstructGPT-zhの方が高精度だったことから、Instructionベースの言語モデルのfew-shot learningの可能性を示唆していました。一方、中国語をGoogle翻訳を用いて英語に翻訳して学習したInstructGPT-enではあまり良い結果が得られませんでした。
教師なしランキングタスクの方では、すべての提案手法(base-1, bayesdcm-2, multinominal-3)は今までのERAIのランキングタスクのベストスコアよりも高精度となっていました。今までのベストスコアの手法との唯一の違いは「市場の感情語彙」の有無でした。このことから、ランキングタスクでは市場の感情語彙を使用すること有用性が示されました。
今回紹介した論文のように、AIによる投資基準の自動評価ができるようになった場合、性別や年代、職種などのセグメント情報と合わせることで個人投資家の価値観が適切に取得しやすくなるため、金融商品のセールスや企画に活かせたり、ファイナンシャルプランナーを代替するチャットボットで投資アドバイスを行う場合の基盤となることが予想されます。
クオンツの取り組みはあまり公開されることはありませんが、SNSが発達した現代では新しいアプローチとして着目され始めているのかもしれません。
今回はInstructGPT-enを構築するために、中国語のデータをGoogle翻訳を使って英語のデータにしてから学習していました。近年は翻訳の精度が向上したことにより、データセットが多くある言語から、データセットがあまりない言語モデルを学習する手法が増えています。しかし、今回の論文に記載されていたように、翻訳をして学習したモデルで高精度なものを作るのは困難です。そのため、特定の言語に特化したモデルや多くの言語に対応するモデルの開発が重要です。