アマチュア投資家の投資根拠をAIが評価

2023年8月12日金融

近年、ロビンフットなどの投資アプリが急速に普及し、一般の人々も簡単に投資を始めることができるようになりつつあります。

世界中から金融を専門とする研究者が集まるFinNLP-2022では、台湾大学のメンバーを筆頭に個人投資家の意思決定の根拠を推定するコンペが開催されました。
同グループの主張によると、自動取引アルゴリズムは金融市場の変動は投資家の意見の変化によって引き起こされ、これらの背後にある理由は意見と見なすことができると説明しています。

本記事ではこの問題に取り組む研究の一部について紹介します。

概要

アマチュアの投資家が投資決定を下す際の理由や根拠を文書として提供し、それらの文書を解析して評価する、“Evaluating the Rationales of Amateur Investors (ERAI)”というタスクがあります。

今回紹介する論文では、ERAIのペアワイズタスクと教師なしランキングタスクにおいて、複数のアルゴリズムを比較しています。

タスク概要

具体的なデータ（ペアワイズのみ）

表1はペアワイズタスクの具体的なデータ例です。文章1と文章2のペアが与えられ、どちらの文章の方が優れているかを予測します。

※ 表1の文章は中国語と、GPT-4を用いて翻訳した日本語です。内容に現地の証券市場や金融関連の内容が含まれているため、翻訳が不十分な点はご了承ください。

文章1	文章2
中壽可以準備賣給開發金了，除權息前應該可以完成訳：中壽は開発金に売る準備ができており、除権利前に完了するはずです	中壽今天發動攻勢，往34靠攏訳：中壽は今日攻勢を開始し、34に近づくように動いています
低接買盤開始浮現,不過近期也應該是盤整(除非有新的進度消息) 訳：低い取引所での買い注文が現れ始めましたが、近い将来も市場は横ばいになるでしょう（新しい進展のニュースがなければ）	宏和一開盤,一路往上衝,漲的有點太高,希望能穩穩漲就好訳：宏和は市場開始と同時に上昇し続け、少し上昇しすぎている感じですが、安定して上昇してくれることを願っています

表1 ペアワイズ比較の具体的なデータ例

ペアワイズ比較

一組のアマチュア投資家の投資理由が与えられ、それらを比較してどちらの理由が優れているかを判断するタスクです。具体的な基準は書かれていませんでしたが、一般的には投資理由の論理性、根拠の強さ、具体性、投資戦略の質などが考慮されている可能性が高いです。

教師なしランキング

複数のアマチュア投資家の投資理由が与えられ、それらを比較してどの理由が優れいているかをランキングするタスクです。ペアワイズ比較と同様に具体的な基準は書かれていませんでしたが、投資理由の論理性、根拠の強さ、具体性、投資戦略の質などが考慮されていると考えられます。

比較するAIアルゴリズム

ペアワイズ比較タスク

T5 (Text-To-Text Transfer Transformer)
- T5はすべてのNLPタスクを”テキストからテキストへ”の変換問題として扱います。
- これにより、様々なタスクに対して一つのモデルで対応することが可能になります。
InstructGPT-zh
- InstructGPTは、OpenAIが開発した言語モデルで、指示や質問に対する回答を生成する能力を持っています。
- このモデルは人間との対話を通じて広範な知識を学習し、人間が理解できる形式で出力をします。
- InstructGPT-zhは、InstructGPTを中国語のデータに対して学習させたモデルを指します。
InstructGPT-en
- InstructGPT-zhと同様、OpenAIが開発したInstructGPTをもとにした言語モデルです。
- InstructGPT-enは、InstructGPTを英語のデータに対して学習させたモデルを指します。

教師なしランキングタスク

base-1
- 以下の要素を考慮したヒューリスティックな関数
  - 文章の長さ
  - 中国語の金融語彙
  - 市場の感情語彙
  - FinBERT（金融に特化したBERT）からの出力
bayesdcm-2
- base-1の要素に加え、以下の要素も考慮したヒューリスティックな関数
  - FinBERT-toneによる肯定的または否定的な感情
  - Loughran-McDonald金融感情語彙
  - 名詞、基数、動詞の数
multinomial-3
- bayesdcm-2と要素は同じだが、各要素に重みをつけたヒューリスティックな関数

結果と考察

ペアワイズタスクでは、T5に比べてInstructGPT-zhの方が高精度だったことから、Instructionベースの言語モデルのfew-shot learningの可能性を示唆していました。一方、中国語をGoogle翻訳を用いて英語に翻訳して学習したInstructGPT-enではあまり良い結果が得られませんでした。

教師なしランキングタスクの方では、すべての提案手法（base-1, bayesdcm-2, multinominal-3）は今までのERAIのランキングタスクのベストスコアよりも高精度となっていました。今までのベストスコアの手法との唯一の違いは「市場の感情語彙」の有無でした。このことから、ランキングタスクでは市場の感情語彙を使用すること有用性が示されました。

アナリストによる分析

今回紹介した論文のように、AIによる投資基準の自動評価ができるようになった場合、性別や年代、職種などのセグメント情報と合わせることで個人投資家の価値観が適切に取得しやすくなるため、金融商品のセールスや企画に活かせたり、ファイナンシャルプランナーを代替するチャットボットで投資アドバイスを行う場合の基盤となることが予想されます。
クオンツの取り組みはあまり公開されることはありませんが、SNSが発達した現代では新しいアプローチとして着目され始めているのかもしれません。

今回はInstructGPT-enを構築するために、中国語のデータをGoogle翻訳を使って英語のデータにしてから学習していました。近年は翻訳の精度が向上したことにより、データセットが多くある言語から、データセットがあまりない言語モデルを学習する手法が増えています。しかし、今回の論文に記載されていたように、翻訳をして学習したモデルで高精度なものを作るのは困難です。そのため、特定の言語に特化したモデルや多くの言語に対応するモデルの開発が重要です。

開発やコンサルティングを依頼する

参考文献

https://arxiv.org/abs/2301.06606

https://aclanthology.org/2022.finnlp-1.14.pdf

この記事を書いた人

Togo

自然言語処理の研究開発をしている大学院生です。
大手シンクタンクのインターンに参加した経験から金融分野にも興味が広がっています。

【所属】
早稲田大学人間科学研究科

【発表した論文】
・システム発話の感情分類による制御を行ったマルチモーダル対話システム（第一著者）
・語用論的対話方策を使用するルールベースの対話システム（第一著者）
・保育現場での実用に向けたテキストベースファシリテーション対話システムの開発（第一著者）
・相談者の期待の種類を考慮する恋愛相談対話システムの検討（第二著者）
・深掘り質問を活用したカタカナ語学習支援対話システム（第二著者）