ライフイズビューティフル

訪問記/書評/勉強日記(TOEIC930/IELTS6.0/HSK5級/Python)

実践金融データサイエンス: 隠れた構造をあぶり出す6つのアプローチ | 三菱UFJトラスト投資工学研究所 (編集) | 2022年書評#53

先日Twitterを見ていたら仮想通貨でのアルゴリズムトレードで有名なUKIさんが株価に対してもアルゴリズムトレードをしているアプローチをまとめてくれていました。

note.com

このように(公開されている)データを活用して十分に個人でもリターンを出しているというケースを目にすることが増えてきました。

以前読んだ本のシモンズ率いるルネサンステクノロジークオンツファンドで多くのリターンを上げています。

ohtanao.hatenablog.com

本書は三菱UFJトラスト投資工学研究所が実施している取り組みやその他事例をテキストマイニングを中心にまとめられた本であり、近年株取引にいかにデータを用いた売買が行われているのか紹介されています。

 

📒 Summary + Notes | まとめノート

感想

本書ではテキストマイニング技術を中心にCSRレポート、決算短信、マクロ指標や要人発言からの株価予想をどのようなアプローチで行われているのか解説されていました。

テキストマイニングという結果に繋がりにくそうで学術思考が強めのアイテムであり、そこに対してAIや機械学習が取り込まれて様々な取り組みが実施されていることを見て取れました。

一方で、AIファンドの結果や資産総額を見るにすこし流行りは過ぎ去り、今後はわかりませんが現状の結果はついてきていないようにも見えます。

UKIさんのように個人レベルでテキストマイニングとは異なる手法で結果が出ていたりするのを見ると、テキストマイニングは今後まだまだ発展の余地があるように思います。はたまた、テキストマイニングという手法がどこまで株価の売買利益に直結できるかというと少し遠回りである可能性もあるように感じてしまう部分もありました。

ただし、内容は総じて面白くこのような手法で投資という世界にデータ分析が活用されているのか!と知れるという意味ではとても良い本だったように思いました。

金融データ分析の変化

金融業界のデータ活用とひとくくりにされがちですが手法は様々あります。ニュースなどからマクロの動きを予想する手法、CSRレポートや決算短信からポジティブな単語、ネガティブな単語を読み取り内容の良し悪しを判断するもの。

有名な物語として「フラッシュ・ボーイズ」に取り上げられたHFTと呼ばれる先回り高速トレードのようなものもあります。

データ分析の手法は日々変化しており、各種経済指標などはあたりまえにブログやTwitter、学術論文、天気、POSデータなど分析をするデータは増え続けています。過去と比べると、量、リアルタイム性、バリエーション、定性情報、正確性、メンテナンス性など大幅に変わりつつあり、データの取得、加工、管理、運営、利用など試行錯誤しながら作り込まれているようです。

いろいろな情報を活用した株式運用

誰が取引しているのか?

JPXが公表している投資部門別売買動向のデータを見ると海外投資家が多くの割合を占めていることがわかります。

株価はなぜ動くのか?

株価が動く要素は様々で、秒・分単位などでは日中の値動きや注目情報、時間・日単位ではニュースや株価チャート(テクニカル)、月などの単位であるとファンダメンタル情報と呼ばれる財務指標やマクロ情報などが要因となります。時にTwitterなどで要人発言があるとそれにともない株価が反応するなどもあります。(イーロン・マスクの発言など)他にも、企業発表(決算発表)、世界銀行の発言なども株価の変動要因となり得ています。

本書内で株価変化に関わる情報区分を大まかに4分類にしております。

  1. 経済・企業の基礎的要因(ファンダメンタルズ)
  2. 株価変動のパターン(テクニカル)
  3. 投資家心理(センチメント)
  4. 説明できない規則性(アノマリー

これらを紐付けながら株価予想をするAIファンドも多く出現しております。

  1. AI日本株式オープン(活用データ:ニュース、企業発表)
  2. Yjamプラス!(活用データ:ニュース、Web検索量) *Paypay投信AIプラスに名称変更
  3. ビッグデータ活用日本中小型株式ファンド(活用データ:新聞、ニュース)
  4. GSビッグデータ・ストラテジー(日本株)(活用データ:アナリストレポート、議事録、ニュース、Webアクセス量)

各投信データを見る限り、資金流入が大きく2017年ごろをピークに運用資産額は減る一方で成績もあまり芳しくないというのが現状のようではあります…。

企業間ネットワークと情報の伝播

本書で具体的事例が5つほどあります。まずは企業間ネットワークについてです。どの企業もサプライチェーンがあり、その関連性や業績の推移に応じてネットワーク内に居る企業の業績推移を予測しようというようなものになります。

一つの例としてトヨタ自動車と大豊工業の関係を上げており、トヨタ自動車生産台数が上がると大豊工業の売上が上がるというような関連性を見ています。

本書には書いていないですが、同様のことは安川電機などが決算発表が早く機械設備の導入具合により決算動向が変わることから先行指標として見られていることなどもゆるやかなネットワークの考え方に思います。ペアトレードなどを行う際にも似たような考え方をしますよね。

テキストマイニング

次に挙げられる事例はテキストマイニングです。CSRレポートには近年注目されているESGに関わる取り組みが書かれており、それを文章情報から分析する手法になります。

テキストマイニングの手法が紹介されており、関連付けをし単語ごとのツリー構造を作成し、単語ごとの特徴づけをすることで、良いのか・悪いのかなどを点数化して内容の良し悪しを判断します。

CSRレポートは書き方も企業様々であり、日本語の複雑さなどもあり分析が難しいのは想像どおりです。

決算短信テキストマイニング

決算短信にもテキストマイニングは実施されております。決算短信は比較的構成が決まっているためCSRレポートに比べると平易である側面があります。

本書に分析方法や重み付けのアプローチなど書かれていますが、ざっくり言うと決算短信が出てきて瞬時にポジティブなのか、ネガティブなのか、ニュートラルなのかを判断し売買ポジションを取るような流れです。

特に場中決算などがあると、反応が顕著にでており、決算短信が公開された直後にAIが判断→その後人がチェックして動きが修正・追加など起こります。公開直後に上昇し、その後さらに上昇を続けるパターンはAIの判断と人の判断が比較的近いケースなどと想像できるでしょう。

www.youtube.com

📚 Relating Books | 関連本・Web

  1. https://www.bloomberg.co.jp/news/articles/2021-06-19/QUWT56T0G1L001 ヘッジファンドルネサンス、顧客資金流出続く-7カ月で1兆円超
  2. https://amzn.to/3I37E9p 最も賢い億万長者 上下合本版 Kindle版 グレゴリー・ザッカーマン (著), 水谷 淳 (翻訳)
  3. https://amzn.to/3WDWFHI フラッシュ・ボーイズ 10億分の1秒の男たち (文春文庫) Kindleマイケル・ルイス (著), 渡会圭子 (翻訳), 東江一紀 (翻訳)
  4. https://www.mtec-institute.co.jp/ 三菱UFJトラスト投資工学研究所(MTEC)
  5. https://www.jpx.co.jp/markets/statistics-equities/investor-type/ JPX 投資部門別売買状況
  6. https://amzn.to/3G0eIRK 「つながり」を突き止めろ 入門!ネットワーク・サイエンス (光文社新書) 新書 – 2010/10/15 安田 雪 (著)
  7. https://amzn.to/3FYQRlt 私たちはどうつながっているのか―ネットワークの科学を応用する (中公新書) 新書 – 2007/4/1 増田 直紀 (著)
  8. https://amzn.to/3C585fO 実践ネットワーク分析―関係を解く理論と技法 単行本(ソフトカバー) – 2001/10/20 安田 雪 (著)
  9. https://amzn.to/3C0UwOr リーディングス ネットワーク論―家族・コミュニティ・社会関係資本 単行本 – 2006/8/1 野沢 慎司 (翻訳)
  10. https://www.jstage.jst.go.jp/article/gendaifinance/40/0/40_400001/_article/-char/ja/ 論文 サプライヤー・カスタマーのつながりに基づくクロスモメンタムの株価予測可能性 磯貝 明文, 川口 宗紀, 小林 寛司
  11. https://www.release.tdnet.info/inbs/I_main_00.html 適時開示情報閲覧サービス
  12. https://home.kpmg/jp/ja/home/insights/2021/06/sustainability-report-survey-2020.html 日本におけるサステナビリティ報告2020
  13. https://www.jstage.jst.go.jp/article/tjsai/30/1/30_30_172/_article/-char/ja/ 企業の決算短信PDFからの業績要因の抽出 酒井 浩之, 西沢 裕子, 松並 祥吾, 坂地 泰紀
  14. https://sigfin.org/?plugin=attach&refer=SIG-FIN-018-05&openfile=SIG-FIN-018-05.pdf 深層学習と拡張手がかり表現による業績要因文への極性付与
  15. https://www.jpx.co.jp/corporate/research-study/working-paper/index.html JPXワーキング・ペーパー
  16. 世界最先端のVCの定量的投資手法 | by Yuki Hayashi (UTEC) | Medium