はじめに
dogwood008 です。面白そうな研究会「第21回 人工知能学会 金融情報学研究会(SIG-FIN)」をやっていたので、気になったのをいくつかチョイスして概要と感想をまとめました。本当は現地まで行きたかったのですが、開催に気付いたのが終わってからでした… 😢
photo by はむぱんさん
適時開示情報の業績に対するリスク有無の自動判定
著者(敬称略): 矢野大輔, 酒井浩之, 北島良三(成蹊大学), 広井康男, 村山勉(QUICK), 河合継(クリスタルメソッド), 西山昇(Dragons'Desk, 千葉商科大学)
<概要>
適時開示に含まれる単語で、特別損失、違反、その他、リスク無しの4つに分類。深層学習を使用し、Chainerでモデルを作成。結果全体制度は87.4%。
<感想>
アプローチは面白いと思ったが、適時開示がだいたい場が閉まっている時に発表されることが多い(実際はわからないがそのような印象がある)ので、適時開示解析→成行売りを自動化するにはちょっと難しいなという印象。論文の主旨とは外れるかもしれないが、本手法で時間の制約がないリスク調査、例えば契約書のリスク調査を行うモデルを作成すると、もしかするとより適合するかもしれない。
為替情報の幾何的特徴を用いた売買アルゴリズムの検討
著者(敬称略): 河合継(クリスタルメソッド), 新田翔(東京理科大学), 山口航(東京工業大学), 木村祐輔(東京大学), 西山昇(Dragons'Desk, 千葉商科大学)
<概要>
PointNet++と呼ばれる、3次元の点群形式データの幾何学的な特徴を処理することに長ける学習器を使用。データの形に着目して未来のFXのグラフを予想して取引する。結果、過学習したため、そのままの実用には堪えない(4つのシミュレーションで1つのみ利益を出した)。仮にランダムに為替レートが動くと仮定すると、そもそもこの試みは無理なことである。
<感想>
著者も述べているように、為替レートがランダムに動くと仮定すると実用はできない。実際にはランダムではないが、未知数の次元によって為替レートが決まると仮定すると、為替レートの遷移は実質ランダムである。この感想の筆者も、過去にbitcoinの過去データで学習したAIに取引させたが、(数字上は儲かったが)正しく学習できたとは言えなかった。過去のデータのみから学習して未来のグラフを作成することは、レートの需給システム上非常に難しいのかもしれない。ニュースをいち早くゲットして、テキストマイニングからの高速取引が実際一番儲かるのかもしれない。
金融テキストマイニングの基づいた投資家支援プラットフォームの開発
著者(敬称略): 坂地泰紀, 和泉潔, 松島裕康(東京大学)
<概要>
原因と結果を結びつけることで、ある特定の事象が発生した際に関連して株価が動きそうな会社を割り出すことができる。例えば「猛暑の影響」という原因表現に対して、「除草関連用品、散水用品、日除け用品が好調に推移しました」という結果表現がある場合、除草剤製造会社の売上が上がることが予測される。Pythonのパッケージでマイニング手法を手軽に行う手段を配付予定。
<感想>
今後が楽しみである。参考文献に少し不安が残る(2/6が全国大会、6つの文献は全て日本語話者による著作)が、日本語のマイニングのため、そうであってもあまりこだわらなくても良いかもしれない(研究会発表だし)。今は経験則で「特定の天変地異が来た時にこの会社の株が上がるor下がる」のようなことがあるが、マイニングによって新しい関連性が見つけられれば儲けるチャンスが増えそうである。ただし、擬似相関には気をつける必要がありそうだ。
外国為替市場におけるトレーディング戦略分類
著者(敬称略): 末重拓己, 金澤輝代士(東京工業大学), 高安秀樹(東京工業大学, 明治大学, Sony CSL), 高安美佐子(東京工業大学)
<概要>
トレーダー個人の取引に着目。EBSの外為高頻度注文データを解析。トレーダーが指数関数を用いたトレンド定義を行っていることを前提とする(実務でもにEMAが使用されている)。個々のトレーダーが過去x分まで遡って参照した上で指値の取引価格を決定しているかを分類。k-meansによりクラスタリング。0.5分、3分、6分、それ以外の4種類。結果3分のクラスタの取引回数が最小。このクラスタ所属のトレーダーは “best price” (とは?詳細不明)から最も遠いところに指し値注文分布が存在。また、0.5分は日本時間に、3分はニューヨーク時間に特徴的な戦略であることがわかった(なぜ?)。つまり、日本時間に活動するトレーダーは現時点での価格に積極的であるのに対し、ニューヨーク時間のそれは消極的である。
<感想>
日本時間中は3分前の価格を見て、ニューヨーク時間中は30秒の前の価格を見て逆張りしたら面白いかもしれない。この論文だけではなんともよくわからない部分が多く消化不良感があるので、続報を待ちたい。
おわりに
今回初めて研究会論文を真面目に読んだのですが、結構ページ数が少なくてサクサク読めました。こういうのをちゃんと習慣づけていきたいですね〜