単発

【徹底比較】センチメントスコア算出手法!! - 第4回

単語埋め込み(word embedding)を用いたセンチメントスコアの算出を実践します!

【徹底比較】センチメントスコア算出手法!! - 第3回

ナイーブベイズ分類器を用いたセンチメントスコアの算出を実践します!

【徹底比較】センチメントスコア算出手法!! - 第2回

辞書ベース手法を用いたセンチメントスコアの算出を実践します。

【徹底比較】センチメントスコア算出手法!! - 第1回

テキストからセンチメント情報を抽出する手法を数回にわたって紹介します。

Pythonのpandas_datareaderから色々なデータを取得してみる

pandas_datareaderを使って色々なデータを取得してみました。

OECD.orgからマクロパネルデータをAPIで取得する

OECD.orgのAPIを使って、各国のマクロ経済データを取得してみました。

Rcppでデータハンドリングを高速に行う(Tickデータの処理を事例に)

おはこんばんにちは。為替のTickデータを使った解析を行っているんですが、サンプルサイズが1年間のデータで1200万件にも及びます。メモリには乗るんですが、一つ一つに対して少し複雑な処理を行おうとすると処理にかなり時間がかかったりして非常に非効率です。今回はRcppパッケージを用いて、C++で書いた関数をR上の関数としてコンパイルし処理速度を高めるという方法を紹介したいと思います。

そのバックテスト本当に再現性ありますか?

金融であればクオンツの方は新規運用戦略の立案をする際に、バックテストを行ってパフォーマンスの確認をすることがあると思います。今回は、バックテストのオーバーフィッティングがアウトオブサンプル・パフォーマンスに及ぼす影響について調べたので備忘録をかねてまとめてみました。

WindowsにNEologd辞書をインストールして、RMeCabを実行する方法

新語に強いNEologd辞書をMecabにインストールしてみました。