R

Rcppでデータハンドリングを高速に行う(Tickデータの処理を事例に)

おはこんばんにちは。為替のTickデータを使った解析を行っているんですが、サンプルサイズが1年間のデータで1200万件にも及びます。メモリには乗るんですが、一つ一つに対して少し複雑な処理を行おうとすると処理にかなり時間がかかったりして非常に非効率です。今回はRcppパッケージを用いて、C++で書いた関数をR上の関数としてコンパイルし処理速度を高めるという方法を紹介したいと思います。

WindowsにNEologd辞書をインストールして、RMeCabを実行する方法

新語に強いNEologd辞書をMecabにインストールしてみました。

10年物長期金利をフィッティングしてみる

単なる思い付きです。

rvestでyahoo競馬にある過去のレース結果をスクレイピングしてみた(2回目)

前回のデータ収集では足りないデータがあったので再度スクレイピングしてみました。

GPLVMでマルチファクターモデルを構築してみた

最近私が注目しているのがガウス過程。今回はそのガウス過程の中でも、主成分分析のようにデータセットの次元削減のために使用されるGaussian Process Latent Variable Model(GPLVM)の紹介をします。

Asset Allocation ModelをRで組んでみた。

社内ワークショップがあり、休日は国会図書館に籠り、先行研究を漁った結果、微妙なアセットアロケーションモデルを構築できました。

カルマンフィルタの実装

時系列解析には欠かせないカルマンフィルタ。Rでもパッケージが用意されていて非常に便利ですが、ここではいったん理解を優先し、カルマンフィルタの実装を行ってみたいと思います。

ガウス回帰の実装をやってみた

万能すぎて逆に面白くないと話題のガウス回帰を実装してみました。

Gianonne et. al. (2008)のマルチファクターモデルで四半期GDPを予想してみた

前回集めた経済データをGiannone et al (2008)のマルチファクターモデルで推定し、四半期GDPを予測したいと思います。

日次GDP推計に使用する経済統計を統計ダッシュボードから集めてみた

Rでデータ集めをします。データ分析はデータ集めと前処理が7割を占めるといわれる中、データ集めを自動化すべくウェブスクレイピングを行いました。