2014年11月24日月曜日

Rで主成分分析するときに使いたいggbiplotパッケージ

本当は来月のAdvent Calenderのネタにしようかと思っていたのだが、DeepLearningのネタを書くというようにDicisionMakingしたので、自分の退路を断つという意味でも先にこれを公開しておこう。

最近、改めて多変量解析をじっくりと行うことが多いのだが、今までplotがあんまりいけてないという理由で主成分分析や因子分析などを活用することがなかった。
ggplotが広く使われるようになって、Rでのビジュアライゼーションに革命が起こったのは周知の事実だが、多変量解析のプロットについてもこの革命の手が及んでいたことが判明して、僕のQOLが向上したので、それを共有したい。

なお、主成分分析とはなんぞやという話は、下記のさのっちの資料によくまとめられているので、そちらを参照されたい。

ちなみに、Rで主成分分析を行う際はstatsパッケージというデフォルトで実装されているパッケージ内のprcomp関数を使用しないといけない。
パッケージのインストール
 
install.packages("ggbiplot")
library(ggbiplot)

このパッケージ内にwineというデータセットがあるので、そちらを使います。
これで描画すると、ggplotをベースにしたbiplotを描くことができます。 

なかなかきれいにplotできています。 引数で色々と設定できますし、個人的にはこの円がなんか響いて、けっこうよく使うようになりました。 主成分分析するときにggbiplotぜひ活用してみてください!

0 件のコメント:

ページビューの合計