『データサイエンティストのための最新知識と実践 Rではじめよう! [モダン]なデータ分析』という本をちょっとだけ書きました。
タイトル通りです。
データサイエンティストのための最新知識と実践 Rではじめよう! [モダン]なデータ分析
- 作者: 瓜生真也,工藤和奏,高柳慎一,牧山幸史,松村杏子,松村優哉,簑田高志,本橋智光,ホクソエム
- 出版社/メーカー: マイナビ出版
- 発売日: 2017/06/30
- メディア: 単行本(ソフトカバー)
- この商品を含むブログを見る
もう発売されてますし、Tokyo.Rではもう宣伝したのですが一応。
続きを読むSASで緯度経度から国名を求める
とりあえず備忘録的にコードと出力だけ。
細かいプロシージャの仕様は後ほど追記します。
コードと出力
RStudio Server + tidyverse + RMeCab で日本語もOKなDockerイメージを作りました
内容をアップデートしました
はじめに
RStudio Server の Docker イメージを作りました。入っているメインコンテンツは、tidyverse なパッケージ群、MeCab および {RMeCab}パッケージ、LaTeX環境 です。また、ggplot2 などでの日本語プロットも文字化けしないようにIPAexフォントを入れています。
RStudio Server の構築手順
Docker をインストール
OS によって変わってくるので、各自検索してください。自分は Mac で boot2docker を使っています。この環境の場合、こちらなどが参考になります。以下、Docker がインストールされていて docker コマンドが使えることを前提とします。
続きを読むtidyverseの正式登場でDockerまわり(rocker)もいろいろ変わってた
はじめに
データ分析では再現性が大切です。しかし、同じコードとデータを使っていても実行環境の違い(OS, ソフトやパッケージのバージョンなど)によって結果が異なることがあります。複数の場所で同じ環境をそろえるための手段の一つとして、はオープンソースのコンテナー管理ソフトウェアであるDockerを使うことが考えられます。Dockerのデータ分析での活用については以下の記事が詳しいです。
tidyverseの登場とDockerまわりの変化
さて、昨年のRStudio ver1.0 のリリースとほぼ同時期にtidyverseが登場し、RStudio Server のDockerイメージを提供しているrockerでのコンテナの種類も変わっていたようです。
それまではhadleyverse*1(便利なパッケージ群)とLaTeX環境が入った rocke/hadleyverse
がメイン だったのが、現在は追加されるパッケージやソフトに合わせて以下の4つになっています。
- rocker/r-ver…debian をベースにRの実行環境を入れたもの
- rocker/rstudio… r-ver に RStudio Server を追加したもの
- rocker/tidyverse… rstudio に tidyverse なパッケージ群 を追加したもの
- rocker/verse… tidyverse に lateX環境 なパッケージ群 を追加したもの
rocker/hadleyverseも生きてはいますが、Docker Hub の冒頭に「これじゃなくて代わりにtidyverse使えよ」って書いてあります。
別にhadleyverseを使ったからと言って何か不都合があるわけではないのですが、RStudio Server の環境構築にDockerを使う場合や自分でDockerイメージを作る場合は頭の片隅に入れておくと良さそうです、&tidyverse周りはまだこれからも変わる(とHadley Wickhamが仄めかしている)可能性が高いので、Rのパッケージと同時にDockerまわりも注視していきたいです。