★データ解析備忘録★

ゆる〜い技術メモ

『データサイエンティストのための最新知識と実践 Rではじめよう! [モダン]なデータ分析』という本をちょっとだけ書きました。

タイトル通りです。

データサイエンティストのための最新知識と実践 Rではじめよう! [モダン]なデータ分析

データサイエンティストのための最新知識と実践 Rではじめよう! [モダン]なデータ分析

もう発売されてますし、Tokyo.Rではもう宣伝したのですが一応。

コンセプト

ベースは昨年マイナビ電子書籍サイト「マナティ」の連載に載った「Rではじめよう! [モダン]なデータ分析」です。書籍内の応用編はほぼこのときの連載です。 当時連載を書いた8名がそのまま著者になってます。

これに導入編としてTokyo.Rでの初心者セッションのような内容が2記事、応用編に追加で1記事加えられたのが本書になります。

僕が書いたところ

導入編1.2 「Rによるモダンな前処理の基礎」で{dplyr}の基礎を、応用編2.6 「青空文庫テキストマイニングをRMeCabパッケージでやってみた」を書いてます。

1.2の方は僕が何度かTokyo.Rでやった「データ・マエショリスト」の発表がベースです。 2.6 の方ではデータ取得からSVMのパラメータチューニングまで全てRでやるというコンセプトでやっています。

注意

「最新知識」と題名に入っていますが、内容は必ずしも最新ではありません。これは原稿を書いた時期と、書籍にする以上は最新でなくても安定して動作するものを書かなければいけないという制約によるものです。例えば、{dplyr}は現在は0.7(CRAN版)ですが僕が執筆した段階では0.5でした。 また、地理データ({sf})やベイズ最適化({rBayesianOptimization})など、わりと最近できたパッケージはフォローしきれてなかったりします。 僕のテキストマイニングの記事も今は{tidytext}とかありますが書籍内では{dplyr}ゴリ押しでやっています。

最後に

まあ、いろいろありますがテーマが豊富で読み物として普通に面白いと思うので、ぜひ手にとっていただければと思います。