★データ解析備忘録★

ゆる〜い技術メモ

Rのrevealjsパッケージで作ったスライドをPDFにしたい

方法

htmlの末尾に ?print-pdf をつけてブラウザの印刷機能でPDF出力。

例: https://ymattu.github.io/TokyoR74/slide.html#/ の場合、

https://ymattu.github.io/TokyoR74/slide.html?print-pdf#/ にする。

ブラウザ上での表示はおかしくなりますが、PDF上ではきれいになります。

(もちろん、PDFなので縦横にスクロールするようなものは無効になって途中で途切れたような表示になりますが。)

オプション

  • 余白:なし
  • オプション:「背景のグラフィック」にチェックする

データフレームから全て NAの列や行を取り除くには

TL;DR

もっと簡単に書ける/良い方法があれば @y__mattu までお願いします。

library(tidyverse)

# サンプルデータ
my_iris <- iris %>%
  # 全部NAの列を追加
  add_column(na_col = NA, .before = 0) %>%
  # 全部NAの行を追加
  add_row(.before = 0)

head(my_iris)
#>   na_col Sepal.Length Sepal.Width Petal.Length Petal.Width Species
#> 1     NA           NA          NA           NA          NA    <NA>
#> 2     NA          5.1         3.5          1.4         0.2  setosa
#> 3     NA          4.9         3.0          1.4         0.2  setosa
#> 4     NA          4.7         3.2          1.3         0.2  setosa
#> 5     NA          4.6         3.1          1.5         0.2  setosa
#> 6     NA          5.0         3.6          1.4         0.2  setosa

# 全部NAの列を削除
my_iris %>%
  select_if(~sum(!is.na(.)) > 0) %>%
  head()
#>   Sepal.Length Sepal.Width Petal.Length Petal.Width Species
#> 1           NA          NA           NA          NA    <NA>
#> 2          5.1         3.5          1.4         0.2  setosa
#> 3          4.9         3.0          1.4         0.2  setosa
#> 4          4.7         3.2          1.3         0.2  setosa
#> 5          4.6         3.1          1.5         0.2  setosa
#> 6          5.0         3.6          1.4         0.2  setosa

# 全部NAの行を削除
my_iris %>%
  filter_all(any_vars(!is.na(.))) %>%
  head()
#>   na_col Sepal.Length Sepal.Width Petal.Length Petal.Width Species
#> 1     NA          5.1         3.5          1.4         0.2  setosa
#> 2     NA          4.9         3.0          1.4         0.2  setosa
#> 3     NA          4.7         3.2          1.3         0.2  setosa
#> 4     NA          4.6         3.1          1.5         0.2  setosa
#> 5     NA          5.0         3.6          1.4         0.2  setosa
#> 6     NA          5.4         3.9          1.7         0.4  setosa
続きを読む

useR ! 2018 のまとめと(雑な)感想

これはなに

7/10-13の4日間、自腹を切ってuseR ! というRのカンファレンス(世界大会みたいなやつ)に参加してきました。

user2018.r-project.org

今年はオーストラリアはブリスベンでの開催。 見たものと感想を簡単に。帰国したら多分付け足します。

続きを読む

RユーザのためのRStudio[実践]入門 という本が出ます。

久しぶりの更新が宣伝ですいません。 タイトルの通り、6/29に書籍が出ます。

副題も含めたちゃんとしたタイトルは

RユーザのためのRStudio[実践]入門−tidyverseによるモダンな分析フローの世界−

です。

RユーザのためのRStudio[実践]入門−tidyverseによるモダンな分析フローの世界−

RユーザのためのRStudio[実践]入門−tidyverseによるモダンな分析フローの世界−

自分が筆頭著者になっているのは単純に書いたページ数が一番多いからです。正直、この本に対しては溢れんばかりの熱い想いがありますので、特に誰かに頼まれたわけではないけどこうして宣伝記事を書いています。

続きを読む

RStudio Server + tidyverse + RMeCab で日本語もOKなDockerイメージをアップデートしました

はじめに

1年ほど前に作った日本語+Mecab+tidyverseなDockerイメージですが、時代に合わせてアップデートしました。

1年前の記事:

y-mattu.hatenablog.com

今回のDocker イメージ: https://hub.docker.com/r/ymattu/mecab-d/

アップデート内容は

  • R 3.4.4 対応
  • TeX Live を入れていたけど Tiny TeX に変更
  • tidytext パッケージを追加

あたりです。

入っている内容は相変わらず tidyverse パッケージ群、MeCab および RMeCabパッケージ、LaTeX環境(R Markdown PDF出力用) です。また、ggplot2 などでの日本語プロットも文字化けしないようにIPAexフォントを入れています。このフォントはR Markdownで日本語のPDFを出力する時にも必要です。

続きを読む