★データ解析備忘録★

ゆる〜い技術メモ

2022年振り返り

今年は数年ぶりに穏やかな年末を迎えているので、振り返りを書こうと思います。なんとこのブログで1年を振り返るのは5年ぶり。最後の振り返りは2017年でした(2017年を雑に振り返る - ★データ解析備忘録★)。修士に進んで結果の出ない時期が続いたり、なんと…

『Rユーザのためのtidymodels[実践]入門』という本が出ます。

この記事はR Advent Calendar 2022 9日目の記事です。 そしてこのブログも1年ぶりの更新となります。ごめんなさい。 さて、タイトルの通り書籍が出ます。正式タイトルは 『Rユーザのためのtidymodels[実践]入門〜モダンな統計・機械学習モデリングの世界』 …

useR! 2021の運営に参加して感じたこと

はじめに この記事はR Advent Calendar 2021 の25日目の記事です。 僕は今年のRの国際カンファレンス useR! 2021 に運営の一人として参加し、大きな挫折を味わいました。 useR! 2021 のホームページには「Global Organizing Committee」「Conference Facilit…

r-libで気になるパッケージを列挙する

はじめに この記事は R Advent Calendar 2021の18日目の記事です。 r-libとは r-libは、Rの開発や環境(Environment; RStudioなどの実行環境とは異なる)を支えてくれるような、レイヤーが低めな部分を担当するパッケージを多く開発している組織です。 githu…

『RユーザのためのRStudio[実践]入門』の改訂2版が出ます。

はじめに 『RユーザのためのRStudio[実践]入門』(通称「宇宙本」)が改訂され、3年ぶりに帰ってきます。 私は初版に引き続き1章「RStudioの基礎」と2章「スクレイピングによるデータ収集」を担当しています。カバーも新しくなり、見た目のアップデート感も…

lantern パッケージの紹介

はじめに この記事は R Advent Calendar 2020 22日目の記事です。 今年は色々ありまして、まさかの1年ぶりの記事更新です。 lantern パッケージは、平たく言えば tidymodels で torch のモデリングを提供するものです。 この一文で意味が分かる方は少し飛ば…

闇のExcelに対する防衛術

この記事は R Advent Calendar 2019 の25日目の記事です。 Rユーザにとっての闇、それはデータソースとして渡されるエクセルファイルでしょう(異論は認める)。 tidyverseの中にある readxl パッケージによってだいぶ楽になったとはいえ、まだまだ手元でエク…

easystatsについて①: パッケージ群の紹介

これはR Advent Calendar2019の第1日目の記事です。 はじめに R言語の特徴として 統計解析向けの手法がたくさん実装されている CRANやGitHubに誰でもパッケージを公開できる というものがあるかと思います。他にも tidyverse パッケージ群の登場によってデー…

「白金鉱業 Meetup Vol.12(白金鉱業 x IBM社内勉強会dsn 合同企画回)」に参加しました。

白金鉱業 Meetup Vol.12(白金鉱業 x IBM社内勉強会dsn 合同企画回)に参加しました。 白金鉱業 Meetupの参加自体始初めてだったのですが、非常に楽しめました。 brainpad-meetup.connpass.com

「データアーキテクト(データ整備人)を”前向きに”考える会」に参加しました

はじめに 11/27に開催された「データアーキテクト(データ整備人)を”前向きに”考える会」にブログ枠として参加させて頂いたのでイベントの様子をレポートとして書きます。 analytics-and-intelligence.connpass.com 会場: 株式会社オプト

RからGoの関数をつかう→はやい

R Go

これはなに こんな話があります(だいぶ昔 qiita.com qiita.com で、RからRustを使おうというのが ゆたにサンの記事。*1 notchained.hatenablog.com それで、この記事はRからGoを使おうって話です。 速度の比較をやりたいので、本記事ではフィボナッチ数列の関…

Rおじさん、Lisperへの道 (Common Lisp環境設定編)

はじめに Twitter上でこんなやりとりがあって、Lispをちゃんと勉強しようかなと思った次第。これまでEmacsを使って設定ファイルも(汚いけど)それなりに書いてきたので基礎を知ってるくらいなので、ここは一つCommon Lispをちゃんとやっておきたいなというの…

vroomパッケージを使ってみる。【追加検証編】

これはなに 以下の記事の追加検証です。随時更新 y-mattu.hatenablog.com

vroomパッケージを使ってみる

R

これはなに データ読み込み系のパッケージで新しいのが出現したので、ちょっと触ってみた記録です。 2019年5月にリリースされたばかりのほやほやパッケージ。 vroomパッケージ github.com

【Rパッケージ】appveyor.ymlの注意点

これはなに 久しぶりにRパッケージのメンテをしていてハマったので備忘録としてメモ。タイトル通りappveyorでコードをテストするときの注意点です。 Appveyorとは Rパッケージ等のソフトウェアのチェックをする際に使われるCI (継続的インテグレーション) ツ…

Rのrevealjsパッケージで作ったスライドをPDFにしたい

R

方法 htmlの末尾に ?print-pdf をつけてブラウザの印刷機能でPDF出力。 例: https://ymattu.github.io/TokyoR74/slide.html#/ の場合、 https://ymattu.github.io/TokyoR74/slide.html?print-pdf#/ にする。 ブラウザ上での表示はおかしくなりますが、PDF上…

データフレームから全て NAの列や行を取り除くには

R

TL;DR もっと簡単に書ける/良い方法があれば @y__mattu までお願いします。 library(tidyverse) # サンプルデータ my_iris <- iris %>% # 全部NAの列を追加 add_column(na_col = NA, .before = 0) %>% # 全部NAの行を追加 add_row(.before = 0) head(my_iris…

useR ! 2018 のまとめと(雑な)感想

これはなに 7/10-13の4日間、自腹を切ってuseR ! というRのカンファレンス(世界大会みたいなやつ)に参加してきました。 user2018.r-project.org 今年はオーストラリアはブリスベンでの開催。 見たものと感想を簡単に。帰国したら多分付け足します。

RユーザのためのRStudio[実践]入門 という本が出ます。

久しぶりの更新が宣伝ですいません。 タイトルの通り、6/29に書籍が出ます。 副題も含めたちゃんとしたタイトルは RユーザのためのRStudio[実践]入門−tidyverseによるモダンな分析フローの世界− です。 RユーザのためのRStudio[実践]入門−tidyverseによるモ…

RStudio Server + tidyverse + RMeCab で日本語もOKなDockerイメージをアップデートしました

はじめに 1年ほど前に作った日本語+Mecab+tidyverseなDockerイメージですが、時代に合わせてアップデートしました。 1年前の記事: y-mattu.hatenablog.com 今回のDocker イメージ: https://hub.docker.com/r/ymattu/mecab-d/ アップデート内容は R 3.4.4 対…

2017年を雑に振り返る

年の瀬ですので、2017年を振り返りたいと思います。 研究 お仕事 勉強会 SAS ユーザー総会 Pycon Tokyo.R, Japan.R OSS 活動

私とホクソエム

はじめに これは HOXO-M Advent Calendar 2017 25 日目の記事です。 出ない順ホクソエム語彙集(その1) - Technically, technophobic. にある通り、ホクソエムにはその文脈によって3つの意味合いがあります。 匿名知的集団ホクソエム 「hoxo_m」というIDの…

Python 製のシェル xonsh を使ってみる

はじめに これは Xonsh Advent Calendar 2017 24 日目の記事です。 終盤なのに使ってみた記事でごめんなさい。

Rとtidyverseと私

はじめに 大遅刻ですが、tidyポエム Advent Calendar 2017の16日目です。 Rとtidyverseへの思いをただ綴るポエムですので、Rのコードなど1行も出てきません。

運営雑用係から見たJapan.Rの振り返り

はじめに これは R Advent Calendar 9日目の記事です。 去る12/2(土)に、年に1度のRユーザーの祭典である Japan.Rが開催され、大変に盛り上がりました。 私は今年は2度目となる運営のお手伝い(雑用)と、LTの発表で参加させていただきました。 何を手伝ったの…

EmacsでつくるオレオレRStudioから1年、自分の分析環境の変化について

はじめに 遅れてすいません。RStudio アドベントカレンダー2日目です。 一年前のアドベントカレンダーで、こんな記事を書いたら意外と反響がありました。 y-mattu.hatenablog.com これを書いたら周りから過激派だの何だの言われましたが、まあ自分の中では楽…

R Markdown で作ったスライドに R で音声を吹き込む

R

はじめに R Markdown ではスライドを作ることができます。 https://kazutan.github.io/SappoRoR6/rmd_slide.html#/ とくに、reveal.js ベースの {revealjs} パッケージや remark.js ベースの {xaringan}パッケージは簡単にRの出力を含めたシンプルなスライド…

CRANは闇なのか

はじめに こんな話があります。 闇と向き合う from Nagi Teramo www.slideshare.net RのパッケージをCRANに登録するのは闇であるという内容です。一方で、そんなに闇ではないという意見もあります。 estatapiパッケージがCRANで公開されました。 - Technical…

「機械学習のパラメータをベイズ最適化でチューニング」をRで超簡単に書けるパッケージを作った

0. 要約 機械学習のハイパーパラメータをベイズ最適化でチューニングするのは既存パッケージの組み合わせで頑張ればできたのですが、頑張らなくても簡単に書けるパッケージを作りました。 github.com これにより、例えば iris データをXGboostの3-foldクロス…

Pythonでshapefileから逆ジオコーディング

はじめに 緯度経度から住所(市区町村・番地)を求める逆ジオコーディングですが、Rを使ったバージョンは以前書きました。 y-mattu.hatenablog.com また、上記は市までわかっているバージョンだたのですが、そもそもの県や市を求めたいときは以下も参考になり…