2017-01-01から1年間の記事一覧
年の瀬ですので、2017年を振り返りたいと思います。 研究 お仕事 勉強会 SAS ユーザー総会 Pycon Tokyo.R, Japan.R OSS 活動
はじめに これは HOXO-M Advent Calendar 2017 25 日目の記事です。 出ない順ホクソエム語彙集(その1) - Technically, technophobic. にある通り、ホクソエムにはその文脈によって3つの意味合いがあります。 匿名知的集団ホクソエム 「hoxo_m」というIDの…
はじめに これは Xonsh Advent Calendar 2017 24 日目の記事です。 終盤なのに使ってみた記事でごめんなさい。
はじめに 大遅刻ですが、tidyポエム Advent Calendar 2017の16日目です。 Rとtidyverseへの思いをただ綴るポエムですので、Rのコードなど1行も出てきません。
はじめに これは R Advent Calendar 9日目の記事です。 去る12/2(土)に、年に1度のRユーザーの祭典である Japan.Rが開催され、大変に盛り上がりました。 私は今年は2度目となる運営のお手伝い(雑用)と、LTの発表で参加させていただきました。 何を手伝ったの…
はじめに 遅れてすいません。RStudio アドベントカレンダー2日目です。 一年前のアドベントカレンダーで、こんな記事を書いたら意外と反響がありました。 y-mattu.hatenablog.com これを書いたら周りから過激派だの何だの言われましたが、まあ自分の中では楽…
はじめに R Markdown ではスライドを作ることができます。 https://kazutan.github.io/SappoRoR6/rmd_slide.html#/ とくに、reveal.js ベースの {revealjs} パッケージや remark.js ベースの {xaringan}パッケージは簡単にRの出力を含めたシンプルなスライド…
はじめに こんな話があります。 闇と向き合う from Nagi Teramo www.slideshare.net RのパッケージをCRANに登録するのは闇であるという内容です。一方で、そんなに闇ではないという意見もあります。 estatapiパッケージがCRANで公開されました。 - Technical…
0. 要約 機械学習のハイパーパラメータをベイズ最適化でチューニングするのは既存パッケージの組み合わせで頑張ればできたのですが、頑張らなくても簡単に書けるパッケージを作りました。 github.com これにより、例えば iris データをXGboostの3-foldクロス…
はじめに 緯度経度から住所(市区町村・番地)を求める逆ジオコーディングですが、Rを使ったバージョンは以前書きました。 y-mattu.hatenablog.com また、上記は市までわかっているバージョンだたのですが、そもそもの県や市を求めたいときは以下も参考になり…
最近、仕事でShinyアプリケーションを作るようになったのですが、ちょこっとはまったのでメモ。 shiny の基本のキは分かってる人向けです。 Shiny での文字入力 まず、Shiny で文字入力してボタンを押すとUIに反映されるを実現するには r - Create a data fr…
タイトルが長くなってしまったけど、なぜかこんな単純なことが3系で書かれたものが見つからなかったので備忘録的に(あったらゴメンなさい)。 import os import zipfile import glob for i in glob.glob('*.zip'): with zipfile.ZipFile(i, 'r') as zf: dirna…
はじめに これまで 形態素解析器JUMAN++をRから操作するパッケージを作り始めました - ★データ解析備忘録★ 【R】{rjumanpp}ver0.0.0.9991の変更点とパッケージの構想について - ★データ解析備忘録★ {rjumanpp} ver0.0.0.9992 表層形ではなく活用の原形を出力…
はじめに これまで 形態素解析器JUMAN++をRから操作するパッケージを作り始めました - ★データ解析備忘録★ 【R】{rjumanpp}ver0.0.0.9991の変更点とパッケージの構想について - ★データ解析備忘録★ {rjumanpp} ver0.0.0.9992 表層形ではなく活用の原形を出力…
rjumanpp 形態素解析器JUMAN++をRから操作するパッケージを作り始めました - ★データ解析備忘録★ 【R】{rjumanpp}ver0.0.0.9991の変更点とパッケージの構想について - ★データ解析備忘録★ github.com 絶賛開発中で、今回は出力で原形を返すオプションをつけ…
結論 RSeleniumはだいたいわかってるから読むのが面倒くさい人へ。サーバー起動時にextraCapabilitiesオプションでダウンロードディレクトリの情報をChromeオプションとしてlist形式で渡してやれば設定できます。 # Chromeオプションを追加 eCaps <- list( c…
はじめに 先日、国勢調査 小地域 Shapefileからより細かい粒度で逆ジオコーディングを行う方法を書きました。 y-mattu.hatenablog.com しかし、ここで使っていた小地域shapefileをダウンロードをする関数では県と市をこちらで指定する必要がありました。(uri…
はじめに 現在開発中のJUMAN++をRから操作するパッケージ{rjumanpp}ですが、まだ完成には程遠いもののベースになる部分はほぼできており、前回からいくつか基本的な変更があります。 ver 0.0.9991 関数名について rjumanppパッケージでは、解析に関係する主…
はじめに @u_riboさんによるこんなツイートがある。 一部で話題の(?)e-Statが提供する国勢調査小地域のShapefileをRからダウンロードする関数を書きました (gifが高速過ぎる orz) コードは https://t.co/Dd2R58ov94 pic.twitter.com/SRo2H1Fk4W— Uryu Shinya…
はじめに JUMAN++という日本語の形態素解析器が昨年登場したようです。 速度はMeCabには劣るものの、解析精度(特に表記ゆれや話し言葉)に強いようです。 JUMAN++自体のインストールや使い方は公式マニュアルや以下のリンクが参考になります。 qiita.com あと…
はじめに 検索してもでてこなかったので、緯度経度からその点が含まれる3次メッシュ(基準地域メッシュ)コードを算出する関数をSASで作成しました。(僕が知らないだけでもしかしたら既にあるのかもしれませんが。) 地域メッシュコードの概要については統計局…
SASによるジオコーディングはアメリカやカナダのデータは標準装備されていて非常にやりやすいのですが、日本のデータでやろうとするとshapfileから用意しなければならず、非常にやりづらいです。一応、動くものが作れたので備忘録としてメモ。 shapefile シ…
はじめに Rで逆ジオコーディングをやるやり方は、以下のようなやり方が提案されています。 qiita.com qiita.com ただし、いずれも速度面や正確さの面で問題があると記事内でも言及されています。
タイトル通りです。 データサイエンティストのための最新知識と実践 Rではじめよう! [モダン]なデータ分析作者: 瓜生真也,工藤和奏,高柳慎一,牧山幸史,松村杏子,松村優哉,簑田高志,本橋智光,ホクソエム出版社/メーカー: マイナビ出版発売日: 2017/06/30メデ…
タイトル通りです。 SASとRと両方使う人でないと特に意識する場面はないと思いますが、どちらも記法が酷似しているので両方使う人は気をつけてないとミスります。 Rのdplyr::rename dplyr::rename(新しい変数名=古い変数名) です。
とりあえず備忘録的にコードと出力だけ。 細かいプロシージャの仕様は後ほど追記します。 コードと出力
内容をアップデートしました y-mattu.hatenablog.com はじめに RStudio Server の Docker イメージを作りました。入っているメインコンテンツは、tidyverse なパッケージ群、MeCab および {RMeCab}パッケージ、LaTeX環境 です。また、ggplot2 などでの日本語…
はじめに データ分析では再現性が大切です。しかし、同じコードとデータを使っていても実行環境の違い(OS, ソフトやパッケージのバージョンなど)によって結果が異なることがあります。複数の場所で同じ環境をそろえるための手段の一つとして、はオープンソー…