★データ解析備忘録★

ゆる〜い技術メモ

2017-07-01から1ヶ月間の記事一覧

RSeleniumでChromeからファイルをダウンロードするディレクトリを指定する方法

結論 RSeleniumはだいたいわかってるから読むのが面倒くさい人へ。サーバー起動時にextraCapabilitiesオプションでダウンロードディレクトリの情報をChromeオプションとしてlist形式で渡してやれば設定できます。 # Chromeオプションを追加 eCaps <- list( c…

Rで欲しい県について国勢調査 小地域 Shapefile を全部ダウンロードする

はじめに 先日、国勢調査 小地域 Shapefileからより細かい粒度で逆ジオコーディングを行う方法を書きました。 y-mattu.hatenablog.com しかし、ここで使っていた小地域shapefileをダウンロードをする関数では県と市をこちらで指定する必要がありました。(uri…

【R】{rjumanpp}ver0.0.0.9991の変更点とパッケージの構想について

はじめに 現在開発中のJUMAN++をRから操作するパッケージ{rjumanpp}ですが、まだ完成には程遠いもののベースになる部分はほぼできており、前回からいくつか基本的な変更があります。 ver 0.0.9991 関数名について rjumanppパッケージでは、解析に関係する主…

【R】国勢調査 小地域 Shapefile を使って緯度経度から住所を求める(市までわかっているときver.)

はじめに @u_riboさんによるこんなツイートがある。 一部で話題の(?)e-Statが提供する国勢調査小地域のShapefileをRからダウンロードする関数を書きました (gifが高速過ぎる orz) コードは https://t.co/Dd2R58ov94 pic.twitter.com/SRo2H1Fk4W— Uryu Shinya…

形態素解析器JUMAN++をRから操作するパッケージを作り始めました

はじめに JUMAN++という日本語の形態素解析器が昨年登場したようです。 速度はMeCabには劣るものの、解析精度(特に表記ゆれや話し言葉)に強いようです。 JUMAN++自体のインストールや使い方は公式マニュアルや以下のリンクが参考になります。 qiita.com あと…

SASで緯度経度から地域メッシュコードを計算する

はじめに 検索してもでてこなかったので、緯度経度からその点が含まれる3次メッシュ(基準地域メッシュ)コードを算出する関数をSASで作成しました。(僕が知らないだけでもしかしたら既にあるのかもしれませんが。) 地域メッシュコードの概要については統計局…

SASによる逆ジオコーディング(緯度経度から都道府県・市を求める)

SASによるジオコーディングはアメリカやカナダのデータは標準装備されていて非常にやりやすいのですが、日本のデータでやろうとするとshapfileから用意しなければならず、非常にやりづらいです。一応、動くものが作れたので備忘録としてメモ。 shapefile シ…

【R】OSMのNominatimでAPIを使わずに緯度経度から都道府県と市を求める(スモールデータ向きお手軽版)

はじめに Rで逆ジオコーディングをやるやり方は、以下のようなやり方が提案されています。 qiita.com qiita.com ただし、いずれも速度面や正確さの面で問題があると記事内でも言及されています。

『データサイエンティストのための最新知識と実践 Rではじめよう! [モダン]なデータ分析』という本をちょっとだけ書きました。

タイトル通りです。 データサイエンティストのための最新知識と実践 Rではじめよう! [モダン]なデータ分析作者: 瓜生真也,工藤和奏,高柳慎一,牧山幸史,松村杏子,松村優哉,簑田高志,本橋智光,ホクソエム出版社/メーカー: マイナビ出版発売日: 2017/06/30メデ…