★データ解析備忘録★

ゆる〜い技術メモ

SASによる逆ジオコーディング(緯度経度から都道府県・市を求める)

SASによるジオコーディングはアメリカやカナダのデータは標準装備されていて非常にやりやすいのですが、日本のデータでやろうとするとshapfileから用意しなければならず、非常にやりづらいです。一応、動くものが作れたので備忘録としてメモ。

shapefile

シェープファイル (Shapefile) は、 他の地理情報システム(GIS)間でのデータの相互運用におけるオープン標準として用いられるファイル形式である。 例えば、井戸、川、湖などの空間要素がベクタ画像である点 (数学)、線分、多角形で示され、各要素に固有名称や温度などの任意の属性を付与できる。(Wikipediaより)

今回は、国土数値情報 ダウンロードサービスの「2014年版 行政区域データ 全国のファイル」を使います。 ダウンロード及びzipの解凍は手動でやってもいいのですが、今回はRで緯度経度から都道府県・市区町村を求める - Qiitaを参考にしてRを使いました。

続きを読む

【R】OSMのNominatimでAPIを使わずに緯度経度から都道府県と市を求める(スモールデータ向きお手軽版)

はじめに

Rで逆ジオコーディングをやるやり方は、以下のようなやり方が提案されています。

qiita.com

qiita.com

ただし、いずれも速度面や正確さの面で問題があると記事内でも言及されています。

続きを読む

『データサイエンティストのための最新知識と実践 Rではじめよう! [モダン]なデータ分析』という本をちょっとだけ書きました。

タイトル通りです。

データサイエンティストのための最新知識と実践 Rではじめよう! [モダン]なデータ分析

データサイエンティストのための最新知識と実践 Rではじめよう! [モダン]なデータ分析

もう発売されてますし、Tokyo.Rではもう宣伝したのですが一応。

続きを読む

Rのdplyr::renameとSASのDATA STEP のRENAMEステートメントでは変数の書く順番が違うので注意

タイトル通りです。 SASとRと両方使う人でないと特に意識する場面はないと思いますが、どちらも記法が酷似しているので両方使う人は気をつけてないとミスります。

Rのdplyr::rename

dplyr::rename(新しい変数名=古い変数名) です。

続きを読む