★データ解析備忘録★

ゆる〜い技術メモ

【R】国勢調査 小地域 Shapefile を使って緯度経度から住所を求める(市までわかっているときver.)

はじめに

@u_riboさんによるこんなツイートがある。

要するに、shapefileの細かい版ですね。細かいので、市レベルでファイルが分かれているようです。

今回は、これを使って逆ジオコーディングをやってみます。ただし、「やってみた」レベルなので今回は知りたい緯度経度が何市にあるかまでは絞れているとします。 市を見つけるのには、RであればRで緯度経度から都道府県・市区町村を求めるSASであればSASによる逆ジオコーディング(緯度経度から都道府県・市を求める)が参考になります。

続きを読む

形態素解析器JUMAN++をRから操作するパッケージを作り始めました

はじめに

JUMAN++という日本語の形態素解析器が昨年登場したようです。 速度はMeCabには劣るものの、解析精度(特に表記ゆれや話し言葉)に強いようです。

JUMAN++自体のインストールや使い方は公式マニュアルや以下のリンクが参考になります。

qiita.com

あと、おそらくJUMAN++は現時点ではWindows非対応なので、以下の話は全部MacLinux限定の話になります…

続きを読む

SASで緯度経度から地域メッシュコードを計算する

はじめに

検索してもでてこなかったので、緯度経度からその点が含まれる3次メッシュ(基準地域メッシュ)コードを算出する関数をSASで作成しました。(僕が知らないだけでもしかしたら既にあるのかもしれませんが。)

地域メッシュコードの概要については統計局ホームページ/地域メッシュ統計についてに、その算出方法については 緯度経度からメッシュコードを作成する方法に解説が載っていますが、標準地域メッシュコーどは約1km四方で、大体の粒度は地図上で標準地域メッシュを確認するページで確認できます。ちなみに、JR田町駅周辺だとこのくらいの粒度です。 f:id:songcunyouzai:20170715142017p:plain

続きを読む

SASによる逆ジオコーディング(緯度経度から都道府県・市を求める)

SASによるジオコーディングはアメリカやカナダのデータは標準装備されていて非常にやりやすいのですが、日本のデータでやろうとするとshapfileから用意しなければならず、非常にやりづらいです。一応、動くものが作れたので備忘録としてメモ。

shapefile

シェープファイル (Shapefile) は、 他の地理情報システム(GIS)間でのデータの相互運用におけるオープン標準として用いられるファイル形式である。 例えば、井戸、川、湖などの空間要素がベクタ画像である点 (数学)、線分、多角形で示され、各要素に固有名称や温度などの任意の属性を付与できる。(Wikipediaより)

今回は、国土数値情報 ダウンロードサービスの「2014年版 行政区域データ 全国のファイル」を使います。 ダウンロード及びzipの解凍は手動でやってもいいのですが、今回はRで緯度経度から都道府県・市区町村を求める - Qiitaを参考にしてRを使いました。

続きを読む

【R】OSMのNominatimでAPIを使わずに緯度経度から都道府県と市を求める(スモールデータ向きお手軽版)

はじめに

Rで逆ジオコーディングをやるやり方は、以下のようなやり方が提案されています。

qiita.com

qiita.com

ただし、いずれも速度面や正確さの面で問題があると記事内でも言及されています。

続きを読む