★データ解析備忘録★

ゆる〜い技術メモ

Python3でカレントディレクトリ内のzipファイルを全て、zipのファイル名でディレクトリを作って解凍する

タイトルが長くなってしまったけど、なぜかこんな単純なことが3系で書かれたものが見つからなかったので備忘録的に(あったらゴメンなさい)。

import os
import zipfile
import glob

for i in glob.glob('*.zip'):
    with zipfile.ZipFile(i, 'r') as zf:
        dirname = i.rstrip('.zip')
        zf.extractall(dirname)

{rjumanpp} ver0.1.0 祝!マイナーリリース

はじめに

これまで

形態素解析器JUMAN++をRから操作するパッケージを作り始めました - ★データ解析備忘録★

【R】{rjumanpp}ver0.0.0.9991の変更点とパッケージの構想について - ★データ解析備忘録★

{rjumanpp} ver0.0.0.9992 表層形ではなく活用の原形を出力できるようになりました - ★データ解析備忘録★

{rjumanpp} ver0.0.0.9993 サーバーモードに対応しました & vignetteを公開しました - ★データ解析備忘録★

GitHub

github.com

祝! マイナーリリース(ver0.1.0)

JUMAN++のRラッパーパッケージである{rjumanpp}ですが、これまでちまちま機能追加とバグフィックスを繰り返してきましたが、単純な文字列の入力に関して一通りの機能は揃えたのと、目立ったバグは概ね解消されたのでここで一気にバージョンを0.1.0にしてマイナーリリースとします。

続きを読む

{rjumanpp} ver0.0.0.9993 サーバーモードに対応しました & vignetteを公開しました

はじめに

これまで

形態素解析器JUMAN++をRから操作するパッケージを作り始めました - ★データ解析備忘録★

【R】{rjumanpp}ver0.0.0.9991の変更点とパッケージの構想について - ★データ解析備忘録★

{rjumanpp} ver0.0.0.9992 表層形ではなく活用の原形を出力できるようになりました - ★データ解析備忘録★

GitHub

github.com

ver0.0.0.9993

そろそろ0.0.1にしてもいいかなあと思ってるくらいには形になってきました。今回のアップデートではサーバーモードをサポートする関数をつけました。

続きを読む

{rjumanpp} ver0.0.0.9992 表層形ではなく活用の原形を出力できるようになりました

rjumanpp

形態素解析器JUMAN++をRから操作するパッケージを作り始めました - ★データ解析備忘録★

【R】{rjumanpp}ver0.0.0.9991の変更点とパッケージの構想について - ★データ解析備忘録★

github.com

絶賛開発中で、今回は出力で原形を返すオプションをつけました。引数の場所ですが、引数の名前を指定するのは面倒くさいので、第二引数に設定しました。ここを1にすると原形を返、デフォルトは0になっています。それ以外のオプションは今まで通りです。

続きを読む

RSeleniumでChromeからファイルをダウンロードするディレクトリを指定する方法

結論

RSeleniumはだいたいわかってるから読むのが面倒くさい人へ。サーバー起動時にextraCapabilitiesオプションでダウンロードディレクトリの情報をChromeオプションとしてlist形式で渡してやれば設定できます。

# Chromeオプションを追加
eCaps <- list(
  chromeOptions = 
    list(prefs = list(
      "profile.default_content_settings.popups" = 0L,
      "download.prompt_for_download" = FALSE,
      "download.default_directory" = "/path/to/download_directory"
    )
    )
)

# リモートサーバーへ接続
rD <- rsDriver(extraCapabilities = eCaps)
続きを読む