★データ解析備忘録★

ゆる〜い技術メモ

{rjumanpp} ver0.0.0.9992 表層形ではなく活用の原形を出力できるようになりました

rjumanpp

形態素解析器JUMAN++をRから操作するパッケージを作り始めました - ★データ解析備忘録★

【R】{rjumanpp}ver0.0.0.9991の変更点とパッケージの構想について - ★データ解析備忘録★

github.com

絶賛開発中で、今回は出力で原形を返すオプションをつけました。引数の場所ですが、引数の名前を指定するのは面倒くさいので、第二引数に設定しました。ここを1にすると原形を返、デフォルトは0になっています。それ以外のオプションは今まで通りです。

library(rjumanpp)

# 普通に分かち書き
jum_wakati("私はミルクティを飲みました")
#> [1] "私 は ミルクティ を 飲み ました"

# 活用形は原形で
jum_wakati("私はミルクティを飲みました", 1)
#> [1] "私 は ミルクティ を 飲む ます"

# 活用形は原形で、表記ゆれは標準表記に置き換え
jum_wakati("私はミルクティを飲みました", 1, redirect = TRUE)
#> [1] "私 は ミルクティー を 飲む ます"

githubinstall

これは本パッケージとは直接関係ないのですが、パッケージインストールの際に{githubinstall}パッケージでインストールできるようになりました。

# インストール方法1
githubinstall::githubinstall("rjumanpp")

# インストール方法2
devtools::install_github("ymattu/rjumanpp")

これから

データフレーム周りの関数を追加する予定です。