{rjumanpp} ver0.1.0 祝！マイナーリリース

これまで

JUMAN++のRラッパーパッケージである{rjumanpp}ですが、これまでちまちま機能追加とバグフィックスを繰り返してきましたが、単純な文字列の入力に関して一通りの機能は揃えたのと、目立ったバグは概ね解消されたのでここで一気にバージョンを0.1.0にしてマイナーリリースとします。

vignetteでも公開している通り、データフレームの特定の列にテキストが入っていて、それを分かち書きした形で出力するような単純な分かち書きに関してはかなり変な文字列を入れても大抵のものは自然な形で返ってくると思います。(エラーとか出たらごめんなさい…)

分かち書きさえしていれば、{tidytext}パッケージなどをかませることで代表的なテキストマイニング手法(SVM, RF, Tf-IDFのスコア付, 共起ネットワーク, トピックモデル, word2vecなど)の形に持っていくことができるので、今回はこの時点でマイナーリリースとしました。

形態素解析をRで、といえば{RMeCab}パッケージが有名ですが、このパッケージではできた

みたいなことは全く手付かずなので、その辺をやっていこうと思います。

もし「こんな機能がほしい！」とか「エラーが出たんだけど…」みたいなことがあれば冒頭のGitHubのissueでお願いします。