★データ解析備忘録★

ゆる〜い技術メモ

2016-02-24から1日間の記事一覧

RMeCabの顔文字の誤解析を後処理で消す

顔文字を含んだ文の解析 {RMeCab}、日本語の形態素解析に便利なのですが顔文字の分類は苦手です。 例えば、 words ふう。お腹いっぱい( ´•౪•`) 暇だな(☝ ՞ਊ ՞)☝ 試験頑張るぞ\\\\ ٩( ‘ω’ )و //// というデータフレームを解析して単語の頻度を数えるとし…