寄り道建国日記

お出かけしたりスポーツ見たり日々をゆるゆる綴る日記

『LINEBot』は便所の落書きなのか

この前Twitterで、LINEBotりんなに対する、ユーザの使用フレーズトップ30を見た。

以下の通りだ。

f:id:yorimichi_eki:20171031225441j:plain

出典:http://www.anlp.jp/proceedings/annual_meeting/2016/pdf_dir/B1-3.pdf

 

 

下品な言葉や乱暴な言葉が並んでいて、なんだか少し悲しくなった。

なんか対話してるっていうより、便所の落書きみたいだよね。

 

今日は、自身が開発したLINEBot『ちびいずむ』の会話ログを分析することで、本当に対話エージェントは便所の落書きなのかを確かめようと思う。

 

 

1. ちびいずむとは

ちびいずむ(以下『ちびいずむ』)とは、僕が去年開発したLINE対話エージェントである。

「幼い子犬がしゃべるようになった!」をコンセプトにし、私の実家の子犬をモチーフにしている。『ちびいず』はドコモの雑談対話API[1]を通して、会話する機能が中心の機能であるBotである。その他WipediaのAPIを参照して検索をしたり、占いをするような機能も備えている。ユーザーはLINEを通して、『ちびいず』に話しかけ、それに対して応答を受け取ることが可能になっている。

 

 下みたいな感じで、ちょっと支離滅裂な会話を楽しめる。

f:id:yorimichi_eki:20171031230510j:plain

 

2.分析手法

 『ちびいず』との会話は、「タイムスタンプ」と「会話内容」が蓄積されている。

コンプライアンスの問題を考慮し、どのユーザーがどんな発言をしているかはわからないようにしている。

 

今回は、会話内容を形態素解析することによって、先ほどのりんなのようなランキングを作ることを目的にする。

形態素解析においては、gooラボ形態素解析API[2]を使用した。

 

解析したメッセージは7000件以上、6万文字以上に及んだ。ただし、ちびいずむの機能を利用するための特定の用語は分析から省いた。

今でも会話を楽しんでくれるユーザーが多いみたいで、非常に感謝している。

 

3.結果

以下、ちびいずむに向かって使われた「名詞」ランキングトップ30を示す。 

左の%は、一番話された『ちび』に対する各単語の割合を示している。

 

f:id:yorimichi_eki:20171031231927p:plain

 

1位は『ちび』だった。

これはちびいずむを形態素解析すると、『ちび/い/ず/む』になることが原因と考えられる。

すなわち、多くのユーザーが『ちびいず』に対して、名前を呼んでくれているということだろう。

ペットみたいな感じなのかな。

 

5位と13位に『好き』『大好き』もランクインしている。

7位『花火』、17位『合格』、24位『元気』もポジティブな単語な気がする。

 

30位までに下ネタも乱暴な言葉もなかった。

(下位にいけば、それなりにある)

 

自分が想像していたよりは、暖かい単語が並んでいるなあと言った印象だ。

 

 

よかった。

 

4.まとめ

やっぱりみんな、こいぬが好きなのかな。

自分が作ったものに対して、こんなに暖かい言葉がかけられてるとは知らず、感動しました。

あたたかさを作れる人になりたいよね。

 

 

読んでくれたみなさま、ありがとうございました。

『ちびいず』と話したい人は以下のリンクからどうぞ。

https://line.me/R/ti/p/JjyT8_TE3

 

 

[1] https://dev.smt.docomo.ne.jp/?p=docs.api.page&api_name=dialogue&p_name=api_usage_scenario

 

  [2] https://labs.goo.ne.jp/api/jp/morphological-analysis/