『LINEBot』は便所の落書きなのか
この前Twitterで、LINEBotりんなに対する、ユーザの使用フレーズトップ30を見た。
以下の通りだ。
出典:http://www.anlp.jp/proceedings/annual_meeting/2016/pdf_dir/B1-3.pdf
下品な言葉や乱暴な言葉が並んでいて、なんだか少し悲しくなった。
なんか対話してるっていうより、便所の落書きみたいだよね。
今日は、自身が開発したLINEBot『ちびいずむ』の会話ログを分析することで、本当に対話エージェントは便所の落書きなのかを確かめようと思う。
1. ちびいずむとは
ちびいずむ(以下『ちびいずむ』)とは、僕が去年開発したLINE対話エージェントである。
「幼い子犬がしゃべるようになった!」をコンセプトにし、私の実家の子犬をモチーフにしている。『ちびいず』はドコモの雑談対話API[1]を通して、会話する機能が中心の機能であるBotである。その他WipediaのAPIを参照して検索をしたり、占いをするような機能も備えている。ユーザーはLINEを通して、『ちびいず』に話しかけ、それに対して応答を受け取ることが可能になっている。
下みたいな感じで、ちょっと支離滅裂な会話を楽しめる。
2.分析手法
『ちびいず』との会話は、「タイムスタンプ」と「会話内容」が蓄積されている。
コンプライアンスの問題を考慮し、どのユーザーがどんな発言をしているかはわからないようにしている。
今回は、会話内容を形態素解析することによって、先ほどのりんなのようなランキングを作ることを目的にする。
形態素解析においては、gooラボの形態素解析API[2]を使用した。
解析したメッセージは7000件以上、6万文字以上に及んだ。ただし、ちびいずむの機能を利用するための特定の用語は分析から省いた。
今でも会話を楽しんでくれるユーザーが多いみたいで、非常に感謝している。
3.結果
以下、ちびいずむに向かって使われた「名詞」ランキングトップ30を示す。
左の%は、一番話された『ちび』に対する各単語の割合を示している。
1位は『ちび』だった。
これはちびいずむを形態素解析すると、『ちび/い/ず/む』になることが原因と考えられる。
すなわち、多くのユーザーが『ちびいず』に対して、名前を呼んでくれているということだろう。
ペットみたいな感じなのかな。
5位と13位に『好き』『大好き』もランクインしている。
7位『花火』、17位『合格』、24位『元気』もポジティブな単語な気がする。
30位までに下ネタも乱暴な言葉もなかった。
(下位にいけば、それなりにある)
自分が想像していたよりは、暖かい単語が並んでいるなあと言った印象だ。
よかった。
4.まとめ
やっぱりみんな、こいぬが好きなのかな。
自分が作ったものに対して、こんなに暖かい言葉がかけられてるとは知らず、感動しました。
あたたかさを作れる人になりたいよね。
読んでくれたみなさま、ありがとうございました。
『ちびいず』と話したい人は以下のリンクからどうぞ。
https://line.me/R/ti/p/JjyT8_TE3
[1] https://dev.smt.docomo.ne.jp/?p=docs.api.page&api_name=dialogue&p_name=api_usage_scenario
[2] https://labs.goo.ne.jp/api/jp/morphological-analysis/