Elevator Pitch
「あなたこともっとよく知りたいの…」こんな酔狂な願いもPythonなら叶えてくれます。requests, gensim, scikit-learnなどPythonのライブラリを利用してTwitter個人アカウントの性格推定を試みます。
Description
テキストマイニングによるTwitter個人アカウントの性格推定
- ツイートの収集(requests)
- 文書分類器の作成
- 形態素解析(mecab-python3)
- 特徴ベクトルの作成(gensim)
- ツイートと性格ラベルの学習(scikit-learn)
Notes
エゴグラムという性格診断手法があり、その特徴量をもつアカウントがTwitterには数多く存在します。そのTwitterアカウントのツイートと特徴量を正解データとし学習させ、性格不明のTwitterアカウントをツイートから推定します。その過程と結果を紹介します。時間が許せば、Webアプリケーションを作成し公開したいと思っています。