今回は大人気の米津玄師さんが作詞された「パプリカ」や「Lemon」などの歌詞を
統計的に「テキストマイニング」で分析したらどんな結果が出るのか挑戦してみました
テキストマイニング用 統計解析ソフト「KH Coder」
今回使用した統計解析ソフトは「KH Coder(けーえいち こーだー)」というテキストマイニング専用のソフトです
「KH Coder」は無料で利用できるフリーソフトです
ロゴ引用元:http://khcoder.net/
作成者は大阪大学の川端亮教授と立命館大学の樋口耕一准教授で
「KH」は「Kawabata Higuchi」の略というのが有力とのこと
ダウンロード方法等の詳細は以下のリンク先をご覧ください
初心者でも簡単に使える設計となっているので、
ぜひあなたもダウンロードして使ってみてくださいね
※あくまでもフリーソフトの大原則
「解析結果・動作は無保証」「使用は自己責任で」は忘れないでください
使用したデータ
米津玄師さんが作曲された曲の中でも「Uta-Net」で人気の高かった9曲
- Lemon
- LOSER
- 灰色と青
- アイネクライネ
- orion
- ゴーゴー幽霊船
- 馬と鹿
- MAD HEAD LOVE
- ピースサイン
に加えて
「パプリカ」と「打上花火」を加えた
計11曲の歌詞データを使用しました
データはこちらから閲覧できます↓
米津玄師さんの歌詞テキストマイニング結果
では米津玄師さんの歌詞をテキストマイニングした結果をご紹介します
頻出語リスト
「頻出語リスト」は単語の出現頻度をグラフ化したものです
この結果から米津玄師さんの歌詞の中でどんな単語が頻繁に使われているか分かります。
結果を見てみると
「あなた」「君」「今」「僕」「愛」「歌う」
という単語が頻繁に使われている事が分かります
気になるのが8位の「消える」という単語です
この単語だけ否定的な意味を含んでいます
なので単純な「愛」ではなくて「はかなさ」や「切なさ」を含んだ歌詞が聴く人の共感を得ているのかもしれません
共起ネットワーク分析
次に歌詞の1節1節でどの単語同士が同時に使われているか(共起という)をあらわす「共起ネットワーク」を表示します
これを見ると単語同士が繋がって
「あなたを愛す」「僕の笑う声」「今を歌う」「君の言葉が消える」
といった重要な文章が浮かび上がってきます
相手への愛情と自分の中の幸せな感情、そしてはかなさ寂しさを含んだ歌詞が共感を得ている
のではないでしょうか。
対応分析
最後はどの曲でどの単語が多く使われているのかをあらわす「対応分析」を行ってみます
対応分析を行うことで曲同士の「距離」も見ることができます
これをみると「パプリカ」や「Lemon」では「夢」「あなた」という単語が多く使われており
「アイネクライネ」や「フラミンゴ」も近い距離にいることが分かります
一方で「MAD HEAD LOVE」は「愛」一直線という感じでほかの楽曲とはだいぶ離れています
若干1つの軸による影響がとても大きい時に現れる「馬蹄型」にも見えますが
今回は細かいことは気にせず分析結果を楽しみましょう
米津玄師「パプリカ」等の歌詞をテキストマイニングで分析 まとめ
今回は現在大人気の米津玄師さんが作詞された「パプリカ」や「Lemon」などの歌詞を、統計的に「テキストマイニング」で分析してみました。
歌詞のようなテキストデータでも統計解析ソフトを使えば簡単に分析することができます。
テキストマイニングからは「頻出語」「共起ネットワーク」「対応分析」などが行えるので是非あなたも身近なテキストデータを使って挑戦してみてくださいね。