【ガチ比較】やばい vs すごい

こんにちは。かとうです。 この記事はみんなのガチ比較 Advent Calendar 202319日目の記事です。


導入

この記事では「やばい」と「すごい」をガチ比較します。ガチ比較の説明は1日目担当のAtriaくんの記事を参照ください。ガチ比較の創設者のやままくんは大学の学友です。縁に感謝ですね。

さて、今回私が比較するのは「やばい」と「すごい」です。似た意味を持つ単語なのに、我々はなんとなくこの場面は”やばい”を使おうとか、このときは”すごい”だなとか、使い分けることができます。不思議ですね。どうやって使い分けてるんですかね。どちらが”強い”んですかね。ということで私がどちらがより”強い”か、決めていきます。

評価軸

いろいろ調べて私の一存で決めます。調べる内容は以下です。

  • 辞書
  • Google検索ヒット数
  • 自然言語モデル
  • Twitterアンケート

辞書

weblio辞書(デジタル大辞泉)

  • やばい[形]《形容動詞「やば」の形容詞化》危険や不都合な状況が予測されるさま。あぶない。「—・い商売」「連絡だけでもしておかないと—・いぞ」

  • すごい【▽凄い】[形][文]すご・し[ク] 1 ぞっとするほど恐ろしい。非常に気味が悪い。「—・い目でにらむ」 2 びっくりするほど程度がはなはだしい。並外れている。大層な。「—・い人気」「—・いプレー」「—・い秀才」「—・い散らかりよう」→凄く

すごいは”凄い”という漢字が割り当てられているのは点数高いですね。すごそう。しかも「ぞっとするほど恐ろしい」らしいです。やばそう。

Google検索ヒット数

  • やばい

  • すごい

すごいがすごい強いですね。ヒット件数だけで見ると2倍ほどあります。今のところやばいはだいぶやばいですね。やばいにはすごい頑張って欲しいです。

自然言語モデル

最近は賢い言語モデルも多いですからね。彼らにも意見を仰ぎましょう。Huggingfaceの事前学習済モデルを使って感情分析させてみます。Google Colabですぐ動かせます。

まずは必要なあれこれをインストールします。

1
2
!pip install ipadic
!pip install fugashi

Huggingfaceから日本語のモデルを持ってきます。

1
2
3
4
5
from transformers import pipeline, AutoModelForSequenceClassification, BertJapaneseTokenizer,BertTokenizer, BertForSequenceClassification

model = AutoModelForSequenceClassification.from_pretrained('koheiduck/bert-japanese-finetuned-sentiment') 
tokenizer = BertJapaneseTokenizer.from_pretrained('cl-tohoku/bert-base-japanese-whole-word-masking')
classifier = pipeline("sentiment-analysis",model=model,tokenizer=tokenizer)

これで準備完了です。「すごい」と「やばい」を戦わせます。入力文のラベルを「POSITIVE」「NEGATIVE」「NEUTRAL」の3つで判別します。scoreはモデルがどの程度確証を持って判別しているかを表しています。

1
2
3
result = classifier("このあいだすごいことが起きてびっくりした")[0]
print(f"label: {result['label']}, with score: {round(result['score'], 4)}")
>>> label: POSITIVE, with score: 0.711
1
2
3
result = classifier("このあいだやばいことが起きてびっくりした")[0]
print(f"label: {result['label']}, with score: {round(result['score'], 4)}")
>>> label: NEUTRAL, with score: 0.7447

すごいはポジティブで、やばいはニュートラルらしいです。本当か?

1
2
3
result = classifier("やばい仕事を受けた")[0]
print(f"label: {result['label']}, with score: {round(result['score'], 4)}")
>>> label: NEGATIVE, with score: 0.9739
1
2
3
result = classifier("すごい仕事を受けた")[0]
print(f"label: {result['label']}, with score: {round(result['score'], 4)}")
>>> label: POSITIVE, with score: 0.9681

これは本当っぽいですね。えらい。

1
2
3
result = classifier("うわーーーーやばい")[0]
print(f"label: {result['label']}, with score: {round(result['score'], 4)}")
>>> label: NEGATIVE, with score: 0.9852
1
2
3
result = classifier("うわーーーーすごい")[0]
print(f"label: {result['label']}, with score: {round(result['score'], 4)}")
>>> label: POSITIVE, with score: 0.8144

ちなみにビックリマークつけると判定が変わります。面白いですね。面白いだけでどっちが強いかはよくわからないですね。

Twitterアンケート

うーーーん結局どちらが強いのかよくわからないですね!(すっとぼけ)ということでTwitterでアンケートを取りました。最後は人の手で決めましょう。民意大事ですよね。

全部で22票でした。投票にご協力いただけた方々、ありがとうございます。投票の結果、やばいの勝ちですね!!!!!!

終わり

「やばい vs すごい」はやばいの勝ちでした。すごいやばい戦いでしたね。この世の謎が一つ解けてすごいよかったです。次は「いっぱい vs たくさん」ですかね。お疲れ様でした!