日本語と英語で「検索のやり方」が異なる理由

ASIA

こんにちは、ゲイル(@galenomad)です。

日本語と英語で検索のやり方が違うような気がする。なぜ?

今回は、このような疑問に答えます。読者の中にご存知の方もいるかもしれませんが、日本語と英語では検索の方法が異なり、検索エンジンも言語別に対応が施されています。

予めお詫びしておきます:私は言語学者ではないため、間違っている箇所があるかもしれません。面白半分に読んでいただければ幸いです。

日本語は単語の羅列、英語は完成した文章

日本語は単語を並べただけで検索を成立させることがほとんどですが、英語は文章で検索することが一般的です。もちろんこれは、傾向であって絶対的ではありません。

両者の立場を逆転させると

試しに「日本人が完成された文章を検索した場合」と「英語圏の人が単語を羅列して検索した場合」を想像してみましょう。どのようなことが起こるでしょうか。

日本人が完成された文章を検索

腹が減ったな。「東京で美味しいご飯を食べるにはどこのお店に行くのが良いか」っと。

一般的な日本人なら「東京 うまい ランチ」のような単語の羅列を行って検索するところです。しかし完成された文章だと、まるでインターネットに疎い人が検索しているようです。

英語圏の人が単語を羅列して検索

腹が減ったな。「Melbourne delicious lunch」っと。

これも変な印象を受けます。この場合だと「What are the best restaurants in Melbourne」が予想される文です。もっと簡潔に「Best lunch in Melbourne」でも良いですが、いずれにせよ元となる英文の語順に単語が並べられます。

検索のやり方が異なる理由

双方の検索のやり方に違いがあるのは複数の理由が挙げられます。残念なことに、私からは何が異なる検索方法を決定づけるものかは断言できません。

それでも、いくつかの興味深い理由が見つかったので、以下に紹介します。

複合語の豊富さ

英語は必ず分かち書き(単語の間にスペースを入れる)を行い、複数の単語の組み合わせによって初めて意味が成立しますが、日本語は複合語が多く存在し、一つの単語だけで何が言いたいのか伝わる場合が多いです。

例えば、漢字で「転職」と書いた場合は意味が当然のように理解できますよね。これが英語だと「job change」と2つの単語を組み合わせないといけません。

2つ以上の単語を組み合わせる場合は単語の間にスペースを空けなければいけないため、日本語のように「単語の羅列検索」をすると意味が崩壊することに気づくでしょう。

「名詞の区切りのスペース」と「文節の区切りのスペース」が混在して、訳わからないことになるね。

日本語は主語や動詞を省略しても通じる

日本語は世界でも有数の主語や動詞の省略が許される言語です。代表的なのが、よく見かける「ゴミはくずかごへ」という注意看板です。

ゴミは主語ではなく、この場合だと「あなた・みなさん」という主語が省略されています。さらに、ゴミに対応する動詞は「捨てる」ですよね。これも省略されています。

ご存知のように、日本語は助詞を上手く使うことで「主語・動詞」を使わずとも意味が通じてしまいます。このあたりの柔軟性も単語の羅列検索に影響を及ぼしている可能性があります。

日本語の検索ワードには助詞すら省かれることが多いけど、どうなってるんだ日本語は・・・。

受け身も主語いらず

受け身で検索することはありますよね。例えば「告白された」や「いじめられた」のように。これらも当たり前のように主語が省略されています。

むしろ「私は告白された」「私はいじめられた」なんて検索履歴が残っていたら、違和感を覚えるだけではなく、恐怖感すら覚えます。日本語の検索は主語を含む場合が本当に限られています

語順が命の英語

英語はドイツ語やフランス語と兄弟ですが、現代英語は多くの活用形が省略され、語順が意味を成立させる上で非常に重要な言語になっています。

実はスペイン語やロシア語は分かち書きでありながら、語順にある程度の自由が許されているのですが、それは活用形が英語よりも多く残されているという前提があるからです。

結局なにが言いたいのかというと「英語は語順を守らないと意味が通じないから、単語の羅列検索がやりづらい」ということです。

結局どちらが合理的なのか

ここで「どちらとも言えませんね」と浅はかで穏便な結論を言いたくはないのですが、本当に「見方による」という結論になってしまうのが悔しいです。

対戦結果

  • 日本語勝利:少ない文字数
  • 英語勝利:明確な情報の指定
  • 日本語勝利:単語を入れ替えても成立
  • 英語勝利:スクリプトの一貫性

少ない文字数で済むのは日本語

前述したように、日本語は主語や動詞を簡単に省略することができ、検索ボックスに打つ場合は助詞すらも省略することが出来ます。

また、漢字を使えて複合語が豊富な日本語は、圧倒的に文字数を節約できます。英語には多くの複合語がありますが、その多くが2つ以上の単語で構成されるか、ハイフンを使った複合名詞になるからです。

英語は明確に情報を指定する

もちろん、完成された文章を検索ボックスに入れることは悪いことではありません。利用者が求めている情報を検索エンジンが把握しやすい利点があります。

検索エンジンは、検索者の質問に対して答えを出すのが仕事です。「完成された文章」と「単語の羅列」のどちらが求められている答えを出すのが容易でしょうか?

単語を入れ替えても成立する日本語

日本語では完成された文章で検索しないおかげで、単語を自由に動かして検索しても全く問題ありません。動詞を前に持ってきても、地名を後ろにくっつけても許されます。

検索している途中に情報を追加したくなるときはありませんか?そんなとき、日本語なら文を組み立て直す必要はなく、単語を後ろに追加するだけで良いのです。

英語はスクリプトに一貫性がある

ご存知のように、英語はアルファベット以外にスクリプトがありません。一方、日本語は3つのスクリプトが存在する上に、アルファベットを使って検索する場合があります。

スクリプトが一つに統一されている方が、検索エンジンが検索者に対して用意した答えを集中させることが出来ますし、何より検索結果の質を高く保つことが出来ます。

ピンとこない方のために、以下に例を用意しました。

「ワールドカップ」の場合

  • ワールドカップ
  • W杯
  • わーるどかっぷ
  • World Cup

4種類のスクリプトが同じ意味です。

「ワールドカップ」のような知名度の高い単語なら検索エンジンが同じ単語として認識してくれますが、もっとマイナーな単語ならそうではないかもしれません。

利点を考えて使い分けるべき

前述の通り、日本語の検索と英語の検索の間にはそれぞれの長所と短所があります。利点を考えつつ、知りたい情報に合わせて使い分けることが出来たら最高ですね。

 

タイトルとURLをコピーしました