インターネットはコトバに満ちあふれている。東京大学 生産技術研究所 戦略情報融合センター 喜連川研究室 特任助教の鍜治伸裕博士(情報理工学)は、Webという膨大なコトバの集合体を使った、新しい言語学へのアプローチを研究している。Web時代の言語学は、計算機によってどのように進化しているのか、鍜治先生から、研究の紹介をしていただこう。
皆さんは「ググる」という言葉を知っていますか? これを読んでいる人であれば、おそらくご存知だと思います。もちろん「グーグルで検索する」という意味です。では「ファブる」はどうでしょうか? 他にも「モフる」「テクる」「ハラシマる」なんて言葉もあります。信じられないかもしれませんが、これらはすべてWebで実際に使われている(または使われていた)言葉です。もっとも、一部の人たちしか使っていないマニアックな言葉も含まれていますが。
では、ご存知なかった方のために意味を載せておきます。
●ふぁぶる 【ファブる】 (動詞・ラ行五段活用)
1.ファブリーズを使って布や衣服を消臭すること。
●もふる 【モフる】 (動詞・ラ行五段活用)
1.仰向けになった猫の腹を撫でたり、腹の毛に顔を埋めて愛でること。
2.猫の冬毛が伸びてフサフサしてくること。
●てくる 【テクる】 (動詞・ラ行五段活用)
1.何かに対して高度なテクニックを有している者がそれを行使すること。または、その様子。
●はらしまる 【ハラシマる】 (動詞・ラ行五段活用)
1.主に同人誌のコミュニティにおいて、原稿を書くこと。原稿の誤字である原縞が「はらしま」と読めることに由来する。
皆さんはいくつ知っていましたか? なぜこのような話をしたかと言うと、私は「新語」の研究をしているからです。もう少し具体的に言うと、大規模Webアーカイブを活用した言語学という新しいスタイルの言語学と、それを実現するための工学技術の研究しています。そこでこのコラムでは、その研究の一部を紹介させていただきます。
(※言語学者である東京大学の宇野良子博士と共同研究をしています)
新語と言語学
言語学において新語は研究対象です。なぜかというと、言葉は"変化するもの"だからです。例えば、「ググる」のような新しい単語はこれからも日々作られていくでしょう。そしてその一方で、古くなった単語は次第に使われなくなって消滅していってしまいます。また「全然」や「ヤバい」のように単語の意味が変化することもあるでしょう。
今、私たちが当たり前のように使っている言葉の中で、こうした変化の結果生まれたものがたくさんあります。例えば「サボる」がそうです。この動詞は今でこそ普通に使われるようになっていますが、本来はフランス語の「サボタージュ(sabotage)」に由来する造語とされています。では、このような言葉の変化はでたらめ(ランダム)に起こっているのでしょうか?
私はそこには何らかの規則性が存在すると考えています。例えば「ググる」にしても「ファブる」にしても、元の単語(グーグルとファブリーズ)の先頭の文字を取ってきて新語が作られています。また、他の新語にも同じ傾向が見られます。可能性だけを考えるならば、末尾の文字を取ってきて「グルる」や「リーズる」でも良さそうです。
これらは新語が持つ規則性の一例ですが、このような規則性は人間の認知的なメカニズムが背後に関係していると言われています。新語発生のメカニズムを解明することは、言語学の観点から非常に興味深い問題なのです。
しかしながら、残念なことに、これまでの研究では新語発生のメカニズムは十分に解明されていません。その大きな原因は、新語の発生、伝搬過程を調査できるようなデータが少ないからです。例えば「ググる」が使われ始めてから、世の中に広まっていく様子を記録したデータなんていうのはなかなか手に入らないでしょう。
次ページ「Web時代の言語学」に続く