トップ 最新

ワタタツの日記!

2009 年 12 月 3 日 (木)

Googleにはかなわんわー Google 日本語入力

とりあえず衝撃の変換候補を見てください。

Google Japan Blog に Google Japan Blog: 思いどおりの日本語入力 - Google 日本語入力このように書いてあるように、「もしかして」機能を担当していた人たちが Google の 20% ルールの時間で作りはじめたものだそうです。

なんでかなわんわーって思ったかというと、こういう、統計的に言語を解析して扱うのをわしもやりたくて、関連する本もすでに買って 1% ルール(独自ルール(笑))でやってみようと思っていたところに Google のすんごいクラスタとプログラマがやってしまったからにはもう太刀打ち出来ま千円と思ったからです。しくしく

思えば Google Earth もそうですよねー。国土地理院のデータから POV-Ray で地形図を作って遊ぼうと思いながら何年もたっていたら Google Earth が出て根本的にすべてをやられてしまったわけでござんす。ふははは!

アイディアはあたためているだけでは何にもならない (全くの零だとは言いませんけど)。なんでもいいからとりあえず形にしてなんぼというところがあります。そのことを Google にはいつも思い知らされます。

追記。このような膨大なウェブからの言語モデルや語彙の作成は、画像にあげたような既に広まっている誤用も容認するということになります。(ちなみに ATOK だとこう) 言葉が変わっていく要因の一つに誤用によるものがあるので、そういう意味ではこの自動計算による語彙というのは、そういう現象を先取りして「既成事実の辞書」と考えることもできて面白いと思います。一方、言葉には由来やら歴史があってその意味にになっているので、誤用はあくまで誤用だと言える時期は存在すると思います。しかしそういう過渡期ですら辞書に入れてしまうことになるこのシステムは大変面白いと思います。まさに、誤用だろうが何だろうが、「今使われているものが今の言葉だ」という考え方をやっているということ、そしてそれを自動的にやっていること、という二重に面白いとわしは思っています。面白いですが、誤用を誤用と警告してくれる ATOK には、まだそういう人の手による優位性があるので ATOK つぶしというわけにはいきませんが、今後はわからないですね。つまり Google がそういうところまで自動計算してくるかもしれないということで。でも根拠のない予想ですが、人力の優位性はいつまでも消えることはないとは思います。しかし将来、すんごいいい有料とそれよりちょっとしか劣らない無料という状況になってしまったら、ATOK の商売が成り立たなくなる可能性もあるとは思います。ATOK は応援しているのでがんばってください!

関係ないですけど、わしの名字も名前も正しい読み方で変換できます。さすがは Google 有名人です。ATOK にはリクエストに入れたので既に入っています。(名字は戸籍の表記ではないが第2水準までしか使わないなら正しい)

家計が破たんしそうです。助けてください! (読売の発言小町)

上手すぎる! 発言小町がプライベートのしょうもないいざこざをどうしょうもない切り口で相談しあう(というよりただ発言しあう)場所であることを皮肉るかのように、その路線に沿った見事な例え話を提供されていて、二重に面白いです。