IMEの現代病 近年の高度に知的な漢字変換プログラム(以降IMEと書きます)は、単純なパターンマッチングの時代では考えられないような誤字をたくさん生み出しています。今日は現代のIMEがかかえる病気について考えてみましょう。 まず最初は「品詞病」がありました。IMEが構文解析を行うようになった時から抱えているポピュラーな病気です。構文解析に失敗して助詞、助動詞等を優先して変換するあまり単語の変換に失敗してしまう病気です。しかしこれはまだかわいい病気です。最近では新たな重病「共起(きょうき)病」が蔓延しています。現代の誤字の大半はこの共起病が原因ではないかと僕は思っています。 共起関係とは、(1つの)文の中で同時に出現する単語の関係のことです。たとえば「飯を喰う」と言う文では、「飯」と「喰う」という単語が共起しています。このとき「飯」と「喰う」に共起関係があると言います。 最近のIMEは、共起辞書を持っており、その結果、たとえば「せいさく」という動詞では きかいのせいさく | 機械の製作 | せいふのせいさく | 政府の政策 | えいぞうのせいさく | 映像の制作 | といった具合に、一緒に変換する言葉によって変換結果が異なります。このような変換が「便利だ、賢い」と宣伝されています。 次は「みる」という動詞を変換してみましょう。 てれびをみる | テレビを見る | かんじゃをみる | 患者を診る | 「めちゃくちゃ便利!」ですか?では、テレビを使った遠隔治療をしてみましょう。 かんじゃをてれびでみる | 患者をテレビで見る | てれびでかんじゃをみる | テレビで患者を診る | どちらも同じ意味のつもりでも違う漢字になりました。なに?両方とも同じ結果になった?では歯医者さんになったつもりで、テレビのかわりに鏡を使ってみてください。 てれびでかんじゃをみる | テレビで患者を見る | かがみでかんじゃをみる | 鏡で患者を診る | あう、使うアイテムを換えただけなのに違う漢字になってしまいました。これが共起病です。同じ言葉を変換しても文中に現れる他の単語に引っ張られて異なる漢字に変換されてしまうのです。品詞病はIMEのクセに慣れてくれば結果の予想がつきますが、共起病は予想が困難な上に、ユーザーの変換結果からも共起関係を勝手に学習するため、目を皿のようにして誤変換を見張るしか対処できません。特にMS-IMEは変換中の文だけでなく、直前の変換結果からも共起辞書を引いているらしく始末におえません。
こういう「余計なお世話」とも言える病気にかかることがIMEの「進化」だとされている時代ですから、将来は、夜に「おはよう」という文を書くと、勝手に「こんばんは」に変換するようなIMEが出てくることでしょう。それをみんな「便利だ!すごい!」と大騒ぎするこの世の終りが見えます... | |