前回は筆者がMosesと出会ったときのお話をしました。今回は、筆者がまだ統計的機械翻訳自体と少し距離があった頃のお話です。
不思議な縁
訳も分からないままMosesのセットアップを終えてから、約1ヶ月が経った2010年4月のことです。某I社とお付き合いの長いあるお客様が、どうやら統計的機械翻訳の採用を前提に評価を始めているらしいという情報が入ってきました。先輩Kさんの予言どおり、何となく業界全体が統計的機械翻訳に向かっているようだと感じたものの、中身が全く分からないだけに、当時は日本語でも本当に使い物になるのかという懐疑的な声も強かったものです。
その翌月、GWが明けた頃に、某I社でも統計的機械翻訳について勉強しておこうということで、Kさんを講師として社内講習会が開かれることになりました。参加希望者は10名を超え、関心の高さが伺えました。筆者を含め、参加者全員が統計的機械翻訳について体系立った話を聞いたのは、この社内講習会が初めてでした。このときは理論に関する話が多かったのですが、実に難解極まりなく、正直、ほとんど理解できませんでした。もちろん、一度聞いたくらいで理解できるような内容ではないので、参加者の誰もが同じような状態でしたが。
しかし、統計的機械翻訳の理論を聞いたとき、不思議な縁のようなものを感じたのは意外でした。まあ、縁と言うと大袈裟ですが、筆者との接点のようなものです。筆者は大学で通信工学を専攻していたのですが、統計的機械翻訳を使って翻訳する仕組みが、通信路を使って情報を伝達する仕組みと、全く同じだったのです。翻訳と通信自体は、表面的には何ら共通点がないのに、本質的には同じモデルが適用できるということに、うまい仕組みを考えたもんだと感心したものです。これに限らず、統計的機械翻訳の仕組みって、「世の中、本当に天才っているんだ」と驚かされることが多いです。
もう少し先の話なのか?
そして、社内講習会の10日後に、今度は統計的機械翻訳を用いたある製品の話を聞く機会がありました。日本の代理店の方がお見えになり、製品紹介をしてくださったのですが、某I社からの参加者が10名を超え、先方もかなりびっくりした様子でした。
社内講習会で統計的機械翻訳の予備知識を付けていたので、話の中身は全て理解できました。製品の発売元では、既に数社が評価中もしくは利用中で、「評価中のある1社は従来の機械翻訳より高く評価してくれた」と紹介されましたが、具体的な翻訳サンプルがあったわけではなく、本当に日本語でもうまくいくのかという質問が多く出ました。価格も、あくまでも予定価格が参考程度に紹介されただけで、当時はまだまだ決まっていないことが多いという感じでした。
おそらく、統計的機械翻訳に向かって進んでいくんだろうけど、まだ確信めいたものもなく、かと言って、筆者が積極的に情報収集するわけでもなく、そんな付かず離れずのような状態が、この先も何ヶ月か続きました。しかし、大きな変化は突然にやってくるのでした。
次回は機械翻訳で行くぞです。
[注] この回顧録は、かつて勤めていた会社で書いた連載を復元したもので、某I社の現在の状況を反映している訳ではありません。