翻訳業界、特にIT翻訳の世界は、今まさに大きな転換期に差し掛かっています。欧米言語間で実用化されつつある統計的機械翻訳が、ついに日本語の世界にも押し寄せてきており、黒船が来襲してきたような感じすらあります。従来のような人の翻訳に代わって統計的機械翻訳が取り入れられると、その前後の工程や作業内容も大きな変更を求められます。
もちろん、某I社でも統計的機械翻訳を取り入れたパイロット・プロジェクトなどを通じて、さまざまな取り組みを行なっていますが、その成果をどうやってみなさんにお伝えすべきか、思案し続けていました。しかし、スマートなキャッチコピーを並べるより、試行錯誤した過程を飾ることなく、ありのまま日記のように綴るのがいいのではないかという結論に至りました。
題して、Moses奮闘記。第1回は、筆者がMosesと出会ったときのお話です。
Mosesを使いたいので、セットアップしていただけませんか?
会社の先輩であるKさんから、こんな依頼を受けたのが、Mosesとの最初の出会いでした。2010年3月のことです。従来の機械翻訳とは異なる統計的機械翻訳というもので、Linuxで動くオープンソースのソフトウェアだと。確かそんな説明を受けました。そして、参考になるからと紹介されたのが、Statistical Machine Translationという厚さが24mmもある洋書です。正直、えらいことになったなぁと思いました。
某I社では、Kさんを筆頭に、機械翻訳を取り入れた案件に携わったことがありますし、筆者も2005年暮れと2007年秋から2008年夏にかけて、機械翻訳の調査や実験を担当したことがあります。当時は、機械翻訳はまだまだ使い物にならないし、コストダウンの掛け声とは裏腹に、手間がかかるばかりで現場の人が疲弊してしまうのが実態だという、決していい印象を持っていませんでした。
ただ、Kさんの話を聞くと、統計的機械翻訳は従来の機械翻訳とは全く異なる手法を用いており、ここから未来が開けていくような、そんな希望のようなものを感じたのも事実です。ともかく、中身はよくわかりませんが、セットアップに取り掛かったのでした。
何だこれ?
Mosesについて調べてみると、どうやらWindows版もあるようでした。Linux版は同僚のFさんに任せ、筆者はWindows版のセットアップを担当することにしました。Windows版は何とか1日でサンプルが動く状態になりましたが、全く意味がわかりません。指定されたとおりにコマンドを入力すると、
das ist ein kleines haus
という文章が
this is a small house
という文章になって出てきました。ドイツ語から英語に翻訳されたわけですが、「で?」というのが正直な感想でした。統計的機械翻訳の概念も用語も知らないのに、専門用語の並ぶ英語の説明を読んで、意味もわからずとりあえずサンプルを動かしてみたという状態なので、自分が何をしたのか、全く理解できていませんでした。
その後、Windows版でMosesを動かすのは、事実上、無理があるというのがわかり、Linux版を担当したFさん頼みになりました。Windows版と異なり、一口にLinuxと言っても種類がたくさんあるため、どの環境なら動くのかから調べ、必要なものをインストールし、場合によってはコンパイルから行なうという作業をしてもらいました。とりあえずサンプルを動かすところまでは1日でできたものの、残りの必要なツールをセットアップするのに、ちょうど1週間かかりました。Fさんも筆者と同じく、とりあえずサンプルが動いたけど、何をやってるのか全く理解できないという状態でしたが、どうにかセットアップは完了したので、依頼者であるKさんにお渡ししました。
この後、再びMosesを使うことになるのは、ずいぶんと時間が経ってからになってしまいましたが、今思えば、このとき既に統計的機械翻訳の世界に足を踏み入れていたのでした。
次回は夜明け前の出来事です。
[注] この回顧録は、かつて勤めていた会社で書いた連載を復元したもので、某I社の現在の状況を反映している訳ではありません。