前回は、某I社が機械翻訳へと大きく舵取りをしたときのお話をしました。今回は、筆者が本格的にMosesに取り組むことになったときのお話です。
一緒にMosesの担当者になってほしい
別の部署のマネージャーであるGさんに、そう切り出されたのは、2010年9月末のことでした。筆者は、某I社に入社してからの大半の時間を社内ITインフラの責任者として過ごしていて、他部門からの依頼事は日常茶飯事です。この日も、PCのセットアップか、何か新しいITインフラを用意したいという依頼かと思って、特別身構えることもなかったのですが、まさかMosesの担当者になるという話だとは思ってもいませんでした。
筆者は、直接的に翻訳案件にかかわることがほとんどなかったのですが、翻訳業界の動向のようなものは、やはり自然と耳に入ってきます。統計的機械翻訳についても、いつかは確実に取り入れることになるものの、各社ともまだ様子眺めと思っていました。ところが、どうもお客様の方が先行しているらしいという情報が入り、某I社でも本格的に力を入れることになったのでした。
ただ、このときは、いくつかある仕事がもう1つ増えるくらいにしか思っていませんでした。
11月1日付だから
10月上旬、社長が同席する何かのミーティングで、Gさんの部署への異動を告げられました。社内ITインフラの責任者という全社的なミッションはそのままに、Mosesの担当をメインにするということでした。同時に、Webサイトの担当者から外れました。異動を伴うような大きな話だったとは。気付くのが少し遅かったようです。
そして、10月中旬、統計的機械翻訳の関係者が集ってキックオフ・ミーティングが開かれ、以下のことを確認しました。
- 見込み客も含めた某I社のお客様の統計的機械翻訳への対応状況
- 目的は統計的機械翻訳を活用することによる翻訳コストの削減
- 目標は12月末までにMosesによる社内向けサービスを提供できるように環境を構築すること
この日を境に、筆者の仕事のリズムががらりと変わりました。社内ITインフラで改善したいことがいくつかありましたが、全て後回し。とにかく、寝ても覚めても統計的機械翻訳という生活の始まりです。Mosesという得体の知れないものを、ほとんど経験のないLinuxで動くようにし、かつ、使いこなせるようにならないといけないわけです。何から始めようって感じです。
とにかく、スケジュールを作らないことには、どうにもなりません。以下のように2週間単位で大まかな目標を立て、これを基に細かな作業項目を全て洗い出し、WBSを作りました。
- 10月末までに、Mosesが動く環境をセットアップする。
- 11月中旬までに、1万センテンス程度のパラレルコーパスを使って、一通りの手順を確認する。
- 11月末までに、10万センテンス程度のパラレルコーパスを使って、仕組みの理解とパフォーマンス測定を行ない、次の開発に向けた課題や要件を洗い出す。
ここからは、毎日が奮闘の連続です。壁にぶち当たったり、仮説の検証に失敗したりしながらも、時に周りの人に助けられながら、少しずつ前進しています。ようやく本題に入りますが、次回からは日々の奮闘振りを振り返ってみたいと思います。
次回はLinuxの壁です。
[注] この回顧録は、かつて勤めていた会社で書いた連載を復元したもので、某I社の現在の状況を反映している訳ではありません。