富士ゼロックスが複合機でスキャンした書類のレイアウトを維持したまま機械翻訳する「スキャン翻訳サービス」を開始しました。これを手持ちのドキュメントスキャナのOCR機能とGoogle翻訳を使って、簡単に実現できました。しかも無料。精度は完璧ではありませんが、知らない単語を辞書で引く手間を省いたり、文脈を理解するには十分そうです。
まずはドキュメントスキャナで洋書をスキャンします。使用したスキャナはScanSnap S1500で、「検索可能なPDFにします」をチェックしておきます。
こうすると文字の部分(実際には画像データ)の上に、テキストが付加されます。
PDFファイルを保存したらGoogle翻訳にアクセスして、ファイルを選択して翻訳ボタンを押すと、すぐに翻訳した結果が表示されます。
【翻訳前】
【翻訳後】
翻訳後の画面に出力されるのはテキスト部分だけですが、ちゃんと段落まで再現されているのが素晴らしいですね。