Google様の翻訳API
昨日紹介した自作サービスについて。
日本語→英語、日本語→中国語 に翻訳するのに
Wikipediaを使っている。
日本語をキーにして、Wikipediaで検索し、取得したHTMLから
正規表現で英語(or中国語)の文字列(キーに対応する単語)を取得している。
これは、自作翻訳API。
これのいいところは、「ドラえもん」とか、「ウルトラマン」とか、
普通の翻訳ツールじゃカバーしづらい固有名詞に強いというところ。
逆に、弱いのが、あいまいさが残るものがダメ。
たとえば、「竹島」とを英訳してやろうとしても、自分は例の領土紛争の竹島を指しているつもりでも、
実は竹島っていう地名はいっぱいあるので「Takeshima_(disambiguation)」 となる。
つまり、おせっかいな事にあいまいさ回避のためのページに飛ばされてしまう。
これじゃ、カッコ悪いので
なんか、翻訳APIないかなぁと検索してみたら、Googleが出してるらしい。
おおふorz
http://code.google.com/apis/ajaxlanguage/
なんちゅー太っ腹なんだ。。
すげーよ。ごっごる。
とりあえず、これを使って見ることにする。
ちょっとドラえもんとかは惜しい気がするけど、ま、いいや。
本来なら、Wikipediaの結果と比較して、よさそうな方を採用ってロジックにした方がいいんだろうけどね。
ほんじゃ、さっそく、ドキュメント読み読みして、入れ込んでみます。