[word-warp · on-device translation]

翻訳を、
ブラウザだけ
済ませる。

機密文書、 メール下書き、 健康相談、 契約書草案。 外部APIに送りたくない 文章でも、 ここに貼ると 8つの言語ペアで翻訳できます。 transformers.js + OPUS-MT があなたのブラウザ内だけで動く、 プライベートな辞書 + 翻訳器。

on-device wasm + onnx 8 language pairs · opus-mt + nllb-200

[ ./how_it_works ]

仕組み。

step / 01

翻訳方向を選ぶ

日本語⇔英語、中国語⇔英語、韓国語→英語、英語→フランス語/ドイツ語/スペイン語 の 8ペア。 7ペアは OPUS-MT (~80MB/ペア)、 英→日本語のみ NLLB-200 (~430MB) を使用。

step / 02

テキストを入力

左パネルに原文を入力。 機密文書、 メール下書き、 仕事の要件、 何でも構いません。 サーバーには送られません。

step / 03

ローカル推論

初回のみ OPUS-MT モデル本体 (~80MB) を Hugging Face CDN からダウンロード。 以降は IndexedDB から再利用してオフラインでも動きます。

[ ./faq ]

よくある質問。

本当にテキストはサーバーに送られないのですか?+

送られません。 WordWarp は @xenova/transformers (transformers.js) を WASM + ONNX で動かしているだけで、 翻訳はすべてあなたのデバイス内で完結します。 入力テキストが私たちのサーバーや DeepL / Google 翻訳 等の外部サービスに届くことはありません。 (初回のみモデル本体を Hugging Face CDN からダウンロードします。これはモデルファイルの取得で、 あなたの文章ではありません)

DeepL / Google翻訳と比べて品質はどうですか?+

OPUS-MT は OSS の中で実用範囲ですが、 DeepL のような商用大規模モデルには劣ります。 短い実務文 / 観光会話 / メール下書きは十分実用。 文学的表現、 ニュアンス、 専門用語の精度は商用エンジンに分があります。 「サーバーに送りたくない私的な文章を一旦下訳する」 用途で強さを発揮します。

なぜブラウザだけにこだわるのですか?+

翻訳に入れる文章は、 個人的なメール、 健康相談、 契約書のドラフト、 機密情報を含むことが多い。 それを外部APIに送らずに済む選択肢が必要だから。 transformers.js と量子化済み OPUS-MT が揃った今、 その選択肢は現実的になりました。

対応言語ペアは?+

現在 8ペア。 OPUS-MT (Helsinki-NLP) で 7ペア (日→英 / 中⇔英 / 韓→英 / 英→仏独西、 各 ~80MB)、 NLLB-200 (Meta) で 1ペア (英→日本語、 ~430MB) の二段構え。 OPUS-MT は軽量・特化型、 NLLB-200 は重量・多言語型。 一度ロードしたモデルはブラウザの IndexedDB に保存されオフラインでも動きます。

英→日本語 (en→ja) だけ別モデルなのはなぜ?+

OPUS-MT の英→日モデル (opus-mt-en-jap) は学習データの大半が聖書コーパスで、 「hello」→「陰府は陰府に及ぶ」 のような意味不明な聖書文を返す致命的な品質問題があります。 そこで英→日だけは Meta の NLLB-200 (200言語対応の品質保証済み多言語モデル) に差し替えました。 サイズは ~430MB と他の OPUS-MT より大きいですが、 一度ダウンロードすれば実用品質の英→日翻訳がで動きます。

OPUS-MT と NLLB-200 の品質差は?+

OPUS-MT は言語ペアごとに専用学習された軽量モデルで、 日→英 / 中⇔英 / 英→仏独西 等の主要ペアでは短文の品質は実用範囲です。 NLLB-200 は 1モデルで 200言語をカバーする多言語モデルで、 特に日本語や朝鮮語のような OPUS-MT が弱い言語で品質を担保します。 サイズは 5倍以上 (~430MB) ですが、 ブラウザにロードしたあとは推論速度は十分に実用的です。

長い文章は翻訳できますか?+

OPUS-MT は 1回の推論で 512 トークン程度が上限です。 WordWarp は入力を段落 (空行区切り) で自動分割し、 各段落を順に翻訳して結合します。 1万文字程度までは実用範囲ですが、 短文の方が品質は安定します。

他のメディアサービスとの関係は?+

voice-scribe / clip-cast / bg-snap / text-pluck / pdf-anvil / pixel-lift / pic-flip / mind-cell / beam-drop に続くラボの 10本目です。 voice-scribe (音声→文字) や text-pluck (画像→文字) の出力を、 WordWarp で別言語に変換する Process Chain の起点になります。

← back to ai-lab.org