[word-warp · on-device translation]

翻訳を、
ブラウザだけ
済ませる。

機密文書、 メール下書き、 健康相談、 契約書草案。 外部APIに送りたくない 文章でも、 ここに貼ると 8つの言語ペアで翻訳できます。 transformers.js + OPUS-MT があなたのブラウザ内だけで動く、 プライベートな辞書 + 翻訳器。

on-device opus-mt · wasm 7 language pairs

[ ./how_it_works ]

仕組み。

step / 01

翻訳方向を選ぶ

日本語→英語、中国語⇔英語、韓国語→英語、英語→フランス語/ドイツ語/スペイン語 の 7ペアから選択。

step / 02

テキストを入力

左パネルに原文を入力。 機密文書、 メール下書き、 仕事の要件、 何でも構いません。 サーバーには送られません。

step / 03

ローカル推論

初回のみ OPUS-MT モデル本体 (~80MB) を Hugging Face CDN からダウンロード。 以降は IndexedDB から再利用してオフラインでも動きます。

[ ./faq ]

よくある質問。

本当にテキストはサーバーに送られないのですか?+

送られません。 WordWarp は @xenova/transformers (transformers.js) を WASM + ONNX で動かしているだけで、 翻訳はすべてあなたのデバイス内で完結します。 入力テキストが私たちのサーバーや DeepL / Google 翻訳 等の外部サービスに届くことはありません。 (初回のみモデル本体を Hugging Face CDN からダウンロードします。これはモデルファイルの取得で、 あなたの文章ではありません)

DeepL / Google翻訳と比べて品質はどうですか?+

OPUS-MT は OSS の中で実用範囲ですが、 DeepL のような商用大規模モデルには劣ります。 短い実務文 / 観光会話 / メール下書きは十分実用。 文学的表現、 ニュアンス、 専門用語の精度は商用エンジンに分があります。 「サーバーに送りたくない私的な文章を一旦下訳する」 用途で強さを発揮します。

なぜブラウザだけにこだわるのですか?+

翻訳に入れる文章は、 個人的なメール、 健康相談、 契約書のドラフト、 機密情報を含むことが多い。 それを外部APIに送らずに済む選択肢が必要だから。 transformers.js と量子化済み OPUS-MT が揃った今、 その選択肢は現実的になりました。

対応言語ペアは?+

v1 は 日本語→英語、 中国語⇔英語、 韓国語→英語、 英語→フランス語/ドイツ語/スペイン語 の 7ペア。 各ペアが独立した OPUS-MT モデルで、 切替時にモデルを動的ロード (~80MB)。 一度ロードしたモデルはブラウザに保存されオフラインでも動きます。

なぜ英→日本語 (en→ja) が無いのですか?+

正直に書きます。 OPUS-MT の英→日モデル (Helsinki-NLP/opus-mt-en-jap) は学習データの大半が聖書コーパスで、 一般的な文を投げると 「hello」→「陰府は陰府に及ぶ」 のように意味不明な聖書文を返す既知の偏りがあります。 動くフリをして実用にならない出力を出すのは誠実ではないので、 v1 では除外しました。 NLLB-200 等の品質を担保できる多言語モデル (~400MB) への切替を将来の改善候補として扱っています。 英→日が必要な場合は、 mind-cell (ブラウザ内 LLMチャット) に翻訳依頼として投げる回避策があります。

長い文章は翻訳できますか?+

OPUS-MT は 1回の推論で 512 トークン程度が上限です。 WordWarp は入力を段落 (空行区切り) で自動分割し、 各段落を順に翻訳して結合します。 1万文字程度までは実用範囲ですが、 短文の方が品質は安定します。

他のメディアサービスとの関係は?+

voice-scribe / clip-cast / bg-snap / text-pluck / pdf-anvil / pixel-lift / pic-flip / mind-cell / beam-drop に続くラボの 10本目です。 voice-scribe (音声→文字) や text-pluck (画像→文字) の出力を、 WordWarp で別言語に変換する Process Chain の起点になります。

[ ./journal ]

開発ログ。

WordWarp

WordWarp ができるまで — OPUS-MT をブラウザで動かして翻訳をローカル化する

@xenova/transformers と OPUS-MT (Helsinki-NLP) の量子化版で、 テキストをサーバーに送らずブラウザ内推論で翻訳する Webサービスの設計記録。 言語ペア切替、 段落分割、 IndexedDB キャッシュ、 8ペア対応の UX まで解説します。

read log →

all_entries →

← back to ai-lab.org