[word-warp · on-device translation]
機密文書、 メール下書き、 健康相談、 契約書草案。 外部APIに送りたくない 文章でも、 ここに貼ると 8つの言語ペアで翻訳できます。 transformers.js + OPUS-MT があなたのブラウザ内だけで動く、 プライベートな辞書 + 翻訳器。
[ ./how_it_works ]
step / 01
日本語→英語、中国語⇔英語、韓国語→英語、英語→フランス語/ドイツ語/スペイン語 の 7ペアから選択。
step / 02
左パネルに原文を入力。 機密文書、 メール下書き、 仕事の要件、 何でも構いません。 サーバーには送られません。
step / 03
初回のみ OPUS-MT モデル本体 (~80MB) を Hugging Face CDN からダウンロード。 以降は IndexedDB から再利用してオフラインでも動きます。
[ ./faq ]
送られません。 WordWarp は @xenova/transformers (transformers.js) を WASM + ONNX で動かしているだけで、 翻訳はすべてあなたのデバイス内で完結します。 入力テキストが私たちのサーバーや DeepL / Google 翻訳 等の外部サービスに届くことはありません。 (初回のみモデル本体を Hugging Face CDN からダウンロードします。これはモデルファイルの取得で、 あなたの文章ではありません)
OPUS-MT は OSS の中で実用範囲ですが、 DeepL のような商用大規模モデルには劣ります。 短い実務文 / 観光会話 / メール下書きは十分実用。 文学的表現、 ニュアンス、 専門用語の精度は商用エンジンに分があります。 「サーバーに送りたくない私的な文章を一旦下訳する」 用途で強さを発揮します。
翻訳に入れる文章は、 個人的なメール、 健康相談、 契約書のドラフト、 機密情報を含むことが多い。 それを外部APIに送らずに済む選択肢が必要だから。 transformers.js と量子化済み OPUS-MT が揃った今、 その選択肢は現実的になりました。
v1 は 日本語→英語、 中国語⇔英語、 韓国語→英語、 英語→フランス語/ドイツ語/スペイン語 の 7ペア。 各ペアが独立した OPUS-MT モデルで、 切替時にモデルを動的ロード (~80MB)。 一度ロードしたモデルはブラウザに保存されオフラインでも動きます。
正直に書きます。 OPUS-MT の英→日モデル (Helsinki-NLP/opus-mt-en-jap) は学習データの大半が聖書コーパスで、 一般的な文を投げると 「hello」→「陰府は陰府に及ぶ」 のように意味不明な聖書文を返す既知の偏りがあります。 動くフリをして実用にならない出力を出すのは誠実ではないので、 v1 では除外しました。 NLLB-200 等の品質を担保できる多言語モデル (~400MB) への切替を将来の改善候補として扱っています。 英→日が必要な場合は、 mind-cell (ブラウザ内 LLMチャット) に翻訳依頼として投げる回避策があります。
OPUS-MT は 1回の推論で 512 トークン程度が上限です。 WordWarp は入力を段落 (空行区切り) で自動分割し、 各段落を順に翻訳して結合します。 1万文字程度までは実用範囲ですが、 短文の方が品質は安定します。
voice-scribe / clip-cast / bg-snap / text-pluck / pdf-anvil / pixel-lift / pic-flip / mind-cell / beam-drop に続くラボの 10本目です。 voice-scribe (音声→文字) や text-pluck (画像→文字) の出力を、 WordWarp で別言語に変換する Process Chain の起点になります。
[ ./journal ]