Question 1

本当にテキストはサーバーに送られないのですか？

Accepted Answer

送られません。 WordWarp は @xenova/transformers (transformers.js) を WASM + ONNX で動かしているだけで、 翻訳はすべてあなたのデバイス内で完結します。 入力テキストが私たちのサーバーや DeepL / Google 翻訳 等の外部サービスに届くことはありません。 (初回のみモデル本体を Hugging Face CDN からダウンロードします。これはモデルファイルの取得で、 あなたの文章ではありません)

Question 2

DeepL / Google翻訳と比べて品質はどうですか？

Accepted Answer

OPUS-MT は OSS の中で実用範囲ですが、 DeepL のような商用大規模モデルには劣ります。 短い実務文 / 観光会話 / メール下書きは十分実用。 文学的表現、 ニュアンス、 専門用語の精度は商用エンジンに分があります。 「サーバーに送りたくない私的な文章を一旦下訳する」 用途で強さを発揮します。

Question 3

なぜブラウザだけにこだわるのですか？

Accepted Answer

翻訳に入れる文章は、 個人的なメール、 健康相談、 契約書のドラフト、 機密情報を含むことが多い。 それを外部APIに送らずに済む選択肢が必要だから。 transformers.js と量子化済み OPUS-MT が揃った今、 その選択肢は現実的になりました。

Question 4

対応言語ペアは？

Accepted Answer

v1 は 日本語→英語、 中国語⇔英語、 韓国語→英語、 英語→フランス語/ドイツ語/スペイン語 の 7ペア。 各ペアが独立した OPUS-MT モデルで、 切替時にモデルを動的ロード (~80MB)。 一度ロードしたモデルはブラウザに保存されオフラインでも動きます。

Question 5

なぜ英→日本語 (en→ja) が無いのですか？

Accepted Answer

正直に書きます。 OPUS-MT の英→日モデル (Helsinki-NLP/opus-mt-en-jap) は学習データの大半が聖書コーパスで、 一般的な文を投げると 「hello」→「陰府は陰府に及ぶ」 のように意味不明な聖書文を返す既知の偏りがあります。 動くフリをして実用にならない出力を出すのは誠実ではないので、 v1 では除外しました。 NLLB-200 等の品質を担保できる多言語モデル (~400MB) への切替を将来の改善候補として扱っています。 英→日が必要な場合は、 mind-cell (ブラウザ内 LLMチャット) に翻訳依頼として投げる回避策があります。

Question 6

長い文章は翻訳できますか？

Accepted Answer

OPUS-MT は 1回の推論で 512 トークン程度が上限です。 WordWarp は入力を段落 (空行区切り) で自動分割し、 各段落を順に翻訳して結合します。 1万文字程度までは実用範囲ですが、 短文の方が品質は安定します。

Question 7

他のメディアサービスとの関係は？

Accepted Answer

voice-scribe / clip-cast / bg-snap / text-pluck / pdf-anvil / pixel-lift / pic-flip / mind-cell / beam-drop に続くラボの 10本目です。 voice-scribe (音声→文字) や text-pluck (画像→文字) の出力を、 WordWarp で別言語に変換する Process Chain の起点になります。

翻訳を、
ブラウザだけで
済ませる。

仕組み。

翻訳方向を選ぶ

テキストを入力

ローカル推論

よくある質問。

開発ログ。

WordWarp ができるまで — OPUS-MT をブラウザで動かして翻訳をローカル化する

翻訳を、ブラウザだけで済ませる。