Question 1

本当にメッセージはサーバーに送られないのですか？

Accepted Answer

送られません。MindCell は WebLLM (@mlc-ai/web-llm) を WebGPU で動かしているだけで、推論はすべてあなたのデバイス内のGPUで完結します。 会話内容が私たちのサーバーや OpenAI / Anthropic 等の外部サービスに届くことはありません。(初回のみモデル本体を Hugging Face CDN からダウンロードします。これはモデルファイルの取得で、あなたの会話ではありません)

Question 2

何が必要ですか？

Accepted Answer

WebGPU 対応ブラウザ (Chrome 113+ / Edge / Opera のデスクトップ版が最も安定)。 Safari は Tech Preview / iOS 18+ で実験的サポート。Firefox は Nightly のみ。 メモリは 4GB 以上 (Qwen 0.5B 利用時)、 8GB 以上推奨 (Llama 1B / Phi 3.5)。

Question 3

回答品質はどうですか？

Accepted Answer

Qwen 2.5 0.5B は『軽量』 を最優先したモデルなので、 ChatGPT / Claude のような大規模モデルには明らかに劣ります。 短い質問への回答、簡単な要約、定型タスクには使えますが、 複雑な推論や厳密な事実確認には向きません。 用途が合えば Llama 3.2 1B / Phi 3.5 mini に切り替えると精度は上がります。

Question 4

なぜブラウザだけにこだわるのですか？

Accepted Answer

AI チャットに入れる内容は、 個人的だったり機密だったりすることが多いです。 仕事のメール、健康相談、家族のこと、契約書のドラフト。 これらを外部 API に送らずに使える選択肢があるべきです。 WebGPU と量子化済みモデルが揃った今、その選択肢はやっと現実的になりました。

Question 5

他のメディアサービスとの関係は？

Accepted Answer

voice-scribe / clip-cast / bg-snap / text-pluck / pdf-anvil / pixel-lift / pic-flip のメディア処理 7本に続く 8本目です。 メディアから一歩出て、 テキスト生成 (会話 AI) もブラウザだけで成立する、 という別軸の実証になります。

AIチャットを、
ブラウザだけで
動かす。

仕組み。

メッセージを送る

WebGPU でローカル推論

モデルを切り替える

よくある質問。

開発ログ。

MindCell ができるまで — ブラウザだけで LLM を動かすチャット設計

AIチャットを、ブラウザだけで動かす。