この記事の本文はまだ準備中です。
[ ./next_action ]
読んだら、 BrushShift を実際に動かす。
この開発ログは BrushShift をどう作ったかの記録です。 読み終わったらそのままサービス本体へ戻って、 実物で価値を確かめてください。
画像処理 ライン 15 本目。 Sobel エッジ + Bilateral blur + k-means 色量子化 + 浮世絵 専用 パレット (朱赤 / 藍 / 黄土 / 抹茶 / 墨 / 生成り) 最近傍マッピング + Sobel 勾配垂直 方向の楕円ブラシストローク + 紙ノイズ overlay + 4 階調 化 を、 ML モデル / 有料 API ゼロ で 純 JS Canvas に 組み合わせて、 写真を 6 スタイル絵画に 変換する エンジンの設計記録。 美術館 ギャラリー + brass 額装 + 朱印 motif。
この記事の本文はまだ準備中です。
[ ./next_action ]
この開発ログは BrushShift をどう作ったかの記録です。 読み終わったらそのままサービス本体へ戻って、 実物で価値を確かめてください。
[ ./related_logs ]
AnimeGANv2 の小さな ONNX (約9MB) を onnxruntime-web (単一スレッド WASM=COOP/COEP不要、 color-revive で承認済みライブラリの再利用) で実行。 512x512・[-1,1] 正規化で推論し、 結果を元解像度に戻して表示する設計記録。 写真は端末内処理。
read log →DeOldify の量子化 ONNX を onnxruntime-web (CDN side-load・単一スレッド WASM=COOP/COEP不要) で実行。 256x256 でモデル推論し、 輝度は元写真・色だけ AI を YCbCr で再合成して輪郭を保つ設計記録。 写真は端末内処理。
read log →CLIP (Xenova/clip-vit-base-patch32) の image-feature-extraction を transformers.js の CDN ESM で side-load し、 各写真を正規化ベクトル化。 cosine 類似度で重複・似た写真をブラウザ内で検出する設計記録 (新ライブラリ追加なし=what-cam と同じ CLIP の再利用)。
read log →多言語の文章埋め込みモデル (Xenova/multilingual-e5-small) を transformers.js の CDN ESM で side-load し、 各文を正規化ベクトル化。 cosine 類似度で意味検索と似ている文ペア検出を全て端末内で行う設計記録。
read log →CLIP (Xenova/clip-vit-base-patch32) を transformers.js の CDN ESM で side-load し、 写真と候補ラベルの近さをブラウザ内で計算。 日本語ラベルを英語プロンプトに変換し、 図鑑と自由入力の両モードで「これ何?」を判定する設計記録。
read log →Depth Anything (transformers.js) を CDN ESM で side-load し、 1枚の写真から深度マップを推定。 WebGL2 フラグメントシェーダで深度に比例した視差 (iterative backward parallax) を作り、 赤青アナグリフ / WebM 書き出しまで端末内で完結させた設計記録。
read log →