Question 1

これ何? の 画像認識 は どう やって 判定 して いますか?

Accepted Answer

CLIP という AI が、 写真 と 「ことば の 候補」 を それぞれ 数値 (ベクトル) に 変換 し、 どの 候補 が 写真 に いちばん 近い か を 計算 して います。 あらかじめ 決まった 分類 だけ で なく、 その場 で 渡した 候補 の 中 から 選べる の が 特徴 で、 これ を ゼロショット 画像分類 と 呼びます。

Question 2

どんな 写真 が 正しく 判定 されやすい ですか?

Accepted Answer

対象 が 画面 の 中央 に 大きく はっきり 写って いる 写真 が 当たりやすい です。 また 図鑑 の カテゴリ を 選ぶ と 候補 が 絞られる ので 精度 が 上がります。 用意 した イラスト の 例 でも 試せます が、 スマホ で 撮った 実際 の 写真 の ほう が AI は 本領 を 発揮 します。

Question 3

候補 を 自分 で 入れる とき の コツ は?

Accepted Answer

日本語 の 一般的 な 言葉 (犬 / 猫 / りんご など) は 自動 で 英語 に 変換 して 判定 します。 珍しい 言葉 や 思いどおり に 当たらない とき は、 英単語 で 入力 する と 精度 が 上がります。 CLIP は 英語 で 学習 して いる ため です。 候補 は 2 つ 以上 入れて ください。

Question 4

写真 や カメラ の 映像 は アップロード されますか?

Accepted Answer

され ません。 画像 認識 に 使う AI モデル (CLIP) は 初回 に 一度 だけ ダウンロード され、 以降 は あなた の ブラウザ の 中 で 動きます。 写真 や カメラ の 映像 は 端末 の 外 に 出ない ので、 個人 の 写真 でも 安心 して 試せます。

Question 5

ai-lab の 他 の サービス と の 関係 は?

Accepted Answer

ai-lab は AI を 使った Web ツール を 作って 公開 する 実験 ラボ。 WhatCam は 写真 を 端末内 で AI 処理 する 系 の 1 本 で、 写真 3D化 (depth-cast) ・ 背景 透過 (bg-snap) ・ 色覚 シミュレーション (chroma-lens) などと 同じ 仲間。 こちら は 「これ は 何 か を 当てる」 役割 を 受け持ちます。

これ、何?

WhatCam の特徴

写真・カメラで「これ何?」を判定

候補を自分で決められる (ゼロショット)

一致度をランキング表示

端末内処理・送信ゼロ

よくある質問

これ何? の画像認識はどうやって判定していますか?

どんな写真が正しく判定されやすいですか?

候補を自分で入れるときのコツは?

写真やカメラの映像はアップロードされますか?

ai-lab の他のサービスとの関係は?

WhatCam の 特徴