このページの本文へ

田口和裕の「ChatGPTの使い方!」 第34回

ローカルAI、スマホでサクッと動かせる グーグル「AI Edge Gallery」

2025年06月13日 17時00分更新

文● 田口和裕

  • この記事をはてなブックマークに追加
  • 本文印刷

画像認識を試す

 Gemma 3nはテキストだけではなく画像を使ったプロンプトも理解するマルチモーダルLLMだ。画像を使いたい場合は「Ask Image」からチャットウィンドウを開こう。

 プロンプトウィンドウの左端にある「+」から「Take a picture」または「Pick from album」を選び写真を選択しよう。

 今回は「AKG」というメーカーのヘッドフォン、型番「K240 Studio」の写真をアップロードして「これはなに?」と聞いてみた。

 型番が「K-240」のヘッドフォンであることは正解だが、残念ながらメーカー名を「Beyerdynamic」と間違ってしまったようだ。競合だししょうがないか……。

 もう1問出題。筆者が50年遅れでハマっている「ピンクフロイド」というバンドの「ANIMALS」というアナログレコードを見せてみると。

「ANIMALS / Pink Floyd」

 うーん残念!アーティスト名はピンクフロイドで正解だが、その後のアルバム名、メンバー名、そして説明すべてデタラメであった。

 ハルシネーションの問題は残るが、インターネットに接続されていない状態でも画像を使った質問をAIにできるのは新鮮だ。

カテゴリートップへ

この連載の記事
ピックアップ