画像認識を試す
Gemma 3nはテキストだけではなく画像を使ったプロンプトも理解するマルチモーダルLLMだ。画像を使いたい場合は「Ask Image」からチャットウィンドウを開こう。
プロンプトウィンドウの左端にある「+」から「Take a picture」または「Pick from album」を選び写真を選択しよう。
今回は「AKG」というメーカーのヘッドフォン、型番「K240 Studio」の写真をアップロードして「これはなに?」と聞いてみた。
型番が「K-240」のヘッドフォンであることは正解だが、残念ながらメーカー名を「Beyerdynamic」と間違ってしまったようだ。競合だししょうがないか……。
もう1問出題。筆者が50年遅れでハマっている「ピンクフロイド」というバンドの「ANIMALS」というアナログレコードを見せてみると。
うーん残念!アーティスト名はピンクフロイドで正解だが、その後のアルバム名、メンバー名、そして説明すべてデタラメであった。
ハルシネーションの問題は残るが、インターネットに接続されていない状態でも画像を使った質問をAIにできるのは新鮮だ。

この連載の記事
-
第42回
AI
ChatGPT、Gemini、Claude、Grokの違いを徹底解説!仕事で役立つ最強の“AI使い分け術”【2025年12月最新版】 -
第41回
AI
中国の“オープンAI”攻撃でゆらぐ常識 1兆パラ級を超格安で開発した「Kimi K2」 の衝撃 -
第40回
AI
無料でここまでできる! AIブラウザー「ChatGPT Atlas」の使い方 -
第39回
AI
xAI「Grok」無料プラン徹底ガイド スマホ&PCの使い方まとめ -
第38回
AI
【無料】「NotebookLM」神機能“音声概要”をスマホで使おう! 難しい論文も長〜いYouTubeも、ポッドキャスト化して分かりやすく -
第37回
AI
OpenAIのローカルAIを無料で試す RTX 4070マシンは普通に動いたが、M1 Macは厳しかった… -
第36回
AI
無料で「Gemini 2.5 Pro」が使える!グーグル「Gemini CLI」の使い方を簡単解説 -
第35回
AI
【無料】グーグル神AIツール5選 「Google AI Studio」はこれがやばい -
第33回
AI
文章術としてのCursor入門 仕事で使うための実践編 -
第32回
AI
文章術としてのCursor入門 - この連載の一覧へ











