Gemma 3nを試す
ダウンロードが終わると下記画面に変わるので、プロンプトを入力して「紙飛行機」アイコンをタップ。
プロンプト:日本語で自己紹介して
ChatGPTのようにスラスラとまではいかないが、そこそこのスピード(31.1秒)で回答が生成された。「Show Stats」をタップすると詳細を確認できる。
項目の詳細は以下。初回トークン生成に少し時間がかかってはいるものの、生成開始後は安定したペースで文章が出力されている。
| 項目 | 値 | 単位 | 説明 |
|---|---|---|---|
| 1st token | 4.84 | sec | 最初の文字が生成されるまでの時間 |
| Prefill speed | 1.03 | tokens/s | 入力された質問を処理する速度 |
| Decode speed | 4.00 | tokens/s | 回答を生成する速度 |
| Latency | 31.09 | sec | 質問から回答完了までの総時間 |
1秒間に4トークンという生成速度は、ユーザーが読むペースとほぼ同等であり、回答を待つストレスは少ない。クラウドAIと比較すれば遅いものの、完全オフラインでこの性能が得られるのは画期的といえるだろう。
このように、文体の変更も可能だ。これならローカルでも十分話し相手になるのではないだろうか。
ちなみに、こちらの記事で紹介したPocketPal AIを使って「DeepSeek-R1」に同じプロンプトを投げてみたところ以下のようになった。おもしろくはあるが日本語はまだ厳し目に感じる。

この連載の記事
-
第42回
AI
ChatGPT、Gemini、Claude、Grokの違いを徹底解説!仕事で役立つ最強の“AI使い分け術”【2025年12月最新版】 -
第41回
AI
中国の“オープンAI”攻撃でゆらぐ常識 1兆パラ級を超格安で開発した「Kimi K2」 の衝撃 -
第40回
AI
無料でここまでできる! AIブラウザー「ChatGPT Atlas」の使い方 -
第39回
AI
xAI「Grok」無料プラン徹底ガイド スマホ&PCの使い方まとめ -
第38回
AI
【無料】「NotebookLM」神機能“音声概要”をスマホで使おう! 難しい論文も長〜いYouTubeも、ポッドキャスト化して分かりやすく -
第37回
AI
OpenAIのローカルAIを無料で試す RTX 4070マシンは普通に動いたが、M1 Macは厳しかった… -
第36回
AI
無料で「Gemini 2.5 Pro」が使える!グーグル「Gemini CLI」の使い方を簡単解説 -
第35回
AI
【無料】グーグル神AIツール5選 「Google AI Studio」はこれがやばい -
第33回
AI
文章術としてのCursor入門 仕事で使うための実践編 -
第32回
AI
文章術としてのCursor入門 - この連載の一覧へ










