このページの本文へ

Stability AI、画像を日本語で説明「Japanese InstructBLIP Alpha」公開

2023年08月18日 10時50分更新

文● 田口和裕

　Stability AI Japanは8月17日、入力した画像の説明や画像についての質問を日本語で回答できる画像言語モデル「Japanese InstructBLIP Alpha」を公開した。

研究目的なら自由に利用可能

日本語向け画像言語モデル「Japanese InstructBLIP Alpha」公開しました！
入力した画像に対して文字で説明を生成できる画像キャプション機能や、画像についての質問に回答することもできます！
詳しくはこちら💁https://t.co/kA5zvmq9C3 pic.twitter.com/6jZmTtUuq4
— Stability AI 日本公式 (@StabilityAI_JP) August 17, 2023

　本モデルは、8月10日に公開された日本語向け指示応答言語モデル「Japanese StableLM Instruct Alpha 7B」を拡張し、画像を元にしたテキストを生成するモデル。ベースモデルの発表からわずか1週間というハイペースのリリースとなった。

　高いパフォーマンスが報告されている画像言語モデル「InstructBLIP」のモデル構造を用い、モデルの一部を大規模な英語のデータセットで事前学習されたInstructBLIPによって初期化し、限られた日本語データセットを用いてチューニングしたという。

　商業利用はできないが、研究目的であればHugging Face Hubにおいて他のモデルと同様に推論や追加学習を試すことができる。

状況説明だけでなく質問に回答も可能

　たとえば上記の例では、入力された画像を元に「富士山を見ながらベンチに座っている二人」という状況説明テキストを生成している。

　海外製モデルでは間違うことも多かった「桜と東京スカイツリー」「京都の金閣寺」といった日本特有の建造物を正しく認識できていることがわかる。

　さらに、画像以外に質問などのテキストも入力可能。例えば2台の自動販売機が並んでいる画像を入力し、「大きいのはどっちですか？」というプロンプトに対して「左」と正解を日本語で出力できる。

　Stability AI Japanは「英語圏と比べ、日本語のデータセットは限られており、マルチモーダル（複数のデータ形式）なデータセットはさらに限られている」と指摘。「今後も研究開発を積極的に行い、日本向けの生成基盤モデルを構築・公開することで、日本のAIコミュニティのさらなる活性化に貢献していく」としている。

■関連サイト

ツイートする

カテゴリートップへ

AIオススメ記事

2024年12月09日

AI

画像生成AIの進化が早すぎる　2024年に起きたことまとめ
2024年12月02日

AI

イラストに強すぎる画像生成AIモデル　SDXL系「NoobAI-XL」の衝撃
2024年11月25日

AI

3DモデリングにAI革命の兆し　1枚のイラストから3Dデータが完成
2024年12月09日

AI

AI、人間超えた説　OpenAIの従業員が「AGIを達成した」との見方示す
2024年12月09日

AI

人気の画像生成AIツール「ComfyUI」デスクトップアプリがめっちゃラク　初心者にオススメ
2024年12月10日

AI

【速攻解説】OpenAI「Sora」の使い方　月額3000円で出来ること、出来ないこと
2024年12月23日

AI

OpenAI「Sora」残念な離陸　中国勢が飛躍する動画生成AI
2024年11月25日

AI

業界トップ級の画像生成AIツール「Recraft」　Adobeユーザーは体験する価値あり
2024年12月09日

AI

X、AI「Grok」無料で試せるように　写真みたいな画像も生成できる
2024年11月25日

sponsored

今後のPCはAI対応が当たり前になる、それならエイサーのCopilot+ PCがいいーー「Swift 14 AI」で生産性アップ

ピックアップ

sponsored

いまゲーミングノートを選ぶなら“薄軽”が必須条件、Ryzen AI 9とRTX 4060搭載の最新「ROG Zephyrus G16」
sponsored
CORSAIR「iCUE LINK TITAN RX RGB」をチェック

iCUE LINKで面倒な取り付けやRGB設定が超簡単、冷却性能もバッチリ高いCPUクーラーが3万円強！
sponsored
ASUSの新ケース「TUF Gaming GT502 Horizon」にCore Ultra 9 285Kを採用

あれもこれもASUS！新ピラーレスケースも渋カッコいいBTOPCのコダワリを聞く
sponsored
基調講演には総務省 CISOの山内智生氏が登壇、サイバー空間をめぐる脅威動向や政策を紹介

ランサム感染の実体験からMDR導入事例までが語られた「Canon Security Days 2024」
sponsored
「LEVEL-15FXA61-R7-RM4X」を試す、重さは2.26kg、144Hzにも対応

実家・ホテル・コタツでゲームしたいなら、Ryzen 7とRTX 4060のLEVEL∞15.6型ノートPC
sponsored
「M75 WIRELESS」「K70 PRO TKL」「VIRTUOSO MAX」を試す

いずちののさんにCORSAIRの白いゲーミングデバイスを試してもらった、淡い光り方に「カワイイ」と太鼓判
sponsored
180Hz駆動でGTG0.5msのRAPID VAパネルを搭載、MSI「MAG 325CQRF QD E2」

ゲームの世界にいるみたい！没入プレイしたいなら大画面の湾曲ゲーミングディスプレーがおすすめ
sponsored
“ツールを入れただけ”じゃ、プロジェクト・タスク管理は回らない！

Backlogの利用をチーム内で定着させたい？初歩のノウハウをまとめます
sponsored
セキュリティログの分析／可視化「FortiAnalyzer」と、高度なAIアシスタント「FortiAI」

“アラート疲れ”で担当者がサイバー攻撃を見落とす！どうやったら防げた？
sponsored

狭い机でも縦置き／横置きどちらもOK！高性能な小型デスクトップパソコンでノートPC以上の作業効率アップを狙う
sponsored
ファーウェイ製スマートウォッチは、家族や知人、自分（!?）へのプレゼントにもピッタリ！

バッテリー長持ちのスマートウォッチで2025年こそ健康的な生活！クリスマスプレゼントに合う製品を紹介！
sponsored
JAPANNEXTの「JN-IB375C144UQR-H」をレビュー

144Hzで21：9の3840×1600ドット37.5型ウルトラワイドディスプレー、ゲームの没入感や仕事の効率アップがスゴイ
sponsored
ポータブルゲーミングスピーカー「TQ-PG300」

パイオニアの小型ゲーミングスピーカー、想像を超える没入感でめちゃくちゃ驚きなんですけど！
sponsored
1本のサウンドバーで360立体音響が実現！

自宅で映画を見るならソニー「HT-A9000」が最高の選択だ
sponsored
「QuTS hero」はランサムウェア対策、安価なSSD／大容量HDDの導入など、中小企業オフィスでも役立つ

NASのデータ保護強化におすすめ！ QNAPのハイエンドOSが中小企業向けモデルにも対応
sponsored

狭い机という課題は「二刀流」で解決、いまあえて選ぶべき一体型パソコンが「IdeaCentre AIO 27IRH9」
sponsored
ゲーマーからクリエイター向けまで、オススメマザーを紹介！

Core Ultra 200Sで自作するならコレ！ASUSのクラス別Z890マザーボード5選
sponsored
自作の煩雑さやトラブルシューティングの手法は軽減！MSI「MAG Z890 TOMAHAWK WIFI」

光らない！ドラゴンなし！ Core Ultra 200S世代の硬派なゲーミングPC向けZ890マザーボードは、自作PC初心者にも簡単で分かりやすくておすすめ
sponsored
Backlogに招待するだけでは「使ってくれない」、ではどうする？

うまくいく！複数人チームでのプロジェクト・タスク管理立ち上げの方法
sponsored
JN-38i160U-H-C9をレビュー

PS5 Proの4K/120fpsプレイを大迫力で！38型でKVM機能付きのゲーミング液晶がかなりイイ
sponsored
高価格にも納得できるサウンド

7万円の高額ワイヤレスイヤホン「B&W Pi8」の音が、泣けるほど良かった
sponsored
JN-IPS27WQHDR-C65W-FLD-Tをレビュー

27型WQHDディスプレー最強格現る、昇降式・USB給電・KVM・タッチの超多機能で4万円台
sponsored

ビデオカードなしで｢FFXIV: 黄金のレガシー｣の60fps超えが狙える!? 「AMD Ryzen 5 8600G」の実力を見た！