このページの本文へ

Stability AI、商用利用可能な日本語画像言語モデル「Japanese Stable VLM」

2023年11月13日 17時00分更新

文● 田口和裕

ツイートする
一覧
お気に入り

　Stability AIは11月13日、商用利用可能な日本語画像言語モデル「Japanese Stable VLM」をリリースした

画像の内容を日本語で説明

　「Japanese Stable VLM」は、日本語で利用できる画像言語モデル（Vision-Language Model：VLM）。入力した画像に対して文字で説明を生成できる「画像キャプショニング」機能のほか、あらかじめ出力キャプションで使ってほしい単語を入力できる「タグ条件付きキャプショニング」機能も用意されている。

　さらに、上記画像のように、画像についてのユーザーの質問に回答したり、動画のフレームを抜き取ることで、動画キャプショニングやリアルタイム動画の質問応答も可能としている。

商用利用も可能

　訓練には最新手法「LLaVA-1.5」のモデル構造・学習手法を適用、言語モデルには同社が10月25日に発表した「Japanese Stable LM Instruct Gamma 7B」を用い、画像エンコーダとしてOpenAIの「clip-vit-large-patch14」を使用している。

　クリエイターからオプトアウトの要求があったり、robot.txtや利用規約で利用が禁止されているデータは訓練には使用していないという。

　なお、2023年8月17日に発表された最初のバージョン「Japanese InstructBLIP Alpha」は非商用利用に限定されていたが、今回のモデルは商用利用可能になっている。

　ただしライセンスは「STABILITY AI JAPANESE STABLE VLM COMMUNITY LICENSE」とだけ記されており、詳細は準備中のようだ。

■関連サイト

ツイートする

カテゴリートップへ

AIオススメ記事

2025年03月31日

AI

動画生成AI、革命の兆し「Stable Diffusion」級の衝撃再び
2025年03月21日

AI

【解説】Geminiの画像生成がすごい　無料で使えるうちに試してみて
2025年03月24日

AI

無料で使えて超高品質、画像生成AIの最新事情
2025年03月10日

AI

動画生成AIの進化がすごい　「超リアル」「ローカルで動く」2つの方向に
2025年03月21日

AI

グーグル「NotebookLM」にみんな大好き「マインドマップ」機能が追加！
2025年03月17日

AI

文章術としてのCursor入門
2025年03月21日

AI

AIがあるので、今年はエンジニア採用やめました　Salesforce
2025年01月27日

AI

動画生成AI、ついにアダルトの扉が開く
2025年03月13日

ビジネス

世界にわずか数台!! 原子1つまでハッキリ見える透過型電子顕微鏡ほか、産総研先端設備を一挙紹介
2025年04月02日

AI

OpenAI「GPT-4.5」がチューリングテストに合格したと、カリフォルニア大の研究チームが発表

ピックアップ

sponsored
「社内／社外への安全な共有」から「Office文書の共同編集」「電子署名」まで

“仕事で使うDropbox”の基本と便利な使い方 ― 人気記事ベストセレクション
sponsored
手軽なのに安心なサイバーセキュリティ対策「QTクイックセキュリティアセスメントサービスpowered by KDSec」

自社のセキュリティ対策の弱点を2週間で可視化　中小企業向け問診型のセキュリティ診断
sponsored
気軽に着けられるサイズと価格、最長14日間の動作や充実の睡眠モニタリングなどが特長

人気スマートバンドがさらに魅力的に進化！ファーウェイ「HUAWEI Band 10」レビュー
sponsored
JN-i238G200F-HSP-Wをレビュー

200Hzの23.8型ゲーミングディスプレーが2万980円!? さすがに安すぎるけど大丈夫？
sponsored
Wi-Fi 7対応の「Archer BE450」「Archer BE220」、便利なスマートリモコン「Tapo H110」

Wi-Fi 7ルーターで一番売れてたTP-Link！　Amazon限定版は納得の高コスパ、メッシュ化もスマートホームも快適だ
sponsored

ストリーマー・はつめが爆速光回線「ビッグローブ光10ギガタイプ」で配信もゲームもストレスゼロの新体験！
sponsored

ヤリ手ビジネスマンになりたければビッグローブ光10ギガタイプを選べ！ベテラン編集者が新人営業マンに教える高速回線の重要性
sponsored

【PC作業効率大幅上昇】「ノートPCでマルチディスプレイ環境」の基本のキを、マウスのDAIVノート＋iiyamaディスプレイで学ぶ！
sponsored

”モンハンワイルズ”を遊べる！インテル Arc B580ならOS込み15万円でゲーミングPCを作れる
sponsored
Backlog World 2024の運営ではチームワークマネジメントを実践していた

「解散が寂しくなる」ような居心地のいいチーム作りはどうやって実現するのか？
sponsored
積み上がる課題とタスクをチームで前向きにさばくためのBacklog活用

メンバーのやる気をMAXにするチーム組成術　コミュニティイベントから学ぶ
sponsored

驚くほど広くて高解像度のノートがほしい!?　それなら14型＋14型の2画面ノート「Zenbook DUO UX8406CA」だ
sponsored

究極のデジタルライフとカーライフの両立　歯科医レーサーの及川紗利亜がビッグローブ光10ギガタイプで実現
sponsored
この春購入したいマウスコンピューターのノートパソコンをピックアップ

新生活始める人にピッタリなパソコン見つけた！マウスのノートパソコンを選ぶ8の理由
sponsored
MSIからまさかのGoogle TV対応ディスプレーが登場、「Modern MD272UPSW」レビュー

新生活にテレビ不要ならアマプラもネトフリも見られる4Kスマートモニターがベストバイ
sponsored
SOUND TECTORのデスクトップゲーミングスピーカーはどのように作られた？

感動した俺は山形県に飛んだ、パイオニアのゲーミングスピーカーが「驚きの音の良さ」
sponsored
理由は〈品質・価格・安心〉を徹底したオプテージのサービス精神にあり！

なぜ関西では「eo光」が戸建の光回線シェアトップ＆18年連続満足度No.1なのか？
sponsored

高速回線はリアルの人々も繋ぐ！ラリードライバー長尾選手はビッグローブ光10ギガタイプで夢の実現スタート
sponsored
血圧が1日の間でどう変わるのかもわかる

血圧計が常に手首にあると超便利！ファーウェイのスマートウォッチ「HUAWEI WATCH D2 ウェアラブル血圧計」で生活がこう変わる！
sponsored
HYTEのY70 Touch Infinite Pandaを採用、ライザーケーブルでビデオカードを縦置き

【ゲーミングPCにおいて最強】目指しX3DとRTX 5090を選択、タッチ液晶付きPCケースに載せたら超カッコよくなった
sponsored
NVIDIA高橋想氏、津田恵理子氏にインタビュー

いま、NVIDIA RTX AIワークステーションを導入する企業が増えている理由
sponsored
27歳アスキー編集部員がガチ体験レポート（3ヶ月連続企画）

「3ヶ月で15キロ、マジで痩せられたらどうしよう！！」運動なしでダイエットできると評判の「メンズ専用サロンEVOCORE」体験します！
sponsored
Crucial X9 ProポータブルSSDで逼迫するストレージ容量を解決

新生活PCと一緒に外付けSSDを買ったほうがいい理由
sponsored
16型で1.28kgのスタンダードノートや、RTX 40シリーズ搭載ゲーミングノートなどをラインアップ

最大3万5000円引きだと？仕事やゲーム向けのノートパソコンを探しているならパソコン工房「決算セール第2弾」は必見だろ！
sponsored

新しいスマホ、パソコン、銀行口座、サービスアカウントまで、新生活をまとめて守れる1本のソフトがコレ
sponsored
話題の光10ギガサービス、今がはじめどきの「5つの理由」

So-net 光 10ギガが月額基本料金最大12カ月無料、「速い、安い、快適」なら契約しない手はない
sponsored
JAPANNEXTの「JN-IPS34G165UQ-HS」をレビュー

【ド迫力】相性良すぎ！『真・三國無双 ORIGINS』を4万円台の21：9・34型ウルトラワイドディスプレーで遊んだらマジでほしくなった
sponsored

【お悩み解決】推し活もはかどる！ネット動画の時代だからこそ始めよう、全自動録画の魅力
sponsored
JN-i55U-Uをレビュー

55型4Kディスプレーはアームで運用できるのか？困難の先にある圧倒的没入感
sponsored
農作業効率化ソリューション「レポサク」を支える「MEEQ SIM」を紹介

【DX成功のヒント満載！】位置情報ソリューション開発のエゾウィン、IoT通信「MEEQ」ウェビナーに登壇
sponsored
JN-IPS27Q4FL-HSPC9-DLをレビュー

超多機能27型WQHDディスプレー、USB Type-C給電・デイジーチェーン・有線LAN・KVMアリで3万円台に「おっ？」
sponsored

ビデオカードなしで｢FFXIV: 黄金のレガシー｣の60fps超えが狙える!? 「AMD Ryzen 5 8600G」の実力を見た！