このページの本文へ

新清士の「メタバース・プレゼンス」 第46回

画像生成AIが爆速で進化した2023年をまとめて振り返る

2023年12月11日 07時00分更新

文● 新清士 編集●ASCII

  • この記事をはてなブックマークに追加
  • 本文印刷

Hugging FaceとGitHubが発展の軸に

「Hugging Face」内、Stablility AIのページ

 なぜこんなに爆発的な発展が起きたのか。

 それは、データセット共有サイトの「Hugging Face」と、ソフトウェア開発用プラットフォームの「GitHub」の影響がやはり大きいですよね。世界規模で論文やコードを即座に公開・共有できる環境が整っていたため、並行的に生まれる研究を発表直後から即利用できたわけです。

 たとえばLCMの技術は北京の精華大学から出てきたものですが、一瞬で世界中に広がり、1ヵ月もしないうちに、「Fooocus」などのアプリはもちろん、欧米や日本の企業が開発するサービスにも組み込まれるようになりました。

 この開かれた環境があったことによって、イノベーションが爆発的に早まったと言えそうです。

 新しい学会に向けて何かが発表されるたびに、そのソースコードをすぐに利用できる。そこには研究者だけでなく、一般のユーザーも含まれます。仕事で開発している人、様々な趣味で開発しているホビーストなどが集まって、アイデアをぶつけあい、技術の発展を加速化させてきたわけです。

 Stable Diffusionが急速に普及したのも、Stability AIが自分たちの学習モデルをHugging Faceで配布したことがきっかけでした。その後、Stability AIでさえまったく予想しなかったであろう形で、発展が続いているのです。

 また、AI系データ投稿サイトの「Civitai(シビタイ)」も、イノベーションの加速化の一翼を担っているのは間違いありません。

AI系データ投稿サイト「Civitai」

 Civitaiには、Stable Diffusion向けのとても様々なモデル(Checkpoint)が投稿されており、YouTube初期を連想するものがあります。

 様々な狙い撃ちLoRAや、性的な学習データなどがアップロードされており、かなり問題点の多いデータが含まれているという指摘がされています。一方で、写真をイラスト風に変えたり、ライトの処理を加えるLoRAのデータ、新機能を手軽に実験できるComfyUIのデータなどが発表されていたりと、実に多様なユーザー主導の実験もなされています。

 同じようなUGCサイトは、中国を含めて世界の様々なところに登場してきており、当分この流れは止まることはなさそうだというのが正直な感想です。

カテゴリートップへ

この連載の記事
ピックアップ