このページの本文へ

前へ 1 2 3 4 5 次へ

新清士の「メタバース・プレゼンス」 第155回

非エンジニアが数百万円級のツールを開発 画像&動画生成AIツールがゼロから作れた話

2026年05月04日 07時00分更新

文● 新清士

  • この記事をはてなブックマークに追加
  • 本文印刷

 今回は、筆者が個人的にAnthropicの「Claude Code」を使い、ビューアーと画像・動画AIの統合環境「百夜スタジオ」を開発している話です。筆者はプログラミングはほぼ初心者で、本格的な開発経験はありません。にもかかわらず、AIツール環境「ComfyUI」やLLM環境「LM Studio」と組み合わせた本格的なアプリを開発できるようになってきました。1日で原型ができ、1週間で形になり、1ヵ月で複雑な機能を持つツールへと発展しました。数年前であれば、数ヵ月の開発期間と数百万円の費用がかかってもおかしくないものが、動いていることに驚きを隠せません。筆者の体験を通じて、起きている変化の一端をご紹介します。

「私が作った方が早い」とAIは言った

 画像や動画生成する場合、Claude CodeのOpusを通じてComfyUIを制御することで、ComfyUIの複雑な操作を回避できる方法を以前にご紹介しました(参考:画像・動画生成AIの常識が変わる、Claude Codeに全部やらせる方法論)。ただ、この方法にも弱点があります。トークン消費がそれなりに大きい点です。色々なプロンプトを作成して、そのバリエーションを指示して、生成を繰り返していると、月100ドルのMaxプランであっても5時間ごとの利用上限に達してしまうことが少なくありませんでした。

 また、画像・動画AIを使って、多数のデータを生成しているのですが、その管理が難しくなってきていました。定番の「Eagle」を試したのですが、筆者には合わず、画像管理にはシェアウェアの「XnView MP」を使っていました。ところが、XnViewは動画の管理が弱く、今後もアップデートでその強化は予定されていません。それぞれの画像をどういうプロンプトで作成したのかという情報などが簡単に見られるビューアーがほしいと思ったんですよね。それで、ついでにComfyUI連携もして、生成機能までつけられないだろうかと。

 同じ課題感を持つ方はいるようで、いくつか実験的なプロジェクトがGitHubに上げられていたのですが、インストールしてみると、エラー連発と使いものになりませんでした。実はその作業自体も、Claude Codeにやらせていたのですが、「これなら、最初から私が作ったほうが速い」と言い出したんですね。半信半疑だったのですが、では、画像ビューアーのプロトタイプ版を作ってみてと指示したわけです。

ComfyUIの画面。インシデントのレポートを作成させたところ

 そこで、作り上げてきたのが、静止画・動画の表示にも対応し、それぞれのファイルにデータ生成時に書き込まれるメタデータも表示できるようにしたビューアーでした。Claude Codeが選んだ技術構成は「Python + Flask + SQLite + vanilla JS」でしたが、その技術選定も、環境構築も、すべてClaude Codeが実行したもので、もちろん、筆者は一行もコードを書いていません。そもそも、Flaskが何であるのかも筆者にはよくわかっていません。そして、最初のバージョンが出来上がるには30分程度しかかかっておらず、できあがってきたアプリを見て、ただただ感心するだけでした。

現在の「百夜スタジオ」のビューアーモード。画像が生成日別に並び、プロンプトなども一覧できる

 人間というものは、勝手な生き物なので、できあがったものを見ると、ここが足りない、あの機能がほしいと、次々に機能を追加したくなってきます。まず、ローカルLLMの動作環境の「LM Studio」とも連携させ、画像認識に優れている割に比較的軽い「Qwen3 VL 8B」をサーバとして起動しておいて、画像をスキャンして独自のタグ付けをする機能を追加しました。そして、サムネイルの表示、全画面表示、スライドショー機能など、次々に追加していきました。それらも、こういう機能をつけるように、Claude Codeに指示を出していきます。

 もちろん、挙動については、人間が確認しなければならないところも多く、バグが多数発見されるために、それらを改修する作業は、最初に制作するのと同じぐらいの手間がかかります。バグの状況を人間が伝え、問題解決が難しければ、スクリーンショットを取って渡したり、デバッグ用のツールを入れて原因を特定するように指示して、解決を進めていきます。

 しかし、できあがったものには満足しました。これまで様々なビューアーを試してきましたが、それぞれに感じていた不満の多くが解消できたためです。筆者個人のニーズをこのビューアーは満たしてくれているのです。

30分で出てきたビューアーの最初期のバージョン。早速バグっていて、画像の上の方しか表示されていないので修正指示をしていった

前へ 1 2 3 4 5 次へ

カテゴリートップへ

本記事はアフィリエイトプログラムによる収益を得ている場合があります

この連載の記事
ピックアップ