FastLabel、AI機械学習用途に「権利クリア」な「公平性尊重型人物データセット」 約43,000画像の販売を開始
FastLabel
Data-centric AI開発に必要なデータ収集・生成からアノテーション、モデル開発、MLOps構築までの全工程を支援するFastLabel株式会社(本社:東京都渋谷区、代表取締役:鈴木健史、以下「当社」)は、AI開発用途に被写体から利用承諾を得ている権利クリアかつAI倫理を遵守する「公平性尊重型人物データセット」 約43,000画像の販売を開始したことをお知らせします。
■データセット販売開始の背景
当社は、2020年1月の創業以来、教師データ作成代行やアノテーションツールの提供を主力事業として展開。現在ではData-centric AI開発全体を包括的に支援するサービス(業務代行およびコンサルティング)およびシステム(各種ツール)を提供しています。これまで、大手企業を中心とした数百社の支援をする中で、AI開発プロセスにおける「データ収集」に関する課題が多く寄せられてきました。
米OpenAI社の「GPT-4」他、大規模言語モデルが公開されたことを受け、コンテンツを生成することが可能な生成AI(Generative AI)技術が急速に発展しています。併せて、英Stability AI社の「Stable Diffusion」に代表される画像に関する生成AIも登場し、活用の可能性が期待されると同時にAI倫理の観点から、被写体からAI開発への利用承諾を得ていることがAIに使用するデータとしての利用条件となるケースが増えています。
上述を背景として、大手企業を中心に既存のデータセットの権利の透明性を見直す動きが進んでいますが、AI開発に必要となる多量のデータを権利クリアに収集することは容易ではありません。そこで、AI倫理を遵守しながら、AI開発の高速化も実現できる短納期でのデータ提供を可能とするため、今回の権利クリアな公平性尊重型人物データセットの販売に至りました。
■当社が販売するデータセットの特徴
当社が販売するデータセットの特徴は以下の3点です。
- 権利クリアであること当社の販売するデータセットは、データ取得およびAI開発への利用に関する同意書を「すべての被写体」から取得しています。
- データの利用用途に合わせて、データを加工したうえで納品が可能であることこれまで当社が支援してきた実績とAI開発への深い知見を活かし、利用用途に合わせたトリミング処理や印象分類、アノテーション等のオプションも提案可能です。
- 各業界の実際の開発要件に沿って収集しているデータであること販売しているデータセットは、AI開発を行っているお客様のご要望に沿って収集したデータであるため、実際のAI開発に活用しやすい撮影要件となっています。
■公平性尊重型人物データセットの内容
本データセットの特徴は、総務省が定めた「AI開発ガイドライン及びAI利活用ガイドライン」の「尊重するべき価値」にも言及のある「公平性」を尊重した内容となっている点です。
アフリカ系・中東系・欧米系・東南アジア系・南米系のモデルに対して、データ取得およびAI開発への利用に関する同意を得た上うえで、屋内外・個人/集団・装飾品の有無等の様々なパターンで撮影を行ったデータセットとなります。
【データセットの詳細】
キャスト:
・人数:計250名
・性別:男女
・年代:10代~70歳代
・国籍:アフリカ・スリランカ・インド・中東系・欧米系・オーストラリア・中国・東南アジア系・南米系
撮影条件:
・撮影場所:屋内・屋外
・内容:装飾品の有り無し、被写体集団・個人など、さまざまなパターンで撮影された約43000画像
・サイズ:1920px*1080px
・データ形式:jpg
・ファイルサイズ:1画像あたり20~30MB
※当社プラットフォーム上より「データマネジメント機能」を活用したサンプルイメージ
■データセットの購入およびサンプル画像の確認方法
ご購入またはお見積り、サンプル画像の確認や新規撮り下ろしをご希望のお客様は、以下のメールアドレス宛、もしくはフォームよりお問い合わせください。
今回販売を開始するデータセットにご希望の要件のデータがない場合は、ご要件に応じた新規撮り下ろし対応も可能です。
お問い合わせ:pr@fastlabel.ai
お問い合わせフォームURL:https://fastlabel.ai/dataset-lp-press
■当社のデータセット事業について
当社は、データセットの販売のみならず、以下に対応したデータ収集代行サービスを展開しています。
画像(人物撮り下ろし、帳票データ収集 他)
動画(スポーツ動画撮影、走行車両撮影 他)
音声(スクリプト発話、ノイズ収音 他)
テキスト(会話コーパス 他)* LLM開発用途含む
【データ収集代行サービスの取り組み事例】
・ソニーネットワークコミュニケーションズ株式会社:https://fastlabel.ai/casestudy/snc
・AWL株式会社:https://fastlabel.ai/casestudy/awl
■今後の展望
当社は、権利クリアなデータを幅広い業種・業界のAI開発現場へスピーディーに提供するため、さらなるデータセットの拡充を進めていきます。また、システムと業務の両面からAI開発プロセスを効率化し、AI開発に取り組む企業、研究機関のインフラとなることで、日本社会におけるAI革命を下支えしていきたいと考えています。
FastLabel株式会社について
当社は、“AIインフラを創造し、日本を再び「世界レベル」へ”をパーパスに掲げ、2020年1月の創業以来、教師データ作成代行やアノテーションツールの提供を主力事業として展開してきました。
現在では、AI開発に必要な学習データ素材の収集、アノテーション、モデル開発、MLOps構築までの全工程をサポートする事業を展開しています。
AI開発においてお困りごとがあれば、以下のメールアドレス宛、もしくはURL先からお気軽にお問い合わせください。
お問い合わせ:pr@fastlabel.ai
お問い合わせフォームURL:https://fastlabel.ai/contact-pr
社名:FastLabel株式会社
代表者:代表取締役CEO 鈴木健史
事業内容:AI開発を包括的に支援する「AIPaaS」(※)の提供(AIデータプラットフォーム、アノテーションサービス)
設立:2020年1月23日
本社所在地:〒151-0051 東京都渋谷区千駄ヶ谷五丁目27番5号
URL:https://fastlabel.ai/
※)AIPaaS…AI Process as a Service、AI開発プロセスを高速化・高度化させるサービス、プロダクトの総称