このページの本文へ

機械学習の総本山トロント発のベンチャーが生成AIでのデータ流通を促進

AIとプライバシーを両立させるPrivate AI 機械学習でデータの匿名化を自動化

2024年02月02日 09時00分更新

文● 大谷イビサ 編集●ASCII

  • この記事をはてなブックマークに追加
  • 本文印刷

 機械学習による個人情報の匿名化を実現するカナダのPrivate AIが国内展開を進めている。昨年12月に発表されたのはマクニカとのパートナーシップ。昨年から日本でのビジネスの立ち上げを進めている後藤元気氏にサービスの概要について話を聞いた。

Private AI Japan Country Manager 後藤元気氏

生成AIの学習データを前提に個人情報を匿名化

 Private AIは、機械学習を用いてテキストデータから個人情報を抽出し、匿名化を実現する。匿名化に関しては、手動でのマスキングや正規表現には手間がかかるが、非構造データだと自動処理が難しいという課題があった。Private AIではこうした課題をAIで解決する。大量のデータを用いたトレーニングした独自の機械学習モデルを用いることで、高い精度でテキストから個人情報を検出する。

 Private AIの特徴の1つは、対応言語や対象となる個人情報の「エンティティ」の広さ。現在、対応言語は52に上り、対応するエンティティは氏名、年齢、住所、生年月日などのいわゆる個人情報(PII:Personally Identifiable Information)、血液型や病状、薬名、薬の容量などの個人保健情報(PHI:Protected Health Information)、銀行口座情報、クレジットカード番号、クレジットカードの期限日、CVVなどのクレジット情報(PCI:Payment Card Industry)など50以上に上る。もちろんGDPR、CPRA、HIPAAに完全対応。「日本特有のマイナンバーや日本語での住所表現にも対応します」(後藤氏)とのことだ。

Privete AIによる匿名化

 コンテナ経由での展開になるため、デプロイ先はオンプレミスでも、プライベートクラウドでも、パブリッククラウドでもOK、API経由で各種ドキュメントやテキストをアップロードすれば、個人情報が匿名化されたデータとして利用できる。匿名化されたデータを再識別することも可能で、社内の個人情報管理で利用するだけではなく、外部とのデータ共有も安全に行なえる。

名門トロント大学のAIスタートアップ 国内でのニーズに応える

 Private AIは2019年にカナダのトロントで設立されている。トロントという地名でピンと来る人も多いと思うが、トロント大学はディープラーニングの総本山とも呼べる名高い学校で、Google、Apple、Facebook、OpenAIなどのAI研究者はここから輩出されている。Private AIも、こうしたトロント発のAIスタートアップの1つだ。

 匿名化やマスキングに関しては、競合もいくつかあるが、Private AIは精度の高さが売り。「競合に比べてベンチマークの結果も優れています。マクニカから評価を受けたのもやはり精度の高さです」と後藤氏は語る。

他社製品と比べた適合率、再現率、調和平均(F値)の比較

 利用用途は、個人情報漏えいに配慮したマスキング対応のみならず、大規模言語モデルの情報入力やファインチューニングにおけるプライバシーに配慮したデータ利用だ。「今後、企業が自社データを用いて、生成AIや大規模言語モデルを活用する際には、データセットをいかに安全に、公平にできるか大きなテーマ。GDPRがある欧州やAIの利用が進む北米は、AIでのデータ活用の意識が高い」と後藤氏は語る。

 日本には昨年の9月に進出したばかり。AIとプライバシーを両立させるPrivate AIのニーズは、すでに国内でも高まっており、マクニカとともにビジネスの拡大を進めたいという。「生成AIはもっと日本でも拡がっていい。弊社の製品でデータ流通とAI活用がもっと促進できれば考えています」(後藤氏)。

■関連サイト

カテゴリートップへ

本記事はアフィリエイトプログラムによる収益を得ている場合があります

アクセスランキング

  1. 1位

    TECH

    訓練だとわかっていても「緊張で脇汗をかいた」 LINEヤフー、初のランサムウェア訓練からの学び

  2. 2位

    ITトピック

    若手が言わない“本音の退職理由”上位は/「データ停止は景気後退よりも企業の脅威」6割/クライアントに告げずAI活用するフリーランス、ほか

  3. 3位

    ビジネス・開発

    最悪のシナリオは「フィジカルAI」による基幹産業の衰退 日本の勝ち筋は、“同期技術”と“ドメイン知識”

  4. 4位

    Team Leaders

    ファイル名が命名規則に合っているかの自動チェック、Power Automateのフローで実現しよう

  5. 5位

    TECH

    糖尿病超早期を採血なしで検出、予防へ! 代謝や臓器のつながりに着目した予防法開発

  6. 6位

    データセンター

    液冷技術の最先端が集うイノベーションラボ「DRIL」、印西のデータセンターに現わる

  7. 7位

    ビジネス

    廃校がAIの心臓部に!? 地方の遊休施設を「AIデータセンター」に生まれ変わらせるハイレゾの挑戦がアツいぞ

  8. 8位

    TECH

    “GPUなし”ノートPCで動くLLMで、ローカルAIエージェントを自作する

  9. 9位

    Team Leaders

    バックオフィス業務もAIに“丸投げ” マネーフォワードが「Cowork」機能を2026年7月に投入へ

  10. 10位

    TECH

    合成ゴムが及ばない天然ゴムの高性能のメカニズムを、現象発見から100年後に解明

集計期間:
2026年04月09日~2026年04月15日
  • 角川アスキー総合研究所