行動認識AIのアジラ、独自の行動認識技術×VLM融合でAI警備の精度革新へ

アジラ
2026年03月12日

アジラ
～汎用VLMにはない現場知見を武器に、プロダクト実装に～

行動認識AIを独自で研究開発する株式会社アジラ（本社：東京都町田市、代表取締役 CEO尾上剛、以下「アジラ」）は、独自のVision-Language Model（以下、VLM）技術をプロダクトへ実装する取り組みに着手しました。

アジラは、姿勢推定・行動認識の独自モデルおよび学習データと、現場運用で蓄積してきた誤検知・失報パターンの知見をVLMに統合することで、汎用的な視覚言語モデルでは到達できない、実運用に耐える検知精度の実現を目指します。
本取り組みの第一段階として、AI警備システム「AI Security asilla」における誤報・失報の抑制に取り組み、将来的にはリアル空間の出来事を構造的に理解するAI基盤の構築を見据えます。
背景～現場が求める“使えるAI”と、汎用VLMの限界

商業施設や駅、公共空間など不特定多数が出入りする場所では、人の流れや行動が常に変化し、予測しきれない事象が発生します。事故やトラブルを未然に防ぐ体制と、過度な人員増加に頼らない効率的な運営の両立が求められる中、映像AIへの期待は年々高まっています。

近年、汎用的なVLM（視覚言語モデル）の登場により、映像と言語を統合的に理解するAI技術が急速に進展しています。しかし、汎用VLMは幅広いタスクに対応できる一方で、セキュリティ現場のような高い精度と即応性が求められる領域においては、いくつかの課題が存在します。

第一に、人の行動パターンや危険の兆候に関する専門的な理解が浅く、セキュリティ文脈での判断精度が限定的であること。
第二に、カメラ設置環境や照明条件、運用ルールなど施設固有の状況に最適化されていないこと。
第三に、実運用レベルの精度に到達するには、何が誤検知で何が見逃しかを知るフィードバックデータが不可欠であるにもかかわらず、従来のAIにはその蓄積がないことです。

アジラは、こうした従来のAIの限界を補完する独自のアプローチとして、自社の技術資産をVLMに統合するプロダクト実装に着手しました。
アジラの技術的優位性　～行動認識AIが培った2つの資産～

アジラが構築する独自VLMの差別化の核心は、従来のAIには存在しない2つの技術資産にあります。
１. 行動認識の独自モデルと学習データ
アジラは創業以来、人の姿勢推定技術と行動認識AIの研究開発に特化してきました。転倒、侵入、不審行動、徘徊、混雑など多様な行動パターンを高精度で分類する独自モデルと、その開発過程で構築された大規模な学習データセットは、汎用VLMが持たないドメイン特化の知識基盤です。

VLMが映像を「意味」として理解する際、この行動認識の知識基盤が姿勢レベルの動作情報を補完することで、一般的な視覚情報の解析だけでは判別困難な行動の意図や危険度を、より高い精度で推定することが可能になります。
２. 現場運用で蓄積した誤検知・失報パターンの知見
「AI Security asilla」は、商業施設、鉄道駅、オフィスビルなど多様な施設で運用されており、その過程で膨大な量のフィードバックデータが蓄積されています。どのような状況で誤報（False Positive）が発生し、どのような事象が失報（False Negative）となるのか──この実運用データは、AIの精度改善において最も価値のある資産です。

汎用VLMは一般的な映像理解は可能ですが、「セキュリティ現場において何を誤りやすいか」という知見を持ちません。アジラは、この誤検知・失報パターンの知見をVLMの学習・推論プロセスに組み込むことで、“現場で本当に使えるAI”の精度水準を実現します。

VLM統合がもたらす進化　～「検知」から「状況理解」へ～

VLM（Vision-Language Model）は、映像と自然言語を統合的に理解できるAIモデルです。
従来のAIが、物体の検出、姿勢の判定、閾値ベースの異常判定に基づいていたのに対し、アジラの独自技術資産と融合したVLMは、「転倒しかけている可能性がある」「通常とは異なる滞留挙動」「危険意図を含む可能性のある行動」「混雑が発生しつつある状況」といった、文脈を含めた意味理解が可能になります。

アジラはこれまで培ってきた行動認識技術とVLMを融合させることで、「動きを検出するAI」から「状況を理解するAI」への進化を図ります。
短期的展開：誤報・失報の抑制による運用高度化
本取り組みの第一段階として、アジラは既存プロダクトであるAI警備システム「AI Security asilla」において、誤報（False Positive）および失報（False Negative）の抑制に取り組みます。

現場運用においては、検知アラートの数と同様に、その質も求められます。誤報が多発すると不要な確認業務が増え、本来対応すべき重要な事象への判断が遅れる可能性があります。一方で、失報は検知すべき事象を見逃すことにつながり、安全確保の観点から重大なリスクとなります。
独自VLMを組み合わせることで、検知結果を文脈レベルで補完・再評価し、「何が起きたか」だけでなく「何が起きつつあるのか」までを踏まえた判断を可能にします。

これにより、不要なアラートを抑制しながら見逃しを低減し、通知の信頼性を高めます。結果として、現場の確認業務の効率化と、安全対応の確実性向上を同時に実現することを目指します。
中長期ビジョン：リアル空間を“理解する”AI基盤へ
アジラが見据えるのは、誤報・失報の抑制にとどまりません。
VLMを基盤とすることで、映像を単なる事象の記録としてではなく、「状況」や「行動の意味」を捉えるデータへと進化させます。

将来的には、危険予兆の高度な抽出、行動や出来事の自動要約、自然言語による映像検索、施設全体の出来事の構造的な把握といった、より高度な映像活用の実現を目指します。

これにより、事故やトラブルの発生後に対応する“事後型の運用”から、兆しを捉えて未然に備える“予防型の運用”への転換を支援します。アジラは、リアル空間の出来事を理解し、社会インフラの安全性と持続可能性を支えるAI基盤の構築に取り組んでまいります。
「AI Security asilla」について
既存の防犯カメラ映像をAIが24時間365日解析し、暴力、転倒、侵入などの異常行動や、徘徊、混雑、体調不良などの注意行動を瞬時に検知するシステムです。
警備人材不足が深刻化する中、人によるモニタリングでは見逃しやすい異変を捉え、警備員や管理者に即座に通知。既設カメラをそのまま活用できるため設備投資が不要で、限られた人員でも高い安全性を維持できる次世代セキュリティソリューションです。

株式会社アジラ
代表者：代表取締役CEO 尾上剛
所在地：東京都町田市中町一丁目4-2
事業内容：行動認識AIをベースとした各種プロダクト・ソリューションの開発・提供
公式webサイト：https://jp.asilla.com/
本プレスリリースに関するお問い合わせ
株式会社アジラ　広報担当　中村
Email：pr@asilla.jp