高専発ベンチャー企業 TAKAO AI、OpenAI社/ChatGPTの技術を用いた「ドキュメントの視覚障害者対応」エンジンの試用サイトを公開
TAKAO AI 株式会社
情報アクセシビリティ向上のための最先端のAI実装の先駆けに
最先端のAI技術を活用したサービスによる情報アクセシビリティ改善に取り組む高専発ベンチャー、TAKAO AI株式会社(東京都八王子市、代表取締役社長:板橋竜太、以下TAKAO AI)は、画像/文書データを自動視覚障害者対応のデータに変換できるエンジン「Tendoc」に、米OpenAI社の「ChatGPT」にも用いられるLLM(大規模言語モデル)「gpt-3.5-turbo」を導入した最新バージョンを開発し、視覚障害者向けの試用サイトを3月15日 (水)に公開しました。
試用版サイトURL:https://v2.demo.takao.ai/
■文書視覚障害者対応エンジン「Tendoc」とは
TAKAO AI のエンジンは、入力された画像/文書データ、またWebページを独自開発のシステムによって解析し、全自動で点字や、音声読み上げに対応したテキスト等に変換できるエンジンです。ディープラーニング等の技術を用いることで画像からの情報の認識精度の向上、処理時間の高速化、さらにレイアウト情報から要約文章の生成や一部の代表的な情報を重点的に抽出・変換するなど、視覚に訴える情報のコンテキストを反映したまま、視覚障害者の方が読みやすいデータを生成できます。
これにより、日常身近に受け取る
学校や自治体からの手紙
地域イベントのお知らせ
スーパー・小売店舗のチラシ
レストランのメニュー
スーパーで手に取った商品のラベル
公共料金の請求書 / 明細 など
のような印刷物に加え、複雑にレイアウトされたWebページなどにも、晴眼者が介すことなく視覚障害者の方のみでタイムリーにアクセスできるようになります。
■「Tendoc」試用サイト 最新バージョンのポイント
ChatGPT API導入による点訳結果の読みやすさの飛躍的向上
以前公開した旧バージョンの試用サイト( https://demo.takao.ai )では、TAKAO AI独自開発の文書解析エンジンを用いて画像/文書を一次元のテキストに変換し、それを点字に変換・表示するものでした。今回公開した試用サイトでは、最近公開され話題となっている米OpenAI社のLLM(大規模言語モデル) 「gpt-3.5-turbo」の技術を追加で導入し、弊社の解析エンジンと組み合わせることで、
ドキュメントの中に散らばった情報をトピックごとに整理し、文書を構造化
音声読み上げ・点字読み上げを意識し、より読みやすくなったテキストの生成
を実現しました。
視覚障害を持つ利用者の声に応え、スクリーンリーダー(※1)に完全対応
以前のバージョンは、晴眼者に対する弊社技術のデモンストレーションのために開発したものだったため、視覚障害者にとってユーザビリティの低い設計が含まれていました。しかし公開後、「生活の中で利用している」「便利だ」という視覚障害を持つ利用者からのお声を受け、この試用サイトにもスクリーンリーダーに完全対応したUI設計を採用し、構成し直しました。
(※1)スクリーンリーダーとは、弱視などを含む視覚障害者がPC・スマートフォン等のデバイスで使用する、画面上に表示されたテキストを読み上げ、またスマートフォンであればスワイプ操作、PCであればキーボード操作のみなど、視覚に依存しない操作によってデバイスを制御できる機能を持ったソフトウェアの総称。
■「Tendoc」開発の背景 ― 従来の点字翻訳・視覚障害者対応の課題
従来、文書の点字翻訳は点字技能を有する晴眼者(目の見える人)が1文字ずつ点字に置き換える作業が基本であり、点字に対する深い知識を持つ限られた専門家が長い時間をかけて行う必要があります。そのため、世の中の文書の大半は点訳されておらず、視覚障害者は日常身近で手にするあらゆる墨字(非点字)情報をリアルタイムに取得することは困難です。また、文書の中に含まれる図表などの二次元にレイアウトされた情報を点字で伝えることも非常に困難です。
また、Webサイトの情報に視覚障害者がアクセスするためには、アクセシビリティに配慮した設計が必要不可欠です。昨年デジタル庁の公開した「ウェブアクセシビリティ導入ガイドブック (https://www.digital.go.jp/resources/introduction-to-web-accessibility-guidebook/) 」の内容などに代表される通り、画像に埋め込まれてしまっていてスクリーンリーダーで読み上げることが出来ないテキストの存在や、上から読み上げていくと意味の通じないボタンなど、視覚障害者にとって理解しづらい情報は非常に多く、これを避けた設計をすることが求められつつも、Webサイトの開発において大きな負担となっています。
■今後について
今回開発した技術により、視覚障害者の日常生活における情報アクセシビリティが大きく向上することが期待されます。しかしながら、まだ実験的な技術であるため、文書コンテンツの形式や写真の撮影方法によっては、不完全な結果が出力される可能性があります。目覚ましい速度で進化するAI技術によって積極的に技術面のアップデートを行い、より可用性の高いシステムの開発を進めてまいります。特に、日本時間本日早朝に発表された同OpenAI社の新しい大規模言語モデル「GPT-4」についても強く注目しており、公開され次第いち早く実装に取り組んでいきたいと考えております。
また、現代社会において、あらゆる企業・団体が視覚障害者の情報アクセシビリティに対応していくことが求められています。一方で、先述の視覚障害者対応の課題によって、それが難しいケースも多くあります。そこで、この技術を応用し、情報の発信者である立場からも、低コストで視覚障害者対応のできるサービスを開発中です。こちらも力強く推進してまいります。
■TAKAO AI株式会社について
当社は、高専DCONや高専プログラミングコンテストで実績を持つ東京高等専門学校の学生メンバーで2021年に創業されたAIスタートアップです。私たちは「技術で人々の情報格差をなくす」ことをミッションに掲げ、視覚障害者向け情報変換エンジン「Tendoc」を基盤としたサービス開発と、その実用化に取り組んでいます。
<会社概要>
会社名 TAKAO AI 株式会社
代表者 代表取締役 板橋 竜太
所在地 東京都八王子市椚田町 1220-2 東京高専コラボレーションコモンズ 2 階
設立日 2021 年 2 月 25 日
■本件に関するお問い合わせ先
TAKAO AI 株式会社 代表
メールアドレス:info@takao.ai
その他、以下の会社ホームページの問い合わせフォームからもお問い合わせください。
TAKAO AI ホームページ : https://takao.ai/