このページの本文へ

「IBM watsonx」向けに東京基礎研究所が構築、80億パラメーターでオンプレミス導入も可能

IBM、高い日本語性能を持つLLM「Granite日本語版モデル」提供開始

2024年02月28日 11時50分更新

文● 大河原克行 編集● 大塚/TECH.ASCII.jp

  • この記事をはてなブックマークに追加
  • 本文印刷

 日本IBMは2024年2月27日、AI基盤モデル「Granite日本語版モデル」の提供開始を発表した。

 Graniteは、AI/データプラットフォームである「IBM watsonx」の生成タスク用に設計されたIBM独自の基盤モデル(LLM:大規模言語モデル)で、IBM Researchが開発。今回発表したのは、すでに提供を開始している英語版Graniteモデルと同じ設計思想を持ち、日本語性能を向上した「granite-8b-japanese」と呼ばれる日本語版モデルである。パラメーター数は80億。

IBM Granite日本語版モデル

日本IBMが提供開始した「Granite日本語版モデル(granite-8b-japanese)」の特徴

 同日の記者発表会に出席した日本IBM 技術理事 東京基礎研究所 AI Technologies担当シニアマネージャーの倉田岳人氏は、この日本語版モデルは同社の東京基礎研究所が構築を担当していると紹介し、「日本IBMのテクノロジー事業部門、コンサルティング部門との連携により、日本のお客様の現場で、モデルが効率的に動くように開発、支援している。フィードバックをもとに、提供開始後もさらなる改善を行っていく」と述べた。

 また、日本IBM 理事 テクノロジー事業本部 watsonx事業部長の竹田千恵氏は、「日本語に特化した基盤モデルを持っていることが日本IBMの強みになる。granite-8b-japaneseに対する期待が高く、現在、お客様のもとで進行しているプロジェクトにも貢献ができる。日本における生成AIのビジネスを右肩上がりで伸ばしていく」と語った。

IBM Granite日本語版モデル

日本IBM 理事 テクノロジー事業本部 watsonx事業部長の竹田千恵氏、同社 テクノロジー事業本部 Data and AI エバンジェリストの田中孝氏、同社 技術理事 東京基礎研究所 AI Technologies担当シニアマネージャーの倉田岳人氏

1兆6000億トークンのデータセットを学習、日本語独自の処理も付加

 IBMでは2023年9月から、IBMが独自に開発するLLMとしてGranite英語版の提供を開始している。「granite-13b-instruct」と「granite-13b-chat」の2種類を用意しており、これまでに2度の改良および更新が行われている。

 Graniteは、IBMが「ビジネス用途向け」にキュレーションしている点が特徴で、インターネット/学術/コード/法務/財務の5領域から取得した、ビジネスに関連するデータセットで学習を行っている。また、好ましくないコンテンツを除去するための綿密な検査や、社内外のモデルと比較したベンチマーク評価も行っており、watsonx.dataやwatsonx.governanceとの連携によって、リスクを軽減し責任ある形でモデル出力ができるように設計されている。技術仕様や学習に用いたデータソースも公開し、透明性を高めることで、ビジネスへの適用をより安心して進められるようにしている。

IBM Granite日本語版モデル

IBM「Granite(英語版)」の概要

 今回提供を開始したGranite日本語版モデルでは、日本語(5000億トークン)、英語(1兆トークン)、コード(1000億トークン)の合計1兆6000億トークンに及ぶ高品質データセットを学習するとともに、「日本語トークナイザー」と呼ぶ日本語に特化した言語処理を導入したことで、長い日本語の文章を効率的に処理し、より高速な推論を実現。エンタープライズグレードの日本語能力を持つという。80億パラメーターという比較的軽量なLLMであり、高い精度を実現しながらインフラ要件が低い点も特徴だ。

 日本IBMによると、Llama-2を日本語化した同規模モデル(ELYZA)とのベンチマークにおいて同等以上の性能を確認しており、「リアルなユースケースでも自然な日本語が出力でき、高速に動作する。またチューニングによって、さまざまなユースケースで利用できる」という。クラウドだけでなく、オンプレミス環境での利用も可能だ。

 英語版Graniteと同様に、日本語版でも技術仕様や学習データを公開している。日本語版Graniteにおいては、13.9TBのデータを収集したうえで、重複や文書品質に基づく除去、法令遵守などの基準に基づくフィルタリングを行い、1.3TBの高品質なデータを抽出したうえで学習を実行していると説明した。

IBM Granite日本語版モデル

今回提供を開始した「Granite日本語版モデル」の概要

IBM Granite日本語版モデル

「日本語トークナイザー」の概要。より長い文脈を、より高速に処理することができる

3つのレイヤーのAIソフトウェア製品を通じて、生成AIの価値を提供

 発表会では、日本IBMのAI戦略も紹介された。

 IBMは昨年(2023年)、「AIファースト」の方針を打ち出し、エンタープライズ利用を前提とした生成AIの開発、提供に力を入れている。日本IBM テクノロジー事業本部 Data and AI エバンジェリストの田中孝氏は、昨年多くの企業が生成AI活用に向けた試行を始めたことをふまえて、「IBMは基盤モデルの本番活用を見据えたアプローチを開始し、2024年はそこに一歩踏み出していく」と語る。

 「そのためには、パフォーマンス向上、コスト削減、多言語対応とともに、知的財産権に関するお客様保護が重要になる。それに向けた新機能の提供や、料金体系の見直し、新たなモデルの提供によって、お客様の本番活用をしっかりと支援していく」(田中氏)

 IBMでは、AIとデータのプラットフォーム/AIアシスタント/ドメインアプリケーションという3レイヤーのソフトウェア製品を通じて、顧客企業に生成AIの価値を提供していく戦略を打ち出している。

 ひとつめの「watsonxプラットフォーム」は、AI活用や構築のための企業向けスタジオである「watsonx.ai」、自社固有のデータを一元管理および活用するための「watsonx.data」、データとAIのガバナンスツールキットである「watsonx.governance」の3製品で構成される。

 2つめの「AIアシスタント」は、データとAIを活用する基盤を提供し、業務自動化を実現する「watsonx Orchestrate」、カスタマケアを対象にした「watsonx Assistant」、コード生成を支援する「watsonx Code Assistant」で構成する。

 3つめの「ドメインアプリケーション」は、業界を問わず利用されるユースケースに特化したAIアプリケーション群を提供している。具体的にはオートメーション、セキュリティ、モダナイゼーション、サステナビリティといった分野のソフトウェア製品群を、生成AIを組み込んだかたちで提供する。

IBM Granite日本語版モデル

IBMでは、AI開発/活用のためのプラットフォーム、AIアシスタント、ドメインアプリケーションの3レイヤーで、生成AIの価値を提供する戦略をとっている

IBM Granite日本語版モデル

watsonxプラットフォームについても紹介した

 こうした製品群に加えて、専門知識を有するコンサルティングチームやエコシステムパートナーとともに提案する体制を敷くのも特徴だ。竹田氏は、顧客のビジネスニーズに対応した生成AIソリューションを共同で策定し、迅速に実証する組織として「IBM watsonx Pilot Team」があることを紹介した。

 「IBM watsonx Pilot Teamは、50カ国以上で600人以上のAIエンジニア、100人以上のインダストリーエキスパート、デザイナーなどが参加し、専門知識を無償で提供する。共創プログラムでは、アセスメント、ブリーフィング、ワークショップ、watsonx PoVを通じて、お客様に寄り添い、watsonxの価値を提供していく」(竹田氏)

IBM Granite日本語版モデル

顧客のビジネスニーズに即した生成AIソリューションを共創するプログラムも提供している

 なお、watsonxプラットフォームでは特に、「watsonx.ai」の説明に時間を割いた。watsonx.aiは、AI開発者がモデルのトレーニング/検証/チューニング/導入を行う“開発スタジオ”であり、現在ではSaaS(2024年1月に東京リージョンでの提供を開始)、オンプレミスソフトウェアの両方で使える。田中氏は、watsonx.aiのコンポーネントのひとつである「基盤モデルライブラリー」において、今回発表したGranite日本語版モデルも利用できるようになると説明した。

生成AI活用ソリューションの事例も紹介

 発表会ではまた、IBMの生成AIを活用したソリューション事例も紹介した。

 watsonx.aiを活用した保健業界向けの「デジタル従業員」では、watsonx Orchestrateにより複数の業務連携ツールを自動化。これを他業種においても展開し、業務の自動化、業務連携、業務効率化に生成AIを活用しているという。

 また、ナレッジ活用においては、製造領域において、当日の作業情報から類似する防災事例や“ヒヤリハット”を計測して、内容を周知する「労働災害アドバイザー」を提供している。たとえば「ポンプの清掃」と入力すれば、薬傷が多いことや特定の配管に激突することが多いがわかり、リスクを抽出して、危険予知レベルを向上するほか、設備改善にもつなげることができる。

 ソフトウェア開発においては、システム構築のモダナイゼーションに生成AIを活用して30%の生産性向上を実現したり、watsonx Code Assistantを活用して、コードから仕様書を作成、あるいは仕様書からコードを作成したりすることで、同様に30%の生産性向上を実現できるという。

IBM Granite日本語版モデル
IBM Granite日本語版モデル

IBMの生成AI活用ソリューション事例も紹介

 市場調査によると、今後3年間で生成AIがもたらす経済効果は500兆円規模に達するといわれているほか、ナレッジワーカーの生産性を80%改善すること、ビジネスプロセスにAIを組み込む企業が80%に達し、ソフトウェアベンダーの70%が、エンタープライズアプリケシーョンにAIを組み込むと予測されていることについても触れた。

カテゴリートップへ