国内初。キーワードから約6秒で文章生成ができる 日本語の文章執筆AI ”ELYZA Pencil”を一般公開
株式会社ELYZA
~大規模言語AIによるホワイトカラーのDX推進を目指す~
東京大学松尾研発・AIスタートアップ、株式会社ELYZA(イライザ、本社:東京都文京区、代表取 締役 曽根岡 侑也)は、キーワードから約6秒で日本語の文章を生成できる大規模言語AIの開発に成功しました。また本日より、当モデルを用いた文章執筆AI”ELYZA Pencil”(イライザ ペンシル)をデモサイトとして一般公開いたします。
▮当ニュースのサマリー
● 2021年8月に公開し、5日間で13万人利用の反響を得たELYZA DIGESTに次ぐ大規模言語AIの第2弾
● キーワードを入力するだけで、約6秒でAIが日本語のタイトル・文章を自動生成
● 一般公開デモではニュース記事、ビジネス用のメール、職務経歴書を生成可能
● 日本語においてキーワードから文章生成できる大規模言語AIの一般公開は国内初
● 社内検証で、東大生に比べ執筆時間は56分の1。流暢性は同水準という結果に
● 全国民のホワイトカラー業務の10%以上をAIを用いて代替できる可能性あり
※AIが実際に文章生成した結果サンプルも掲載しております。
▮概要
文章執筆AI”ELYZA Pencil”とは何か。
2021年8月に公開し、5日間で13万人利用の反響を得たELYZA DIGESTに次ぐ第2弾の大規模言語AIの公開となります。
”ELYZA Pencil”は、キーワードを数個入力するだけで、約6秒で日本語のタイトルや文章を自動生成する文章執筆AIです。ELYZA独自の大規模言語AIを用いることで高精度な生成型の文章執筆を可能にいたしました。今回の一般公開デモではニュース記事、ビジネス用のメール、職務経歴書の生成機能を提供いたします。
今後、ELYZAはホワイトカラーが持つ「書く」業務を生成型の文章執筆AIでサポートしていきたいと考えております。 「書く」「まとめる」「読む」「答える」などの多様なホワイトカラー業務を大規模言語AIでサポートすることにより、全国民のホワイトカラー業務10%以上をAIへ代替できる可能性があるのではないかと想定しております。
"ELYZA Pencil"の公開は、キーワードから文章生成できる日本語の大規模言語AIとして、国内初の一般公開となります。
"ELYZA Pencil"は、下記URLより登録不要でご利用いただけます。
https://www.pencil.elyza.ai/
AIによる文章執筆の例は以下になります。
▮社内検証で東大生に比べ執筆時間は56分の1。流暢性は同水準という結果
ELYZA Pencilによる文章生成の速度や精度評価を行うために、以下の観点でAIと人間(東大生)の執筆について比較検証を行いました。
検証概要
・選定したキーワードを用いて「東大生3名」と「ELYZA Pencil」で文章を生成
・ニュース記事・職務経歴書・メールの執筆の平均スコアを比較
・「速度」「流暢性」「正確性」「キーワード含有率」の観点で評価
評価結果
●「速度」の比較
ELYZA Pencilの執筆平均速度は「6.4秒(※)」で、東大生の作業時間の56分の1
※ニュース記事、メール文、職務経歴書を10回ずつ作成した際の平均所要時間
●「流暢性」の比較
ELYZA Pencilは東大生とほぼ同じ水準で執筆できることがわかった
●「正確性」の比較
正確性を示す事実と異なる記載をした率では、東大生が「20%」、ELYZA Pencilが「27%」となった
●「キーワード含有率」の比較
東大生が「100%」、ELYZA Pencilが「94%」であった
表.東大生と ELYZA Pencilの「速度」「流暢性」「正確性」「キーワード含有率」の比較
ELYZA Pencilは「正確性」「キーワード含有率」については東大生に負けるものの、「速度」は56分の1と圧倒的なスピード差をつけ、「流暢性」では同等水準の結果となった。
▮どのような「未踏」への挑戦なのか
文章作成・メール作成・記事作成など高度に言葉を扱うホワイトカラーとAIのさらなる共存
この度公開した”ELYZA Pencil”で用いられている文章執筆AIを改善していくことで、言葉を扱うホワイトカラーの方々の生産性を向上させていきたいと考えております。
具体的には、デスクワークにおける文章作成、顧客対応におけるメール作成、メディア運営における記事作成など、あらゆるホワイトカラー業務で発生する「書く」業務について、多数のユースケースでの活用を想定しております。
実用化まで一歩届いていなかった言葉を扱うAI、近年のブレイクスルーにより実用化へ
音声認識や画像認識分野における技術の発展により、対話の音声データや紙のスキャン画像から「テキストデータに変換できる」段階までAI活用が進んでいます。一方、そのテキストデータを「言葉として理解し活用するための技術」(NLP)が「人間に遠く及ばない」精度にとどまっていたため、ホワイトカラー業務を代替/サポートする上では不十分なことが多く実用化が一部の領域に限定されていました。
そのような中、2018年秋にブレイクスルーが起き、Googleより大規模言語AI「BERT」が発表され、2019年にはNLP分野で「人間を超える」精度を達成されました。そのため、英語ではNLPの最先端技術を実用化したサービスや事例が誕生しています。
一方、日本語では言語特性に依存する技術的な難易度の高さや公開されているデータ量の問題から、NLPの最先端技術の実用化が遅れていました。ELYZAは、この状況に問題意識を持ち、2020年にBERT以降の大規模言語AIと弊社独自の大規模データセットを活用した日本語特化AIエンジン「ELYZA Brain」を開発しました。その後、ELYZA Brainの改良を行いつつ、日常・ビジネスの場でよく発生する「文章生成」という問題設定に特化し、この度、皆さまに文章執筆 AI”ELYZA Pencil”をお披露目するに至りました。
”ELYZA Pencil”は、大規模言語AIを用いて高精度な生成型の文章執筆AIを作る試みとなります。結果として、キーワードを入れるだけで約6秒で精度の高い文章を生成することが可能になりました。
AIを用いた文章の生成には大きくテンプレート型と生成型の2つが存在しますが、”ELYZA Pencil”では、難易度の高い生成型を採用することで、多様な種類の文章を臨機応変に執筆することができるようになりました。
▮技術の詳細
”ELYZA Pencil”はAIが一から文章を作成する「生成型」
イライザは日本語特化の大規模言語AIを独自に開発しており、”ELYZA Pencil”では「生成型」と呼ばれる成功例が国内ではまだ少ない技術を用いております。さらに生成型の中でも、意図した文章を生成する方向に制御する技術として「キーワードを元にAIが一から文章を生成する形式」を取っています。
AIによる文章生成はテンプレート型、生成型の大きく2種類のモデルがあります。それぞれの特徴は下記画像をご参照ください。
”ELYZA Pencil”では、テンプレート型と比べて技術的難易度の高い生成型を採用しています。多様な文章を生成可能な大規模言語AIを元に構築をしており、状況に応じて臨機応変に文章を生成することを可能にしています。
また、特定の業務に特化させることが可能で、生成文の多様性と制御可能性の両方の観点から実用に足るAIとなっています。さらに”ELYZA Pencil”ではキーワードを指定することにより、執筆したい内容のコントロールを行いやすくしているのも特徴です。
なぜ高精度の生成型文章生成モデルを作れたのか。
今回の取り組みでは、ELYZA独自の日本語の大規模言語AIを活用することで、高精度な文章執筆AIを開発しました。当AIモデルの構築には、最先端の自然言語処理技術の知見に加え、大量の日本語テキストを集め学習させることが必要ですが、この要件を満たす企業は国内に多くありません。
東京大学・松尾研究室に出自を持ち、最先端技術の社会実装を目指す弊社では、BERTが登場した2018年以降大規模言語AIの研究開発を進めており、2020年にはBERT以後の大規模言語AIと弊社独自の大規模データセットを活用した日本語特化AIエンジン「ELYZA Brain」を開発しました。その後も、「ELYZA Brain」の改良だけでなく、タスクに特化した改善を継続的に実施しており、その活動の成果の1つとして今回の”ELYZA Pencil”の公開に至りました。
▮背景
なぜ当AIモデルを社会へ公開するのか。
3年前まではAIによる自然な文の生成は難しい状況にありました。その後、大規模言語AI「BERT」が2018年10月に登場し状況が変わり、英語では大規模言語AIをベースに人間並みの文の生成をはじめとした、読解・要約・翻訳などができるモデルが登場しつつあります。
上記のように大規模言語AIでは大きく技術が進んでおり、最新技術を扱える技術力・ノウハウと大量のテキストデータを掛け合わせることで、主にホワイトカラー領域における大幅な業務効率化ができる可能性があります。
しかし、他のAI技術と同様に、海外と比較して日本では大規模言語AIの理解が遅れており、結果として実用化も遅れています。今回の文章執筆AIはあくまでも大規模言語AIで起きている大きな変化の一部ですが、そのパラダイムシフトをより多くの方に体験・理解してもらうことで、日本における大規模言語AIを活用したホワイトカラー業務のDXを少しでも前に進めることができればという思いで公開させていただきました。
▮展望
今回、ELYZAはキーワードを数個入力するだけで約6秒で日本語のタイトル・文章を自動生成する「書く」AIを一般公開いたしました。大規模言語AIが可能とするのは「書く」ことだけでなく「文章をまとめる」「文章を読んで整理する」「質問に答える」など様々です。当社では、全国民のホワイトカラー業務の10%以上をAIへ代替できる可能性があると想定しており、今後、ホワイトカラーが行っている「書く」業務をはじめ、「まとめる」「読む」「答える」といった業務をAIでサポートできる世の中にしていきたいと考えています。
また、テキストを大量に保有してる企業との共同研究も積極的に行い、大規模言語AIの社会実装も加速させて参ります。
▮株式会社ELYZAとは
株式会社ELYZAは、「未踏の領域で、あたりまえを創る」という理念のもと、日本語の大規模言語AIに焦点を当てて企業との共同研究やSaaSプロダクトの開発を行なっております。「まとめる、書く、読む、答える」といったこれまで難しいとされていた自然言語処理を実用化し、ホワイトカラー業務のDXを推進して参ります。
<株式会社ELYZAに関するニュース>
ELYZA、日本語における高精度の生成型要約モデルを開発。“ELYZA DIGEST”として一般公開へ
https://prtimes.jp/main/html/rd/p/000000011.000047565.html
SOMPOホールディングスとAIスタートアップのELYZA、コールセンター領域におけるDXパートナーとして提携。損保ジャパンのカスタマーセンターで実証実験を実施
https://prtimes.jp/main/html/rd/p/000000009.000047565.html
東京大学大学院教授 松尾豊氏、株式会社ELYZAの技術顧問に就任
https://prtimes.jp/main/html/rd/p/000000006.000047565.html
株式会社ELYZA、人間を超える国内最大の日本語AIエンジン「ELYZA Brain」を開発
https://prtimes.jp/main/html/rd/p/000000007.000047565.html
<会社概要>
社名 :株式会社ELYZA
所在地 :〒113-0033 東京都文京区本郷3-15-9 SWTビル 6F 代表者 :代表取締役 曽根岡侑也
設立 :2018年9月
URL :https://elyza.ai/