このページの本文へ

星新一がコンピュータで甦る? 人工知能は芸術を創れるのか?

2012年10月23日 12時00分更新

文● 美和正臣 撮影●小林伸

  • この記事をはてなブックマークに追加
  • 本文印刷

スーパーコンピュータでブン回す
そんな無粋なことはしたくない

――そもそも何で星新一さんを選んだわけですか?

 星さんの小説を選んだのはオチがあるからです。オチがないショートショートも世の中にはあるんですが、それはコンピュータも作ろうと言えば作れます。でも、ちょっと難解すぎるので評価ができない。星さんは1000くらい作品があるので、オチを調べるとある種パターン化ができていて、その組み合わせを変えることができます。星さんがやっていなかった組み合わせで作れば、習作はできるのではないかと思うわけです。こちらのイメージとしては、それを飛び越えることを最終的にはしたいと思っています。

 例えばオリジナル作品だと、インターネットとか、携帯電話とかは作中に出てこない。星さんは90年代に亡くなられているので、作品の時代感はギリギリその前の世代で終わっているんですね。星さんは昔書いていた小説で「電話のダイヤルをまわす」って表現があったのを、その後で「押す」って表現に変えられたらしいのですが、今だったら「インターネット」とか「携帯電話」をネタにしたショートショートを書かれているはずです。「今、星さんが生きていれば、こんなショートショートを書いているんじゃないか」という内容を出力させて、一定の評価を受けられれば、プロジェクトとしては成功だなと思います。

――プロットでこんな流れにしようかっていうのを考えて、そこにコンピュータが判断した単語が入ってくると、文章として成立するのかどうかがわからないですよね。本来の文からずれた意味の単語が中に入ってきて、物語として成立しているという判断はどういうふうにさせるのでしょうか?

 それは難しいです(笑)。正直言って答えがでているわけではないですが、何かのプログラムで自分の作った小説を点数化するようなシステムを作ることになると思います。例えば60点以下は足切りとかですね。そこは瀬名さんとも「文学コンテストと同じですね」って話をしています。そういったコンテストでは審査員の作家に見せる前に編集者が下読みして、本当にダメなのはポンポン捨てて、作家には上だけのものしか見せないわけです。でも、それって正直難しいですよね。読んで、これが「話になっていない」と思うのは、人間が非常に常識を持っているからです。常識をそのまま書いたらショートショートにならないのだけど、常識からあんまり離れていてもショートショートにならない。先ほども「星さんからのズレ」って言いましたけど、常識からのズレや気の利いたオチというのが、星さんの小説の分析でしなければならないところです。星さんの選んだのは、作品数が1000と多いので、分析しやすい。いくら有名な作家でも10作とかしかないと分析しにくいわけです。ズレの数値化みたいなことをある程度して、星さんと同じくらいの数値がズレているという感じで判断することになると思います。

松原教授は2010年に行われた将棋の清水市代女流王将に挑戦して勝利した「あから2010」開発チームの責任者でもある。当時の情報処理学会の「清水市代女流王将vs.あから2010速報」のリリースページには、松原教授が会見に臨んでいる写真も掲載されている

 ちょっと余談になるんですけど、私の友人に大岡信さんの息子さんで大岡玲という作家がいるんです。私の中学・高校の同級生なんですね。彼がブログで、我々のプロジェクトが面白いと書いてくれました。このプロジェクトによって星新一さんがどういうプロセスで小説を書いていたかっていうのを解明できる可能性があるわけですね。元々これは、人工知能にも芸術が扱える、感性が扱えることを示したいという1つの例として、ショートショートを作るというものをやっているつもりなんです。人工知能というのは、将棋とかチェスとか、理性の部分は結構できてきました。チェスも人間に勝つし、将棋もそろそろ勝ちそうになってきたから、次は感性を扱いたい。人間がコンピュータやロボットをもっと使いやすくするには、人間の感性をコンピュータがもっと理解できたほうがいい。感性を理解するというのは、例えば芸術作品で言うと、芸術作品を観賞する、いい作品を見て「わぁ、すごいな」って思える。人間はそれができるので、その気持ちを少しでもコンピュータが理解したほうがいい。理解するためには、コンピュータも芸術作品「もどき」かもしれないけれど、それを作れるってことを示したいっていうわけです。

――新潮社さんから電子データをもらって、単語分けをして、再構成させるためにどれくらいのマシンパワーが必要なんでしょうか。

 そんなすごいスーパーコンピュータをブン回してやるっていうことは考えていません。確かにそういう方法はあると思います。それこそ富士通が作った「京」っていうコンピュータを使ってとかですね。

 比喩でチンパンジーにタイプライターを渡しておけば、それでチンパンジーがある確率でノーベル文学賞をとるような作品を作るかもしれないというものがあります。それの延長線で、さすがにキーボードをむちゃくちゃに打っていると単語にならないけど、単語の辞書だけ持たせておいて、接続詞など最低限の文法だけ満たすようにして、日本語の文章をランダムに生成するシステムを作るという手もあります。それを8000字なら8000字以内に制限して、わーってやると、1兆個に1個くらいの確率でいいものができてくるかもしれないというアプローチもあり得ます。でも、我々はそうではなくて、ある程度、数百とか数十という数のレベルの中から1つ選ぶみたいな方法をとりたい。多分、星さんだってボツにした作品って結構あると思うんで、人間がボツにするぐらいのレベルの数から選ぶという方法を目指しています。そういう意味では、あまりコンピュータパワーは使わないでしょうね。しかし、星さんのデータ以外にも、例えばこれが日本語として成立しているのかどうかとか、そういうのはインターネットに聞いてみるつもりです。インターネットをすべて信じるわけではないけれども、参考にインターネットの情報を使うということはあり得ると思っています。

――星さんの原稿ってきれいな日本語ですよね。インターネットは、例えば2ちゃんねるとかすさまじい文法ですが、あれを参照したら、星新一の作品の2ちゃんねる版みたいなのができあがってしまうことも考えられませんか(笑)。

 星さんを選んだのは、文章の質のほか、ショートショートの第1人者であるという点です。こういうときにはトップを目標にした方がいい。例えば、ちょっとアナロジーで言うと、現在、将棋の強いプログラムを作っています。今度、羽生善治さんと戦えば何とか勝負になるとこっちは思っているのですけど、そのプログラムには羽生さんの過去の棋譜をデータに使っているんです。星さんのデータだけを使うのは、例えば羽生さんに勝つために羽生さんの棋譜だけを教習データとして使うという方法です。でも、逆に将棋プログラムで結構うまくいっているのは、素人がインターネットで指した棋譜をたくさん集めてきて、それを分析して、機械学習させるというものです。それなりにいいものができるんですね。将棋を知ってる人に言うと、「え?本当にクズのような対戦のそんなものが?」って言います。羽生さんの棋譜がいいのは、ある局面で指した手が、たまに間違えるかもしれないけれどほとんど正解だから、教師データとして使えるっていうのがあるんです。それは人工知能の理屈としては正しい。でも、インターネット上の素人の棋譜は、最善手は少ないかもしれませんが、知性のある人が選択肢の中からそれなりの基準で選んだものです。その人だって勝とうと思って指してるわけですから、それを教師データに使っても、それなりに結構使えるっていうのがあるんですね。

 そういう意味で、日本語として使えるかって言うと、おっしゃっている通り、2ちゃんねるとかインターネットの文章は酷いものが多いです。私も学生に「インターネットの日本語ばっかり見てるから、お前の日本語は下手なんだ」とよく言います。本というのは、本として出す価値があるって編集者が判断して、商品価値を見いだしているから存在価値があるんですよね。それで日本語として最低条件を満たしているわけです。インターネットには文章の質の問題は確かにあるのだけど、基本のデータとしては使える可能性がある。2ちゃんねると言えども、意味が通じるようには書いているわけですよね。隠語とかたくさんあるし、罵倒する悪い言葉とかたくさんあるけれど、少なくとも自分の意図が相手に通じてないといけないですから。チンパンジーがアルファベットをキーボードでランダムに打ったものよりは、2ちゃんねるの文章でも遙かに使える。もちろん2ちゃんねるの文章だけを教師データに使うわけではないですけど。

カテゴリートップへ

注目ニュース

ASCII倶楽部

プレミアムPC試用レポート

ピックアップ

ASCII.jp RSS2.0 配信中

ASCII.jpメール デジタルMac/iPodマガジン