このページの本文へ

前へ 1 2 次へ

クラウドネイティブ時代を告げる「AWS Summit 2018」 第4回

メディアの激変に立ち向かうべく、AWSをフル活用

機械が見出しを自動生成!編集業務をテクノロジーで変革する朝日新聞社

2018年06月01日 08時00分更新

文● 大谷イビサ/TECH.ASCII.jp

  • この記事をはてなブックマークに追加
  • 本文印刷

 2018年5月31日、AWS Summit 2018において「機械学習を用いた編集業務の生産性向上への取り組み」というセッションを披露した朝日新聞社。メディアの激変にテクノロジーに立ち向かう同社のエンジニアが、機械学習を用いた編集業務の省力化・自動化について説明した。

現場の課題を解消する実用度の高い機械学習活用

 セッションは登壇者の自己紹介と組織の説明からスタートする。前半に登壇した落合隆文氏が所属する情報技術本部は、朝日新聞社内のITエンジニアを統合し、2015年に発足した組織で、新聞製作や社内業務、「朝日新聞デジタル」のシステム開発などを担当。また、「ICTRAD」と呼ばれる本部横断チームで、機械学習を用いた研究開発にも取り組んでいるという。

朝日新聞社 情報技術本部 開発部 落合隆文氏

 落合氏らのチームは、おもに現場の課題を聞き取り、社内サービスを構築。まずはプロトタイプからスタートし、ニーズのあるものは本番サービスに仕上げていく。これまで編集向けの記事分類サービスや時事問題の自動生成サービスなどを手がけ、人手で数時間かかる作業を大幅に省力化してきたという。

 具体的に披露されたのは、記事のデジタル化に必要な写真を探してくれる「関連記事・画像検索サービス」だ。もともと写真のない記事でも、デジタル版で配信する際は、写真があった方が注目されやすい。しかし、記事にあった写真を探すのは手間がかかる。こうした課題が現場から聞き、落合氏らは記事内容を解析し、最適な写真候補を見つけ出すシステムをプロトタイプとしてAmazon EC2で構築した。評判も良好だったため、編集者が記事の本文を入力すると、内容を解析して写真を提案してくれる機能を編集者用のCMS(コンテンツ管理システム)に実装することにしたという。

記事内容を解析し、最適な写真を候補として提案してくれる

 とはいえ、プロトタイプから本番サービス化するにあたっては、Webメディアという業務上、24時間365日の運用が必要という点が課題になった。運用メンバーも少なく、土日に急遽対応するのも大変。そこで、本番環境ではサーバーレスに移行し、インフラやセキュリティ、運用保守を省力化。メンバーは開発に専念できる体制を実現することにしたという。

サーバーレス化のメリットは安い、早い、うまい

 サーバーレス化を進めるにあたっては、Webフロントと機械学習の推論部分をAPI化。それぞれの機能を変更しやすいよう、システムを分離した。また、推論APIに関しては、EC2上で稼働するように設計し、万が一障害になっても、サービスとして継続できるようにしたという。編集者が記事内容をCMSに登録すると、Lambda経由で推論APIを呼び出し、その結果を基にElasticsearchの検索が走り、あらかじめS3に保存された画像から最適なものがリコメンドされる。この段階で2017年6月にシステムは公開され、現場で利用できるようになったという。

サーバーレスでの構成。Webフロントと推論部分を分離

 その後、サービスの使われ方や機械学習の教師データを溜めるべく、クリックログを取得するAPIも開発された。どの画像が選ばれたのかを学習することで、リコメンドの精度をさらに高める狙いだ。こうして収集したデータを元に編集者とコミュニケーションを行ない、さらにサービスを継続的に改善したという。PDCAサイクルを回しながら、システムにブラッシュアップをしていったわけだ。

 サーバーレス化のメリットは大きかった。フロントがマネージドサービスなので、少人数でも運用でき、スケールにも悩まずに済む。また、インフラの運用にかける時間を削減し、編集者とのコミュニケーション時間をとることができたため、サービスを継続的に改善することが可能になったという。さらに、フロントにEC2を用いた場合に比べ、コストも大幅に削減できたほか、デプロイまでの時間もスピーディになった。「フロントと機械学習でコンポーネントを分離したため、柔軟な機能改修が実現した。Lambdaのコード容量など制約事項も多かったが、メリットのほうがはるかに大きかった。まさに安い、早い、うまいというメリットが得られた」と落合氏は語る。

サーバーレス化のメリット

 とはいえ、現状では推論APIがEC2上で稼働しているため、インフラ管理の負荷はまだ残っている。また、アプリのコンテナ化も進めているが、コンテナ自体を管理する負荷も気になるところ。「サーバーレスのコンテナ管理を実現するFargateを早く東京リージョンで使いたい」と落合氏は要望を出した。

前へ 1 2 次へ

カテゴリートップへ

この連載の記事