クラウドネイティブ時代を告げる「AWS Summit 2018」 第4回
メディアの激変に立ち向かうべく、AWSをフル活用
機械が見出しを自動生成!編集業務をテクノロジーで変革する朝日新聞社
2018年06月01日 08時00分更新
2018年5月31日、AWS Summit 2018において「機械学習を用いた編集業務の生産性向上への取り組み」というセッションを披露した朝日新聞社。メディアの激変にテクノロジーに立ち向かう同社のエンジニアが、機械学習を用いた編集業務の省力化・自動化について説明した。
現場の課題を解消する実用度の高い機械学習活用
セッションは登壇者の自己紹介と組織の説明からスタートする。前半に登壇した落合隆文氏が所属する情報技術本部は、朝日新聞社内のITエンジニアを統合し、2015年に発足した組織で、新聞製作や社内業務、「朝日新聞デジタル」のシステム開発などを担当。また、「ICTRAD」と呼ばれる本部横断チームで、機械学習を用いた研究開発にも取り組んでいるという。
落合氏らのチームは、おもに現場の課題を聞き取り、社内サービスを構築。まずはプロトタイプからスタートし、ニーズのあるものは本番サービスに仕上げていく。これまで編集向けの記事分類サービスや時事問題の自動生成サービスなどを手がけ、人手で数時間かかる作業を大幅に省力化してきたという。
具体的に披露されたのは、記事のデジタル化に必要な写真を探してくれる「関連記事・画像検索サービス」だ。もともと写真のない記事でも、デジタル版で配信する際は、写真があった方が注目されやすい。しかし、記事にあった写真を探すのは手間がかかる。こうした課題が現場から聞き、落合氏らは記事内容を解析し、最適な写真候補を見つけ出すシステムをプロトタイプとしてAmazon EC2で構築した。評判も良好だったため、編集者が記事の本文を入力すると、内容を解析して写真を提案してくれる機能を編集者用のCMS(コンテンツ管理システム)に実装することにしたという。
とはいえ、プロトタイプから本番サービス化するにあたっては、Webメディアという業務上、24時間365日の運用が必要という点が課題になった。運用メンバーも少なく、土日に急遽対応するのも大変。そこで、本番環境ではサーバーレスに移行し、インフラやセキュリティ、運用保守を省力化。メンバーは開発に専念できる体制を実現することにしたという。
サーバーレス化のメリットは安い、早い、うまい
サーバーレス化を進めるにあたっては、Webフロントと機械学習の推論部分をAPI化。それぞれの機能を変更しやすいよう、システムを分離した。また、推論APIに関しては、EC2上で稼働するように設計し、万が一障害になっても、サービスとして継続できるようにしたという。編集者が記事内容をCMSに登録すると、Lambda経由で推論APIを呼び出し、その結果を基にElasticsearchの検索が走り、あらかじめS3に保存された画像から最適なものがリコメンドされる。この段階で2017年6月にシステムは公開され、現場で利用できるようになったという。
その後、サービスの使われ方や機械学習の教師データを溜めるべく、クリックログを取得するAPIも開発された。どの画像が選ばれたのかを学習することで、リコメンドの精度をさらに高める狙いだ。こうして収集したデータを元に編集者とコミュニケーションを行ない、さらにサービスを継続的に改善したという。PDCAサイクルを回しながら、システムにブラッシュアップをしていったわけだ。
サーバーレス化のメリットは大きかった。フロントがマネージドサービスなので、少人数でも運用でき、スケールにも悩まずに済む。また、インフラの運用にかける時間を削減し、編集者とのコミュニケーション時間をとることができたため、サービスを継続的に改善することが可能になったという。さらに、フロントにEC2を用いた場合に比べ、コストも大幅に削減できたほか、デプロイまでの時間もスピーディになった。「フロントと機械学習でコンポーネントを分離したため、柔軟な機能改修が実現した。Lambdaのコード容量など制約事項も多かったが、メリットのほうがはるかに大きかった。まさに安い、早い、うまいというメリットが得られた」と落合氏は語る。
とはいえ、現状では推論APIがEC2上で稼働しているため、インフラ管理の負荷はまだ残っている。また、アプリのコンテナ化も進めているが、コンテナ自体を管理する負荷も気になるところ。「サーバーレスのコンテナ管理を実現するFargateを早く東京リージョンで使いたい」と落合氏は要望を出した。
この連載の記事
-
第7回
クラウド
ISV 3社が語った「SaaSビジネスの苦労」と「AWSを選んだ理由」 -
第6回
クラウド
富士ソフトのプロが語るVMware Cloud on AWSの気になる中身 -
第5回
クラウド
Sage MakerやQuickSightが東京リージョンで提供!7月にはFargateも -
第3回
クラウド
ユーザーの声を取り込み、ますます進化するAlexaスキルの現状 -
第2回
クラウド
コンタクトセンターの置き換えにとどまらないAmazon Connectの破壊力 -
第1回
クラウド
KDDI、ソニー銀行、SOMPO HDなどが語った「AWS Summit」基調講演 -
クラウド
クラウドネイティブ時代を告げる「AWS Summit 2018」 - この連載の一覧へ