このページの本文へ

1週間以上かかっていた分析を1日に短縮

Hadoopによる機械学習処理を10倍以上高速化する技術

2013年10月09日 11時00分更新

文● TECH.ASCII.jp

  • この記事をはてなブックマークに追加
  • 本文印刷

 NECはビッグデータ分析を高速化する分散処理技術を開発。機械学習で頻繁に用いられる繰り返し演算および行列演算を、信頼性を損なわずにHadoopによる機械学習処理を大幅に高速化する。

 今回開発した技術では、繰り返し演算と行列演算を多用するHadoopの機械演算を高速化するもの。具体的には、Hadoopの分散処理手法であるMapReduce間のデータ受け渡しをHDDではなく、メモリで実現することで、繰り返し演算を高速化。また、行列演算に関しては、分散処理手法としてMPI(Message Passing Interface)を利用可能にした。これにより、機械学習プログラムにおいてHadoopの10倍以上の速度を実現したという。

 さらに新技術の高速化と信頼性を両立するため、メモリ上にある処理の状態を高速にハードディスクに保存する技術を世界で初めて開発した。Hadoopでは、サーバーの故障時にハードディスク上にある入力データを用いて、故障したサーバーの計算をやりなおすことで処理を継続する。しかし、新技術で高速化を行なう場合、サーバーが故障するとメモリ上にあるMapReduceの入力データが失われてしまうため、プログラムが利用中のすべてのメモリ内容を保存する手法しかなかった。これに対して、新技術では処理の継続に必要な部分だけを選択することで、保存するデータサイズを大幅に削減し、高速な保存を実現した。定期的に処理の状態をハードディスクに保存し、サーバーの故障時にはハードディスクに保存した処理状態をメモリに読み込むことで処理を継続できる。

処理の継続に必要な部分だけを選択することで、保存するデータサイズを大幅に削減し、高速な保存を実現(同社の資料より)

 NECでは、「レコメンド・価格予測・需要予測などの分析において、従来提供まで1週間以上かかっていた最終的な分析結果を、翌日に提供でききるようになる」と説明している。

 なお、本成果の一部は、平成21年度より平成24年度までNECが参画した独立行政法人新エネルギー・産業技術総合開発機構(NEDO)のプロジェクト「グリーンネットワーク・システム技術研究開発プロジェクト(グリーンITプロジェクト)」によるもの。

■関連サイト

カテゴリートップへ

本記事はアフィリエイトプログラムによる収益を得ている場合があります

アクセスランキング

  1. 1位

    TECH

    訓練だとわかっていても「緊張で脇汗をかいた」 LINEヤフー、初のランサムウェア訓練からの学び

  2. 2位

    ITトピック

    若手が言わない“本音の退職理由”上位は/「データ停止は景気後退よりも企業の脅威」6割/クライアントに告げずAI活用するフリーランス、ほか

  3. 3位

    ビジネス・開発

    最悪のシナリオは「フィジカルAI」による基幹産業の衰退 日本の勝ち筋は、“同期技術”と“ドメイン知識”

  4. 4位

    Team Leaders

    ファイル名が命名規則に合っているかの自動チェック、Power Automateのフローで実現しよう

  5. 5位

    TECH

    “GPUなし”ノートPCで動くLLMで、ローカルAIエージェントを自作する

  6. 6位

    TECH

    糖尿病超早期を採血なしで検出、予防へ! 代謝や臓器のつながりに着目した予防法開発

  7. 7位

    ビジネス

    廃校がAIの心臓部に!? 地方の遊休施設を「AIデータセンター」に生まれ変わらせるハイレゾの挑戦がアツいぞ

  8. 8位

    データセンター

    液冷技術の最先端が集うイノベーションラボ「DRIL」、印西のデータセンターに現わる

  9. 9位

    TECH

    業界横断で“サイバー攻撃から供給網を死守” NTT・アサヒ・トライアルらが「流通ISAC」始動

  10. 10位

    Team Leaders

    バックオフィス業務もAIに“丸投げ” マネーフォワードが「Cowork」機能を2026年7月に投入へ

集計期間:
2026年04月08日~2026年04月14日
  • 角川アスキー総合研究所