このページの本文へ

前へ 1 2 3 次へ

数十万件のカードローン顧客データから「貸倒れ確率」予測モデルを開発、ユニークな着眼点も

新生銀行の大規模リアルデータを使った学生ハッカソンを見てきた

2019年04月15日 08時00分更新

文● 谷崎朋子 編集● 大塚/TECH.ASCII.jp

  • この記事をはてなブックマークに追加
  • 本文印刷

独自性のある着眼点でモデル作成の可能性も広がる

 そのほかにもユニークな視点の発表がいくつかあったので紹介したい。

 優秀賞を授与された東京大学の古田陸太さんは、「実用性をとことん意識した」モデル開発に取り組んだという。プレゼンテーションの冒頭で「そもそも作成モデルの性能評価が高いことが重要なのでしょうか」と述べた古田さんは、新生ハッカソンの“真の目標”は、現場で役立つモデルを生み出すことにあると考え、「現場で役立つモデル」とは何かを基点としてさまざまな施策を練った。

 たとえば、過去のトレンドが必ずしも現在のトレンドとは呼応しないことから、過去の参照は最小限に抑えつつ、最新情報を素早くモデルに反映して回すほうが「役立つ」と考察した。PCAで次元削減(変数の数を100個削減)を実行し、学習にかかる時間を22%削減することに成功した。

 「今回のハッカソンで利用したデータ量やリソースであれば、学習は1時間で完了します。これは現場において『今日のデータを明日の貸倒れ確率に反映することができる』ということです」(古田さん)

 具体的に削減した変数は、たとえば「性別」だという。これは男女関係なく働き、収入を得ることが一般化した現代社会において、性別変数を加える意味はないとの判断からだ。審査員からは「分析結果の説明責任」という観点で、意味付けを注視しつつ結果にもこだわりが感じられる、バランスのとれたモデルだと評価された。

 古田さん自身はこれまで何回かハッカソンに参加した経験を持つが、「ここまでリアルデータを扱えるハッカソンはなかなかない」と述べる。

 「もちろん、深層学習や機械学習向けの無償データも数多くありますが、せっかくなら普段触れないものを触ってみたいと思って、参加申し込みをしました」。9日間は濃度が高く疲れたが、楽しかったと振り返る。

優秀賞を受賞した東京大学の古田陸太さん

 一方で「ボーナス」に着目して貸倒れ確率のモデルを作成したのが、横浜国立大学大学院の大矢康介さんだ。「まだボーナスをもらったことがない」大矢さんは、一般企業のボーナス月(6~7月、12月)を調べたうえで貸倒れ率と照合。その結果、ほかの月よりもボーナス月のほうが貸倒れ率が高いことがわかった。さらに1月も貸倒れ率が高かったことから、借り入れ側を「新年を口実にお金を使いすぎてしまう“財布のひもがゆるい”傾向があり、ボーナスが入っても借りなくてはならないような困った人たち」と想定。1月・6月・7月・12月を「ボーナス月変数」として追加し、ボーナス月の借り入れ申し込みをその他の月と区別した。そのほか、世帯収入に対して借り入れ額が大きく、貸倒れが生じやすい状況を見分けるための借り入れ変数比率を追加するなどの工夫を行ったと説明した。

 ただし大矢さんによると、ボーナス月と申し込み月をマッチングさせる方法では、貸倒れ率の精度にあまり影響がなかったという。ボーナス月であっても銀行口座に振り込まれる週/期間が異なるので、「月単位」でひとまとめに変数化してしまったのが原因ではないかと分析しており、「申込日」の単位を変数として扱うほうがよかったかもしれないと語った。

 審査員から「ほかにどんなデータがあったら面白いか?」と質問が飛ぶと、「休日の過ごし方。麻雀に行っているとかパチンコに通っているとかが分かると面白いかもしれません」と大矢さんは回答。データの背後にいる人間の行動に注目する行動ファイナンス理論を導入したことが評価され、データサイエンティストとしての素質があると賞賛された。

 「今回のハッカソンを通じて、ネット越しよりも実際に会って話し合ったほうがずっと深くテーマを掘り下げて議論できることを知りました。自分は思いつかなかったような発想を(他の参加者の)発表で学ぶことができ、期間は長かったけど楽しかったです」(大矢さん)

特別賞の横浜国立大学大学院の大矢康介さん

 審査結果の発表後、新生銀行 グループ本社チーフオフィサー兼専務執行役員の平沢晃氏は「今回のハッカソンは甲乙つけがたい僅差の勝負」だったと総括したうえで、参加した学生たちに次のようなメッセージを贈った。

 「今回開発に挑んでもらった予測モデルの背景には、返済能力の低い顧客に貸しすぎてその人を破綻に導くことがないよう、『借り入れ側に寄り添った貸し出しを考える』という目的があります。皆さんは今後社会に出て、さまざまなモデルを開発することになると思いますが、ただ『正解を当てにいく』のではなく、こうした背景を理解して相手に付加価値を提供できる、そのうえで自分も納得のいくものを開発できるよう目指してもらいたいと思います。このハッカソンを通じて、皆さんが今後より良いデジタル社会を構築する礎になってもらえたら、私たちにとってこの上ないよろこびです」(平沢氏)

前へ 1 2 3 次へ

カテゴリートップへ

アスキー・ビジネスセレクション

ASCII.jp ビジネスヘッドライン

ピックアップ