表に出なかった行政データで政策立案やオープンイノベーションを推進。国交省の新しいオープンデータ「Project LINKS」
「【キックオフイベント】 LINKS:DATA x Hackathon」レポート
提供: 株式会社日建設計総合研究所
国土交通省は、これまで活用されてこなかったさまざまな行政情報をデータとして再構築し、オープンデータとして提供する新たな取り組み「Project LINKS」を2024年4月にスタートした。これらのデータを活用したユースケース開発を推進するため、2024年度は、「LINKS:DATA × Hackathon 国土交通分野のオープンデータ活用チャレンジ」と題して、キックオフイベント、アイデアソン、ハッカソンの3形態のイベントを開催する。9月6日には、第1弾となるキックオフイベントがオンライン開催された。
「まったく新しい国土交通省のDX推進プロジェクト」
キックオフイベントの前半は、Project LINKS(以下、LINKS)のテクニカル・ディレクターを務める国土交通省の内山裕弥氏が、その概要と、提供するオープンデータの例を紹介した。
LINKSでは、国土交通省が保有する行政情報を、自然言語処理AIにより非構造化データの各種処理を実施し、営利・非営利を問わず二次利用が可能なオープンデータとして一般に公開していく。内山氏は、LINKSを「まったく新しい国土交通省のDX推進プロジェクト」と位置付ける。従来、行政が提供するオープンデータは、主に民間や研究で活用することを想定したものだった。これに対して、LINKSは、もともと国土交通省内に眠っていた各種行政データを、EBPM(Evidence Based Policy Making:エビデンスに基づく政策立案)に活用するために整備しオープンデータ化するプロジェクトだ。
国土交通省ではLINKSのプロジェクト向けに、データ処理・検索システム「LINKS Veda(Verbal Exploring Data Access)」を開発した。Vedaは、LLM(大規模言語モデル)を用いてデータが整形されていない非構造化データを自然言語解析し、意味情報を抽出して構造化データを自動生成する。また、多様かつ大量なデータを効率よく検索するための基盤として機能する。
LINKSでは、例えば、次の4つのようなオープンデータを提供予定だという。
1つ目は、一般旅客定期航路事業(旅客船を航行する事業)等に関するデータ。今回オープンデータ化するのは、国土交通省海事局が保有する旅客事業の許可申請書、運輸安全委員会が保有する船舶事故等調査報告書、気象庁の海上分布予想データを統合して作成する新しいデータだ。「事業の安全性評価サービスや、もしものときの訓練シミュレーションなどに活用できるのではないか」と内山氏は見込んでいる。
2つ目は、ドローン(無人航空機飛行計画データ)の事故情報だ。ドローンの飛行申請には「DIPS2.0(ドローン情報基盤システム2.0)」という手続きに関するオンラインシステムが用意されているが、システム内でデータ同士がひもづけられておらず、データベース設計の行程における重複などの正規化されていないものが混ざるなど、活用に課題があった。今回LINKSでは、ドローンの飛行計画データ、機体登録データ、事故報告データと、各種空域情報を前述のVedaで統合し、CSV形式でオープンデータ化する予定だ。「ドローン保険サービスの開発や保険料算定サービスなどが考えられる」(内山氏)。
3つ目は、貨物自動車運送事業(貨物トラックの事業)のデータ。運送業界では、トラック運転手が不足する“2024年問題”への対応が喫緊の課題だ。今回LINKSでは、トラックの事業実績報告書、報告規則に基づく事業報告書、厚生労働省の毎月勤労統計調査をまとめた1つのCSV形式のデータとして公開することを検討している。内山氏は、「トラック事業の労働生産性の検証、物流業界分析レポートサービスなどが実現できるのでは」と説明した。
4つ目は、内航海運業(貨物船の事業)のデータ。この業界では、船舶と船員の高齢化、および中小企業が多く経営基盤が脆弱という課題がある。LINKSでは、事業登録申請データ、事業概要報告書、統計調査、港湾調査・港湾統計年報、港湾位置情報など、これらを統合したCSV形式のオープンデータ化を検討中だ。実現できれば、「港単位の経済性や環境性の評価に使える」(内山氏)という。
データとAIの組み合わせでイノベーションが加速
キックオフイベントの後半は、東京大学先端科学技術研究センター 特任准教授 吉村有司氏、インフォ・ラウンジ株式会社 取締役・副社長 小林巌生氏、国土交通省の内山氏によるトークセッションが行われた。最初のトークテーマは「Project LINKSの印象」について。(以下、敬称略)
当日のトークセッションの模様は、YouTubeでも公開されている
国ももっとクリエイティビティの高い業務ができる
吉村:私は建築・都市が専門だが、空き家データなど今回LINKSで提供されるようなデータはこれまでなかった。アカデミックの責任として、これらのデータを分析・活用して社会に還元していかないといけない。
小林:プロジェクトの目的にEBPMのキーワードがあり、LINKSのオープンデータは、民間での活用、国土交通省内での活用の両方を想定している点に注目している。これまでオープンデータは民間での利活用を想定して公開していたものの、使いやすいものにはなっていなかった。それは、官公庁側でデータの使い勝手について十分に評価できていないまま公開していたから。LINKSではEBPMでの活用ということで、官公庁側でもデータを積極的に使っていくことが想定されている。そうした点からデータの品質が向上していくのではないかと期待している。
内山:LINKSは国土交通省で使うためにまず作って、そのうえで今回はハッカソンなどでエンジニアのみなさんに触ってもらう取り組みをやっている。今後、アカデミアとの連携で研究で利用するとなると求められる正確性も違ってくる。その点でアドバイスをいただけるとデータ自体の価値も上がっていく。
吉村:非常に重要な視点。国土交通省の人もいいデータがあると、もっとクリエイティビティの高い業務ができる。
ロジックモデルとセットで公開するのも面白い
続くトークテーマは、「国土交通省にどんなデータを出してほしいか」。ファインダブルな(見つけやすい)データであるという点や、安心して使えるように、データがどう作成されたのかというメタデータ提供への希望が語られた。
吉村:(このような)データ自体が出回ってないので、分析の仕方もまだわからないはず。ナレッジの蓄積もないので、データを整備していくと同時に、それをどう分析して解釈していくかということもパラレルに進めないといけない。また、時空間情報をあまりに粒度高く出してしまうことはプライバシーの問題にもつながる。ここは我々アカデミアの人間が1枚噛めるところであり、どううまく加工していくかという問題と、それを加工したうえで民間に開いていくところで、産官学民のパートナーシップも変わってくるのではないか。
小林:いまはどの自治体も業務DXに一生懸命取り組まれていて、先進的なところは官公庁の中で事業評価をするのにロジックモデルを組み立ててKPIを設定している。その際、KPIを図るためにはどんなデータが必要かというのを見極めて、それを収集して分析するということを真面目にやろうとしている。ぜひ国土交通省の中でもそういうロジックモデルとかがあるならば、そういうものもセットで公開してもらえるといろんな観点がそこには含まれて面白い。
大量のデータをフックに産官学民のパートナーシップのあり方そのものが変わる
3つ目のトークテーマは「オープンイノベーションを起こし続けるためにLINKSに求めることは?」。
吉村:LINKSでは、楽しい、親しみやすさを大事にしているように見える。ハッカソンやアイデアソンなど、親しみやすいイベントを開催し続けることに意味があると考える。
小林:AIというキーワードを意識してデータを提供していくと面白いことが起こるのではないか。
吉村:これまで、データを扱えるのはPythonなどのプログラミングスキルがある人だけだった。生成AIがあることで、誰でもデータを分析できるようになった。さらに、高校でプログラミングが必修になったので、これからの若い世代は当たり前にコードを書いてデータを有効活用するのではないか。
吉村:このLINKSは大量なデータをフックにして、産官学民のパートナーシップのあり方と仕事の仕方そのものを変える話ではないかと僕は捉えているが、内山さんとしてはどうか?
内山:データを中心に生産性向上や価値を高める、EBPMをするといった方向性はあるが、そのために実行できるためのデータ量やインターフェースはこれまで存在しなかった。うまくいくかは参画いただくみなさん次第なので、ぜひ協力していただきたい。
小林:今は、LLMとナレッジグラフを組み合わせて、より正確で具体的な情報を引き出す技術がある。LINKSもこの先、データの公開の先にデータの知識基盤となっていくことを期待している。
11月23日~24日には初のハッカソンを開催!
「LINKS:DATA × Hackathon 国土交通分野のオープンデータ活用チャレンジ」の第2弾として10月5日にアイデアソン、第3弾として11月23日~24日にハッカソンが開催される。国土交通省の中に眠ってきたデータからどのような新しい価値が生み出されるのか、期待したい。