このページの本文へ

遠藤諭のプログラミング+日記 第158回

ChatGPTプロンプトプログラミング講座(3)

ChatGPTの新機能コードインタープリターに《未来の仕事の全自動化》が見える

2023年07月10日 17時00分更新

文● 遠藤諭(角川アスキー総合研究所 主席研究員)

  • この記事をはてなブックマークに追加
  • 本文印刷

国勢調査(csv)と国土地理院(xls)とドン・キホーテ店舗数(html)を自動マージしてパワポにする

 OpenAIが、ChatGPTに革命的ともいえる新機能「Code Interpreter」を追加して、試した人たちの間で大騒ぎになっている。さまざまな機能が可能になっているが、その本質は名前のとおりChatGPTの中でプログラムを実行可能になったことだ。

 ChatGPT plus(20ドル/月の有料ユーザー)は、随時このCode Interpreter というプラグインが使えるようになるそうなのだが。画面左下から「Settings」を選び、「Code Interpreter」のスライドスイッチをONできれば利用可能。「New Chat」をスタートしたときに「GPT-4」を選び、「Code Interpreter」にチェックする。

 とくに、データサイエンティスト的な数値の分析の世界にインパクトが大きいとされているが、実際には、机の上で仕事をする人たち全員に影響する内容である。

 たとえば、複数のデータからもってきた情報を1つの表にしてまとめてプレゼン資料にするなど誰でもやる作業である。この例では、《国勢調査》による都道府県別の人口と、《国土地理院》による面積、さらに、《ドン・キホーテ》の店舗数をもってくる。

 そこで、こうしたデータを手作業で切り貼りするわけだが、面倒だしヒューマンエラーも発生しがちというものだ。簡単そうに見積ってしまい残業になりがちでもある。

 政府統計の総合窓口 e-Statは、とてもありがたいサイトだが、まずここから国勢調査のデータをダウンロードしてくる。開発者向けとしてAPIもいろいろと紹介されているのだが、今回は、それがない場合の例としてCSV形式のダウンロードデータを使わせてもらうので念のため。

 次に、国土交通省 国土地理院の令和5年に公開された「全国都道府県市区町村別面積調」(「面積調」という言葉があるのですね)をもとにした、総理府統計局が公開している「都道府県別面積」のエクセル形式のデータである。

 最後が、ドン・キホーテの公式ページにある店舗一覧である。これは、CSVでも、エクセルでも、APIでも、XMLでもなく、人間が目で見るためのウェブページである。このページを構成しているhtml形式ファイルをダウンロードして使わせてもらうことにする。

 これを、ChatGPTの新機能 Code Interpreter でどんなふうにマージして1つのエクセルファイルにして出力、さらには、その結果をパワーポイントにしたか? 次のビデオでご覧いただきたい(大幅に省いてあるのでやりとりの雰囲気を見ていただきたい)。

 Code Interpreter を使う設定にすると、ChatGPTのメッセージ窓の左側に「+」マークが表示されるようになる。これは、ファイルのアップロードボタンだ。そこで、国勢調査の人口データ、国土地理院の面積データ、ドン・キホーテの店舗一覧画面データを、1つずつアップロードしては、エクセルにマージしていく。

 ちなみに、Code Interpreterの意味は「Pythonのコードを作って実行できる」ということから来ているのだろう。アップロードしたデータの加工を、ChatGPTが自動生成したコードを実行することで行うわけだ。私も、エクセル形式のデータを大量に操作するときには、Pythonでエクセルが操作できる「Openpyxl」というライブラリを使ったりするが、同じ発想である。

 今回の場合は、私は、元データを都合よい形に編集したり、Pythonのコードを書いたりすることも一切していない。ひたすら、ChatGPTが、全自動で作業をすすめるようすを眺めながら、必要なファイルを与え、ときどき「こうしてほしい」とか入力しているだけである。

説明しながら動くので《人間の作業者》以上に信頼できる?

 動画をよく見てほしいのだが、バラバラのデータ形式の整合性をとったり、都道府県の表記のブレ、さらには数値データなのに文字形式だったりするなど、こまかな対応を次々にやってくれている。その都度、そうした対応の内容を実況中継し、うまく処理できなかったと自身が評価したときは、「申し訳ありません」とお詫びした上で新たな試行錯誤をしてくれる。ケナゲとしか言いようがない。

 途中、私が介在をしたのは、ドン・キホーテの店舗一覧ページの処理をやっていたときだけだ。htmlファイルから店舗の住所を特定できない言ってきたので、住所らしい表記は店舗住所しかないので、それを集計すればよいのでは? とアドバイスした。

 「郵便番号と住所がきちんと書かれている文字列を見つけて集計する」といったことは、人間ならとっくにやっていることだろう。ひょっとしたら、今回、私がこんなヒントを与えたことで、今後は、ChatGPTは、こうした店舗一覧ページをなんなく処理するようになるかもしれない。

 などと書くと、「妄想でしょう」と言われそうだが、あながちそうでもないかもしれない(他にやる人が増えればか?)。私は、2023年11月にChatGPTがリリースされてすぐ、「モノを擬人化したラブストーリー」を書いてとお願いした。すると「このようなリクエストを受けたのは初めてですがやってみます」と答えてストーリーを書いてきたのだ。現在では「擬人化してストーリーを書いて」という要求に、黙って答えてくる。

 結果的に、国勢調査と国土地理院とドン・キホーテのデータをまとめたエクセルファイルがまずはできあがり、さらには、パワポファイルを書きだしてもらった。パワーポイントについても、Pythonには、「python-pptx」というライブラリがあるので、Code Interpreter は、それを実行して出力してきたわけだ。

 実際に生成したパワポでは、店舗数の多い/少ないのトップ5、「人口あたり」の多い/少ないのトップ5、「面積あたり」の多い/少ないのトップ5をあわせた6枚のスライドを出力。上記は、その例だが縦軸に人口あたりの小数点以下の桁数の多さや店舗数に「0.5」があるのは、いまのところご愛敬。こうしたことも対応していく可能性がある。

 また、これに関する所見として次のような「まとめ」を書きだしてきた。

 このデータ分析により、ドン・キホーテの店舗数が都道府県ごとにどのように分布しているかが明らかになりました。店舗数が多い都道府県は主に大都市圏に位置しており、特に愛知県が最も多くの店舗を擁しています。一方で、店舗数が少ない都道府県は主に地方の県で、特に四国や中国地方の県が目立ちます。これは都市部と地方部との間で人口や経済規模に大きな差があることを反映している可能性があります。

 また、人口あたりの店舗数や面積あたりの店舗数を見ると、店舗数の多い都道府県とは異なる傾向が見られます。これらの指標では、人口が比較的少ない県や面積が狭い県が上位にランクインしています。これは、ドン・キホーテが地方都市でも一定の市場を獲得していることを示しているかもしれません。

 この分析からは、ドン・キホーテの店舗展開戦略に地域間で一定の差があることが読み取れます。また、西日本の県では店舗数が全体的に少ない傾向があり、これは西日本に新たな店舗を開設する機会があることを示しているかもしれません。

 分かり切った分析といわれそうだが、知らない事柄については、このくらいシンプルなところからでいないと相手に伝わらない。

 おそらく、都道府県の人口と面積、ドン・キホーテの店舗数をまとめて表にするだけなら、ちょっと慣れた人なら1時間くらいでまとめてしまうのだと思う。今回、これだけのことをやるのに延々と時間がかかったのは、あまり効率的でないようにも見える。しかし、もっと分かりにくい大量の項目を名寄せしたい場合には、ChatGPTのCode Interpreterは、威力を発揮するはずである。

 なお、ChatGPTは、実行時のほんのちょっとした条件の違いで結果が変わるので、私と同じ結果にはならない可能性がある。今回は与えたデータの整合性に関しては難易度がやや高かったとも思える。

 こうしたオフィスワークのためのAIによる自動化や効率化は、マイクロソフトも提案しているし(Microsoft 365 Copilot)、ChatGPTの周辺ツールとしてエージェントと呼ばれる分野(AutoGPTやAgentGPT、BabyGPT)が成立している。明日、我々の仕事がすべて変わりはじめるわけではないが、未来の仕事のようすが少し見えはじめている

「AIは人の仕事を奪う」ではなく「AIはプログラムの存在をあやうくする」

 ところで、このようにして得られた結果というのは正しいのだろうか? 実は、間違っている可能性がおおいにある。今回の例くらいシンプルな問題なら、「全件」元データにあたって検証してみることができる(目的によってはサンプルでもよいだろう)。

 それが可能なくらい複雑にならないよう作業を分解して、ChatGPTにタスクを与えるべきである。今回も、1つファイルを追加するごとにエクセルファイルの中身を確認して、表全体ができてはじめて「こんなパワポを作ってほしい」とお願いした。「全自動化」とは書いたが、実際に全自動化できるとは思うが段階的にやるのが賢明というわけだ。

 大切なデータであれば、バリデーションという作業を行うのが当たり前である。たとえば、1つのデータを入力するときに二度にわたって別の人間が入力して、突き合せをする。ChatGPTは、人間みたいなものだから同じ作業を異なるアプローチでやってもらって比較するのもありだろう(あるいは別の人工知能と比べるか)。

 また、ChatGPTがコードを書いてそれを実行しているのがCode Interpreterなのだから、コードを書きだして保存・検証する方法もあるだろう。その際、彼は丁寧な解説をコメント付きのコードとともに書き出してくる。

 ChatGPTは「人間に理解を促す」ように作られていることは、もう少し理解されるべきだと思う

 ところで、ChatGPTの中身ともいえる大規模言語モデルGPT-4は、もともとマルチモーダルで画像を認識することもできる(一般ユーザーに開放されていないだけなのだ)。それが、今回、Code Interpreter では、ファイルのアップロードによって本当に部分的ではあるが可能になった(従来も裏技的なアプローチはあった)。また、GIFファイルの出力もできるあたりは、人に理解をうながすアニメを吐き出すのも時間の問題かもしれない。

 プログラマーが、鉛筆で描いたメモを見てChatGPTが仕事をする時代がくる。すでにそうしたGPT-4のデモ映像が知られている。データ構造、それをあつかうための基本的なアイデアや概念図など、「ことば」とともにさまざまな手段で、人工知能とのインタラクションができるようになりそうだ。

 しかし、そうした時代にプログラムというものをまだ人間は目にしているのだろうか? AIが、SFで描かれた世界のように世の中に直接関与することの是非は議論されている。「AIが人の仕事を奪う」という議論がされてきたが、「AIがプログラムの存在をあやうくする」ことになるかも知れない。将来的にプログラミング言語はAIと人間の合意のための言語になると思っているのではあるが。

 

遠藤諭(えんどうさとし)

 株式会社角川アスキー総合研究所 主席研究員。MITテクノロジーレビュー日本版 アドバイザー。プログラマを経て1985年に株式会社アスキー入社。月刊アスキー編集長、株式会社アスキー取締役などを経て、2013年より現職。人工知能は、アスキー入社前の1980年代中盤、COBOLのバグを見つけるエキスパートシステム開発に関わりそうになったが、Prologの研修を終えたところで別プロジェクトに異動。「AMSCLS」(LHAで全面的に使われている)や「親指ぴゅん」(親指シフトキーボードエミュレーター)などフリーソフトウェアの作者でもある。趣味は、カレーと錯視と文具作り。2018、2019年に日本基礎心理学会の「錯視・錯聴コンテスト」で2年連続入賞。その錯視を利用したアニメーションフローティングペンを作っている。著書に、『計算機屋かく戦えり』(アスキー)、『頭のいい人が変えた10の世界 NHK ITホワイトボックス』(共著、講談社)など。

Twitter:@hortense667

カテゴリートップへ

この連載の記事
1
【整備済み品】中古 ノートパソコン NEC VersaPro VKT16/15.6型・第8世代Core i5-8250U(最大動作3.4GHz)/快適メモリ8GB/ 高速SSD 256GB/Win11 Pro/MS Office 2019付属/テンキー付, Webカメラ, USB3.0, HDMI, VGA, 有線LAN, WIFI内蔵, Bluetooth/ACアダプター付属/180日間保証
【整備済み品】中古 ノートパソコン NEC VersaPro VKT16/15.6型・第8世代Core i5-8250U(最大動作3.4GHz)/快適メモリ8GB/ 高速SSD 256GB/Win11 Pro/MS Office 2019付属/テンキー付, Webカメラ, USB3.0, HDMI, VGA, 有線LAN, WIFI内蔵, Bluetooth/ACアダプター付属/180日間保証
¥26,880
2
【整備済み品】富士通 ノートパソコン LIFEBOOK U9310 13.3型FHD(1920x1080) 超軽薄 ノートPC/第10世代 Core i5-10310U@1.7GHz/ 8GB メモリ/高速ストレージ SSD/Webカメラ/WIFI/Type-C/HDMI/win11&MS Office 2019 搭載 ビジネス 在宅勤務向け パソコン (メモリ:8GB/SSD:256GB)
【整備済み品】富士通 ノートパソコン LIFEBOOK U9310 13.3型FHD(1920x1080) 超軽薄 ノートPC/第10世代 Core i5-10310U@1.7GHz/ 8GB メモリ/高速ストレージ SSD/Webカメラ/WIFI/Type-C/HDMI/win11&MS Office 2019 搭載 ビジネス 在宅勤務向け パソコン (メモリ:8GB/SSD:256GB)
¥36,979
3
HP ノートパソコン 15-fd 15.6インチ インテル Core Ultra 5 125H メモリ16GB SSD512GB Windows 11 Microsoft Office 2024搭載 WPS Office搭載 カメラシャッター 指紋認証 薄型 Copilotキー搭載 ナチュラルシルバー (BJ0M7PA-AAAF)
HP ノートパソコン 15-fd 15.6インチ インテル Core Ultra 5 125H メモリ16GB SSD512GB Windows 11 Microsoft Office 2024搭載 WPS Office搭載 カメラシャッター 指紋認証 薄型 Copilotキー搭載 ナチュラルシルバー (BJ0M7PA-AAAF)
¥134,377
4
Lenovo Chromebook クロームブック IdeaPad Flex 3i Gen8 12.2インチ インテル® プロセッサー N100搭載 メモリ4GB eMMC 64GB バッテリー駆動12.0時間 重量1.25kg アビスブルー 82XH001KJP
Lenovo Chromebook クロームブック IdeaPad Flex 3i Gen8 12.2インチ インテル® プロセッサー N100搭載 メモリ4GB eMMC 64GB バッテリー駆動12.0時間 重量1.25kg アビスブルー 82XH001KJP
¥39,800
5
Apple 2025 MacBook Pro 10 コアCPU、10 コアGPU のM5 チップ搭載ノートパソコン:Apple Intelligence のために設計、14.2 インチLiquid Retina XDR ディスプレイ、24GB ユニファイドメモリ、1TBのSSD ストレージ - スペースブラック
Apple 2025 MacBook Pro 10 コアCPU、10 コアGPU のM5 チップ搭載ノートパソコン:Apple Intelligence のために設計、14.2 インチLiquid Retina XDR ディスプレイ、24GB ユニファイドメモリ、1TBのSSD ストレージ - スペースブラック
¥296,323

Amazonのアソシエイトとして、ASCII.jpは適格販売により収入を得ています。

ASCII倶楽部

注目ニュース

  • 角川アスキー総合研究所

プレミアム実機レビュー

ピックアップ
1
KIOXIA(キオクシア) 旧東芝メモリ microSD 128GB UHS-I Class10 (最大読出速度100MB/s) Nintendo Switch動作確認済 国内サポート正規品 メーカー保証5年 KLMEA128G
KIOXIA(キオクシア) 旧東芝メモリ microSD 128GB UHS-I Class10 (最大読出速度100MB/s) Nintendo Switch動作確認済 国内サポート正規品 メーカー保証5年 KLMEA128G
¥1,880
2
Anker PowerLine III Flow USB-C & USB-C ケーブル Anker絡まないケーブル 240W 結束バンド付き USB PD対応 シリコン素材採用 iPhone 17 / 16 / 15 / Galaxy iPad Pro MacBook Pro/Air 各種対応 (1.8m ミッドナイトブラック)
Anker PowerLine III Flow USB-C & USB-C ケーブル Anker絡まないケーブル 240W 結束バンド付き USB PD対応 シリコン素材採用 iPhone 17 / 16 / 15 / Galaxy iPad Pro MacBook Pro/Air 各種対応 (1.8m ミッドナイトブラック)
¥1,890
3
【Amazon.co.jp限定】バッファロー microSD 32GB 100MB/s UHS-1 U1 microSDHC【 Nintendo Switch 対応 】V10 A1 IPX7 Full HD RMSD-032U11HA/N
【Amazon.co.jp限定】バッファロー microSD 32GB 100MB/s UHS-1 U1 microSDHC【 Nintendo Switch 対応 】V10 A1 IPX7 Full HD RMSD-032U11HA/N
¥980
4
Anker USB Type C ケーブル PowerLine USB-C & USB-A 3.0 ケーブル iPhone 17 / 16 / 15 /Xperia/Galaxy/LG/iPad Pro/MacBook その他 Android 等 USB-C機器対応 テレワーク リモート 在宅勤務 0.9m ホワイト
Anker USB Type C ケーブル PowerLine USB-C & USB-A 3.0 ケーブル iPhone 17 / 16 / 15 /Xperia/Galaxy/LG/iPad Pro/MacBook その他 Android 等 USB-C機器対応 テレワーク リモート 在宅勤務 0.9m ホワイト
¥740
5
Anker iPhone充電ケーブル PowerLine II ライトニングケーブル MFi認証 超高耐久 iPhone 14 / 14 Pro Max / 14 Plus / 13 / 13 Pro / 12 / 11 / X/XS/XR / 8 Plus 各種対応 (0.9m ホワイト)
Anker iPhone充電ケーブル PowerLine II ライトニングケーブル MFi認証 超高耐久 iPhone 14 / 14 Pro Max / 14 Plus / 13 / 13 Pro / 12 / 11 / X/XS/XR / 8 Plus 各種対応 (0.9m ホワイト)
¥990
6
【Amazon.co.jp限定】 ロジクール 静音 ワイヤレス トラックボール マウス M575SPd Bluetooth Logibolt 無線 windows mac iPad OS Chrome トラックボールマウス ブラック M575 M575SP 国内正規品 ※Amazon.co.jp限定 壁紙ダウンロード付き
【Amazon.co.jp限定】 ロジクール 静音 ワイヤレス トラックボール マウス M575SPd Bluetooth Logibolt 無線 windows mac iPad OS Chrome トラックボールマウス ブラック M575 M575SP 国内正規品 ※Amazon.co.jp限定 壁紙ダウンロード付き
¥5,280
7
KIOXIA(キオクシア)【日本製】USBフラッシュメモリ 32GB USB2.0 国内サポート正規品 KLU202A032GL
KIOXIA(キオクシア)【日本製】USBフラッシュメモリ 32GB USB2.0 国内サポート正規品 KLU202A032GL
¥699
8
キヤノン Canon 純正 インクカートリッジ BCI-381(BK/C/M/Y)+380 5色マルチパック BCI-381+380/5MP 長さ:5.3cm 幅:13.9cm 高さ:10.75cm
キヤノン Canon 純正 インクカートリッジ BCI-381(BK/C/M/Y)+380 5色マルチパック BCI-381+380/5MP 長さ:5.3cm 幅:13.9cm 高さ:10.75cm
¥5,545
9
バッファロー SDカード 128GB 100MB/s UHS-1 スピードクラス1 VideoSpeedClass10 IPX7 Full HD データ復旧サービス対応 RSDC-128U11HA/N
バッファロー SDカード 128GB 100MB/s UHS-1 スピードクラス1 VideoSpeedClass10 IPX7 Full HD データ復旧サービス対応 RSDC-128U11HA/N
¥1,980
10
バッファロー USBメモリ 32GB USB3.2(Gen1)/3.1(Gen 1)/3.0/2.0 充実サポート RUF3-K32GA-BK/N
バッファロー USBメモリ 32GB USB3.2(Gen1)/3.1(Gen 1)/3.0/2.0 充実サポート RUF3-K32GA-BK/N
¥880

Amazonのアソシエイトとして、ASCII.jpは適格販売により収入を得ています。

デジタル用語辞典

ASCII.jpメール デジタルMac/iPodマガジン