本記事はFIXERが提供する「cloud.config Tech Blog」に掲載された「【令和最新版】爆速で英語論文を理解するには?ハウツーがここにあります【GPT-4o】」を再編集したものです。
やりたいこと
英語論文って、読むの疲れませんか。
僕は英語力がヘボいこともあって、めちゃ疲れます。
英語を勉強するのは、それはそれでやらないといけないんですけど、手っ取り早く読みたい。
そういう時は、世間を賑わせているGPT-4oなどのLLMに読ませればいいのです。
効率的に論文を読んで、効率的に知識を増やしましょう!
使うツール
・ChatGPT 4o
今回使う主なツール。無料でも使えます(1日の利用上限あり)
感謝の気持ちも込めて課金するのは全然アリ
・SCISPACE
論文を検索・保存・メモするのに使います
こちらにもAIベースの論文要約機能はありますが、日本語が弱いです(僕調べ)
論文を食わせる
まずは、読みたい論文のPDFを用意します。
今回は僕が今読んでる論文「3D Gaussian Splatting for Real-Time Radiance Field Rendering」を読んでみましょう。
ChatGPT 4o
画面下部のクリップのボタンを押します。
すると、エクスプローラーが起動するので、読みたい論文のPDFを選択するだけです。
選択したら、日本語で 「概要を教えて」 とでも付け加えておきましょう。
そうすると勝手に日本語で論文の解説をし始めます。
SciSpace
大概の論文は、タイトルを検索すると出てきます。
例えば、この前紹介した「Pyramid Texture Filtering」を調べてみましょう。
すると、検索結果からブックマークや引用コピーなどができます。以下のボタンを押すと、ブックマークできますよ。
検索しても出てこない論文は、PDFをアップロードして保存しておくこともできます。
左のタブからLibraryを選択して、表示された画面の右にある Upload PDFs からアップロードできます。
保存した論文は、文章選択をしてメモを残したり、AIに要約させたりすることができます。
他にも色んな機能があるので、ぜひ試してみてくださいね。
前提知識を得る
論文を理解するためには、その研究の背景となる最低要件の知識が必要です。
まずは、その知識を得ることから始めましょう。
GPT 4oにこの研究を理解するための前提知識を挙げてと聞いてみます。
すると、こんな風に知っておくべき知識を挙げてくれます。
次に、挙げてくれたものの中でわからないものを続けて聞いてみます。ここではSfMについて聞いてみましょう。
このように、わからない技術の概要や応用、処理手順を教えてくれます。まずはこのように、前提知識の習得を行いましょう。
内容を素早く掴む
この記事を読むような人はご存知だと思いますが、論文は主に以下のような構成で流れていきます。
1.Abstract
1.提案手法の特徴、解決される問題、従来手法との違いが簡潔に語られる
2.はじめに
1.Abstractの内容がもう少し掘り下げられる
3.従来手法
1.提案手法の背景となる技術について語られる
4.提案手法
1.手法の具体的なステップ、処理手順が語られる
5.実験・考察
1.実験結果や、考察が語られる
6.まとめ
1.この手法でどのような問題が解決されたか、残された問題などについてまとめている
普通の本などだと、最初のページから順番に読んでいきますよね。しかし論文の場合は、もっと効率的に読む順番があります。
以下の順番は僕の個人的感想です。
具体的には、「Abstract」→「はじめに」→「画像」→「まとめ」→「従来手法」→「提案手法」→「実験・考察」です。
まず、Abstractを読んで、その研究が何をしてる研究なのかを簡単に理解します。この際、前提知識を得る で得た知識があるとスムーズに理解できるはずです。
最初に 概要を教えて と質問しているので、そこを読めば大丈夫です。
次に「はじめに」に該当する箇所を読んでみましょう。3D Gaussian Splatting for Real-Time Radiance Field Rendering だと 1 INTRODUCTION が該当します。
読んでいてわからない箇所は、適宜質問しましょう。
「Abstract」と「はじめに」を読めば、その研究の大体の内容は掴むことができます。
画像を見る
次に画像を眺めることで「はじめに」の内容がイメージしやすくなります。
例えば本論文のFig2を見ると、この研究の大まかな処理の流れがイメージできます。
GPT 4oは画像も理解できるので、質問すれば内容も教えてくれます。
こんな感じで、提案手法や実験・考察に載っている画像を順に見ていってみましょう。
「まとめ」を読む
「まとめ」を読むことで、この研究で実現できたこと・できなかったことを知ることができます。
本論文ですと8 DISCUSSION AND CONCLUSIONSが該当します。
ここまで読めば研究の大体の内容を理解できているので、あとは読んでいない章を読みましょう。
概要はわかっているので、スムーズに読めるはずです!
まとめ
近年、発展が目覚ましいLLMのチカラで研究のやり方は大きな変革期を迎えていると思います。
数年前ですと、泥臭くDeepLなどとにらめっこしながら読んでいた英論文も、ChatGPTなどを使用すれば自分だけの担当教授と一緒に読んでいる感覚で読めます。
このように、最新技術の力を借りながら研究も加速させていきましょう!
参考文献
・Kerbl, Bernhard, et al. "3d gaussian splatting for real-time radiance field rendering." ACM Transactions on Graphics 42.4 (2023): 1-14.
・ChatGPT.「ChatGPT」, (2024-05-20 参照).
・SciSpace.「AI Chat for scientific PDFs | SciSpace」, (2024-05-20 参照).
レイチェル琥珀
大学院時代はUnityとPythonを使って、コンピュータグラフィックス・機械学習の研究を行っていました。
就職後は、COBOL→Java変換の自動化技術を開発しています。
現在はCG・画像処理・AI技術の学び直し中です。
この連載の記事
-
TECH
生成AIに感謝を伝えると回答精度が向上する? GaiXerで検証した -
TECH
生成AIアシスタントのAmazon QにS3のデータソースを連携する方法 -
TECH
LLMをローカルPCで動かし“話し相手”を作ってみた結果…… -
TECH
インスタグラムのエフェクトを「Meta Spark Studio」で自作してみた -
TECH
インスタエフェクト自作第二弾!“小顔デカ目効果”を作る -
TECH
RAGの基礎知識を得て“ゼロ円RAGシステム”を構築してみた -
TECH
Microsoft Fabricを触ってデータサイエンスに超入門してみた! -
TECH
LLM活用はチャットだけじゃない、自由記述文を共通フォーマットに落とし込む方法を学んだ -
TECH
Gemini 1.5 Proの特徴とは? Gemini API経由で試す -
TECH
Azure OpenAIの便利な「jsonモード」の使い方&制限事項 -
TECH
生成AIのClaude 3に本格的なコーディングをさせるプロンプトを作った - この連載の一覧へ