ChatGPT「Advanced Data Analysis(旧Code Interpreter)」でデータ分析!使い方や活用事例・料金について徹底解説
2023年7月、ChatGPTの有料版(ChatGPT Plus)を利用しているユーザーに向けて、新機能「Advanced Data Analysis(旧Code Interpreter)」の提供を開始しました。
「Advanced Data Analysis」とは、ChatGPT-4が提供する高度なデータ分析機能です。
例えば、売上データを管理しているExcelをアップロードして、ChatGPTにそのデータを使ってデータ分析やグラフ作成を依頼できます。
従来は有料ユーザーのみが使える機能でしたが、現在(2024年6月4日時点)は、ChatGPT-4oを利用すれば、無料ユーザーもこの機能を利用できます。
この記事では、ChatGPT「Advanced Data Analysis」の始め方や使い方といった基本的な情報に加え、実際のデータ分析における具体的な活用事例について詳しく紹介します。
Advanced Data Analysis(旧Code Interpreter)とは
「Advanced Data Analysis」とは、ChatGPT-4が提供する高度なデータ分析機能です。
従来は「Code Interpreter」として提供されていましたが、現在は「Advanced Data Analysis」として拡張されています。
ユーザーがChatGPTのチャット上にアップロードしたデータに対して、クリーニング、探索的データ分析、高度な分析などを行い、分析結果をグラフやチャートで可視化します。
自然言語によるPythonコードの生成も行えるため、コードの知識がない人もPythonコードを生成できるのが強みです。
データ分析も自然言語のみで実行でき、作業結果はcsvなどでダウンロードできます。
さらに、QRコードの生成、PDFの翻訳や要約も行えます。
幅広い用途で活用でき、業務の効率化が見込める優れた機能です。
詳しい仕組みについては、以下のサイトで解説されているので、気になる方はこちらも参考にしてみてください!
現在、「Advanced Data Analysis」はChatGPT Proに加入していない方でも、一定の回数は利用可能ですので、ぜひ試してみてください。
また、2023年9月にこのChatGPTの機能である「Advanced Data Analysis」とほぼ同じ機能をローカルで使える「Open Interpreter」というオープンソースが公開されて話題となっています。
「Advanced Data Analysis」をもっと使いたい方や、ローカル環境でも同じ機能を使いたい方は、「Open Interpreter」もぜひチェックしてみてください。
以下のページでは始め方や使い方、さらには実際に「Open Interpreter」を使ってデータ分析をしてみた結果も解説していますので、こちらも併せてご覧ください。
Advanced Data Analysisの始め方
Advanced Date Analysisは、ChatGPT-4以上に装備されている機能です。
GPT-4は有料版のみに提供されていますが、GPT-4oは無料ユーザーも利用できます。
始めるのに特別な設定は必要ありません。
チャット欄に自然言語で語り掛けるだけでAdvanced Date Analysisが利用できます。
以下は、実際に無料プランで試してみたものです。
無料プランでも自然言語で簡単にQRコードが生成できました。
同様に、自然言語でデータ分析なども実行できます。
ただし、無料プランではGPT-4oを3時間に10回までしか利用できません。
もっと使いたい場合は、ChatGPTの有料版であるChatGPT Plus(月額20ドル)への加入が必要です。
GPT-4oについて詳しくはこちらの記事をあわせてどうぞ。
Advanced Data Analysisの料金
ChatGPTでAdvanced Data Analysisは無料プランでも利用できます。
ただし、2024年6月現在、無料プランユーザーは3時間10回という回数制限があるため、さらに使いたい場合は、ChatGPTの有料版であるChatGPT Plus(月額20ドル)への加入が必要です。
Advanced Data Analysisで何ができるのか
何となく便利そうなのは伝わったと思いますが、結局一番気になるのは「Advanced Data Analysis」を使って何ができるのかですよね
「Advanced Data Analysis」の一番の凄いところは、ChatGPT上にファイルのアップロードやダウンロードができるようになった点です。
これにより、ChatGPTにデータ分析や画像の編集、動画の加工など、さまざまな領域の作業を依頼できるようになりました。
例えば、売上データを含むCSVファイルをアップロードすれば、そのデータを基に売上の低下原因を分かりやすいグラフを用いて分析してくれます。
さらに、プレゼンテーションの資料作成が必要な場合でも、ChatGPTに指示すればPowerPoint形式で資料を自動作成してくれます。
手作業でやるとかなり時間がかかる、このようなGIFも一瞬で作ってくれます。
Google DriveやMicrosoft OneDriveのファイルを直接分析
新しいデータ分析機能として、Google DriveやMicrosoft OneDriveから直接ファイルを取り込む機能が追加されています。
利用できるのは有料プランのユーザーが使うGPT-4oモデルです。
データをアップロードすることなく、Google Drive、またはMicrosoft OneDriveからファイルを直接追加できます。
そのため、Google スプレッドシート・ドキュメント・スライド、Microsoft Excel・Word、PowerPoint のファイルのデータ分析がさらに便利になりました。
セキュリティとプライバシーにも配慮されており、Team及びEnterpriseプランのデータは、モデルのトレーニングに使用されません。また、ChatGPT Plusのユーザーは、「データコントロール画面」でデータがトレーニングに使用されることをオプトアウト(拒否)できます。
参照:Improvements to data analysis in ChatGPT
Advanced Data Analysisの具体的な使い方や活用事例
ここからは具体的な使い方や活用事例について紹介します。
店舗の売上データの分析
こちらの記事ではアパレル店舗の売上データの分析をChatGPTを用いてどれだけ簡単かつ迅速に行えるのかを具体的な実例を交えて詳しく紹介しています。
ChatGPTが自ら売上データを分析して、最終的にはどんなアクションを取れば良いかまで教えてくれている一連の流れを実際のやりとりのスクショと共に解説されています。
予測モデルの作成
「Advanced Data Analysis(旧Code interpreter)」を使えば、過去のデータから未来のデータを予測する予測モデルの作成も可能です。
こちらの記事では、「Advanced Data Analysis(旧Code interpreter)」を使って予測モデルを作成して、データ分析の大会で平均以上の成績を出した様子が書かれています。
まだデータサイエンティストのような専門家が本気で作った予測モデルには精度では勝てないですが、プログラミングについての知識がなくても予測モデルを作成ができるのは驚きですね。
Netflixのデータ解析
こちらの記事では、「Advanced Data Analysis(旧Code interpreter)」を使ってNetflixの世界の視聴ランキングデータを元に、日本の人気作品や日本製のNetflixオリジナル作品が他の国でどれだけ人気があるかを分析しています。
Excelで行うと時間がかかるような分析も「Advanced Data Analysis(旧Code interpreter)」を使うことで誰でも簡単にできるようになる良い例ですね!
ツイートからの人物プロファイル推定
こちらの記事では、ユーザーが自身のTwitterの全ツイートデータを「Advanced Data Analysis(旧Code interpreter)」に分析させ、そのユーザーの人物像を推測できるのかを検証する実験を行っています。
最終的には、ユーザーの職業や年齢、家族構成などを高い精度で推測できており、「Advanced Data Analysis(旧Code interpreter)」の分析能力の高さを物語る結果となっています。
EXCELの集計・編集
この記事では、大量のExcelデータを迅速に集計、分析するための方法を「Advanced Data Analysis(旧Code interpreter)」を用いて具体的に紹介しています。
複数のファイルに散らばったデータを1つにまとめ、Excelでの集計作業はもちろんのこと、グラフの作成までを「Advanced Data Analysis(旧Code interpreter)」に丸投げしている様子は、これからの仕事の仕方が大きく変わることを確信させてくれます。
ダミーデータの作成
この記事では、リアルなテストデータが必要な場面で、実際のデータを使用することができない場合に「Advanced Data Analysis(旧Code interpreter)」を使用してどのようにダミーデータを簡単に生成できるのかを詳細に紹介しています。
データの構造や条件を指定するだけで、リアルに近いデータを大量に生成することが可能なので、開発やテスト作業の時に役立ちます。
音声データの解析
この記事では、「Advanced Data Analysis(旧Code interpreter)」を使えば専門的な知識がなくても音声ファイルの様々な処理が可能であることを紹介しています。
具体的には、音声ファイルのトリミング、再生速度の変更、音源の波形の確認、そしてスペクトログラムの作成といった一連の作業を、特別なコードを書くことなく行う方法を詳しく解説しています。
画像データの解析
この記事では、「Advanced Data Analysis(旧Code interpreter)」を使った画像処理について詳しく解説されています。
具体的には、画像のフォーマットの変更、RGB画像のグレースケールへの変換、特定のテーマに基づく画像処理、さらには物体の輪郭検出など、多岐にわたる処理を実施する方法を実例とともに解説されています。
プレゼン資料作成
この記事では、「Advanced Data Analysis(旧Code interpreter)」にプレゼン資料を作ってもらう方法が紹介されています。
作りたいプレゼン資料のテーマと内容を説明するだけで、資料の構成と内容を考えて、その内容に沿ったプレゼン資料を作成してくれるので、普段からプレゼン資料を作る機会が多い人は必見です!
Webアプリの作成
この記事では、「Advanced Data Analysis(旧Code interpreter)」を活用して、手軽にwebアプリを開発する方法を詳しく取り上げています。
ChatGPTとの具体的なやり取りや実際に使用したコードも紹介されており、本当に1行も書かずにwebアプリが作成できている様子の一部始終を見ることができます。
QRコードの生成
QRコードの生成をチャットで依頼するだけで、簡単にQRコードが生成できます。
こちらがダウンロードしたQRコードです。簡単ですので是非、試してみてください。
Advanced Data Analysisを現役データサイエンティストが実際に使ってみた素直な感想
現役データサイエンティストである筆者が「Advanced Data Analysis(旧Code interpreter)」をリリース開始直後から実際に使った素直な感想です。
良かった点
「めっちゃ凄い!!!!」というが正直な感想です。
これまでの分析ツールと異なり、やりたいことをざっくりとチャット形式で伝えるだけで良いという使いやすさは、データ分析の専門家でない人でも非常に使いやすいなと思いました。
また、データ分析の専門家であっても、初期分析や探索的な分析、可視化などをChatGPTに依頼することで分析の効率が大幅に上がることは間違いありません。
そして、「Advanced Data Analysis(旧Code interpreter)」の最も素晴らしい点は、「ChatGPT上でコードが実行できる」ことです。
これまでにもデータ分析が可能なツールは存在しましたが、結果の最終的な解釈は人間が行う必要がありました。
しかしながら、「Advanced Data Analysis(旧Code interpreter)」では、カラム名やデータの特徴、そして結果からChatGPTが自らデータを解釈し、既に学習済みの膨大なデータを元に考察を行なってくれるのです。
例えば、一般的なAIや機械学習ツールであれば、「年齢と給与には相関関係があり、年齢が高いほど給与も高い」といった結果を出力できます。しかし、その結果を解釈し、意味を理解することは難しいです。
しかし、ChatGPTは事前に様々な情報を学習しているため、「年齢が高いほど給与も高いのは一般的な状況と同じである」といった一般論と比較して結果を考察してくれます。
これは他のツールでは得られない特徴であり、非常に価値があると感じました。
つまり「Advanced Data Analysis(旧Code interpreter)」はデータを与えれば自動で分析して、データから分かることを教えて示唆を出してくれる、全ビジネスマンガ望んだツールになる可能性があるということです!!
イマイチな点
まず第一にGPT-4の利用制限が厳しいです。
2024年6月現在はGPT-4oは有料版(GPT-PRO)でも、3時間で50メッセージ、GPT-4で3時間当たり40メッセージの利用制限があるため、実際の分析作業においてはすぐに到達してしまいます。
加えて、制限解除の3時間後に分析を再開しようとすると、アップロードしたデータが消去されているので、再度データのアップロードから行う必要があります。このため、実質的な利用制限はさらに厳しく感じます。
加えてに、メモリ制限も結構シビアです。
データは最大で512MBまでアップロードできますが、100MB程度のデータで特徴量を増やすだけで、すぐにメモリ不足に陥ってしまいます。
なので現状では、これらの制約のため、大規模なデータセットを使用した複雑なデータ分析にはまだ使えないですね
しかし、これらの制限が解消され、さらに自分の分析環境に接続できたり、直接データベースにアクセスできるようになったら、GPT-4はデータサイエンティストの代替になる可能性は充分あると思います。
さらに、ChatGPTはデータ分析の専門家ではないので、分析部分をAutoMLやDataRobotのような高度なAIモデル作成ツールと組み合わせることができれば、さらに便利になることは間違いなしです!
また、2023年9月にこのChatGPTの機能である「Advanced Data Analysis」とほぼ同じ機能がローカルで使える「Open Interpreter」というオープンソースが公開されて話題となっています。
もし、「Advanced Data Analysis」は使ってみたいけど、ChatGPT Proに入っていない人やローカルでも同じ機能を使いたいという人はこちらもぜひチェックしてみてください
以下のページでは始め方や使い方、さらには実際に「Open Interpreter」を使ってデータ分析をしてみた結果も解説していますので、こちらも併せてご覧ください。
Advanced Data Analysisに関するQ&A
Advanced Data Analysisに関するよくある質問をまとめました。
実は危険?アップロードしたデータの流出の可能性はある?
Open AI社は「Advanced Data Analysis」のプライバシーとセキュリティについては、最大限の配慮をしていると述べています。
ですが、現時点では絶対安全という保証はないので、機密情報や個人情報のアップロードは避けた方が良いでしょう。
ファイルのアップロードサイズの上限と種類は?
512MBまでのCSV、Excel、PDF、GIFs、動画、画像などファイルをアップロードできます。
アップロードできる主なファイルは以下の通りです
- テキストファイル(.txt)
- Python スクリプト(.py)
- Jupyter ノートブック(.ipynb)
- CSV ファイル(.csv)
- Excel ファイル(.xls, .xlsx)
- 画像ファイル(.jpeg, .jpg, .png, .gif, .bmp など)
- PDF ファイル(.pdf)
- ZIP ファイル(.zip)
- 動画ファイル(.mp4, .avi, .movなど)
- GIFファイル(.gif)
生成したソースコードはダウンロードできる?
作成してもらったコードを.py形式で出力するできるので、同じコードをローカルで実行することもできます。
Python以外のプログラミング言語は実行できる?
2024年6月現在、「Advanced Data Analysis」はPythonのみ実行可能です。
Pythonの実行環境は?
Pythonの実行にはOpenAIのサンドボックス環境が使用されています。具体的なバージョンは2024年6月現在でPythonのバージョン:3.11.8です。
インストールされているライブラリは以下の通りです。
- インストールされているライブラリ(クリックして開く)
-
absl-py==1.4.0 affine==2.4.0 aiohttp==3.8.1 aiosignal==1.3.1 analytics-python==1.4.post1 anyio==3.7.1 anytree==2.8.0 argcomplete==1.10.3 argon2-cffi==21.3.0 argon2-cffi-bindings==21.2.0 arviz==0.15.1 asttokens==2.2.1 async-timeout==4.0.2 attrs==23.1.0 audioread==3.0.0 Babel==2.12.1 backcall==0.2.0 backoff==1.10.0 backports.zoneinfo==0.2.1 basemap==1.3.2 basemap-data==1.3.2 bcrypt==4.0.1 beautifulsoup4==4.12.2 bleach==6.0.0 blinker==1.6.2 blis==0.7.9 bokeh==2.4.0 branca==0.6.0 Brotli==1.0.9 cachetools==5.3.1 cairocffi==1.6.0 CairoSVG==2.5.2 camelot-py==0.10.1 catalogue==2.0.8 certifi==2019.11.28 cffi==1.15.1 chardet==4.0.0 charset-normalizer==2.1.1 click==8.1.4 click-plugins==1.1.1 cligj==0.7.2 cloudpickle==2.2.1 cmudict==1.0.13 comm==0.1.3 compressed-rtf==1.0.6 countryinfo==0.1.2 cryptography==3.4.8 cssselect2==0.7.0 cycler==0.11.0 cymem==2.0.7 dill==0.3.6 deprecat==2.1.1 defusedxml==0.7.1 decorator==4.4.2 debugpy==1.6.7 dnspython==2.3.0 docx2txt==0.8 distro-info==0.23ubuntu1 idna==2.8 unattended-upgrades==0.1 six==1.14.0 setuptools==45.2.0 requests-unixsocket==0.2.0 python-apt==2.0.1+ubuntu0.20.4.1 PyGObject==3.36.0 PyAudio==0.2.11 pip==20.0.2 urllib3==1.25.8 wheel==0.34.2
- インターネットに接続されていないため、外部APIにリクエストを送信したり、Webスクレイピングを行ったりすることはできません。
- 実行時間には制限があり、特定のコードセルの実行が120秒以上かかると、タイムアウトとなります。
- メモリ使用量やCPU使用量には制限があります。
- アップロードしたファイルやダウンロードファイルは一定時間終了すると削除されます。
プライバシー保護やセキュリティについて
Open AI社は公式サイトにて「Advanced Data Analysis」のプライバシーとセキュリティについては、最大限の配慮をしていると述べています。
具体的には、AIが生成したコードが現実世界で予期しない影響を及ぼさないよう、コードは安全な環境で実行され、インターネットへのアクセスも制限しており、各セッションで使用できるリソースの量にも制限を設けています。
ただ、Advanced Data AnalysisはcsvやExcelのデータをアップロードできるので、アップロードした後のデータの取り扱いなども把握しておく必要があり、機密情報や個人情報のアップロードは避けた方が良いでしょう。
まとめ
以上、ChatGPTプラグイン「Advanced Data Analysis」のスゴすぎる活用事例を中心に紹介しました。
どの活用事例を見ても、多くの業界や職種で今後の働き方が大きく変わる予感がしますね!
この先、ChatGPTを使いこなすことで仕事の生産性が大きく変わると考えられるため、早めに慣れておくことが重要です。
もし他に良い活用事例があれば追記していきます!
それでは!
「Advanced Data Analysis」を使って、プログラミングの生産性を爆上げる方法は以下のページで紹介しているので、こちらもぜひ参考にしてみてください!