ゼロから始めるChatGPT「Advanced Data Analysis(旧Code Interpreter)」-始め方や使い方・料金を徹底解説

2023年7月、ChatGPTの有料版(ChatGPT Plus)を利用しているユーザーに向けて、新機能「Advanced Data Analysis(旧Code Interpreter)」のベータ版の提供を開始しました。
この新機能「Advanced Data Analysis」を利用することで、ユーザーはChatGPT上でファイルをアップロード・ダウンロードをして、そのファイルに対してChatGPTに様々なタスクの依頼や質問ができるようになります。
例えば、売上データを管理しているExcelをアップロードして、ChatGPTにそのデータを使ってデータ分析やグラフ作成をお願いすることが可能になります。
そこでこちらの記事では、ChatGPT「Advanced Data Analysis」の始め方や使い方といった基本的なことはもちろんのこと、実際のデータ分析においてどのように活用できるかを含む具体的な活用事例まで詳しく紹介しています。
Advanced Data Analysis(旧Code Interpreter)とは

「Advanced Data Analysis」とは、ChatGPTが提供する公式プラグインの1つで、このプラグインを利用することで、ChatGPT上でPythonを使ったコードの実行や、ファイルのアップロード・ダウンロードができるようになります。
ファイルのアップロード機能を使うことで、チャット上にデータをアップロードし、そのデータに対してコードを実行することができるようになります。
また、作業の結果をcsvなどでダウンロードすることが可能です。
つまり、Code interpreterのプラグインを使うことで、ChatGPT上でPythonコードを実行したり、ファイルのやり取りを行うことができるようになり、今まで以上にChatGPTが便利になるということです。
詳しい仕組みについては、以下のサイトで解説されているので、気になる方はこちらも参考にしてみてください!

また、2023年9月にこのChatGPTの機能である「Advanced Data Analysis」とほぼ同じ機能がローカルで使える「Open Interpreter」というオープンソースが公開されて話題となっています。
もし、「Advanced Data Analysis」は使ってみたいけど、ChatGPT Proに入っていない人やローカルでも同じ機能を使いたいという人はこちらもぜひチェックしてみてください
以下のページでは始め方や使い方、さらには実際に「Open Interpreter」を使ってデータ分析をしてみた結果も解説していますので、こちらも併せてご覧ください。

Advanced Data Analysisの始め方
ChatGPTでCode interpreterを利用するためには、まずはChatGPTの有料版であるChatGPT Plus(月額20ドル)に加入する必要があります。
今後のアップデートによって無料版のChatGPTでもCode interpreterが利用できるようになる可能性はありますが、2023年8月現在はCode interpreterを利用するためには、必ずChatGPT Plusに加入する必要があります。

また、ChatGPT Plusに加入しているユーザーでも、Code interpreterの利用を開始するためにはChatGPTの設定画面から、機能をONにする必要があります。

機能をONにしたら、チャット画面でGPT4を選択後に「Code interpreter」を選択することで利用ができるようになります。

チャット入力欄でファイルがアップロードできるようになっているので、そこからファイルをアップロードしてChatGPTにそのファイルについての質問や指示が可能になります。
Advanced Data Analysisの料金

ChatGPTでCode interpreterを利用するためには、ChatGPTの有料版であるChatGPT Plus(月額20ドル)に加入する必要があります。
ChatGPT Plusに加入しているユーザーであれば、追加料金なしでCode interpreterの利用が可能ですが、逆にChatGPT Plusに入らず「Code interpreter」だけを利用することはできません。
Advanced Data Analysisで何ができるのか
何となく便利そうなのは伝わったと思いますが、結局一番気になるのは「Code interpreter」を使って何ができるのかですよね
「Code interpreter」の一番の凄いところは、ChatGPT上にファイルのアップロードやダウンロードができるようになった点です。
これにより、ChatGPTにデータ分析や画像の編集、動画の加工など、さまざまな領域での作業をお願いできるようになりました。

例えば、売上データを含むCSVファイルをアップロードすれば、そのデータを基に売上の低下原因を分かりやすいグラフを用いて分析してくれます。
さらに、プレゼンテーションの資料作成が必要な場合でも、ChatGPTに指示すればPowerPoint形式で資料を自動作成してくれます。
手作業でやるとかなり時間がかかる、このようなGIFも一瞬で作ってくれます。

具体的な使い方や活用事例
ここからは具体的な使い方や活用事例についてご紹介していきます。
店舗の売上データの分析

こちらの記事ではアパレル店舗の売上データの分析をChatGPTを用いてどれだけ簡単かつ迅速に行えるのかを具体的な実例を交えて詳しく紹介しています。
ChatGPTが自ら売上データを分析して、最終的にはどんなアクションを取れば良いかまで教えてくれている一連の流れを実際のやりとりのスクショと共に解説されています。
予測モデルの作成

「Code interpreter」を使えば、過去のデータから未来のデータを予測する予測モデルの作成も可能です。
こちらの記事では、「Code interpreter」を使って予測モデルを作成して、データ分析の大会で平均以上の成績を出した様子が書かれています。
まだデータサイエンティストのような専門家が本気で作った予測モデルには精度では勝てないですが、プログラミングについての知識がなくても予測モデルを作成ができるのは驚きですね。
Netflixのデータ解析

こちらの記事では、「Code interpreter」を使ってNetflixの世界の視聴ランキングデータを元に、日本の人気作品や日本製のNetflixオリジナル作品が他の国でどれだけ人気があるかを分析しています。
Excelで行うと時間がかかるような分析も「Code interpreter」を使うことで誰でも簡単にできるようになる良い例ですね!
ツイートからの人物プロファイル推定

こちらの記事では、ユーザーが自身のTwitterの全ツイートデータを「Code Interpreter」に分析させ、そのユーザーの人物像を推測できるのかを検証する実験を行っています。
最終的には、ユーザーの職業や年齢、家族構成などを高い精度で推測できており、「Code Interpreter」の分析能力の高さを物語る結果となっています。
EXCELの集計・編集

この記事では、大量のExcelデータを迅速に集計、分析するための方法を「Code Interpreter」を用いて具体的に紹介しています。
複数のファイルに散らばったデータを1つにまとめ、Excelでの集計作業はもちろんのこと、グラフの作成までを「Code Interpreter」に丸投げしている様子は、これからの仕事の仕方が大きく変わることを確信させてくれます。
ダミーデータの作成

この記事では、リアルなテストデータが必要な場面で、実際のデータを使用することができない場合に「Code Interpreter」を使用してどのようにダミーデータを簡単に生成できるのかを詳細に紹介しています。
データの構造や条件を指定するだけで、リアルに近いデータを大量に生成することが可能なので、開発やテスト作業の時に役立ちます。
音声データの解析

この記事では、「Code Interpreter」を使えば専門的な知識がなくても音声ファイルの様々な処理が可能であることを紹介しています。
具体的には、音声ファイルのトリミング、再生速度の変更、音源の波形の確認、そしてスペクトログラムの作成といった一連の作業を、特別なコードを書くことなく行う方法を詳しく解説しています。
画像データの解析

この記事では、「Code Interpreter」を使った画像処理について詳しく解説されています。
具体的には、画像のフォーマットの変更、RGB画像のグレースケールへの変換、特定のテーマに基づく画像処理、さらには物体の輪郭検出など、多岐にわたる処理を実施する方法を実例とともに解説されています。
プレゼン資料作成

この記事では、「Code Interpreter」にプレゼン資料を作ってもらう方法が紹介されています。
作りたいプレゼン資料のテーマと内容を説明するだけで、資料の構成と内容を考えて、その内容に沿ったプレゼン資料を作成してくれるので、普段からプレゼン資料を作る機会が多い人は必見です!
Webアプリの作成

この記事では、「Code Interpreter」を活用して、手軽にwebアプリを開発する方法を詳しく取り上げています。
ChatGPTとの具体的なやり取りや実際に使用したコードも紹介されており、本当に1行も書かずにwebアプリが作成できている様子の一部始終を見ることができます。
現役データサイエンティストが実際に使ってみた素直な感想
現役データサイエンティストである筆者が「Code interpreter」をリリース開始直後から実際に使った素直な感想です。
良かった点
「めっちゃ凄い!!!!」というが正直な感想です。
これまでの分析ツールと異なり、やりたいことをざっくりとチャット形式で伝えるだけで良いという使いやすさは、データ分析の専門家でない人でも非常に使いやすいなと思いました。
また、データ分析の専門家であっても、初期分析や探索的な分析、可視化などをChatGPTに依頼することで分析の効率が大幅に上がることは間違いありません。
そして、「Code interpreter」の最も素晴らしい点は、「ChatGPT上でコードが実行できる」ことです。
これまでにもデータ分析が可能なツールは存在しましたが、結果の最終的な解釈は人間が行う必要がありました。
しかしながら、「Code interpreter」では、カラム名やデータの特徴、そして結果からChatGPTが自らデータを解釈し、既に学習済みの膨大なデータを元に考察を行なってくれます。
例えば、一般的なAIや機械学習ツールであれば、「年齢と給与には相関関係があり、年齢が高いほど給与も高い」といった結果を出力できます。しかし、その結果を解釈し、意味を理解することは難しいです。

しかし、ChatGPTは事前に様々な情報を学習しているため、「年齢が高いほど給与も高いのは一般的な状況と同じである」といった一般論と比較して結果を考察してくれます。
これは他のツールでは得られない特徴であり、非常に価値があると感じました。
つまり「Code interpreter」はデータを与えれば自動で分析して、データから分かることを教えて示唆を出してくれる、全ビジネスマンガ望んだツールになる可能性があるということです!!
イマイチなところ
まず第一にGPT-4の利用制限が厳しいです。
2023年7月現在はGPT-4は3時間で25回の利用制限があるため、実際の分析作業においてはすぐに到達してしまいます。
加えて、制限解除の3時間後に分析を再開しようとすると、アップロードしたデータが消去されているので、再度データのアップロードから行う必要があります。このため、実質的な利用制限はさらに厳しく感じます。
次に、メモリ制限も結構シビアです…
データは最大で512MBまでアップロードできますが、100MB程度のデータで特徴量を増やすだけで、すぐにメモリ不足に陥ってしまいます。
なので現状では、これらの制約のため、大規模なデータセットを使用した複雑なデータ分析にはまだ使えないですね
しかし、これらの制限が解消され、さらに自分の分析環境に接続できたり、直接データベースにアクセスできるようになったら、GPT-4はデータサイエンティストの代替になる可能性は充分あると思います。
さらに、ChatGPTはデータ分析の専門家ではないので、分析部分をAutoMLやDataRobotのような高度なAIモデル作成ツールと組み合わせることができれば、さらに便利になることは間違いなしです!
Q&A
無料で数日お試しできる?
ChatGPT Plusにはお試し期間というものは存在しないので、利用するためにはChatGPT Plus(有料版:月額20ドル)に入る必要があります。
無料で使う方法はある?
無料で利用する方法はありませんが、今後無料版のChatGPTでも利用できるようになる可能性はあります。
また、2023年9月にこのChatGPTの機能である「Advanced Data Analysis」とほぼ同じ機能がローカルで使える「Open Interpreter」というオープンソースが公開されて話題となっています。
もし、「Advanced Data Analysis」は使ってみたいけど、ChatGPT Proに入っていない人やローカルでも同じ機能を使いたいという人はこちらもぜひチェックしてみてください
以下のページでは始め方や使い方、さらには実際に「Open Interpreter」を使ってデータ分析をしてみた結果も解説していますので、こちらも併せてご覧ください。

アップロードしたデータは流出しちゃう?
Open AI社は「Code Interpreter」のプライバシーとセキュリティについては、最大限の配慮をしていると述べています。
ですが、現時点では絶対安全という保証はないので、機密情報や個人情報のアップロードは避けた方が良いでしょう。
ファイルのアップロードサイズの上限と種類は?
512MBまでのCSV、Excel、PDF、GIFs、動画、画像などファイルをアップロードできます。
アップロードできる主なファイルは以下の通りです
- テキストファイル(.txt)
- Python スクリプト(.py)
- Jupyter ノートブック(.ipynb)
- CSV ファイル(.csv)
- Excel ファイル(.xls, .xlsx)
- 画像ファイル(.jpeg, .jpg, .png, .gif, .bmp など)
- PDF ファイル(.pdf)
- ZIP ファイル(.zip)
- 動画ファイル(.mp4, .avi, .movなど)
- GIFファイル(.gif)
生成したソースコードはダウンロードできる?
作成してもらったコードを.py形式で出力するできるので、同じコードをローカルで実行することもできます。
Python以外のプログラミング言語は実行できる?
2023年現在、「Code Interpreter」はPythonのみ実行可能です。
Pythonの実行環境は?
Pythonの実行にはOpenAIのサンドボックス環境が使用されています。具体的なバージョンは2023年7月現在でPythonのバージョン:3.8.10です。
インストールされているライブラリは以下の通りです。
- インストールされているライブラリ(クリックして開く)
-
absl-py==1.4.0 affine==2.4.0 aiohttp==3.8.1 aiosignal==1.3.1 analytics-python==1.4.post1 anyio==3.7.1 anytree==2.8.0 argcomplete==1.10.3 argon2-cffi==21.3.0 argon2-cffi-bindings==21.2.0 arviz==0.15.1 asttokens==2.2.1 async-timeout==4.0.2 attrs==23.1.0 audioread==3.0.0 Babel==2.12.1 backcall==0.2.0 backoff==1.10.0 backports.zoneinfo==0.2.1 basemap==1.3.2 basemap-data==1.3.2 bcrypt==4.0.1 beautifulsoup4==4.12.2 bleach==6.0.0 blinker==1.6.2 blis==0.7.9 bokeh==2.4.0 branca==0.6.0 Brotli==1.0.9 cachetools==5.3.1 cairocffi==1.6.0 CairoSVG==2.5.2 camelot-py==0.10.1 catalogue==2.0.8 certifi==2019.11.28 cffi==1.15.1 chardet==4.0.0 charset-normalizer==2.1.1 click==8.1.4 click-plugins==1.1.1 cligj==0.7.2 cloudpickle==2.2.1 cmudict==1.0.13 comm==0.1.3 compressed-rtf==1.0.6 countryinfo==0.1.2 cryptography==3.4.8 cssselect2==0.7.0 cycler==0.11.0 cymem==2.0.7 dill==0.3.6 deprecat==2.1.1 defusedxml==0.7.1 decorator==4.4.2 debugpy==1.6.7 dnspython==2.3.0 docx2txt==0.8 distro-info==0.23ubuntu1 idna==2.8 unattended-upgrades==0.1 six==1.14.0 setuptools==45.2.0 requests-unixsocket==0.2.0 python-apt==2.0.1+ubuntu0.20.4.1 PyGObject==3.36.0 PyAudio==0.2.11 pip==20.0.2 urllib3==1.25.8 wheel==0.34.2
- インターネットに接続されていないため、外部APIにリクエストを送信したり、Webスクレイピングを行ったりすることはできません。
- 実行時間には制限があり、特定のコードセルの実行が120秒以上かかると、タイムアウトとなります。
- メモリ使用量やCPU使用量には制限があります。
- アップロードしたファイルやダウンロードファイルは一定時間終了すると削除されます。
プライバシー保護やセキュリティについて
Open AI社は公式サイトにて「Code Interpreter」のプライバシーとセキュリティについては、最大限の配慮をしていると述べています。
具体的には、AIが生成したコードが現実世界で予期しない影響を及ぼさないよう、コードは安全な環境で実行され、インターネットへのアクセスも制限しており、各セッションで使用できるリソースの量にも制限を設けています。
ただ、Code InterpreterはcsvやExcelのデータをアップロードできるので、アップロードした後のデータの取り扱いなども把握しておく必要があり、機密情報や個人情報のアップロードは避けた方が良いでしょう。
まとめ
以上、ChatGPTプラグイン「Code Interpreter」のスゴすぎる活用事例です。
どの活用事例を見ても、多くの業界や職種で今後の働き方が大きく変わる予感がしますね!
この先、ChatGPTを使いこなすことで仕事の生産性が大きく変わると考えられるため、早めに慣れておくことが重要です。
もし他に良い活用事例があれば追記していきます!
それでは!
「Code interpreter」を使って、プログラミングの生産性を爆上げる方法は以下のページで紹介しているので、こちらもぜひ参考にしてみてください!
