ChatGPT

ChatGPTの「音声会話機能」を使ってみた!日本語での会話も可能!アプリでの始め方も解説

tsukasa
記事内に商品プロモーションを含む場合があります
このエントリーをはてなブックマークに追加

2023年9月25日、突如としてOpenAIの公式Xにより、ChatGPTがマルチモーダル機能が追加されると発表されました

マルチモーダル機能とは、システムがテキストだけでなく、音声や画像など、複数の種類の情報を同時に理解・応答できる機能のことを指します。

これにより、ChatGPTとまるで人と会話をするようにやり取りできたり、画像ベースでの質問をすることができるようになります。

この記事では、そんなマルチモーダル機能の1つであるChatGPTの「音声会話機能」についての始め方や実際に使用してみた感想について解説していきます!

【PR】

ChatGPTのマルチモーダル機能とは?

スクリーンショット 2023-09-26 7.25.57.png

今回、追加される機能は大きく分けて2つあります

スクリーンショット 2023-09-26 7.27.12.png

1つ目は、「音声による会話」機能で、こちらはChatGPTの公式アプリ(iOS・Android)に搭載されます。

これにより、ユーザーはテキスト入力だけでなく、音声での質問や指示をChatGPTに伝えることができるようになります。

例えば、運転中や家事をしながらでも、ChatGPTとの会話を楽しむことができるようになります。音声入力を使用することで、手を使わずに情報を得たり、疑問を解決したりすることが可能となり、さらにアクセス性と使いやすさが向上します。

スクリーンショット 2023-09-26 7.25.29.png

2つ目は、「画像ベースの質問」機能で、これはすべてのプラットフォームで利用可能になります。

この機能により、ユーザーはChatGPTに画像を送信し、その画像に関する質問や説明を求めることができます。

例えば、ある物体や場所の写真を送信して「これは何ですか?」といった質問をすると、ChatGPTがそれに対して答えを提供することができます。また、複雑なグラフや図を送信して、それに関する説明や解釈を求めることも可能です。

日本語でも利用可能?

「音声による会話」機能と「画像についての質問」機能は、日本でも利用できます。

ただし、「画像についての質問」機能は、英語以外の文字を画像から読み取る際には、性能が落ちる可能性があるとのことです。

一方、「音声による会話」機能は、日本語での対話もサポートしています。

利用開始日は?

ChatGPT Plus(有料版)に加入しているユーザーに、今後2週間以内(9/25~10月頭頃)にリリースしていくとのことです。

ChatGPTアプリで音声会話機能を始める方法

マルチモーダル機能がリリースされるとXで公開された直後から、私はChatGPTのアプリで音声会話機能を使うことができるようになりましたので、その方法を解説します

段階的に機能が解放されている可能性もあるので同じ方法を行っても利用開始できない場合は数日待ってから再度お試してください

また、私自身はiOSでの利用のため、Androidでは同じ方法でも利用開始できない可能性もあります。

まず前提として、音声会話機能を利用するためにはChatGPT Plus(有料版)の加入するか、Enterpriseユーザーである必要があります。

次に、ChatGPTのアプリを最新バージョンに更新してください。アプリの更新は各アプリストアから可能です。

その後、ChatGPTのアプリから一度ログアウトして、再度ログインします。

私は、ChatGPTのアプリをただ最新バージョンにしただけでは、音声機能が追加されておらず、一度ログアウトして再度ログインすることで利用できる状態となりました。

再度ログインが完了したら、「Settings」画面を開き「New Features」をクリックします

そうすると「Voice Conversations」と表示されるので、そちらをONにすることで利用が開始できます。

また、「Voice」という設定から音声を選ぶことが可能で、男性2パターン、女性3パターンの合計5パターンから選ぶことができます

音声機能による会話は、「Voice Conversations」の設定をONにすると右上にヘッドホンアイコンが現れるので、このアイコンをクリックすることで音声機能が開始します

スピーカー画面が現れたら、あとは普段ChatGPTと会話をするように知りたいことやお願いしたいことを音声で伝えることで会話がスタートします!

実際に使ってみた感想

実際に会話をしてみたところ、まるで、実際の人と話しているくらい、驚くほど自然な音声で返答が返ってきました。

しかし、日本語の発音に関しては、海外の人が日本語を話すような感じがしました。聞き取りにくいというわけではありませんが、違和感を感じないと言ったら嘘になるという感じです

また、「音声による会話」機能は、他のアプリを開いたままのバックグラウンドでも利用可能でした。

これは非常に便利な機能で、例えばメール作成中にChatGPTに情報を尋ねることができたり、ChatGPTとの会話内容を参考にして、メモアプリでまとめることも可能です。

まだ、触ったばかりですが、ちょっと触るだけでもめっちゃ便利というのが伝わってきました。

このエントリーをはてなブックマークに追加
ABOUT ME
つかさ
つかさ
ChatGPT×ビジネス
データサイエンティストがChatGPTを活用する方法を発信中|データサイエンティスト歴5年|ゲーム会社→フリーランス(現在)|データサイエンティストのためのChatGPTメディア「GPT研究所 データサイエンス支部」運営者
記事URLをコピーしました