Googleの生成AI「Gemini(ジェミニ)【旧 Bard】」とは?日本語対応は?使い方・料金・アプリ・ChatGPTとの比較を紹介!
ChatGPTの登場以来、さまざまな生成AIが次々と生まれ、多くの注目を集めています。
Googleからも独自の生成AI「Gemini(旧称 Bard)」がリリースされました。
そこで、この記事では、Geminiの使い始め方やその特徴について解説します。
さらに、GeminiとChatGPTを徹底的に比較するので、ぜひ自分に最適なツールを見つけるための参考にしてください。
Gemini(ジェミニ)とは
Gemini(旧称 Bard)は、Googleが開発した高度な人工知能(AI)ベースのチャットボットです。
元々は「Bard」と呼ばれていましたが、2024年2月に「Gemini」という名前に変更されました。
OpenAIの「ChatGPT」と同じく、大規模な自然言語処理モデル(LLM)を基盤としており、ユーザーとの対話を通じて情報提供や様々なタスクを実行します。
テキスト、映像、音声などの複数のデータを同時に処理できるネイティブマルチモーダルです。
旅行の計画立てやレシピ提案などの日常なことから、文章の生成やプログラミングコードの生成など、幅広い分野での情報提供を行います。
Googleアカウントを持っている13歳以上であれば、ブラウザから誰でも登録不要で利用可能です。
Geminiの3モデル
Geminiには用途の異なる3つのモデルがあります。
Gemini Nano
Gemini Nanoはスマートフォンなどのデバイス上での利用に最適化されています。
Google Pixel 8 Proに搭載されており、軽量な処理を並行して進めることが可能です。
Gemini Pro
Gemini ProはGemini(旧Bard)に搭載されているモデルです。
幅広い一般的な自然言語処理タスクに対応しており、幅広い用途で利用できます。
テキスト生成、翻訳、要約、質問応答など、デスクトップやサーバー環境での使用に適しています。
Gemini Ultra
Geminiのなかで最も高性能なモデルで、大規模なデータ解析、非常に精緻なテキスト生成、複雑な対話システムなどに最適です。
後ほど紹介する、有料版Gemini Advancedに搭載されています。
Geminiの日本語対応について
Geminiは、日本を含む180以上の国と地域で利用可能で、日本語での対話にも対応しています。
ただし、画像生成やタイマー・アラームの設定など一部の機能については、日本語に対応していません。
その場合は、英語でのプロンプトが必要です。
Geminiの料金
Geminiは基本的には無料で利用できますが、利用回数(トークン数)に制限があります。
具体的な制限数は公開されていませんが、1日当たり約7万字から10万字程度と推測されています。
利用回数の制限をなくしたい場合は(Gemini Advanced)の利用を検討してみましょう。
有料プラン(Gemini Advanced)は月額2900円で、高性能な言語モデル(Gemini Ultra1.0)が利用できます。
複雑なコード生成や高度なデータ分析、翻訳など、高度な機能が使いたい人にもおすすめです。
Gemini 1.5 シリーズとは
Geminiの初期バージョンはGemini 1.0と名付けられ、その後Gemini 1.0 Proに改名されました。
Gemini1.5シリーズは、2024年2月にリリースされた新バージョンです。
処理速度が従来の10倍に向上しており、精度や機能が大幅に向上しています。
1.5シリーズには、Gemini1.5ProとGemini1.5Flashの2種類があります。
現在のGemini には、このGemini1.5Proが搭載されています。
Gemini 1.5FlashはProの軽量版で、処理速度を重視し、リアルタイム処理が必要なタスクに適しており、Google Cloud Vertex AIなどに搭載されています。
Geminiの機能と使い方
Geminiはリリース当初、主に基本的な会話機能が利用できる程度で、過去の会話の履歴を見ることもできませんでした。
しかし、度重なるアップデートに伴い、進化を遂げ、現在では使用できる機能が大幅に拡張されています。
そこで、ここではGeminiの機能について紹介します。
チャット機能
Geminiの主要機能は、ChatGPTに似た高性能AIを使用したチャット機能です。
Geminiに質問すれば、旅行計画やレシピ提案など日常的なものから、文章生成やプログラミングコード作成などの専門的なことまで何でも回答してくれます。
もし、回答が気に入らない場合には、チャット右上の「他の回答案を表示」をクリックすれば、他の回答を見ることができます。
また、チャット下のアイコンをクリックすると、生成された回答の長さや表現方法を変更できます。
回答をよりシンプルにしたり、専門的な表現、カジュアルな表現に変更したい場合に、利用してみましょう。
さらに、公開リンク共有機能を利用して会話を共有し、そのまま続けたり新たな質問を追加することもできます。
画像認識機能
Geminiには画像認識機能が搭載されており、チャット上で画像をアップロードするだけで、その画像に関する情報を得られます。
さらに、この機能は画像に写っているものをただ識別するだけでなく、画像に基づいた質問に回答できます。
例えば解法がわからない数学の問題を写真で送ると、解説が得られます。
コーディング機能
Geminiは、20種類以上のプログラミング言語に対応したコード生成と出力機能を提供しています。
また、生成されたPythonコードはGoogle ColabやReplitなどに直接エクスポートしてテストすることが可能です。
これにより、Geminiに生成してもらったコードをGoogle ColabやReplit上で直接試すことができます。
画像生成機能
2024年2月のアップデートで、画像やイラストを生成する機能が新たに追加され、誰でも無料で画像・イラスト生成AIを手軽に使用できるようになりました。
例えば、「コタツでまるくなる猫の写真を英語で生成してください」と依頼すると、以下のように4種類の画像を生成してくれます。
ただし、現在は画像を生成するためのプロンプトは英語で入力する必要があります。
Google Workspaceアプリへのエクスポート機能
Geminiは、生成したテキストやテーブルをGoogle ドキュメントやGmail、Google スプレッドシートにエクスポートする機能を持っています。
これにより、Geminiで作成した内容をGoogleの各種アプリケーションで直接活用し、簡単に保存や共有が可能になります。
応答のダブルチェック機能
Geminiの応答を再確認する機能「Google It v2」はGeminiが生成した応答を、Google検索結果を通じて検証する機能です。
この機能により、ユーザーはGeminiの回答に関連するウェブコンテンツを検索し、提供された情報の正確性や信頼性を確認できます。
Gemini 拡張機能
Gemini 拡張機能は、GoogleのアプリケーションやサービスとGeminiを直接統合する新しい機能です。
これによりユーザーはGmail、Google Docs、Drive、Maps、YouTubeといったGoogleの日常的なツールから直接関連情報を取得できるようになります。
例えば、「@Youtube」をつけて質問を知れば、Youtube上から必要な情報を取得してくれます。
これにより、ワンストップで情報を取得し、タスクを効率的に遂行することが可能になるため、生産性の向上が期待されます。
データ分析機能
2024年5月21日に、Gemini Advanced限定で、データ分析機能が追加されました。
複数のスプレッドシートをアップロードし、データ分析が可能です。
スプレッドシートだけでなく、CSV、ExcelファイルをGoogleドライブやデバイスからアップロードできます。
Geminiの始め方
Googleアカウントを保持しており、13歳以上のユーザーであれば誰でも利用可能です。
まずはGeminiのサイトを開き、「Geminiを試す」をクリックします。
利用規約とプライバシーを確認し、「同意する」をクリックします。
試験運用中のサービスである旨が表示されます。
問題なければ「続行」をクリックします。
画面下に表示される「ここにメッセージを入力してください」と書かれた箇所に質問を入力し、右の紙飛行機マークをタップすると、チャットを開始できます。
Geminiの活用事例
Googleは2023年における日本でのGeminiの利用方法トップ10を発表しました。
このランキングは、Geminiをまだ使用したことがない方や、日常的に利用していない方々にとって、Geminiをどのように活用できるかについての貴重なヒントとなります。
ここでは「日本でのGeminiの利用方法のランキング」の1位~5位について解説していきます。
事実に関する調べ物
日本においては、Geminiは「水の沸点が気圧によって変わるか?」や「sin 90°の値は何か?」など、明確な答えが求められる「事実に関する調べもの」に多く用いられています。
Geminiに質問することで、従来Google検索を使って自分で最適な情報源を探していた手法と比べ、チャット形式で質問し、目的の情報を容易に得られるため、より手軽に必要な情報を得ることが可能になります。
専門的なトピックの相談
Geminiは、一般的な質問だけでなく、専門家でないと答えるのが難しい質問にも回答します。
例えば、エンジニアであれば「セキュリティ対策を強化したいのですが、どうすればよいでしょうか?」、学生であれば「数学の勉強方法について、アドバイスをお願いします。」など、専門的な領域でどのような方法が有効なのかを教えてくれます。
これにより、誰でも手軽に専門家に相談しているような回答を得ることができます。
プラグラミングのサポート
Geminiはプログラミング学習やサポートに最適なツールです。
たとえば、「音声ファイルをMP3形式に変換するPythonコードを作成して」といったコード生成のリクエストや、「このHTMLコードのバグを修正して」といった既存コードのデバッグ要求にも対応可能です。
この機能により、単にコーディングのアドバイスを提供するだけでなく、サンプルコードの生成も行えるため、従来のインターネット検索に比べて、より容易に必要な情報を得られるようになります
翻訳
Geminiは翻訳にも長けています。
「ontologicalを日本語に翻訳して」といった特定の単語の翻訳から、「次の日本語の文章をビジネス英語にして」といった文脈に合わせた翻訳、さらには「『帯に短したすきに長し』を中国語と韓国語で3つずつ例を挙げて翻訳して」といったように、さまざまな状況や言語に応じた翻訳が可能です。
従来の翻訳ツールは単に文章を他の言語に置き換えるだけでしたが、Geminiでは複数のパターンを提案したり、ニュアンスを変えながら翻訳することもできます。
文章の編集
Geminiは大規模な自然言語処理モデルに基づいているため、文章の生成や編集が得意です。
例えば、文章修正の場合、「以下の文章の流れや構成を修正・分かりやすくしてほしい」といった全体の流れや言い回しの修正、または「表現を自然にして」といった指示に応えることができます。
さらに、「以下を仕事の取引先に送る丁寧なビジネスメールにして。『今年もありがとうございました。来年もよろしくお願いいたします。1月8日から出社します。』」など、ビジネスシーン等の特定の状況に合わせた文章作成にも活用できます。
これにより、従来よりも文章作成にかかる時間を大幅に短縮できる可能性があります。
ChatGPTとGeminiの違い
ChatGPTとGeminiはどちらも、チャット形式で高性能のAIと対話しながら様々な情報を取得したりタスクを実行したりする点では似ているように思えますが、実際には両者の間には大きな違いがあります。
そこで、これからChatGPTとGeminiの違いについて詳しく説明していきます。
搭載されているモデルと得意分野の違い
ChatGPTはOpenAIによって開発されたGPTモデルに基づいており、これらのモデルは多様な会話形式のタスクをこなす能力があり、文章生成や質問応答などに特に優れています。
一方、GeminiはGoogleが開発したGeminiに基づいており、特にウェブからの情報を処理し、関連するリンクを提供することで質問に答えたり要約を提供する能力が高いです。
ChatGPTが文章生成や質問応答などに長けているのに対し、Geminiはインターネット上の情報を基にした情報提供に優れていると言えます。
機能の違い
機能 | ChatGPT | Gemini |
---|---|---|
ブラウジング機能 | ○ | ○ |
画像認識機能 | ○ | ○ |
画像生成機能 | ○ | ○ |
音声会話機能 | ○ | ✖️ |
コード実行機能(Code interpreter) | ○ | ✖️ |
オリジナルチャットbot生成(GPTs) | ○ | ✖️ |
Googleサービスとの連携 | △ | ○ |
ChatGPTとGeminiは共にAIを活用したチャット機能を提供していますが、提供される機能には大きな違いがあります。
ChatGPTには、有料ではありますが、音声会話機能、コードインタープリタ、GPTsなどの機能が搭載されています。
これにより、ユーザーは音声操作やプログラミング作業を行うことができ、プログラミング知識がなくてもChatGPTの機能を活用したシステム開発が可能です。
一方で、Geminiはこれらの機能の利用はできませんが、Googleのサービスとの連携が強く、GmailやGoogleドライブにある情報を基にタスクを行ってもらうことができます。
どちらがおすすめ?
ChatGPTは有料プランに加入すれば、Geminiでは利用できない便利な機能が複数存在します。
したがって、オリジナルChatbotの開発・利用やプログラミング作業などの広範なタスクに対応したい時はChatGPTを、インターネット検索を強化し情報収集を主な用途としたい時はGeminiが適しています。
ChatGPTについて詳しく知りたい方はこちらの記事をあわせてどうぞ。
Geminiのセキュリティとプライバシー
Geminiは、ユーザーとの会話データをサービスの向上や機械学習技術の開発に活用できます。
また、品質向上のため人間のレビュアーが会話を確認することもありますが、プライバシー保護のためGoogleアカウントとの関連付けは解除されます。
会話データは基本的には、サービスの向上のためのみに使われるますが、万が一のために機密情報やプライバシーに関わる情報の入力は避けることをおすすめします。
Q&A
Geminiは日本語で利用できますか?
はい、Googleアカウントの設定を日本語にしていれば日本語で利用できます。
ただし、中には日本語にはまだ対応していない機能があります。
Geminiにスマホアプリはありますか?
はい、Geminiにはスマートフォン用のアプリがあります。
Androidデバイスの場合、Google PlayストアからGeminiアプリをダウンロードして利用できます。
iOSデバイスの場合は、Googleアプリを通じてGeminiを試すことが可能です
Geminiは無料で利用できますか?
Geminiには無料プランも存在します。
利用にGoogleアカウントが必要?
はい、必要です。
利用回数に制限はある?
いいえ、ありません。
まとめ
今回の記事では、Geminiの特性と使い方を紹介しました。
ChatGPTと比べてまだ改善の余地がある部分もありますが、Geminiは現在試験運用段階にあるので、これからどのように進化していくか楽しみにしています。
特に、Googleの各種サービスとスムーズに連携できるという点は、Geminiの大きな魅力です。
日常的にGoogleのサービスを利用している方はもちろん、ChatGPTとは異なる大規模な言語モデル(LLM)を使った生成AIに興味がある方は、ぜひGeminiを試してみてください。