share

公開日 

更新日 

  • 生成AIトレンド

推論や数学に強いモデルが登場!Gemini 2.0 Flash Thinkingの特徴や使い方を解説

2024年12月20日(日本時間)にGoogleが推論や数学に強いモデル「Gemini 2.0 Flash Thinking」を発表しました。

このモデルは、推論や数学分野における能力が強化されており、「Gemini 2.0 Flash」を超える推論力を備えています。

Gemini 2.0 Flash Thinkingの発表により、期待が高まる一方で、機能の詳細や使い方、他のAIモデルとの違いなどについて疑問を持つ方もいるでしょう。

本記事では、Gemini 2.0 Flash Thinkingの特徴や使い方について詳しく解説します。さらに、他の生成AIとの比較や注意点についても紹介します。

本記事を参考にGemini 2.0 Flash Thinkingを試してみてください。

監修者

SHIFT AI代表 木内翔大

(株)SHIFT AI 代表取締役 / GMO他複数社AI顧問 / 生成AI活用普及協会理事 / Microsoft Copilot+ PCのCMに出演 / 国内最大級AI活用コミュニティ(会員9,000人超)を運営。
『日本をAI先進国に』実現の為に活動中。Xアカウントのフォロワー数は9.7万人超え(2024年12月現在)

弊社SHIFT AIでは、生成AIを活用したAI副業の始め方や、AI人材としてキャリアアップする方法を解説する無料セミナーを開催しています。

ご興味のある方は、以下のリンクからセミナーにお申し込みください。

【無料】AI人材の一歩目!

Gemini 2.0 Flash Thinkingの特徴

本章では、Gemini 2.0 Flash Thinkingの特徴を紹介します。

  • 推論過程を確認できる
  • テキストと画像を同時に処理できる

上記の特徴を把握することで、Gemini 2.0 Flash Thinkingが従来のモデルとの違いを実感できるでしょう。

それぞれの特徴を解説していきます。

推論過程を確認できる

推論過程の視覚化例 - Gemini 2.0 Flash Thinking
Gemini 2.0 Flash Thinkingが示す推論過程の例

Gemini 2.0 Flash Thinkingは、AIが結論を出すまでの手順や理由を視覚的に確認できます。

これにより、利用者は質問内容を理解する段階から、適切な公式の選択、具体的な計算結果の提示まで、一連の流れを簡単に追えるでしょう。

たとえば、データ分析において、どのデータを基にした判断なのか、推論の全プロセスがドロップダウン形式で表示されます。

そのため、AIが使用した情報や計算手順を視覚的に確認でき、回答に至る過程を納得しやすいです。

テキストと画像を同時に処理できる

Gemini 2.0 Flash Thinkingは、テキストと画像を同時に処理するマルチモーダル対応機能があります。

この機能により、文章での質問と関連する画像を同時に入力することで、AIがそれらを統合的に分析して回答を生成します。

Xに投稿されていた動画の例を見てみましょう。

例では、「これらの番号のうち、3つを足して30にする方法を教えてください」という質問がテキストで入力され、画像としてビリヤードボールの番号が提示されています。

結果も正しく表示され、過程も確認できます。

テキストと画像を同時に処理できるGemini 2.0 Flash Thinkingを体験してみましょう。

Gemini 2.0 Flash Thinkingの使い方

Gemini 2.0 Flash Thinkingは、現在Google AI Studioを通じて利用できます。

まずはGoogle AI Studioにアクセスし、以下の手順に従って準備を進めましょう。

Google AI Studioにアクセス                                          

Google AI Studioの公式サイトの画像
出典:Google AI Studio

まずは公式サイトにアクセスして、ログインボタンをクリックします。

利用規約の同意                                                                                    

初めてGoogle AI Studioを利用する際には、利用規約への同意が求められます。

Google AI Studioの利用規約に同意する画面
Google AI Studioの利用規約に同意する画面

規約に同意する場合は、チェックボックスにチェックを入れます。

チェックが完了したら、「続行」ボタンをクリックします。

ダッシュボードにアクセス                                                                                   

Google AI Studioのダッシュボード画面
Google AI Studioのダッシュボード画面

アカウント作成が完了したら、画像のダッシュボートにアクセスできます。

メイン画面に「What will you build?」と表示されるダッシュボードが表示されます。

モデルの選択

Gemini 2.0 Flash Thinkingを利用するためには、モデルの選択を行う必要があります。

以下の手順で、正しいモデルを設定しましょう。                                                                              

「Create Prompt」の選択画面
「Create Prompt」の選択画面

左側のメニューから「Create Prompt」をクリックします。これにより、新しいプロンプトを作成するための画面が開きます。

モデルの選択画面
モデルの選択画面

画面右側の「Model」セクションを確認し、メニューから「Gemini 2.0 Flash Thinking Experimental」を選びます。

モデルの選択が完了すると、Gemini 2.0 Flash Thinking Experimentalを使った質問や指示の入力ができます。

Gemini 2.0 Flash Thinkingを試した結果

ここまで、Gemini 2.0 Flash Thinkingの特徴と使い方について解説しました。

本章では、実際にGemini 2.0 Flash Thinkingを使って複雑な問題を解決した例を取り上げます。

性能を確認する上の参考にしてみてください。

①複雑な数学の問題

プロンプト:
【問題】
次の条件を満たす自然数の組(x,y) をすべて求めてください。

1.x+y=10
2.x×y=24

計算結果を再確認したところ、Gemini 2.0 Flash Thinkingが導き出した解は正しいことが確認されました。

②条件付き確率の問題

プロンプト:
【問題】
6面のサイコロを2つ振り、次の条件を満たす確率を求めてください。

1.出た目の合計が10である確率。
2.1つ目のサイコロが5である場合、合計が10である条件付き確率。

問題を条件に従い分解して検証した結果、Gemini 2.0 Flash Thinkingが提示した解答が正しいことが確認できました。

③画像からの問題

プロンプト:
【問題】
画像のボードから3つの数字を選んで、合計が50になる組み合わせをすべて見つけてください。
使用した問題の画像

全ての組み合わせを試した後、Gemini 2.0 Flash Thinkingの結果と一致したため、解答が正確であることが確認できました。

Gemini 2.0 Flash Thinkingと他の生成AIを比較

Gemini 2.0 Flash Thinkingは、生成AIの中でもトップクラスの性能を誇っています。

Chatbot Arenaの生成AI比較画面
出典:Chatbot Arena

上記のランキング画像からもわかるように、Googleが開発した「Gemini-2.0-Flash-Thinking-Exp-1219」は、Arena Score(性能評価値)で1,369ポイントを記録し、他のモデルを圧倒しています。

利用者からの投票数では「Gemini-2.0-Flash-Thinking-Exp-1219」が5,499票を獲得し、多くの利用者に支持されています。

このことから、Gemini 2.0 Flash Thinkingは性能だけでなく、実用性や信頼性の面でも高い評価です。

Gemini 2.0 Flash Thinkingの注意点

Gemini 2.0 Flash Thinkingは多機能で高性能な生成AIですが、使用する際にはいくつかの注意点があります。

  • 1日あたりのリクエスト数に上限がある
  • 画像の出力はできない

Gemini 2.0 Flash Thinkingを利用する上で、注意点を把握しておきましょう。

1日あたりのリクエスト数に上限がある

Gemini 2.0 Flash Thinkingでは、1日に利用できるリクエスト数に上限が設定されています。

リクエストは「10 RPM(1分間あたり10リクエスト)」および「1,500リクエスト/日」に制限されています。

たとえば、リクエストの優先順位の管理が大量のデータを処理するタスクや複数のプロジェクトを同時に進める場合には必要です。

制限に達した場合には、リクエストが処理されなくなる可能性があるため注意しましょう。

画像の出力はできない

Gemini 2.0 Flash Thinkingは、画像に関するデータを解析したり、説明したりすることはできますが、画像そのものを作ることはできません

そのため、写真やイラストを作成する場合は、別の画像生成ツールを利用する必要があります。

たとえば、Geminiシリーズ内で文章をもとに画像を作成する場合、Gemini Pro VisionやGemini Advancedを活用すれば、必要な画像を作れます。

Gemini 2.0 Flash Thinkingを利用する際には、画像出力ができない点を理解し、複雑な問題解決や多段階の推論を必要とするタスクに活用しましょう。

Gemini 2.0 Flash ThinkingでAIの賢さを体験しよう!

Gemini 2.0 Flash Thinkingは、2024年12月時点で推論力と問題解決能力において業界トップクラスの性能を誇るAIモデルです。

本記事では、Gemini 2.0 Flash Thinkingの特徴や具体的な使い方を解説し、他の生成AIとの比較や注意点を解説しました。

Gemini 2.0 Flash Thinkingは、AIがどのように推論を行い、最適解を導き出すかを視覚的に確認できるため、透明性と信頼性の高いシステムとして注目されています。

AIの進化を間近で体感したい方や業務効率化を目指す方は、本記事を参考にGemini 2.0 Flash Thinkingを試してみてください。

弊社SHIFT AIでは、弊社SHIFT AIでは、生成AIを活用したAI副業の始め方や、AI人材としてキャリアアップする方法を解説する無料セミナーを開催しています。

「AIスキルをもっと活用したい」「AIを使った新しいキャリアに挑戦したい」とお考えの方は、ぜひ以下のリンクから詳細を確認し、セミナーにご参加ください。

【無料】AI人材の一歩目!

記事を書いた人

西啓汰

大学での学びと並行して活動するフリーランスのSEO/Webライター。
研究テーマは「Music to Video」。音楽の歌詞や曲調を分析し、自動で映像を生成する仕組みの開発中。
生成AIツールを実際に触れ、体験を通じて得た知見を活かし、価値を届けるライティングを実践。
趣味は野球観戦とラジオ聴取。