2024年9月13日、OpenAIから新たなAIモデル「OpenAI o1」が発表されました。
o1は従来モデルであるGPT-4oに比べ、より複雑なタスクを処理することに特化したモデルです。SNSやネットでも話題となり、性能が高評価されています。
しかし「具体的になにがすごいの?」や「GPT-4oと何が変わったの?」などの疑問をもっている方は多いでしょう。
本記事では、OpenAI o1がもつ6つの特徴や利用制限などを解説しています。また、o1モデルとGPT-4oの違いによる、適切な使い分け方も解説しているため、ぜひ参考にしてみてください。
本記事を読めばOpenAI o1(以降o1と記載)の基本がすべてわかるだけでなく、業務への活用方法まで理解できるでしょう。
|監修者
(株)SHIFT AI 代表取締役 / GMO他複数社AI顧問 / 生成AI活用普及協会理事 / Microsoft Copilot+ PCのCMに出演 / 国内最大級AI活用コミュニティ(会員5,000人超)を運営。
『日本をAI先進国に』実現の為に活動中。Xアカウントのフォロワー数は9万人超え(2024年9月現在)
弊社SHIFT AIでは、AIツールの使い方をまとめた資料を、無料で配布しています。
ChatGPTを業務で活用して、生産性を高めたいと考えている方は、以下のリンクから資料をダウンロードしてみてください。
\ 無料 & 30秒で完了! /
OpenAI o1とは?
o1は、OpenAIが開発した最新のAIモデルです。OpenAIは、o1をこれまでのGPTとは別のモデルであると定義しています。
o1モデルの特筆すべき点は、複雑な問題解決能力や論理的思考力の向上です。数学、科学、プログラミングなどの分野で、人間の専門家レベルの性能を示しています。
たとえば、全米数学オリンピック予選で上位500位相当の成績を収めたり、特定の分野で博士レベルを超えたりなど、能力の高さが証明されています。
o1の登場により、研究支援や教育、ビジネス分析など、さまざまな分野で新たな価値を生み出すことが期待されています。
ChatGPTのGPT-4oについては、以下の記事を参考にしてみてください。
OpenAI o1の特徴6選
本章では、o1の特徴を6つ紹介します。
- GPT-4oに比べて推論能力が大幅に強化
- 内部的な推論過程を観察可能
- 全米数学オリンピック予選で上位500位の実力
- プログラミング世界大会で金メダルレベルの実力
- 物理・生物・化学の問題で人間の博士レベルを超える精度
- 安全性が向上
まずは本章を読んで、基本的な情報を確認してみてください。
複雑な推論タスクに特化
o1は、数学やプログラミングなど、複雑な推論が必要なタスクを処理することに特化したモデルです。
o1の推論能力はGPT-4oを大きく上回っていることが、OpenAIの検証結果で示されています。
数学やプログラミング、博士レベルの問題など、高度な思考を求められるタスクに対して、o1は高い数値を示しています。
内部的な推論過程を観察可能
従来のChatGPTでは、内部で行われている思考プロセスは確認できませんでしたが、o1では思考プロセスの一部を確認できます。
この機能により、ChatGPTがどのような思考経路をたどって結論に至ったのかを理解できます。ChatGPTの判断根拠を把握でき、回答の信頼性をより確認しやすくなりました。
ただし、実際にはより複雑な思考プロセスをたどっており、表示されるのはあくまで”要約”です。そのため、思考プロセスの表示は参考程度にしておくことを推奨します。
全米数学オリンピック予選で上位500位の実力
o1は、全米数学オリンピック予選(AIME)において上位500位に相当する実力を持つことが示されました。
AIMEは、高度な数学的思考力と問題解決能力を要する試験で、アメリカの数学界で優秀な高校生が挑戦します。o1は、15問中平均13.9問を正解し、93%の正答率を達成しました。
この結果は、人間の数学オリンピック候補者と同等以上の実力を示しています。数学的な計算が苦手とされていたAIが、ついにその壁を打ち破ったといえる結果です。
プログラミング世界大会で金メダルレベルの実力
o1は、国際情報学オリンピック(IOI)というプログラミングの世界大会で、参加者の上位10%(金メダルレベル)に入ったことが報告されています。
また、Codeforcesと呼ばれる競技プログラミングをシミュレートしたテスト結果も公表されています。その結果、上記で解説したIOI用に調整されたo1(o1-ioi)が上位7%程度の実力をもつことがわかりました。
o1の高度なプログラミング能力は、ソフトウェア開発の効率化や、複雑なプログラミングコードの生成などに活用できる可能性があります。
物理・生物・化学の問題で人間の博士レベルを超える精度
o1は、GPQA(Graduate-level Physical and Quantitative Assessment)ダイアモンドレベルの問題集で、人間の博士レベルの専門家を上回る正答率を達成しました。
とくに物理学の分野では、94.2%という驚異的な正答率を記録しています。
この結果は、o1が科学の複雑な概念を理解し、高度な問題を解決する能力をもつことを示しています。o1は科学研究の支援や、難解な科学的概念の説明、教育現場での活用など、幅広い分野での応用が期待されます。
安全性が向上
o1では、従来のモデルと比較して安全性が大幅に向上しました。
安全性の評価方法の一つに、ユーザーがAIを意図的に暴走させたり、中身の情報を抜き取ったりしようとするジェイルブレイクに対して、AIがどれだけ規則を守り続けるかをテストするものがあります。もっとも難しいジェイルブレイクテストにおいて、GPT-4oが100点満点中22点だったのに対し、o1-previewモデルは84点を獲得しました。
加えて、OpenAIは米国および英国の機関(AI Safety Institutes)と正式な合意を結び、これらの研究所にo1モデルの研究版への早期アクセスを許可しました。この取り組みによって、今後のo1アップグレードモデルが、より安全にリリースされます。
OpenAIは、生成AIで懸念される安全性を、これらの取り組みによって担保しようとしています。
o1-previewとo1-miniの違い
現在利用可能なバージョンには、o1-miniとo1-previewの2種類があります。これらのモデルは、2024年9月13日現在、有料版のChatGPT Plus・Teamユーザーが利用できます。
o1-miniは、o1-previewよりも高速・低コストのモデルでありながら、一部タスクではo1-previewを上回ります。それぞれ特徴が異なるため、適切に使い分けることが求められます。
o1-previewとo1-miniには、以下のような違いがあります。
特性 | o1-preview | o1-mini |
---|---|---|
1. 目的と最適化 | 複雑な推論タスクを幅広く処理 | STEM(科学、技術、工学、数学)分野の推論に特化 |
2. 性能 | 幅広い分野で高性能 | STEM関連タスクでo1-previewに匹敵かそれ以上、STEM以外の知識では劣る |
3. コストと効率 | 比較的高価 | o1-previewより80%安価で高速 |
5. 使用例 | 幅広い推論タスクに適する | 推論は必要だが幅広い世界知識は不要なアプリケーションに適する |
6. アクセス | • ChatGPT Plus/Teamユーザー • API tier 5開発者 | • ChatGPT Plus/Teamユーザー • API tier 5開発者 ・将来的に無料ユーザーにも提供予定 |
つまり、o1-miniはSTEM分野に特化した効率的なモデルであり、o1-previewはより汎用的な高性能モデルと言えます。それぞれ特徴が異なるため、用途や予算に応じてモデルを選択することが求められています。
OpenAI o1とGPT-4oの使い分け方
OpenAIは「o1モデルはGPT-4oに置き換わるモデルではない」と定義しており、それぞれのモデルの特徴を活かして適切に使い分けることを推奨しています。
o1 models offer significant advancements in reasoning, but they are not intended to replace GPT-4o in all use-cases.
引用元:Reasoning models(OpenAI)
それを象徴する例として、人間による評価を行った結果、ライティングの分野ではGPT-4oに軍配が上がっています。
それぞれのモデルを違いと、適切な活用例を示します。
モデル | 特徴 | 適した使用場面 |
---|---|---|
o1-preview | 広範な一般知識を用いて難問を推論 | 科学的推論、複雑な問題解決、長時間の思考が必要な場合 |
o1-mini | コーディング、数学、科学タスクに特化 | 一般知識を必要としない特定のSTEM分野のタスク |
GPT-4o | 画像入力、関数呼び出し、高速応答に対応 | 画像認識、API連携、即時応答が必要なアプリケーション |
o1モデルは推論能力に優れていますが、GPT-4oの方が適している場面もあります。画像入力や関数呼び出しが必要な場合、あるいは一貫して高速な応答時間が求められる場合は、GPT-4oやGPT-4o miniが適しています。
一方、深い推論が必要で、より長い応答時間を許容できるアプリケーションを開発する場合は、o1モデルが優れた選択肢でしょう。
使用するモデルを選択する際は、アプリケーションの要件や目的を慎重に検討し、各モデルの特性を考慮して最適な選択をすることが重要です。
OpenAI o1はAPIも利用可能
o1のAPIが利用可能で、開発者や企業は自社のアプリケーションやサービスにo1を組み込めます。
APIの利用には、Tier 5※のレート制限が適用されます。o1-previewとo1-miniの2つのモデルが提供され、それぞれ異なる制限が設けられています。
※OpenAIのAPIは用途によってTier1〜Tier5に分けられる
Model | 入力コスト | 出力コスト | 入力コスト (Batch API※) | 出力コスト (Batch API※) |
---|---|---|---|---|
o1-mini | $3.00 / 1M tokens | $12.00 / 1M tokens | – | – |
o1-mini-2024-09-12 | $3.00 / 1M tokens | $12.00 / 1M tokens | – | – |
o1-preview | $15.00 / 1M tokens | $60.00 / 1M tokens | – | – |
o1-preview-2024-09-12 | $15.00 / 1M tokens | $60.00 / 1M tokens | – | – |
gpt-4o | $5.00 / 1M tokens | $15.00 / 1M tokens | $2.50 / 1M tokens | $7.50 / 1M tokens |
gpt-4o-2024-08-06 | $2.50 / 1M tokens | $10.00 / 1M tokens | $1.25 / 1M tokens | $5.00 / 1M tokens |
gpt-4o-2024-05-13 | $5.00 / 1M tokens | $15.00 / 1M tokens | $2.50 / 1M tokens | $7.50 / 1M tokens |
gpt-4o-mini | $0.150 / 1M tokens | $0.600 / 1M tokens | $0.075 / 1M tokens | $0.300 / 1M tokens |
gpt-4o-mini-2024-07-18 | $0.150 / 1M tokens | $0.600 / 1M tokens | $0.075 / 1M tokens | $0.300 / 1M tokens |
※複数のリクエストを一度にまとめて送信し、効率的にAPIを利用するための方法
o1モデルは、gpt-4oやgpt-4o miniに比べてAPI料金が高い傾向にあります。ただ、OpenAIのAPI料金はだんだんと安くなる傾向です。
今後、o1での開発を検討している方は、API料金が抑えられることを期待してもよいでしょう。
【最新】OpenAI o1は利用制限に注意
2024年9月17日現在、ChatGPT Plusユーザーの場合、o1-previewは週に50メッセージ、o1-miniは1日に50メッセージという制限が設けられています。
なお、無料ユーザーは現時点でo1-previewとo1-miniを利用できません※。Enterprise・Educationプランのユーザーは、2024年9月16日の週から順次利用できるようになる予定です。
※o1-miniは今後無料ユーザーに開放予定
また、o1のAPIは、1分間あたりのリクエスト数(RPM)は20回と低く設定されていますが、1分間に処理できるトークン数(TPM)は3,000万から1億5,000万と非常に多い設定です。
これは、o1が複雑で大規模なデータ処理に適していることを示しています。たとえば、長文の要約や複雑な分析タスクなど、一度のリクエストで大量のデータを処理する用途に向いています。
開発者は、これらの制限を考慮しながら、o1の高度な推論能力や科学的知識を活用したアプリケーションを設計することが求められます。APIの利用制限について詳しく知りたい方は、OpenAIの公式サイトを参照してください。
【OpenAI直伝】OpenAI o1のプロンプトのコツ
OpenAIはo1モデルリリースに伴い、o1を利用する際のプロンプトに関するアドバイスを公開しました。
- シンプルにプロンプトを書く
- プロンプトテクニックを使いすぎない
- 区切り記号を使用する
本章では、その中でもとくに重要なコツについてまとめているため、ぜひ参考にしてみてください。
シンプルにプロンプトを書く
o1には、シンプルなプロンプトを入力することが推奨されています。従来のAIモデルでは、詳細かつ、できるだけ具体的なプロンプトが良いとされていましたが、それとは反対のアドバイスです。
たとえば「この数式を解いてください」や「次のコードの問題点を指摘してください」といったシンプルな指示が効果的とされます。
複雑な指示を避けることで、モデルは本来の推論能力を最大限に発揮できるといいます。プロンプトを複雑にする必要がないことは、ユーザーにとっても効率的です。
プロンプトテクニックを使いすぎない
OpenAI o1では、従来のAIモデルで効果的だったいくつかのプロンプトテクニックが不要、あるいは逆効果になる場合があります。
たとえば、複数の例を示してから質問する方法であるFew-Shot Promptingや、「段階的に考えてください」といったChain of Thought Prompting(思考の連鎖プロンプティング)による指示は、o1の性能を低下させる可能性があります。
o1は内部で高度な推論プロセスを行うため、これらのテクニックは不要であると考えられます。代わりに、モデルの推論能力を信頼し、単純明快な質問や指示を与えることが重要です。
区切り記号を使用する
プロンプト内で異なる部分を明確に区別するために、トリプルクォーテーション(”””)、XMLタグ、またはセクションタイトルなど、区切り記号を使用することが推奨されます。
これにより、モデルは各セクションの目的や内容を正確に理解し、適切に処理できます。たとえば、以下のように区切り記号を使用します。
"""以下のコードを最適化してください:
"""
[コードを入力]
このように、区切り記号を使用して、プロンプト内の情報をAIにわかりやすく伝えることが重要です。
【実演】OpenAI o1の活用例
本章では、o1を実際に使用している様子をお見せしながら、具体的な活用例を紹介します。
- フェルミ推定を行う
- プログラミングコードを生成する
- 数学問題を解く
活用例を確認して、自身の業務への応用もイメージしてみてください。
フェルミ推定を行う
OpenAI o1は、複雑な推論を要するフェルミ推定において優れた能力を発揮します。フェルミ推定は、正確な数値を得ることが難しい問題に対して、論理的な推論と概算を組み合わせて答えを導き出す手法です。
o1モデルは、問題を複数の段階に分解し、各段階で必要な情報を論理的に推論しながら、最終的な答えにたどり着きます。
このように、o1は複雑な問題を体系的に分析し、合理的な仮定に基づいて推論を行う能力をもっています。ビジネス戦略の立案や市場規模の推定など、不確実性の高い領域での意思決定支援に活用できるでしょう。
プログラミングコードを生成する
o1は、プログラミングコードの生成において卓越した能力をもっています。
今回は、物理シミュレーションを行うためのアプリケーションを作成してみます。
このコードをv0という生成AIツールで実装した結果を示します。
たった数行のプロンプトで、物理シミュレーションを作成できました。
o1がもつプログラミング性能を活かすことで、コードの品質向上や開発時間短縮が期待できます。
数学問題を解く
o1の数学問題解決能力は、高度な数学的推論を必要とする場面で真価を発揮します。
たとえば、以下のような問題を解いてもらいましょう。
上記の問題は比較的簡単ですが、これまでのAIモデルだと解答できない難解な問題でも、o1なら簡単に処理できます。
o1の高度な数学能力は、数学教育や科学研究、エンジニアリングの分野で役立つでしょう。
弊社SHIFT AIでは、AIツールの使い分けなどをまとめた資料を、無料で配布しています。
ChatGPTをもっと使いこなしたいと考えている方は、以下のリンクから資料をダウンロードしてみてください。
\ 無料 & 30秒で完了! /
OpenAI o1の今後の展望
o1は、現在プレビュー段階(o1-preview)にあり、今後さらなる進化が期待されています。OpenAIは、o1モデルの継続的な開発と改良を計画しており、モデルの性能向上だけでなく、機能の拡充も予定しています。
また、近い将来、o1モデルにはウェブブラウジング機能やファイル・画像のアップロード機能が追加される見込みです。これら機能の追加により、o1の利用範囲がさらに拡大し、より多くのユーザーにとって有用なツールになると予想されます。
また、OpenAIはGPTシリーズの開発も並行して進めていく方針です。o1シリーズの高度な推論能力とGPTシリーズの幅広い応用性を組み合わせた、より強力なAIシステムの登場が期待されます。
さらに、o1-miniの無料版ChatGPTユーザーへの提供も計画されています。高度な推論能力を持つAIが、より多くの人々にアクセス可能になるため、教育や研究、ビジネスなど、さまざまな分野でo1の活用が広がることが予想されます。
OpenAI o1で複雑なタスクを効率化させよう
o1は、数学やプログラミング、科学分野のタスク処理に特化したモデルです。従来のモデルであるGPT-4oと比較しても多くの分野で突出しているため、今後はよりChatGPTの用途の幅が広がるでしょう。
ただし、o1にはpreviewとminiがあります。また、GPT-4oはo1にすべての面で劣っているわけでなく、ライティング能力が高かったり、応答が高速だったりなど、o1に勝る部分もあります。
そのため、ChatGPTを活用する際には、o1-previewとo1-mini、GPT-4o、GPT-4o miniを適切に使い分ける意識が重要です。本記事を参考に、それぞれの特徴を把握して、ChatGPTをより便利に使ってみてください。
弊社SHIFT AIでは、ChatGPTのプロンプト175選など、さまざまなAIツールの使い方をまとめた資料を無料で配布しています。
気になる方は、ぜひ以下のリンクからダウンロードしてみてください。
\ 無料 & 30秒で完了! /