share

公開日 

更新日 

  • ChatGPT

OpenAI o1とは?6つの特徴や利用制限、GPT-4oとの違いを解説

2024年9月13日、OpenAIから新たなAIモデル「OpenAI o1」が発表されました。

o1は従来モデルであるGPT-4oに比べ、より複雑なタスクを処理することに特化したモデルです。SNSやネットでも話題となり、性能が高評価されています。

しかし「具体的になにがすごいの?」や「GPT-4oと何が変わったの?」などの疑問をもっている方は多いでしょう。

本記事では、OpenAI o1がもつ6つの特徴や利用制限などを解説しています。また、o1モデルとGPT-4oの違いによる、適切な使い分け方も解説しているため、ぜひ参考にしてみてください。

本記事を読めばOpenAI o1(以降o1と記載)の基本がすべてわかるだけでなく、業務への活用方法まで理解できるでしょう。

監修者

SHIFT AI代表 木内翔大

(株)SHIFT AI 代表取締役 / GMO AI & Web3株式会社AI活用顧問 / 生成AI活用普及協会理事 / Microsoft Copilot+ PCのCMに出演 / 国内最大級AI活用コミュニティ SHIFT AI(会員1万人超)を運営。
『日本をAI先進国に』実現のために活動中。Xアカウントのフォロワー数は10万人超え(2025年1月現在)

弊社SHIFT AIでは、AIツールの使い方をお伝えするセミナーを無料で開催しています。

生成AIツールを業務で活用して、生産性を高めたいと考えている方は、以下のリンクから詳細をご覧ください。

【無料】30,000人以上が受講!

OpenAI o1とは?

o1は、OpenAIが開発した最新のAIモデルです。OpenAIは、o1をこれまでのGPTとは別のモデルであると定義しています。

o1モデルの特筆すべき点は、複雑な問題解決能力や論理的思考力の向上です。数学、科学、プログラミングなどの分野で、人間の専門家レベルの性能を示しています。

たとえば、全米数学オリンピック予選で上位500位相当の成績を収めたり、特定の分野で博士レベルを超えたりなど、能力の高さが証明されています。

o1の登場により、研究支援や教育、ビジネス分析など、さまざまな分野で新たな価値を生み出すことが期待されています。

ChatGPTのGPT-4oについては、以下の記事を参考にしてみてください。

ChatGPT-4(GPT-4o)の特徴や使い方
【無料で使える】ChatGPT-4(GPT-4o)の特徴や活用事例、使い方を完全網羅!

【無料で使える】ChatGPT-4(GPT-4o)の特徴や活用事例、使い方を完全網羅!

GPT-4(GPT-4o)は文章・画像・音声に対応の、回答の正確性や多様な機能が特徴のAIモデルです。本記事では、GPT-4oの基礎知識や機能、活用方法などを解説します。本記事を読めば、ChatGPTで業務効率化を一気に進められるでしょう。

OpenAI o1の特徴6選

本章では、o1の特徴を6つ紹介します。

GPT-4oに比べて推論能力が大幅に強化
内部的な推論過程を観察可能
全米数学オリンピック予選で上位500位の実力
プログラミング世界大会で金メダルレベルの実力
物理・生物・化学の問題で人間の博士レベルを超える精度
安全性が向上

まずは本章を読んで、基本的な情報を確認してみてください。

複雑な推論タスクに特化

o1は、数学やプログラミングなど、複雑な推論が必要なタスクを処理することに特化したモデルです。

o1の推論能力はGPT-4oを大きく上回っていることが、OpenAIの検証結果で示されています。

OpenAI o1とgpt-4oの比較グラフ
左:数学オリンピック予選結果
中央:競技プログラミング結果
右:博士レベルの問題に対する結果
出典:Learning to Reason with LLMs(OpenAI)
左:数学オリンピック予選結果
中央:競技プログラミング結果
右:博士レベルの問題に対する結果

数学やプログラミング、博士レベルの問題など、高度な思考を求められるタスクに対して、o1は高い数値を示しています。

内部的な推論過程を観察可能

従来のChatGPTでは、内部で行われている思考プロセスは確認できませんでしたが、o1では思考プロセスの一部を確認できます。

OpenAI o1が思考プロセスを表示している様子
OpenAI o1が思考プロセスを表示している様子

この機能により、ChatGPTがどのような思考経路をたどって結論に至ったのかを理解できます。ChatGPTの判断根拠を把握でき、回答の信頼性をより確認しやすくなりました。

ただし、実際にはより複雑な思考プロセスをたどっており、表示されるのはあくまで”要約”です。そのため、思考プロセスの表示は参考程度にしておくことを推奨します。

全米数学オリンピック予選で上位500位の実力

o1は、全米数学オリンピック予選(AIME)において上位500位に相当する実力を持つことが示されました。

AIMEは、高度な数学的思考力と問題解決能力を要する試験で、アメリカの数学界で優秀な高校生が挑戦します。o1は、15問中平均13.9問を正解し、93%の正答率を達成しました。

この結果は、人間の数学オリンピック候補者と同等以上の実力を示しています。数学的な計算が苦手とされていたAIが、ついにその壁を打ち破ったといえる結果です。

プログラミング世界大会で金メダルレベルの実力

o1は、国際情報学オリンピック(IOI)というプログラミングの世界大会で、参加者の上位10%(金メダルレベル)に入ったことが報告されています。

また、Codeforcesと呼ばれる競技プログラミングをシミュレートしたテスト結果も公表されています。その結果、上記で解説したIOI用に調整されたo1(o1-ioi)が上位7%程度の実力をもつことがわかりました。

プログラミング大会での結果
出典:Learning to Reason with LLMs(OpenAI)
o1-preview:現在一般ユーザーに提供されているモデル
o1:o1モデルの完全版(と考えられる)
o1-ioi:国際情報学オリンピック(IOI)向けに特別に調整されたモデル

o1の高度なプログラミング能力は、ソフトウェア開発の効率化や、複雑なプログラミングコードの生成などに活用できる可能性があります。

物理・生物・化学の問題で人間の博士レベルを超える精度

o1は、GPQA(Graduate-level Physical and Quantitative Assessment)ダイアモンドレベルの問題集で、人間の博士レベルの専門家を上回る正答率を達成しました。

o1が博士レベルの問題で高得点を獲得しているグラフ
出典:Learning to Reason with LLMs(OpenAI)
o1とgpt4oを比較したグラフ

とくに物理学の分野では、94.2%という驚異的な正答率を記録しています。

出典:Learning to Reason with LLMs(OpenAI)
GPQAのテスト結果の詳細
pass@1:1回だけの出力で評価
cons@64:64回のうち最も多く出現した出力で評価

この結果は、o1が科学の複雑な概念を理解し、高度な問題を解決する能力をもつことを示しています。o1は科学研究の支援や、難解な科学的概念の説明、教育現場での活用など、幅広い分野での応用が期待されます。

安全性が向上

o1では、従来のモデルと比較して安全性が大幅に向上しました。

安全性の評価方法の一つに、ユーザーがAIを意図的に暴走させたり、中身の情報を抜き取ったりしようとするジェイルブレイクに対して、AIがどれだけ規則を守り続けるかをテストするものがあります。もっとも難しいジェイルブレイクテストにおいて、GPT-4oが100点満点中22点だったのに対し、o1-previewモデルは84点を獲得しました。

加えて、OpenAIは米国および英国の機関(AI Safety Institutes)と正式な合意を結び、これらの研究所にo1モデルの研究版への早期アクセスを許可しました。この取り組みによって、今後のo1アップグレードモデルが、より安全にリリースされます。

OpenAIは、生成AIで懸念される安全性を、これらの取り組みによって担保しようとしています。

o1-previewとo1-miniの違い

現在利用可能なバージョンには、o1-miniとo1-previewの2種類があります。これらのモデルは、2024年9月13日現在、有料版のChatGPT Plus・Teamユーザーが利用できます。

o1-miniは、o1-previewよりも高速・低コストのモデルでありながら、一部タスクではo1-previewを上回ります。それぞれ特徴が異なるため、適切に使い分けることが求められます。

o1-miniの性能グラフ
出典:Learning to Reason with LLMs(OpenAI)

o1-previewとo1-miniには、以下のような違いがあります。

特性o1-previewo1-mini
1. 目的と最適化複雑な推論タスクを幅広く処理STEM(科学、技術、工学、数学)分野の推論に特化
2. 性能幅広い分野で高性能STEM関連タスクでo1-previewに匹敵かそれ以上、STEM以外の知識では劣る
3. コストと効率比較的高価o1-previewより80%安価で高速
5. 使用例幅広い推論タスクに適する推論は必要だが幅広い世界知識は不要なアプリケーションに適する
6. アクセス• ChatGPT Plus/Teamユーザー
• API tier 5開発者
• ChatGPT Plus/Teamユーザー
• API tier 5開発者
・将来的に無料ユーザーにも提供予定

つまり、o1-miniはSTEM分野に特化した効率的なモデルであり、o1-previewはより汎用的な高性能モデルと言えます。それぞれ特徴が異なるため、用途や予算に応じてモデルを選択することが求められています。

OpenAI o1とGPT-4oの使い分け方

OpenAIは「o1モデルはGPT-4oに置き換わるモデルではない」と定義しており、それぞれのモデルの特徴を活かして適切に使い分けることを推奨しています。

o1 models offer significant advancements in reasoning, but they are not intended to replace GPT-4o in all use-cases.

引用元:Reasoning models(OpenAI)

それを象徴する例として、人間による評価を行った結果、ライティングの分野ではGPT-4oに軍配が上がっています。

GPT-4oはライティングが得意であることを示すグラフ
出典:Learning to Reason with LLMs(OpenAI)
人間の評価でGPT-4oはライティング分野で高評価

それぞれのモデルを違いと、適切な活用例を示します。

モデル特徴適した使用場面
o1-preview広範な一般知識を用いて難問を推論科学的推論、複雑な問題解決、長時間の思考が必要な場合
o1-miniコーディング、数学、科学タスクに特化一般知識を必要としない特定のSTEM分野のタスク
GPT-4o画像入力、関数呼び出し、高速応答に対応画像認識、API連携、即時応答が必要なアプリケーション

o1モデルは推論能力に優れていますが、GPT-4oの方が適している場面もあります。画像入力や関数呼び出しが必要な場合、あるいは一貫して高速な応答時間が求められる場合は、GPT-4oやGPT-4o miniが適しています。

一方、深い推論が必要で、より長い応答時間を許容できるアプリケーションを開発する場合は、o1モデルが優れた選択肢でしょう。

使用するモデルを選択する際は、アプリケーションの要件や目的を慎重に検討し、各モデルの特性を考慮して最適な選択をすることが重要です。

OpenAI o1はAPIも利用可能

o1のAPIが利用可能で、開発者や企業は自社のアプリケーションやサービスにo1を組み込めます。

APIの利用には、Tier 5※のレート制限が適用されます。o1-previewとo1-miniの2つのモデルが提供され、それぞれ異なる制限が設けられています。
※OpenAIのAPIは用途によってTier1〜Tier5に分けられる

Model入力コスト出力コスト入力コスト
(Batch API※)
出力コスト
(Batch API※)
o1-mini$3.00 / 1M tokens$12.00 / 1M tokens
o1-mini-2024-09-12$3.00 / 1M tokens$12.00 / 1M tokens
o1-preview$15.00 / 1M tokens$60.00 / 1M tokens
o1-preview-2024-09-12$15.00 / 1M tokens$60.00 / 1M tokens
gpt-4o$5.00 / 1M tokens$15.00 / 1M tokens$2.50 / 1M tokens$7.50 / 1M tokens
gpt-4o-2024-08-06$2.50 / 1M tokens$10.00 / 1M tokens$1.25 / 1M tokens$5.00 / 1M tokens
gpt-4o-2024-05-13$5.00 / 1M tokens$15.00 / 1M tokens$2.50 / 1M tokens$7.50 / 1M tokens
gpt-4o-mini$0.150 / 1M tokens$0.600 / 1M tokens$0.075 / 1M tokens$0.300 / 1M tokens
gpt-4o-mini-2024-07-18$0.150 / 1M tokens$0.600 / 1M tokens$0.075 / 1M tokens$0.300 / 1M tokens

参考:Pricing(OpenAI)
※複数のリクエストを一度にまとめて送信し、効率的にAPIを利用するための方法

o1モデルは、gpt-4oやgpt-4o miniに比べてAPI料金が高い傾向にあります。ただ、OpenAIのAPI料金はだんだんと安くなる傾向です。

今後、o1での開発を検討している方は、API料金が抑えられることを期待してもよいでしょう。

【最新】OpenAI o1は利用制限に注意

2024年9月17日現在、ChatGPT Plusユーザーの場合、o1-previewは週に50メッセージ、o1-miniは1日に50メッセージという制限が設けられています。

なお、無料ユーザーは現時点でo1-previewとo1-miniを利用できません※。Enterprise・Educationプランのユーザーは、2024年9月16日の週から順次利用できるようになる予定です。
※o1-miniは今後無料ユーザーに開放予定

また、o1のAPIは、1分間あたりのリクエスト数(RPM)は20回と低く設定されていますが、1分間に処理できるトークン数(TPM)は3,000万から1億5,000万と非常に多い設定です。

これは、o1が複雑で大規模なデータ処理に適していることを示しています。たとえば、長文の要約や複雑な分析タスクなど、一度のリクエストで大量のデータを処理する用途に向いています。

開発者は、これらの制限を考慮しながら、o1の高度な推論能力や科学的知識を活用したアプリケーションを設計することが求められます。APIの利用制限について詳しく知りたい方は、OpenAIの公式サイトを参照してください。

【OpenAI直伝】OpenAI o1のプロンプトのコツ

OpenAIはo1モデルリリースに伴い、o1を利用する際のプロンプトに関するアドバイスを公開しました。

  • シンプルにプロンプトを書く
  • プロンプトテクニックを使いすぎない
  • 区切り記号を使用する

本章では、その中でもとくに重要なコツについてまとめているため、ぜひ参考にしてみてください。

シンプルにプロンプトを書く

o1には、シンプルなプロンプトを入力することが推奨されています。従来のAIモデルでは、詳細かつ、できるだけ具体的なプロンプトが良いとされていましたが、それとは反対のアドバイスです。

たとえば「この数式を解いてください」や「次のコードの問題点を指摘してください」といったシンプルな指示が効果的とされます。

複雑な指示を避けることで、モデルは本来の推論能力を最大限に発揮できるといいます。プロンプトを複雑にする必要がないことは、ユーザーにとっても効率的です。

プロンプトテクニックを使いすぎない

OpenAI o1では、従来のAIモデルで効果的だったいくつかのプロンプトテクニックが不要、あるいは逆効果になる場合があります。

たとえば、複数の例を示してから質問する方法であるFew-Shot Promptingや、「段階的に考えてください」といったChain of Thought Prompting(思考の連鎖プロンプティング)による指示は、o1の性能を低下させる可能性があります。

o1は内部で高度な推論プロセスを行うため、これらのテクニックは不要であると考えられます。代わりに、モデルの推論能力を信頼し、単純明快な質問や指示を与えることが重要です。

区切り記号を使用する

プロンプト内で異なる部分を明確に区別するために、トリプルクォーテーション(”””)、XMLタグ、またはセクションタイトルなど、区切り記号を使用することが推奨されます。

これにより、モデルは各セクションの目的や内容を正確に理解し、適切に処理できます。たとえば、以下のように区切り記号を使用します。

"""以下のコードを最適化してください:
"""
[コードを入力]

このように、区切り記号を使用して、プロンプト内の情報をAIにわかりやすく伝えることが重要です。

【実演】OpenAI o1の活用例

本章では、o1を実際に使用している様子をお見せしながら、具体的な活用例を紹介します。

  • フェルミ推定を行う
  • プログラミングコードを生成する
  • 数学問題を解く

活用例を確認して、自身の業務への応用もイメージしてみてください。

フェルミ推定を行う

OpenAI o1は、複雑な推論を要するフェルミ推定において優れた能力を発揮します。フェルミ推定は、正確な数値を得ることが難しい問題に対して、論理的な推論と概算を組み合わせて答えを導き出す手法です。

o1がフェルミ推定している画像

o1モデルは、問題を複数の段階に分解し、各段階で必要な情報を論理的に推論しながら、最終的な答えにたどり着きます。

このように、o1は複雑な問題を体系的に分析し、合理的な仮定に基づいて推論を行う能力をもっています。ビジネス戦略の立案や市場規模の推定など、不確実性の高い領域での意思決定支援に活用できるでしょう。

プログラミングコードを生成する

o1は、プログラミングコードの生成において卓越した能力をもっています。

今回は、物理シミュレーションを行うためのアプリケーションを作成してみます。

o1にプログラミングコードを生成してもらっている様子

このコードをv0という生成AIツールで実装した結果を示します。

o1のコードを実装したGIF画像
クリックすると四角形が転がる

たった数行のプロンプトで、物理シミュレーションを作成できました。

o1がもつプログラミング性能を活かすことで、コードの品質向上や開発時間短縮が期待できます。

数学問題を解く

o1の数学問題解決能力は、高度な数学的推論を必要とする場面で真価を発揮します。

たとえば、以下のような問題を解いてもらいましょう。

半径2.67cmの円に内接する正6角形の面積を求めよ、を解いているo1
約20秒で正解を出力

上記の問題は比較的簡単ですが、これまでのAIモデルだと解答できない難解な問題でも、o1なら簡単に処理できます。

o1の高度な数学能力は、数学教育や科学研究、エンジニアリングの分野で役立つでしょう。

OpenAI o1の今後の展望

o1は、現在プレビュー段階(o1-preview)にあり、今後さらなる進化が期待されています。OpenAIは、o1モデルの継続的な開発と改良を計画しており、モデルの性能向上だけでなく、機能の拡充も予定しています。

また、近い将来、o1モデルにはウェブブラウジング機能やファイル・画像のアップロード機能が追加される見込みです。これら機能の追加により、o1の利用範囲がさらに拡大し、より多くのユーザーにとって有用なツールになると予想されます。

また、OpenAIはGPTシリーズの開発も並行して進めていく方針です。o1シリーズの高度な推論能力とGPTシリーズの幅広い応用性を組み合わせた、より強力なAIシステムの登場が期待されます。

さらに、o1-miniの無料版ChatGPTユーザーへの提供も計画されています。高度な推論能力を持つAIが、より多くの人々にアクセス可能になるため、教育や研究、ビジネスなど、さまざまな分野でo1の活用が広がることが予想されます。

OpenAI o1で複雑なタスクを効率化させよう

o1は、数学やプログラミング、科学分野のタスク処理に特化したモデルです。従来のモデルであるGPT-4oと比較しても多くの分野で突出しているため、今後はよりChatGPTの用途の幅が広がるでしょう。

ただし、o1にはpreviewとminiがあります。また、GPT-4oはo1にすべての面で劣っているわけでなく、ライティング能力が高かったり、応答が高速だったりなど、o1に勝る部分もあります。

そのため、ChatGPTを活用する際には、o1-previewとo1-mini、GPT-4o、GPT-4o miniを適切に使い分ける意識が重要です。本記事を参考に、それぞれの特徴を把握して、ChatGPTをより便利に使ってみてください。

生成AIの効果的な活用方法を学び、業務効率化や収入アップを目指したい方へ。弊社SHIFT AIでは、無料セミナーを開催し、参加者には生成AIマスターロードマップや業務効率化ガイドなど、実践的な特典も多数ご用意しています。

AIツールを活用してビジネスを加速させたい方は、以下のリンクからセミナーの詳細をご確認ください。

【無料】30,000人以上が受講!

記事を書いた人

SHIFT AI TIMES編集長

大城一輝

フリーランスとしてライター、ディレクター、生成AIコンサルタントとして活動している。AI活用の講師も多数経験。
SHIFT AIではオウンドメディア(SHIFT AI TIMES)の編集長を担当。
また、SHIFT AIのモデレーターとしてコミュニティ運営や講師にも携わっている。
G検定・生成AIパスポート・Generative AI Test合格
Google AI Essentials修了
ノーコード生成AIツール「Create.xyz」公式アンバサダー
Xはこちら
Linkedinはこちら