2024年8月21日より、GPT-4oとGPT-4o miniのファインチューニングが可能になりました。GPT-4oは、OpenAIの際高性能モデルであり、GPT-4o miniは高性能ながら高速の生成速度をほこるAIモデルです。
ファインチューニングを行うことで、開発者や企業は、より性能の高い、もしくは低コストのサービス・アプリを開発できるようになります。
本記事では、GPT-4oとGPT-4o miniのファインチューニングにかかる料金や使い方、活用例などを解説します。
自社に生成AIを導入し、業務を効率化したいと考えている方は、ぜひ参考にしてみてください。
|監修者
(株)SHIFT AI 代表取締役 / GMO他複数社AI顧問 / 生成AI活用普及協会理事 / Microsoft Copilot+ PCのCMに出演 / 国内最大級AI活用コミュニティ(会員5,000人超)を運営。
『日本をAI先進国に』実現の為に活動中。Xアカウントのフォロワー数は8.6万人超え(2024年8月現在)
GPT-4oとGPT-4o miniのファインチューニングに対応
OpenAIは、GPT-4oとGPT-4o miniのファインチューニングを可能にしたことを発表しました。これにより、開発者・企業は自社業務に特化したAIモデルを作成できます。
ファインチューニングは、モデルの応答やトーンを調整したり、複雑な指示に従わせたりできるようになります。今回ファインチューニングが可能となったモデルの特徴は、以下のとおりです。
モデル名 | 特徴 | 適用範囲 |
---|---|---|
GPT-4o | – 最高性能を誇る – 複雑なタスクに適している | – 複雑なタスク – 専門的な作業 |
GPT-4o mini | – 高速で費用対効果が高い – 日常的なタスクに適している | – 日常的なタスク – 効率重視の作業 |
両モデルとも、コーディングから創造的な文章作成まで、幅広い分野で活躍します。他社モデルと比較しても優秀なモデルであるため、性能も問題ないでしょう。
GPT-4oに関しては、以下の記事で詳しく解説しています。
また、GPT-4o miniに関しては、以下の記事を参考にしてみてください。
GPT-4oとGPT-4o miniのファインチューニングにかかる費用
本章では、ファインチューニングにかかる料金について解説します。
どのくらい費用がかかるか確認して、予算に合わせたモデルを選びましょう。
GPT-4o・GPT-4o mini
GPT-4oとGPT-4o miniのファインチューニングにかかる料金は以下のとおりです。
モデル | 推論コンテキストの長さ | 学習例のコンテキストの長さ |
---|---|---|
gpt-4o-2024-08-06 | 128,000トークン | 65,536トークン(128k 近日公開予定) |
gpt-4o-mini-2024-07-18 | 128,000トークン | 65,536トークン(128k 近日公開予定) |
GPT-4oとGPT-4o miniのファインチューニングには、トレーニングと推論の両方で費用がかかります。GPT-4oは高性能ですが、それに応じて費用も高くなります。
一方、GPT-4o miniは非常に低コストで、GPT-4oに性能は劣るものの、日常的なタスクには最適です。
費用を計算する際は、データセットのサイズ、エポック数(トレーニングデータセット全体を何回モデルに学習させるかを示す回数)、選択するモデルなどを考慮する必要があります。
OpenAIは費用見積もりのためのツールを提供しており、開発者はこれを利用して予算を計画できます。コストの計算に関しては、OpenAIの公式サイトを確認してみてください。
適切なモデルとデータセットのサイズを選択することで、コストを最適化しながら望ましい結果を得られます。
2024年9月23日までは毎日1Mトークン分が無料
OpenAIは、2024年9月23日までの期間限定で、すべての組織に対してトレーニング用に毎日100万トークンを無料で提供しています。
この無料枠は、GPT-4o miniのファインチューニングに適用され、開発者はコストを気にせずにモデルのカスタマイズを試せます。
100万トークンは、中規模のデータセットでファインチューニングを行うのに十分な量で、多くのユースケースに対応できます。たとえば、数百から数千の会話例や、数万行のコードサンプルをトレーニングできます。
この無料期間を最大限に活用するために、毎日の無料枠を使い切れるような計画をたてるとよいでしょう。
GPT-4oとGPT-4o miniをファインチューニングに使う方法
GPT-4oやGPT-4o miniのファインチューニングをする場合、まずはOpenAIのプラットフォームに移動します。
ここで、「+Create」をクリックすると、ファインチューニングの設定が表示されます。そして「Base Model」をクリックして、「gpt-4o-2024-08-06」か「gpt-4o-mini-2024-07-18」を用途に応じて選びましょう。
これで、GPT-4o及びGPT-4o miniをファインチューニングできます。この後の設定に関しては、OpenAIのファインチューニングガイドラインを参考にしてみてください。
ファインチューニングの活用例
本章では、実際にGPT-4oやGPT-4o miniをファインチューニングして作成したモデル例を紹介します。
実際にどのようなモデルを作成できるのか確認してみましょう。
デバッグ特化モデル
Cosineの”Genie”は、SWE-benchベンチマーク※で43.8%のスコアを達成し、最高クラスの性能を発揮しました。
※AIによるソフトウェア開発能力を評価するためのベンチマーク
このデバッグ特化モデルは、実際のソフトウェアエンジニアの作業例を用いてトレーニングされ、複雑な技術的問題を推論し、高精度でコードを変更できるよう設計されています。
企業にとって、このようなモデルは開発プロセスの効率化、バグの早期発見と修正、コード品質の向上に大きく貢献します。
さらに、新人エンジニアの教育ツールとしても活用でき、チーム全体のスキル向上にも役立ちます。この事例を参考に、自社にあったファインチューニングの活用方法を考えてみましょう。
SQL作成特化モデル
DistylのSQL作成特化モデルは、SQL作成能力を測るためのBIRD-SQLベンチマークで71.83%の実行精度を達成し、リーダーボードで1位を獲得しました。
このモデルは、クエリの再構成や分類、修正などのタスクで優れた性能を発揮し、とくにSQL生成で高いパフォーマンスを示しました。
このようなモデルは、データアナリストやビジネスユーザーが自然言語でデータの質問から適切なSQLクエリを生成できるため、データ分析の効率向上に貢献します。
自社にファインチューニングを行うことが難しい場合は、弊社SHIFT AIの生成AI導入サービスの活用を検討してみてください。
その企業特有の業務に特化したモデルの構築をサポートし、業務効率化を実現できます。ご興味のある方は、以下の資料から詳細を確認してみてください。
\ 無料で資料請求 /
ファインチューニングとRAGの使い分け
ファインチューニングの他に、生成AIにはRAG(ラグ)やプロンプトエンジニアリングといった技術があります。
- RAG
- プロンプトエンジニアリング
- ファインチューニング
本章では、上記3点の使い分けについて解説します。
RAG
RAG(Retrieval-Augmented Generation、ラグ)は、生成AIと外部知識ベースの組み合わせを実現する技術です。つまり、生成AIの中身を操作するファインチューニングと異なり、RAGは外付けHDDを生成AIに提供するようなイメージです。
RAGでは、生成AIがユーザーの質問に対して、まず関連する情報を外部データベースから検索し、その情報をもとに回答を生成します。
RAGの長所は、最新の情報や専門知識を柔軟に取り込める点と、ソース情報の追跡が可能な点です。一方で、検索精度に依存する点や、データベース管理が必要な点が短所です。
RAGは、頻繁に更新される情報を扱う場合や、広範な知識ベースが必要なシナリオでとくに有効です。たとえば、社内FAQボット、製品カタログの問い合わせ、法律や医療などの専門分野での質問応答システムに適しています。
ファインチューニングとRAGの違いを理解して、適切な方法を選びましょう。
プロンプトエンジニアリング
プロンプトエンジニアリングは、言語モデルに適切な指示や文脈を与えることで、望ましい出力を得る技術です。
具体的には、タスクの説明、例示、制約条件などを含むようにプロンプトを設計します。ファインチューニングと比較すると、プロンプトエンジニアリングは実装が容易で、調整が容易です。また、モデル自体を変更する必要がないため、柔軟性が高い点がメリットです。
しかし、複雑なタスクや特殊な要件に対しては、プロンプトのみでは限界があります。たとえば、一貫したトーンの維持、複雑な多段階タスクの実行、特定領域の深い理解が必要な場合などには適しません。
また、長いプロンプトは処理コストが高くなる可能性があります。プロンプトエンジニアリングは、一般的なタスクや迅速な調整が必要な場面で有効ですが、高度なカスタマイズにはファインチューニングが必要です。
特性 | プロンプトエンジニアリング | ファインチューニング |
---|---|---|
実装の容易さ | 容易 | 複雑 |
学習コスト | 低 | 高 |
カスタマイズ度 | 中 | 高 |
モデルの変更 | 不要 | 必要 |
ファインチューニング
ファインチューニングは、特定のタスクや領域でモデルの性能を向上させたい場合に効果的です。
とくに、一貫したトーンでの対話や特定のフォーマットの出力が必要な場合、複雑な指示に従う必要がある場合などに有用です。
たとえば、企業固有の文書作成、特定の法律や規制にもとづく回答生成、専門的な知識をもちいた問題解決などが適しています。RAGやプロンプトエンジニアリングでは、大量の特殊なデータを効率的に学習させることや、非常に特殊な応答パターンを一貫して生成することが難しい場合があります。
また、RAG・プロンプトエジニアリング・ファインチューニングは補完的に使用できます。たとえば、ファインチューニングされたモデルをベースに、RAGで最新情報を追加し、プロンプトエンジニアリングで細かい調整を行うといった複合的なアプローチが可能です。
適切な手法を選択して、より柔軟で強力なAIモデルを構築しましょう。
GPT-4o・GPT-4o miniをファインチューニングしてみよう
GPT-4oやGPT-4o miniのファインチューニングが可能になったことにより、開発者はより高性能、もしくは低コストでAIを組みこんだサービスやアプリを開発できるようになりました。
また、AIモデルを調整する技術はファインチューニングだけでなく、RAGやプロンプトエンジニアリングといった方法もあります。自社に求められるタスクに応じて、適切な方法を使いましょう。
自社でAIを使った業務効率化ツールやサービスの導入などを検討しつつも、ノウハウがなく困っている場合は、弊社SHIFT AIの生成AI導入サービスを検討してみてください。
弊社SHIFT AIがかかえる生成AIのプロが、貴社の生成AI導入を徹底的にサポートします。ご興味がある方は、以下のリンクから詳細をご確認ください。
\ 無料で資料請求 /