GPTsのKnowledgeの使い方!対応ファイル形式やうまく使うコツも解説
GPTsのKnowledge(ナレッジ:知識)を活用すれば、ChatGPTにない独自の情報を参照できるようになります。ChatGPTの回答の幅が広がり、より利便性を高められる優れた機能です。
ただし、Knowledgeは便利な機能である一方、使い方を誤るとChatGPTの性能を落としたり、情報漏えいのリスクが高まったりします。
本記事では、GPTsのKnowledgeの特徴やメリット・デメリット、そして効果的な活用方法まで、幅広くカバーしています。さらに、実際の使用例や注意点も交えて、より実践的な内容を解説します。
この記事を読むことで、最新のデータや専門知識をChatGPTに簡単に取り込み、より正確で有用な情報を引き出せるようになるでしょう。
監修者
SHIFT AI代表 木内翔大
(株)SHIFT AI 代表取締役 / GMO他複数社AI顧問 / 生成AI活用普及協会理事 / Microsoft Copilot+ PCのCMに出演 / 国内最大級AI活用コミュニティ(会員5,000人超)を運営。
『日本をAI先進国に』実現の為に活動中。Xアカウントのフォロワー数は9万人超え(2024年9月現在)
GPTsを企業でうまく活用するためには、実際にそれを使う社員のAIリテラシーがもっとも重要です。
弊社SHIFT AIでは、GPTsなどを使いこなせるようになりたい方に向けて、無料のセミナーを開催しています。
生成AIで業務を効率化したいと考えている方は、以下のリンクから詳細を確認してみてください。
目次
GPTsのKnowledgeはRAGと似た機能
GPTsのKnowledge(ナレッジ:知識)は、RAG(ラグ:Retrieval Augmented Generation)と呼ばれる技術と類似した仕組みをもっています。
RAGは、生成AIに外部知識を組み込む手法で、質問に対して関連情報を検索し、その情報をもとに回答を生成します。パソコンにおける外付けハードディスクと似ています。
GPTsのKnowledgeも同様に、アップロードされたファイルから関連情報を抽出し、ユーザーの質問に対してより正確で具体的な回答を生成します。たとえば、企業の製品マニュアルをアップロードした場合、ユーザーが特定の製品について質問すると、GPTはそのマニュアルから関連情報を参照し、的確な回答を提供できます。
この仕組みにより、GPTsは事前学習された知識だけでなく、最新のドキュメントや専門的な情報を活用して、より適切な回答を生成できるようになるのです。
GPTsのKnowledgeが対応しているファイル形式・数・サイズ
GPTsのKnowledgeについて、ファイルについての制限を2つ紹介します。
これらの制限を理解しておくことで、より適切にKnowledgeを活用できるようになります。
対応ファイル形式
GPTsのKnowledge機能は、多様なファイル形式に対応しており、ユーザーが幅広い種類の情報をアップロードできるようになっています。
主な対応ファイル形式は以下のとおりです。
ファイル形式 | 拡張子 | 主な用途 |
---|---|---|
文書、レポート、マニュアル | ||
テキスト | .txt | プレーンテキスト、コード |
CSV | .csv | データセット、表形式のデータ |
Excel | .xlsx | スプレッドシート、データ分析 |
画像 | .jpg, .png | 視覚情報、図表 |
これらのファイル形式に対応することで、ユーザーは必要な情報を最適な形式でGPTsに提供できます。たとえば、製品マニュアルはPDFで、データセットはCSVで、グラフや図表は画像ファイルでアップロードするといった具合です。
多様なファイルをアップロードできるため、自社の都合に合わせてKnowledgeを使える点はメリットといえるでしょう。
ファイル数・ファイルサイズ上限
GPTsのKnowledge機能には、アップロードできるファイル数とサイズに制限があります。
ファイル数とサイズの制限は以下のとおりです。
項目 | 制限 |
---|---|
最大ファイル数 | 20個 |
1ファイルの最大サイズ | 512MB |
合計サイズ上限 | 約500MB |
1ファイルの最大トークン数 | 200万トークン 日本語で120万文字〜150万文字 |
これらの制限内で効果的に情報を提供するためには、重要度の高い情報を優先的にアップロードすることが推奨されます。
また、大きなファイルは分割したり、不要な情報を削除したりして、サイズを抑えることも有効です。ファイル数が多すぎると処理速度や回答精度が低下する可能性があるため、必要最小限のファイル数に抑えることも重要です。
【実演】GPTsのKnowledgeの使い方
GPTs作成画面でプロンプトを入力する
まずは、ChatGPTのトップ画面から「GPTを探す」を押して、「作成する」からGPT作成画面に移動します。
そして、GPTsの名前や指示文を入力しましょう。今回はAIと著作権に関する質問に回答するGPTsを作成します。
具体的なGPTsの作り方については、以下の記事を参考にしてみてください。
関連記事:【実演あり】GPTsの作り方を7ステップで解説!作成のコツや必要な料金も紹介
Knowledgeで資料を与える
次に、「知識(Knowledge)」という場所の「ファイルをアップロードする」をクリックして、パソコンに保存しているファイルをアップロードします。
任意のファイルをアップロードしましょう。ファイルは20個までアップロードできます。
今回は、文化庁が発行している「AIと著作権」という資料を提供します。これで、Knowledgeの設定は終了です。
プレビューする
最後に、提供したKnowledgeを適切に参照しているか、プレビューで確かめましょう。
以下のように、今回はうまく情報を参照して回答してくれました。
また、どこから引用したかを聞くことで、確実性を高められます。
これで、Knowledgeを使ったGPTs作成は完了です。
GPTsのKnowledgeのメリット
GPTsのKnowledgeを活用することによるメリットを3つ紹介します。
- ChatGPTがもっていない知識を簡単にインプットできる
- 回答の正確性が高まる
- 言葉の意味を理解して情報を引き出せる
それぞれのメリットを理解して、Knowledgeをうまく活用しましょう。
ChatGPTがもっていない知識を簡単にインプットできる
GPTsのKnowledgeは、RAGのように、ChatGPTが事前学習していないデータを簡単に提供できます。ChatGPTは学習データの制約や最新情報の欠如という課題がありますが、Knowledgeによってこれらを補完できます。
たとえば、新製品のマニュアルをアップロードすれば、ChatGPTは最新の製品情報にもとづいて質問に答えられるようになります。また、社内の特殊な用語や規則をKnowledgeとして与えることで、組織固有の問い合わせにも対応可能になります。
この機能により、ChatGPTの知識基盤を柔軟に拡張し、より幅広い分野や最新のトピックに対応できるようになります。
回答の正確性が高まる
Knowledgeは、ChatGPTのハルシネーション(幻覚)を防ぐ効果があります。ハルシネーションとは、生成AIが実際には存在しない情報を事実のように生成してしまう現象です。
Knowledgeとして提供された資料をもとに回答を生成するため、根拠のない情報の出力を抑制できます。たとえば、企業の財務報告書をKnowledgeとして与えれば、ChatGPTは具体的な数値や事実に基づいた正確な財務分析を提供できるようになります。
これにより、ユーザーはより信頼性の高い情報を得ることができ、重要な意思決定や研究活動などにChatGPTを安心して活用できるようになります。
言葉の意味を理解して情報を引き出せる
GPTsのKnowledgeは、高度な自然言語理解能力を活かして、ユーザーの意図を汲み取りながら適切な情報を引き出します。Knowledge内の厳密な用語一致を必要とせず、意味的に関連する情報を柔軟に検索できます。
たとえば、ユーザーが「深層学習について教えて」と質問した場合、Knowledgeに「ディープラーニング」という用語が使われていても、ChatGPTはその関連性を理解し、適切な情報を提供できます。
この機能により、ユーザーは専門用語や正確な表現を知らなくても、必要な情報にアクセスしやすくなり、より自然な対話を通じて知識を得られるのです。
GPTsのKnowledgeのデメリット
次に、Knowledgeのデメリットについて解説します。
- ファイルが多すぎると性能が落ちる
- 文脈が流れから類推して情報を引き出す性能が低い
メリットだけでなくデメリットも理解しておきましょう。
ファイルが多すぎると回答精度が落ちる
GPTsのKnowledge機能は、アップロードされたファイル数が多くなりすぎると、回答精度の低下を引き起こす可能性があります。ChatGPTが膨大な情報の中から関連データを探し出す際、対象データが多すぎると、適切な情報の選択が困難になるためです。
たとえば、企業の全部門の資料を一度にアップロードすると、特定の部門に関する質問に対して、不要な情報まで含めた回答を生成してしまう可能性があります。
このデメリットを軽減するには、必要最小限のファイルに絞ることや、テーマごとに異なるGPTsを作成するなどの工夫が効果的です。適切な情報量の管理が、Knowledgeの効果的な活用につながります。
提供した資料が外部に流出する可能性がある
GPTsのKnowledgeを使用する際、提供した資料が意図せず外部に流出するリスクがあります。ChatGPTの学習や、プロンプトインジェクション(悪意のあるユーザーが特定の指示を送り込む攻撃)によって、機密情報が漏えいする可能性があります。
ChatGPTはデフォルトでユーザーの入力を学習に使用します。Knowledgeで提供された資料の扱いについては明確に言及されていませんが、学習に使われる可能性があります。
また、プロンプトインジェクションにより、悪意のあるユーザーがKnowledge内の情報にアクセスしようとする可能性もあります。
たとえば、企業の内部文書や顧客データをKnowledgeとして提供した場合、これらの情報が意図せず外部に流出するリスクがあります。
このリスクを軽減するために、機密情報や個人情報を含む資料はKnowledge機能に提供しないことが重要です。公開可能な一般的な情報のみを使用し、セキュリティ設定を慎重に行うことで、情報流出のリスクを最小限に抑えることができます。
また、ChatGPTの組織・企業向けプランに入ったり、学習させない設定を行ったりする方法も有効です。GPTsに学習させないように設定するためには、以下の記事を参考にしてみてください。
関連記事:GPTsを学習させない方法3選!ChatGPTからの情報漏洩リスクをゼロに
GPTsのKnowledgeをうまく使うコツ
本章では、Knowledgeをうまく活用して、GPTsを理想の挙動にするためのコツを紹介します。
自分に合ったGPTsを作成して、業務効率化を実現させましょう。
提供するファイルを厳選する
GPTsのKnowledgeを効果的に活用するには、提供するファイルを厳選することが重要です。ファイルが多すぎるとChatGPTが情報を適切に処理できず、回答の質が低下する可能性があります。
たとえば、企業の製品マニュアルをアップロードする場合、全製品のマニュアルではなく、よく問い合わせのある製品や最新製品のマニュアルに絞ることで、より的確な回答を得やすくなります。
ファイルを厳選する際は、以下の点を考慮するとよいでしょう。
- 目的に直接関連する情報を含むファイル
- 最新かつ正確な情報を含むファイル
- 重複した情報を含まないファイル
このように厳選することで、ChatGPTの処理効率が向上し、より正確で迅速な回答を得られるようになります。
ファイルの中身を整理する
GPTsのKnowledgeの効果を最大化するには、アップロードするファイルの中身を事前に整理することが重要です。
単にファイルをそのまま提供するのではなく、不要な情報を削除したり、情報を階層構造化したりすることで、ChatGPTの理解度と回答の精度が向上します。
たとえば、製品マニュアルをアップロードする際、目次を詳細化し、各セクションに明確な見出しをつけることで、ChatGPTが必要な情報をより正確に抽出できるようになります。また、頻繁に使用される用語や略語の定義リストを追加することも効果的です。
乱雑なテキストを構造化する際は、事前にChatGPTに構造化したテキストに変換してもらうとよいでしょう。たとえば以下のプロンプトを入力してみてください。
提供するテキストをセクションに分けて、以下の例を参考に構造化した文書に変換してください。内容を追加したり、削除したりしてはいけません。視覚的に理解しやすくしてください。
#参考
1. 大見出し1
1.1 中見出し1
[本文]
1.1.1 小見出し1
[本文]
1.1.2 小見出し2
[本文]
1.2 中見出し2
[本文]
・
・
・
#テキスト
[ユーザー入力]
ファイル整理のポイントは、以下のとおりです。
- 明確な構造と見出しの使用
- 重要な情報のハイライト
- 関連情報のグループ化
- 不要なデータの削除
このように整理された情報を提供することで、ChatGPTはより効率的に知識を活用し、ユーザーの質問に対してより適切で具体的な回答を生成できるようになります。
GPTsのKnowledgeを活用して業務効率化!
GPTsのKnowledgeを活用することで、社内FAQボットや、過去の事例を引用するボットなどを簡単に作成できます。
ファイル数が多すぎると回答精度が落ちることがあるため、本記事を参考に、工夫してKnowledgeを提供し、理想のGPTsを作成してみてください。
弊社SHIFT AIでは、GPTsの作り方をはじめとした、AIリテラシー向上のための無料セミナーを行なっています。
AI人材を目指したい方は、以下のリンクからサービス内容をご確認ください。
【無料】AIでキャリアアップ
記事を書いた人
SEOメディア責任者
大城一輝
フリーランスとしてライター、ディレクター、生成AIコンサルタントとして活動している。AI活用の講師も多数経験。
SHIFT AIではSEOメディア運用を担当。
また、SHIFT AIのモデレーターとしてコミュニティ運営や講師にも携わっている。
G検定・生成AIパスポート・Generative AI Test合格
Google AI Essentials修了
ノーコード生成AIツール「Create.xyz」公式アンバサダー
Xはこちら
Linkedinはこちら
【無料】AIでキャリアアップ
セミナーの詳細を確認する