【実例付き】Perplexityの画像生成機能を3つのモデル別に徹底解説
PerplexityのProプランで使える画像生成機能について、「どの程度のクオリティで生成できる?」「具体的な画像の生成方法は?」と気になっていませんか。
あなたが望む画像をつくれるのであれば、画像生成以外にも便利な機能を兼ね備えたPerplexityを使うに越したことはありません。
しかし、課金してから「思っていた画像が生成できなかった」「別の画像生成AIの方がよかった」と後悔するのは、時間的にも金銭的にも損失です。
後悔や損失がないよう、本記事ではPerplexityの画像生成機能や生成できる画像の特徴や品質の違いを、実例を交えて紹介します。
また、効果的なプロンプトの作成方法や、商用利用に関する注意点についても触れています。
Perplexityの画像生成機能について正確に把握し、あなたのニーズに合わせた最適な画像生成AIモデルを選択する判断材料にしてください。
監修者
SHIFT AI代表 木内翔大
(株)SHIFT AI 代表取締役 / GMO他複数社AI顧問 / 生成AI活用普及協会理事 / Microsoft Copilot+ PCのCMに出演 / 国内最大級AI活用コミュニティ(会員9,000人超)を運営。
『日本をAI先進国に』実現の為に活動中。Xアカウントのフォロワー数は9.7万人超え(2024年12月現在)
弊社SHIFT AIでは、AIを活用したキャリアアップの方法や、AIツールの効果的な使い方についての無料セミナーを開催しています。
「Perplexityをはじめとする最新のAIツールを業務で活用したい」とお考えの方は、無料セミナーへご参加ください。
目次
Perplexityで利用できる画像生成モデル
Perplexityは、Proプランに登録することで画像生成機能を使えるようになります。
この機能は、ユーザーの創造性をサポートするツールとして、位置づけられているといえるでしょう。
Perplexityには、知識へのアクセスを民主化し、ユーザーが情報に困惑しないよう支援するという理念があります。
このツールは、単なる検索エンジンとしての機能だけでなく、コード生成や表作成、数学問題の解答など、さまざまなタスクに対応しています。
画像生成機能も、このような多様な機能の一つとして提供されているのです。
たとえば、Perplexityで利用できる画像生成モデルには、DALL•E 3、FLUX.1、Playground v2.5※という3つのモデルがあります(※2024年12月24日執筆時)。
このように複数の画像生成モデルを使い分けられることで、ユーザーは生成したい画像のイメージや目的に応じて、最適なモデルを選択できます。
Perplexityのプロプランについて詳しく知りたい方は、以下の記事を参考にしてください。
関連記事:PerplexityProと無料プランの違いは?Proで使える機能や料金を解説
Perplexityで画像を生成する方法
Perplexityでの画像生成は以下の手順で行いましょう。
- 設定画面から使用モデルを選択
- ホーム画面から検索
- 「画像を生成する」の右側「+」を選択
- 工具マークから画像のスタイルやプロンプトを入力
まず、設定画面の「画像生成モデル」から、どのモデルで画像を生成するのかを選択しましょう。
次に、ホーム画面から何かしら検索をしてください。
検索バーに直接「⚪︎⚪︎の画像を生成して」と入力しても、画像は生成されません。
検索結果が表示された後、画面右側に「画像を生成する」という項目が表示されます。
「画像を生成する」という項目の右側にある「+」マークをクリックしましょう。
以下のようなスタイルを選択する画面が表示されるので、工具マークをクリックします。
「スタイル」と「主題」という項目が表示されるので、それぞれ入力していきます。
スタイルには、絵画や写真といった画像スタイルを、主題には生成したい画像のプロンプトを入力します。
DALL•E 3以外のモデルは英語でのプロンプト入力が必要になるので、注意しましょう。
以下のように、英語で入力してください。
上記画像のように、スタイルも英語で入力してください。
- 絵画「painting」
- 写真「photo」
- イラスト「illustration」
- 図表「diagram」
スタイル、主題ともに入力が完了したら、「送信」ボタンをクリックします。
そうすると、画像生成が開始されます。
Perplexityの画像生成以外の機能や使い方を詳しく知りたいという方は、こちらの記事を参考にしてください。
関連記事:Perplexityの使い方がわかる!基本操作から実践的な活用事例を解説
効果的なプロンプトの作成方法
画像生成AIを使用する際、適切なプロンプトの書き方を知ることで、より意図した通りの画像を生成できるようになります。
今回は、すべての画像生成AIに共通して使える5つの重要なテクニックをご紹介します。
- 具体的な描写を使用する
- 画像スタイルや技法を指定する
- 環境や背景の情報を追加する
- 感情や雰囲気を表現する言葉を含める
- 適切なアーティスト名や参照作品があれば挙げる
せっかく課金してPerplexityを利用するのであれば、画像生成機能も十分に使いこなしたいところです。
「思い通りの画像が生成できない」と悩む時間を減らせるよう、ぜひこれらのポイントを意識してプロンプトを作成してみてください。
具体的な描写を使用する
画像生成AIで理想的な画像を作成するためには、プロンプトに具体的な描写を含めることが重要です。
適切な描写がないと、AIが独自の解釈で画像を生成してしまい、ユーザーが望む画像とはかけ離れた結果になる可能性があります。
AIは与えられた情報をもとに画像を作成するため、情報が曖昧だと予期せぬ結果を招きかねません。
たとえば、「スーツを着た女性」というプロンプトだけでは、年齢、人種、ポーズ、場所、光の当たり方など、多くの要素がAIの判断に委ねられてしまいます。
試しに以下のプロンプトで画像を生成してみましょう。
A confident businesswoman in her 20s standing in a modern office, professional attire, black hair in a low ponytail, natural lighting, photorealistic style, Japanese woman.
【日本語訳】
現代的なオフィスに立つ20代の自信に満ちたビジネスウーマン、プロフェッショナルな服装、黒髪のローポニーテール、自然な照明、フォトリアリスティックなスタイル、日本人女性
このプロンプトでは、年齢(20代)、場所(現代的なオフィス)、髪型(黒髪のローポニーテール)、光の状態(自然光)、画像のスタイル(写実的)、人種(日本人女性)といった要素を指定しました。
具体的な描写を含めることで、ある程度意図に沿った画像を生成できました。
生成したい画像のイメージをできるだけ詳細に言語化し、それをプロンプトに反映させることが、理想の画像を生成するための近道となります。
画像スタイルや技法を指定する
スタイルや技法を指定することは、画像生成AIを使用するうえで重要な要素です。
Perplexityでは、「写真」「イラスト」「絵画」「図表」といった基本的なスタイル指定が可能です。
しかし、通常の画像生成AIを使用する際は、画像スタイルや技法を指定した方がよいため、ここでもお伝えしておきます。
画像スタイルや技法を明確に指定する利点は、AIがその特徴を理解し、それに沿った画像処理を行えることにあります。
これにより、生成される画像は指定されたスタイルの特徴を反映し、より意図に沿った結果が得られます。
以下のプロンプトで画像を生成してみましょう。
Elderly man sitting in a cozy armchair by the fireplace, warm tones, oil painting style, next to a rustic stone fireplace with flames gently flickering, the room filled with cozy elements such as bookshelves, stacked logs, and soft blankets, creating a warm and inviting atmosphere.
【日本語訳】
暖炉のそばの居心地の良いアームチェアに座る高齢の男性、温かみのある色調、油絵風のスタイル、隣には炎が暖かく揺れる素朴な石造りの暖炉があり、部屋には本棚や積まれた薪、柔らかいブランケットなど居心地の良い要素が満ちていて、温かく心地良い雰囲気を作り出している。
このプロンプトでは、油絵風のスタイルを指定してみました。
その他、暖かみのある色調や、暖炉のそばの椅子に座る老人という具体的な描写に加え、本棚や積み重ねられた薪、柔らかな毛布といった細かな要素まで含まれています。
これらの要素が組み合わさることで、居心地の良い空間の雰囲気が表現できます。
画像生成では、スタイルの指定によって作品の雰囲気が大きく変わります。
油絵風というスタイルを選ぶことで、写真とは異なる芸術的な表現が可能になり、より温かみのある雰囲気を演出できました。
同じシーンでも、水彩画風や写真風など、異なるスタイルを選択することで、まったく違った印象の作品を生み出すことが可能です。
環境や背景の情報を追加する
環境や背景の情報を追加することも、画像生成において重要な要素です。
細かな環境設定を行うことで、AIはより多くの文脈を理解し、表現力豊かな画像を生成できます。
環境や背景の詳細な指定が重要である理由は、それらが画像全体の雰囲気や印象を大きく左右するからです。
時間帯や季節、天候などの情報は、光の当たり方や色調、そして画像全体の印象に直接的な影響を与えます。
今回は以下のプロンプトで生成しました。
Majestic view of Mount Fuji in late spring, lush green forests, blooming wildflowers in foreground, clear blue sky with wispy clouds, serene lake reflection.
【日本語訳】
晩春の富士山の荘厳な景色、青々とした緑の森、手前には咲き誇る野生の花々、澄み渡る青空には薄い雲が広がり、静かな湖面にその姿が映り込んでいる
このプロンプトでは、晩春という季節、生い茂る緑の森、前景に咲く野花、青空に広がる雲、静かな湖面の反射という要素が指定されています。
これらの環境要素が組み合わさることで、富士山の雄大さだけでなく、春の美しさも表現された画像が生成されます。
画像生成において、環境や背景の情報は画像の完成度を高める重要な要素です。
天候、時間帯、季節感など、場面設定に関わる要素を丁寧に指定することで、より意図に沿った画像を生成できます。
感情や雰囲気を表現する言葉を含める
画像生成AIで魅力的な人物画像を作成するには、感情や雰囲気を表現する言葉を含めることが鍵となります。
感情表現を的確に指定することで、AIはより生き生きとした表情や仕草を持つ人物の生成が可能です。
人物画像において表情が与えるインパクトは、非常に大きいです。
単に外見的な特徴だけではなく、感情の機微を伝えることで、AIはより自然で印象的な表情を生成できます。
また、画像全体の雰囲気も感情表現と密接に結びついており、より魅力的な画像を生成することにつながります。
Photorealistic, high-resolution, detailed texture, professional photography, natural lighting. A 20-year-old Japanese woman with a bright, beaming smile, shoulder-length black wavy hair, joyful expression, and clear, glowing skin. She wears a delicate white blouse with lace details. Warm and inviting atmosphere, muted gray background.
【日本語訳】
フォトリアルな高解像度で詳細なテクスチャ、プロフェッショナルな写真撮影、自然光を使用。20歳の日本人女性で、明るく輝く笑顔、肩までの黒いウェーブヘア、喜びに満ちた表情、透明感のある輝く肌を持つ。繊細なレースのディテールが施された白いブラウスを着用。暖かく親しみやすい雰囲気で、背景は控えめなグレー
このプロンプトには、bright(明るい)やbeaming(輝くような)、joyful(喜びに満ちた)といった感情表現が含まれています。
また、warm and inviting(温かみがあり親しみやすい)という雰囲気の指定も加えることで、より魅力的な人物像を表現できます。
感情や雰囲気を表現する言葉は、画像に命を吹き込む重要な要素です。
適切な感情表現を組み込むことで、印象的な画像を生成できます。
適切なアーティスト名や参照作品があれば挙げる
アーティスト名や参照作品をプロンプトに含めることは、画像生成AIで独創的な作品を生み出すための効果的な手法です。
この方法により、AIは特定のアーティストの画風や作品の特徴にもとづいて画像を生成できます。
アーティスト名や作品を指定することで、それらが持つ独自の色使い、筆致、構図などをAIが学習し、新しい作品に取り入れることができます。
今回生成に用いたのは以下のプロンプトです。
Breathtaking autumn scenery in Kyoto, vibrant red and golden maple leaves, traditional Japanese temple in the background, tourists in kimono admiring the view, serene pond reflecting fall colors, soft afternoon light, painted in the style of Claude Monet with impressionist brushstrokes and a dreamy, soft focus.
【日本語訳】
息をのむような京都の秋の風景。鮮やかな赤や金色の紅葉、背景には伝統的な日本の寺院が見える。着物を着た観光客が景色を楽しんでおり、静かな池には秋の色彩が映り込んでいる。柔らかな午後の光が差し込み、クロード・モネの印象派の筆遣いで描かれたような、夢のように柔らかなフォーカスの風景。
このプロンプトでは、印象派の巨匠クロード・モネの画風を指定しています。
完璧にモネの画風を再現しているとはいえませんが、寄せようとしてくれたことは伝わります。
アーティスト名や参照作品を挙げることで、ユーザーの創造性とAIの生成能力を組み合わせ、魅力的な作品を作り出すことが可能です。
ただし、この手法を使用する際は著作権に関する配慮が必要です。
とくに商用利用を目的とする場合は、著作権の保護期間が切れたパブリックドメイン※の作品を参照することが望ましいでしょう。
※知的創作物について、著作権をはじめとする知的財産権(知的所有権)が発生していない、誰でも利用できる状態のこと。
これにより、法的リスクを回避しながら、質の高い画像生成が可能となります。
Perplexityで生成した画像については、商用利用は禁止されているので、ご注意ください。
モデル別に生成画像を比較
PerplexityのPro版で利用できる3つの画像生成モデルには、それぞれ特徴があり、用途によって使い分けることができます。
各モデル(DALL•E 3、FLUX.1、Playground v2.5)で写真、イラスト、絵画の3つのスタイルで画像を生成し、比較してみましょう。
プロンプトは以下を使用します。
プロンプト1
生成スタイル:photo
Photorealistic, high-resolution, detailed texture, professional photography, natural lighting. A 20-year-old male with a Korean idol appearance, sharp and handsome features, styled hair, flawless skin, and a confident yet approachable expression. Wearing trendy and fashionable clothing, set against a clean and modern background.
【日本語訳】
フォトリアリスティックで高解像度、詳細なテクスチャ、プロフェッショナルな写真、自然なライティング。韓国のアイドルのような雰囲気を持つ20歳の男性、シャープでハンサムな顔立ち、整った髪型、完璧な肌、自信に満ちつつも親しみやすい表情。トレンディでおしゃれな服装を身に着け、清潔感のあるモダンな背景
プロンプト2
生成スタイル:illustration
An artistic, hand-drawn digital illustration of a beautiful anime-style girl with long black hair adorned with a red flower. Her large eyes glow warmly, and her cheeks are gently blushed. She wears a blue outfit with pearl details. The background features a soft sunset gradient, with vibrant colors and smooth shading, resembling high-quality anime artwork.
【日本語訳】
美しいアニメスタイルの少女を描いた芸術的な手描き風のデジタルイラスト。長い黒髪には赤い花が飾られており、大きな瞳は温かく輝き、頬がほんのり赤らんでいる。青い衣装を身にまとい、パールの装飾が施されている。背景には柔らかな夕焼けのグラデーションが広がり、鮮やかな色彩と滑らかな陰影で、高品質なアニメ作品を思わせる仕上がり。
プロンプト3
生成スタイル:painting
African savanna at golden hour, acacia trees silhouette, grazing animals, distant mountains, warm color palette, painterly sky.
【日本語訳】
黄金の時間帯に広がるアフリカのサバンナの風景。シルエットになったアカシアの木々、草を食む動物たち、遠くにそびえる山々が描かれている。暖かみのあるカラーパレットが特徴で、空は絵画のように美しく彩られている。
これらのモデルを比較することで、Perplexityでどの程度のクオリティの画像が生成できるのかを具体的に把握できます。
Proプランへの加入を検討する際の判断材料にしてください。
利用目的や求める表現方法によって、最適なモデルを選択することをお勧めします。
DALL•E 3で画像生成
上記のプロンプト1〜3をDALL•E 3で生成してみました。
1の仕上がりを見ると、DALL•E 3では、今のところリアルな人の表現は難しいようです。
2のイラストの画像では、パールの装飾の表現の仕方が良いかどうかは別にして、人物に関しては忠実にプロンプト通り再現ができています。
しかし、背景の夕焼けのグラデーションは、うまく生成できませんでした。
また、3に関してはプロンプト通りに忠実に再現され、絵画のような仕上がりになっています。
FLUX.1で画像生成
続いて、FLUX.1で画像を生成してみます。
1〜3ともに、忠実にプロンプトは再現してくれたという印象です。
3に関しては、絵画というよりは、イラストに近い画像になりました。
Playground v2.5で画像生成
最後は、Playground v2.5で生成した画像です。
1に関しては、身体にタトゥーのようなものが入ってしまいましたが、一番韓国アイドルっぽく仕上がったという印象です。
2、3に関しても、ある程度プロンプト通り忠実に再現してくれました。
それぞれ好みもあるので、どのモデルが優れているということは言えませんが、自分の生成したいイメージにあわせて、ぜひ使い分けてみてください。
Perplexityで画像生成枚数と商用利用について
Perplexityの画像生成機能には、利用制限が設けられています。
具体的には、1日あたり最大50枚までの生成制限があり、この制限は24時間単位でリセットされます。
また、個人用の非商用目的での利用のみが許可されており、商用利用は認められていません。
明確な理由が述べられているわけではありませんが、Perplexityは個人ユーザーの創造性を支援するツールとして位置づけられています。
商用利用を制限することで、生成画像に関する法的問題を未然に防ぐ効果が期待できます。
また、画像生成には多大な計算リソースが必要となるため、利用制限を設けることにより、一部のユーザーによる過度な利用を防ぐことが可能です。
制限内で効率的に画像を生成するためには、事前に生成したい画像のイメージを明確にし、プロンプトを考えてから実行することが推奨されます。
試験的な画像生成を繰り返すうちに制限に達してしまい、本当につくりたい画像が作成できない、という事態にならないよう注意しましょう。
Perplexityの概要を網羅的に知りたいという方は、ぜひこちらの記事も参考にしてください。
Perplexityの画像生成機能の評価
Perplexityは次世代の検索エンジンとして注目を集めており、リサーチツールとしての価値が高く評価されています。
2023年12月に追加された画像生成機能は、コンテンツ制作をサポートする補助的な機能として位置づけられています。
この画像生成機能の評価において重要な点は、生成される画像のクオリティです。
先に示したモデル別の生成例からもわかるように、品質は、画像生成に特化した他のサービスと比較すると、やや物足りない面があることは否めません。
たとえば、ブログ記事やレポート、プレゼンテーション資料など、ビジュアルコンテンツを強化する目的で使用する場合には、十分な機能を備えています。
文章主体のコンテンツに補助的な視覚要素を加える用途であれば、Perplexityの画像生成機能は効果的に活用できるでしょう。
一方で、より詳細な設定が必要な場合や、より高品質な画像を求める場合には、Stable DiffusionやMidjourneyなど、画像生成に特化したAIツールの使用が推奨されます。
どのような目的で画像生成をしたいのか、使用目的や用途に応じて慎重に検討する必要があります。
Perplexityの画像生成は補助ツールとして使うなら最適
Perplexityの画像生成機能は、その特性を理解して活用することで、大きな価値を発揮できるツールです。
本記事で解説してきたように、さまざまなモデルで画像生成が可能である一方、現時点では細かい設定による高度な画像生成はできません。
ただし、補助的な画像生成を必要とするユーザーにとっては、十分な機能性を備えています。
画像生成以外にも、PerplexityのProプランでは高度なリサーチ機能や文章生成機能など、多様な機能を活用できます。
ご自身の画像生成の目的や必要性を見直し、Proプランへの登録を検討してみてください。
Proプランの機能を総合的に活用することで、より効率的なコンテンツ制作につながります。
弊社SHIFT AIでは、最新のAIツールの活用方法や、生成AIを活用したキャリアアップの方法について、実践的な無料セミナーを定期的に開催しています。
このセミナーでは、AIツールの効果的な活用法から、実務での具体的な応用例まで、幅広い内容を取り扱っています。
AIをより深く理解し、業務に活用したいとお考えの方は、ぜひセミナーにご参加ください。
【無料】AI人材の一歩目!
記事を書いた人
高橋塁
美容業、接客業をしながら、フリーランスでライターとしても活動。
AIを勉強してすぐにYouYube台本などのライティング案件を獲得。
SHIFT AIではメディア記事執筆を担当。
【無料】AI人材の一歩目!
セミナーの詳細を確認する