新画像生成AI「Grok Imagine 1.0」がすごい!飛躍的な特徴や使い方を解説

2026年2月2日、イーロン・マスク率いるxAIから、画像・動画生成AIの新モデル「Grok Imagine 1.0」が正式発表されました。
試用版が提供された1か月間で12.45億本(約12億4500万本)以上の動画が生成され、「1.0で化けた」と世界中で話題になっています。
最大10秒・720pの高解像度動画を生成できるほか、BGMや効果音を含めた自然な映像コンテンツも出力できるようになりました。
本記事では、とくに飛躍した「動画生成」を軸に、Grok Imagine 1.0の特徴や使い方を、筆者が試した事例とともに解説します。あわせて、料金体系や商用利用の可否、注意点も紹介します。
最先端のAI動画生成技術を理解し、自分の目的に合った活用方法を見つけてみてください。

監修者
SHIFT AI代表 木内翔大
Grok Imagine 1.0で生成した画像や動画は商用利用が可能です。
飛躍的進化を遂げたGrok Imagine 1.0で生成した画像や動画を使えば、SNSやYouTubeといったコンテンツ・マーケティングで威力を発揮するでしょう。
SHIFT AIでは、GrokやChatGPTなどの生成AIを活用した「AI副業の始め方」や「収入獲得までのロードマップ」を開設するセミナーを無料で開催しています。
参加者限定で以下を含む全12個のプレゼントを無料配布中です。
- 今日から使えるプロンプト100選
- 新時代のAI×デザイン活用ガイド
- 新時代の生成AI×ライティング超実践ガイド
「AIを使って副業収入を得る方法を知りたい」「バズりたい」「顧客獲得を効率化したい」という方は、ぜひ以下のリンクからセミナーに参加してみてください。
目次
Grok Imagine 1.0の特徴
Grok Imagine 1.0は、Grokで最新の画像・動画生成モデルです。主な特徴を4つ紹介します。
- ベンチマークで競合モデルを上回る評価
- 最大10秒の動画を作成可能
- 最大720pの解像度に対応
- 映像と音声を同時に生成
それぞれの特徴について詳しく見ていきましょう。
以下の記事では、Grokの基本亭な使い方や特徴、活用事例を解説しています。ぜひ参考にして、Grokを使い倒してください。
ベンチマークで競合モデルを上回る評価
Grok Imagine 1.0は、AIモデル評価で広く参照されている複数のベンチマーク結果において、競合モデルを上回る評価を獲得しています。
テキストから動画を生成する性能を示すベンチマーク「Text-to-Video Leaderboard」では、Grok Imagine 1.0が1位を獲得しています。

このランキングは、人間評価をもとに動画品質を数値化したもので、サンプル数や信頼区間も考慮したうえで比較されています。
さらに、画像をもとに動画を生成する性能を示すベンチマーク「Image-to-Video Leaderboard」においても、Grok Imagine 1.0は1位を獲得しています。

こちらは、人間評価をもとに、元画像をどれだけ自然な動画として再構成できているかを数値化し、サンプル数や信頼区間を含めて比較した結果です。
ベンチマーク結果から、Grok Imagine 1.0は高品質な動画生成に加え、実用面でも信頼性が高く、コストや待ち時間を抑えて活用できます。
最大10秒の動画を作成
Grok Imagine 1.0では、これまで最大6秒までだった動画生成が拡張され、最大10秒の動画を作成できるようになりました。
従来のAI動画生成は数秒程度の短尺が主流でしたが、最大10秒まで対応したことで、より情報量のある映像表現が可能です。
実際に、以下のような最大10秒の動画を生成できます。
また、動画の長さは生成時に6秒または10秒から選択できるため、用途に応じた使い分けができます。
Grok Imagine 1.0を使えば、広告やSNS投稿向けのショート動画としても活用できます。コンテンツやマーケティングで威力を発揮するでしょう。
SHIFT AIでは、GrokやChatGPTなどの生成AIを活用した「AI副業の始め方」や「収入獲得までのロードマップ」を開設するセミナーを無料で開催しています。
参加者限定で以下を含む全12個のプレゼントを無料配布中です。
- 今日から使えるプロンプト100選
- 新時代のAI×デザイン活用ガイド
- 新時代の生成AI×ライティング超実践ガイド
「AIを使って副業収入を得る方法を知りたい」「バズりたい」「顧客獲得を効率化したい」という方は、ぜひ以下のリンクからセミナーに参加してみてください。
スキルゼロから始められる!
無料AIセミナーに参加する最大720pの解像度に対応
Grok Imagine 1.0では、生成される動画の解像度が最大720p(HD画質)に対応しました。
従来のAI動画生成では480p程度が一般的で、細部が粗く見えるケースもありましたが、720pに対応したため、被写体の輪郭や質感までより鮮明に表現できます。
以下は、同じプロンプトで480pと720pを比較した動画です。
そのため、SNS投稿や広告素材として使っても画質の粗さが目立ちにくく、視聴者に与える印象を高めやすい点が魅力です。
映像と音声を同時に生成
Grok Imagine 1.0は、映像と音声を同時に生成できます。
単に映像にBGMを付けるだけでなく、効果音やセリフまで含めて生成でき、さらにリップシンク機能によって口の動きと音声のズレを自動で補正します。
そのため、キャラクターの口の動きや表情に合わせて音声が出力され、実際に喋っているかのような自然な映像表現が可能です。
以下は、キャラクターがセリフを話す動画の例です。
ただし、現時点(2026年2月4日)では日本語の発話精度にはまだ違和感があり、発音やイントネーションに不自然さが残る場合があります。
Grok Imagine 1.0は、映像と音声を同時に生成できるため、動画編集や音声収録の工程を大幅に省略できます。
Grok Imagine 1.0でできること
ここでは、Grok Imagine 1.0でできる「動画生成の主な機能」を4つ紹介します。
- テキストから動画を生成
- 画像から動画を生成
- 動画の一部を編集・削除
- 動画の雰囲気を指定
Grok Imagine 1.0を使えば、動画の生成から編集までを一貫して行えます。どのような表現が可能なのか確認してみてください。
テキストから動画を生成
Grok Imagine 1.0では、テキスト(文章)を入力するだけで動画を生成できます。
映像の情景や動き、雰囲気をテキストで指示するだけで、その内容に沿った動画をゼロから生成可能です。
以下のように、テキストを入力するだけで簡単に動画を作成できます。
Grok Imagine 1.0を使えば、テキストから直接動画を作成できるため、専門的な編集スキルがなくても手軽に映像制作が可能です。
以下の記事では、Grokを使った動画生成について解説しています。ぜひあわせてご覧ください。
画像から動画を生成
Grok Imagine 1.0では、静止画(画像)をアップロードするだけで動画を生成できます。
Grokが画像の内容を理解し、人物や被写体の動き、カメラワークを補完して、静止画に自然なモーションを加えた動画クリップを生成可能です。
以下のように、画像をもとにした動画を簡単に作成できます。
Grok Imagine 1.0を使えば、写真やイラストをそのまま動画素材として活用でき、静止画を映像表現へ展開できます。
もちろん、Grok Imagine 1.0で生成した画像の動画化も可能です。
以下の記事では、Grokを使った画像生成について解説しています。ぜひあわせてご覧ください。
動画の一部を編集・削除
Grok Imagine 1.0では、生成した動画の一部を編集や削除、追加できます。
以下のように、作成済みの動画に対して部分的な編集を行えます。
画角や照明、映像全体の一貫性を保つ設計のため、編集後も違和感が出にくく、背景やオブジェクトが自然になじみます。
Grok Imagine 1.0を使えば、専門的な動画編集ソフトを使わずに映像の修正や調整が可能です。
動画の雰囲気を指定
Grok Imagine 1.0では、生成する動画の雰囲気を「Spicy」「Fun」「Normal」の3種類から選択できます。
各雰囲気の特徴は以下のとおりです。
| 項目 | 内容 |
|---|---|
| Spicy | ・大胆でドラマチック ・官能的でエッジの効いた表現 |
| Fun | ・遊び心のある演出 ・ユーモラスで動きのある表現 |
| Normal | ・自然でバランスの取れた表現 ・現実的で使いやすい仕上がり |
以下は、同じプロンプトで生成した動画を、それぞれの雰囲気に切り替えた比較例です。
雰囲気は再生成時に切り替えられるため、プロンプトを大きく変えずに、表現のトーンを調整した結果を比較できます。
Grok Imagine 1.0で生成した画像や動画は商用利用が可能です。
飛躍的進化を遂げたGrok Imagine 1.0で生成した画像や動画を使えば、SNSやYouTubeといったコンテンツ・マーケティングで威力を発揮するでしょう。
SHIFT AIでは、GrokやChatGPTなどの生成AIを活用した「AI副業の始め方」や「収入獲得までのロードマップ」を開設するセミナーを無料で開催しています。
参加者限定で以下を含む全12個のプレゼントを無料配布中です。
- 今日から使えるプロンプト100選
- 新時代のAI×デザイン活用ガイド
- 新時代の生成AI×ライティング超実践ガイド
「AIを使って副業収入を得る方法を知りたい」「バズりたい」「顧客獲得を効率化したい」という方は、ぜひ以下のリンクからセミナーに参加してみてください。
スキルゼロから始められる!
無料AIセミナーに参加するGrok Imagine 1.0の料金体系
Grok Imagine 1.0の画像・動画生成機能は、無料プランでも利用可能です。ただし、無料プランでは生成回数や動画の秒数、解像度に制限があります。
より高画質や長尺の動画を作成したい場合は、有料プラン(SuperGrok)への加入が必要です。
以下に、無料プランと有料プランの主な違いをまとめました。
| 項目 | 無料プラン | 有料プラン(SuperGrok) |
|---|---|---|
| 料金 | 無料 | 月額$30 |
| 動画生成回数 | 制限あり(回数非公表) ※筆者の場合:10回 | 制限緩和(回数非公表) |
| 画像生成回数 | 約3〜20回 / 24時間 | 約100回〜 / 24時間 |
| 動画の長さ | 最大6秒 | ・最大6秒 ・最大10秒 |
| 解像度 | 最大480p | ・最大480p ・最大720p |
まずは無料プランで操作感や生成品質を確認し、制限が気になる場合や動画生成を行いたいときは、有料プランへの加入がおすすめです。
また、有料プラン(SuperGrok)には初回7日間の無料期間が用意されているため、試してみてください。
以下の記事では、Grokの料金プランについて詳しく解説しています。
Grok Imagine 1.0で生成した動画は商用利用可能?
Grokの「Imagine video」で生成した動画は、商用利用が可能です。
生成された動画の著作権は利用者に帰属し、SNS投稿や広告素材などに活用できます。ただし、xAIの利用規約に従う必要があり、禁止事項や法的リスクには十分注意が必要です。
xAIの利用規約では以下のように記載されています。
You Own Your User Content. You may provide input (e.g., text, audio, images, video, code, files, folders, drives, etc.) to the Service (”Input”) and receive output from the Service based on the Input (”Output”).
引用:xAI(利用規約)
【和訳】あなたは、自身のユーザーコンテンツの所有者です。テキスト、音声、画像、動画、コード、ファイルなど(「入力」)をサービスに提供し、その入力にもとづく出力(「出力」)を受け取ることができます。
自分で生成した動画を自由に使えるため、SNS投稿やプロモーション動画、Web広告などで活用できます。
Grok Imagine 1.0の使い方
ここでは、Grok Imagine 1.0の基本的な使い方を紹介します。今回は、Web版のGrokを利用する手順を例に解説します。
Grok Imagine 1.0を利用する流れは、以下のとおりです。
- Grokにアクセスする
- メニューから「Imagine」を選択する
- 利用するモードを選択する
- プロンプトを入力する
- 動画を編集する
- 動画を保存する
メニューから「Imagine」を選択する
Grokにログインすると、画面左側にメニューが表示されます。この中から「Imagine」を選択してください。

利用するモードを選択する
「Imagine」を選択すると、画像や動画の生成モードを選ぶ画面が表示されます。
画面下部にあるボタンから、生成したいコンテンツの種類を選択してください。

動画生成を選択した場合は、動画の長さや解像度、アスペクト比などの設定も行えます。

ただし、無料プランでは動画の長さや解像度を変更できません。設定項目は表示されますが、実際に反映されるのは有料プランのみとなるため注意が必要です。
プロンプトを入力する
モードを選択したら、画面下部の入力欄にプロンプトを入力します。

画像から動画を生成する場合は、入力欄の左側にあるボタンを選択し、以下の項目から画像の入力方法を選択してください。
- ファイルをアップロード
- スケッチを描く
- Googleドライブに接続
- Microsoft OneDriveに接続
- 最近使用した画像
ただし、画像を入力した時点で動画生成が即座に開始されるため注意が必要です。
プロンプトや設定を調整したい場合は、画像を追加する前に内容を確認しておきましょう。
動画を編集する
動画が生成されたら編集画面が表示されます。ここでは、必要に応じて生成された動画の調整・編集を行えます。
画面下部の入力欄や各種ボタンから「動画の長さ」「解像度」「動画プリセット」を選択できます。

ただし、筆者が試した環境では、最初からモードを「動画」に設定した場合、編集内容が正しく反映されませんでした。
一方で、テキストから画像を生成し、その画像をもとに動画を生成する手順を踏んだ場合は、問題なく編集できました。
編集がうまく反映されない場合は、テキストから画像を生成してから動画化する方法を試してみてください。
動画を保存する
動画の生成が完了すると、画面右下に操作ボタンが表示されます。生成した動画に対して以下の操作が可能です。
- 保存:端末に動画ファイルをダウンロード
- 共有:リンクを発行して他のユーザーと共有
- 投稿:Xへ直接投稿

Grok Imagine 1.0を試してみた!
ここでは、筆者が実際にGrok Imagine 1.0を使った事例を3つ紹介します。
- 東京とアメリカの風景を合成した動画を生成してみた
- 手書きイラストから動画を生成してみた
- ゴルフ映像をゲーム風に編集してみた
Grok Imagine 1.0で動画を生成するときの具体的なイメージや活用のヒントとして参考にしてください。
東京とアメリカの風景を合成した動画を生成してみた
今回は、テキストから動画を生成した場合に、異なる地域の風景をどこまで自然に表現できるかを確かめました。
具体的には、東京の街並みとアメリカを象徴する都市風景(ニューヨーク)を同時に含む映像をテキストで指示し、1つの動画として自然に合成されるかを試しています。
以下のプロンプトを入力して、動画を作成しました。
A cinematic video where the city smoothly transitions from Tokyo to New York.
Start with Tokyo at night: dense skyscrapers, neon-lit streets, and Tokyo Tower clearly visible.
As the camera slowly moves forward, the scene transitions into New York: Manhattan skyline, wide streets, and the Statue of Liberty in the distance.
Photorealistic style, smooth camera movement, realistic lighting, clear visual transition, no cuts, no text.
生成された動画では、東京の象徴である東京タワーから、アメリカの象徴である自由の女神へと、違和感の少ないグラデーション表現ができました。
Grok Imagine 1.0を使えば、文章で指示するだけで、リアルな風景を違和感なくつなぎ合わせた動画を生成できます。
手書きイラストから動画を生成してみた
今回は、ラフな手書きイラストをもとに動画を生成した場合、どこまで自然な動きや演出が再現されるかを確かめました。
具体的には、筆者が描いた手書きイラストを入力し、Grok Imagine 1.0で動画化を行っています。
以下のような動画が生成されました。
生成された動画では、手書きイラストの雰囲気を保ったままキャラクターが動き、セリフ付きのコミカルな演出が加えられていました。
Grok Imagine 1.0を活用すれば、作成したイラストに動きやセリフを加えた動画を手軽に生成できます。
ゴルフ映像をゲーム風に編集してみた
今回は、ゴルフの映像をゴルフゲーム風の映像表現に変換できるかを検証しました。
具体的には、元のゴルフ映像の構図や動きを保ったまま、ゲームのプレイ画面を思わせるUIや演出を追加し、実写映像をゲーム風に編集しています。
以下は、動画編集時に使用したプロンプトです。
元のゴルフ映像の構図と動きを保ったまま、ゴルフゲームのプレイ画面のような映像に変換する。
スイングやショットのタイミングにあわせて、ゲーム風のUI演出を追加する。
画面には、ショットパワーゲージ、飛距離表示、風向きアイコン、スコア表示などを連想させるゴルフゲーム風の演出が入る。
全体の雰囲気は、家庭用・スマホ向けのリアル寄りゴルフゲーム。
派手すぎないが、ゲーム画面だと分かる表現にする。
以下は、使用した映像と生成結果です。
生成された動画では、実写のゴルフ映像に、風向き・飛距離・パワーゲージなどのUIが重ねられ、ゴルフゲームのプレイ画面のような表現がされました。
Grok Imagine 1.0を使えば、元の映像の動きを活かしたまま、撮り直しや複雑な編集を行わずに、遊び心のある動画を簡単に作成できます。
Grok Imagine 1.0で生成した画像や動画は商用利用が可能です。
飛躍的進化を遂げたGrok Imagine 1.0で生成した画像や動画を使えば、SNSやYouTubeといったコンテンツ・マーケティングで威力を発揮するでしょう。
SHIFT AIでは、GrokやChatGPTなどの生成AIを活用した「AI副業の始め方」や「収入獲得までのロードマップ」を開設するセミナーを無料で開催しています。
参加者限定で以下を含む全12個のプレゼントを無料配布中です。
- 今日から使えるプロンプト100選
- 新時代のAI×デザイン活用ガイド
- 新時代の生成AI×ライティング超実践ガイド
「AIを使って副業収入を得る方法を知りたい」「バズりたい」「顧客獲得を効率化したい」という方は、ぜひ以下のリンクからセミナーに参加してみてください。
スキルゼロから始められる!
無料AIセミナーに参加するGrok Imagine 1.0を使うときの注意点
ここでは、Grok Imagine 1.0を利用するときに注意しておきたいポイントを3つ紹介します。
- 著作権・肖像権に配慮する
- AI生成コンテンツであることを明示する
- 過度なNSFW表現はしない
近年、AI動画をめぐるトラブルや議論は増えています。安心してGrok Imagine 1.0を活用するためにも、必ず確認しておきましょう。
著作権・肖像権に配慮する
Grok Imagine 1.0でコンテンツを生成・利用するときは、著作権や肖像権への配慮が不可欠です。
生成結果がAIによるものであっても、プロンプトや入力素材に既存の作品や実在の人物が含まれている場合、その元となる権利が問題になる可能性があります。
xAI側も以下のように記載しています。
Comply with the law. For example, don’t use our Service or Outputs to promote or engage in illegal activities, including:
引用:xAI利用規約
- Violating copyright, trademark, or other intellectual property law
- Violating a person’s privacy or their right to publicity
- Depicting likenesses of persons in a pornographic manner
- The sexualization or exploitation of children
- Operating in a regulated industry or region without complying with those regulations
- Defrauding, defaming, scamming, or spamming
- Espionage, spying, stalking, hacking, doxing, or phishing
【和訳】
法律を遵守してください。例えば、当社のサービスまたは出力を、以下のような違法行為の促進または関与に使用しないでください。
- 著作権、商標、その他の知的財産権の侵害
- 個人のプライバシーやパブリシティ権を侵害すること
- ポルノ的な方法で人物の肖像を描写すること
- 児童の性的搾取
- 規制産業または地域で、規制を遵守せずに事業を展開する
- 詐欺、中傷、詐欺、スパム行為
- スパイ活動、スパイ行為、ストーカー行為、ハッキング、ドクシング、フィッシング
とくに、有名キャラクターや芸能人、第三者が制作した写真・イラストなどを使用する場合は、権利侵害につながらないか慎重に判断する必要があります。
公開・投稿する前には、必ず人間の目で内容を確認し、最終的な責任は利用者自身が負うという意識を持って利用するようにしましょう。
AI生成コンテンツであることを明示する
Grok Imagine 1.0で作成した画像や動画を公開・共有するときは、AIによる生成コンテンツであると明示する姿勢が必要です。
現時点では、AI生成コンテンツであることの表示が法律で一律に義務付けられているわけではありません。
しかし近年、AIディープフェイクによるフェイクニュースや虚偽情報の拡散が社会問題となっており、制作者側の配慮や透明性がこれまで以上に求められています。
そのため、視聴者に誤解を与えないよう、キャプションや説明文に「※この動画はAIによる生成コンテンツです」といった一文を添えるのがおすすめです。
不要な誤解やトラブルを未然に防ぐためにも、AI生成である旨を明示する意識を持ちましょう。
過度なNSFW表現はしない
Grok Imagine 1.0を利用するときは、過度なNSFW※表現を避ける必要があります。
※NSFW:職場や公共の場での閲覧に適さない、性的・暴力的・刺激の強い表現
生成AIは、プロンプト次第で刺激の強い映像表現も作成できますが、性的・暴力的・不快感を与える表現は、利用規約違反やトラブルにつながる可能性があります。
とくに、Grokを使った性的コンテンツが問題視された事例があり、xAIは実在人物のポルノグラフィックな描写や児童の性的化を厳しく禁止しています。
出典:BBC
どうしても過度なNSFW表現を含むコンテンツを生成したい場合は、個人的な利用にとどめ、公開や共有は控えるようにしましょう。
Grok Imagine 1.0で画像・動画生成のレベルが変わる!
Grok Imagine 1.0の登場によって、画像・動画生成の表現力は大きく引き上げられたと言っても過言ではありません。
とくに筆者として印象的だったのは、動画の編集技術が大幅に強化された点です。
Grok Imagine 1.0を活用すれば、これまで表現が難しかった映像演出にも気軽に挑戦できます。
本記事で紹介した使い方や事例を参考に、ぜひGrok Imagine 1.0を使って、画像や動画の生成・編集を試してみてください。
Grok Imagine 1.0で生成した画像や動画は商用利用が可能です。
飛躍的進化を遂げたGrok Imagine 1.0で生成した画像や動画を使えば、SNSやYouTubeといったコンテンツ・マーケティングで威力を発揮するでしょう。
SHIFT AIでは、GrokやChatGPTなどの生成AIを活用した「AI副業の始め方」や「収入獲得までのロードマップ」を開設するセミナーを無料で開催しています。
参加者限定で以下を含む全12個のプレゼントを無料配布中です。
- 今日から使えるプロンプト100選
- 新時代のAI×デザイン活用ガイド
- 新時代の生成AI×ライティング超実践ガイド
「AIを使って副業収入を得る方法を知りたい」「バズりたい」「顧客獲得を効率化したい」という方は、ぜひ以下のリンクからセミナーに参加してみてください。
スキルゼロから始められる!
無料AIセミナーに参加する執筆者
西啓汰
大学での学びと並行して活動するフリーランスのSEO/Webライター。
研究テーマは「Music to Video」。音楽の歌詞や曲調を分析し、自動で映像を生成する仕組みの開発中。
生成AIツールを実際に触れ、体験を通じて得た知見を活かし、価値を届けるライティングを実践。
趣味は野球観戦とラジオ聴取。






スキルゼロから始められる!
無料AIセミナーに参加する