2024年10月23日、AIを活用した動画生成ツールを提供するGenmoから、オープンソースの最新動画生成AIモデル「Mochi 1」が登場しました。
Mochi 1の特徴は、高精度でリアルな動きとプロンプトの再現力の高さです。オープンソースでありながら、KLINGやViduにひけをとらない高性能な動画生成AIモデルとして、世界中で話題となっています。
本記事では、Mochi 1の特徴や使用方法、活用事例を詳しく解説します。また、筆者自身が実際にMochi 1を活用して生成した動画も公開するので参考にしてみてください。
この記事を読むことで、最新の動画生成AIモデル「Mochi 1」について理解が深まり、基本的な使い方から具体的な活用方法までを把握することができるでしょう。
|監修者
(株)SHIFT AI 代表取締役 / GMO他複数社AI顧問 / 生成AI活用普及協会理事 / Microsoft Copilot+ PCのCMに出演 / 国内最大級AI活用コミュニティ(会員5,000人超)を運営。
『日本をAI先進国に』実現の為に活動中。Xアカウントのフォロワー数は9万人超え(2024年9月現在)
弊社SHIFT AIでは、動画生成AIの使い分けに関する資料を無料で配布しています。
動画生成AIについて詳しく知りたい方は、以下のリンクから資料をダウンロードしてみてください。
\ 無料 & 30秒で完了! /
【無料で使える】Mochi 1とは?
Mochi 1は、Genmo社によって開発された最新の動画生成AIモデルです。
Mochi 1の特徴として、オープンソースであること、物理シミュレーションにってリアルな動きを表現できること、プロンプトを忠実に再現した動画を生成できることが挙げられます。
さらに、Genmoが提供するブラウザベースのプレイグラウンド(genmo.ai/play)では、Mochi 1を誰でも無料で体験可能です。
以降の章では、Mochi 1の3つの主要な特徴について詳しく解説していきます。これらの特徴を理解することで、Mochi 1がなぜ注目を集めているのかが明らかになるでしょう。
Mochi 1の3つの特徴
本章では、Mochi 1の基本知識について以下の3点を解説します。
- オープンソースで実現する高品質な動画生成
- 高度な物理シミュレーションによるリアルな動きの表現
- プロンプトに対する高い理解と忠実な再現力
まずは、Mochi 1がどのような動画生成AIモデルなのか確認しましょう。
1.オープンソースで実現する高品質な動画生成
Mochi 1の最大の特徴は、オープンソースモデルである点です。
Mochi 1は、ソースコードや仕組みを公開する「Apache 2.0ライセンス」で提供されています。これまでクローズドな商用モデルが優位だった動画生成の分野で、オープンソースとして最高水準の性能を実現しました。
1秒間に30コマの滑らかな動画を最大5.4秒生成可能で、現在はスマートフォン程度の480p解像度ですが、年内にはHD画質対応版も登場する予定となっています。
また、WEBブラウザ上で手軽に試せるプレイグラウンドも用意されており、商用利用も可能なため、エンタメやマーケティング、教育など幅広い分野での活用が見込まれます。
2.高度な物理シミュレーションによるリアルな動きの表現
Mochi 1は、水の流れや髪の揺れ、人体や動物の動作など、複雑な動きを自然に表現する能力を備えています。
100億個の学習パラメータを持つ大規模AIと、効率的な処理を実現する独自の「非対称拡散変換器」により、従来のAI生成動画で課題だった不自然な動きを大幅に改善しました。
時間の流れに沿って一貫性のある、実写のような自然な動きを作り出すことが可能です。
とくに人物の動作や液体の動きなど、複雑なシーンで従来のモデルを大きく上回る品質を達成しています。
3.プロンプトに対する高い理解と忠実な再現力
文章での指示(プロンプト)に対する高い理解力と忠実な再現力により、ユーザーの意図通りの動画生成を実現します。
Google製の言語モデル「T5-XXL」による効率的な指示の処理と、4万個以上の映像情報を同時に扱える広い処理範囲により、細かい指示にも正確に対応できます。
シーンの構成要素、動作の種類、時間帯、雰囲気など、多様な要素を指定した生成が可能です。
【1分で完了】Mochi 1の始め方
Mochi 1を使い始めるために必要な作業は、サインイン作業のみです。
※現在、Google・Discordアカウント以外でのサインインができないため、Mochi 1を利用する際は事前にどちらかのアカウントを用意しましょう。
まずは、Genmoが提供するブラウザベースのプレイグラウンド(genmo.ai/play)を開き、「Try Now」をクリックします。
プレイグラウンドにアクセス後、「Log in or Sign up」をクリックします。
次に、「Continue With Google」か「Continue With Discord」をクリックし、使用するアカウントを選択して完了です。
サインインが完了後、動画を生成できるダッシュボードの画面に切り替わったら、動画生成を始めましょう。
【3ステップ】Mochi 1で動画を生成する方法
本章では、Mochi 1の使い方を解説します。
Mochi 1はブラウザ上のプレイグラウンドで、数クリックで動画を生成可能なため、初心者も気軽に楽しむことができます。
ステップごとにスクショや動画付きで解説していくので、実際に手を動かしながら読み進めてみてください。
最初に、プロンプト入力フォームにテキストを入力します。
プロンプトが思い浮かばない時は、「Need prompt ideas?」ボタンを押すと、Mochi 1がランダムでプロンプトを入力してくれます。
「Generate」ボタンを押し、動画を生成しましょう。
「My Creations」ページに移動すると、生成された動画が表示されます。
生成された動画にカーソルを当てると、ダウンロードマークが出てきます。
必要に応じて、ダウンロードマークをクリックし、動画をダウンロードしましょう。
【プロンプトも紹介】Mochi 1で動画を生成してみた
本章では、実際に筆者がMochi 1で生成した動画を紹介します。
- 多様な要素が入ったプロンプトで生成した動画
- 短いプロンプトで生成した動画
- プロンプトの自動入力機能を使い生成した動画
- 日本語のプロンプトで生成した動画
Mochi 1で生成される動画の雰囲気やクオリティの高さがわかるので、ぜひ参考にしてみてください。
多様な要素が入ったプロンプトで生成した動画
まず、主体、環境、衣装、雰囲気、視点シーンなど多様な構成要素が入ったプロンプトで動画を生成しました。
Happy baby floating in blue sky, carried by large colorful balloons. Gentle floating motion, soft clouds background. Baby wearing bright safety outfit, smiling at camera.
日本語訳:大きなカラフルな風船に乗せられて、青い空に浮かぶ幸せな赤ちゃん。穏やかな浮遊感、柔らかい雲の背景。明るい安全服を着た赤ちゃんがカメラに向かって微笑んでいます。
生成された動画は以下です。
プロンプトで指定した要素を理解し、忠実に再現した動画が生成されました。
短いプロンプトで生成した動画
次に、1単語のみのプロンプトで動画を生成してみました。
koala
生成された動画は以下です。
コアラに合った場所やシーンも含め、動画を生成してくれました。
プロンプトのランダム入力機能を使い生成した動画
プロンプトをランダムで入力してくれる機能を使い、動画を生成しました。
A graceful jellyfish pulses through dark waters, its translucent body aglow with internal bioluminescence. High resolution 4k.
日本語訳:優美なクラゲが暗い水面を躍動し、その半透明の体は内部の生物発光で輝いています。
高解像度 4k。
生成された動画は以下です。
ランダムで入力されたプロンプトには多様な要素が含まれていましたが、指定通りの動画を生成してくれました。
日本語のプロンプトで生成した動画
最後に、日本語のプロンプトを使用し、動画を生成してみました。
カフェでコーヒーを飲む人
生成された動画は以下です。
日本語のプロンプトでも、指示した内容を汲み取った動画を生成してくれました。
このように、Mochi 1ではクオリティの高い動画を数分で生成できます。
操作も簡単で、短いプロンプトや日本語のプロンプトでも指示通りの動画を生成してくれるので、動画生成AIを触ったことがない方でも手軽に試せるでしょう。
Mochi 1に期待される活用例
最後に、Mochi 1の活用が期待される分野を3つ紹介します。
- 教育分野
- エンターテインメント分野
- マーケティング分野
自身の業務やビジネスにも活用できないか検討してみましょう。
教育分野
Mochi 1を活用することで、教育分野において、専門的な撮影機材や技術者がなくても、わかりやすく魅力的な教材動画を作成することができます。
具体的な活用例:
- 科学現象のシミュレーション映像
- 手順解説やハウツー動画
- 歴史的シーンの再現映像
とくに物理現象や複雑な動きを自然に表現できる特徴を活かし、従来は実写が難しかった教育コンテンツも手軽に制作できるでしょう。
エンターテインメント分野
Mochi 1を活用することで、個人クリエイターや小規模制作会社が、アイデアを素早く映像化し、高品質なコンテンツを効率的に制作することができます。
具体的な活用例:
- ショートフィルムの事前視覚化
- ミュージックビデオの制作
- ゲームのカットシーン作成
プロンプトの高い制御性により、イメージ通りの映像を作成でき、制作過程での試行錯誤も容易に行えるはずです。
ビジネス分野
Mochi 1を活用することで、企業のプレゼンテーションや商品説明において、説得力のある動的なビジュアルを手軽に作成することができます。
具体的な活用例:
- 製品コンセプトの視覚化
- サービス利用シーンの例示
- 企業ビジョンの表現
文章での指示を忠実に反映できる特徴により、企画段階のアイデアを素早く映像化し、関係者との合意形成を促進できるでしょう。
Mochi 1を使いこなし、クオリティの高い動画を手軽に生成しよう!
Mochi 1を使えば、誰でも簡単にプロ並みの動画を生成できます。
Mochi 1の特徴は、オープンソースモデルでありながらも、最大5.4秒の高品質な動画が作成できる点です。
Mochi 1が提供する機能により、人物の自然な動きや水の流れといった複雑な物理現象を美しく表現することができます。また、独自の技術により、指示した内容を忠実に反映した動画生成が可能です。
本記事を参考に動画を作成し、自身の業務やクリエイティブ活動に取り入れてみてください。
弊社SHIFT AIでは、動画生成AIを含むAI活用方法や、AI時代に必要とされるスキルセットなどのセミナーを無料で開催しています。
興味がある方は、ぜひ以下のリンクからお申し込みください。
\ AI人材の一歩目! /