VIVAGO(ビバゴー)はWebブラウザで利用可能な画像・動画生成サービスです。
OpenAI社が発表し界隈が震撼した動画生成AIであるSora…を彷彿とさせるクオリティの動画を生成させることが出来るのが特徴と言えます。
基本的な機能は無料で利用できるため、興味があるならアクセスしてみると良いでしょう。
運営組織について
VIVAGOは2023年に中国・北京にて設立された「北京智象未来科技有限公司」と、関連する企業またはサービスである「HiDream.ai」によって運営されているサービスです。
「北京智象未来科技有限公司」および「HiDream.ai」の日本国内における情報展開がほぼ無いため詳細は不明ですが、AIGC(AI-Generated Content)の研究・開発に強みがあるようで、実際に生成された動画や画像を見てもレベルが高い印象を受けます。
アクセス&アカウント登録方法
VIVAGOの利用にはアカウントの登録が必須です。
Webサイトへのアクセス方法から順に説明していきましょう。
- STEP 1/4vivago.aiへのアクセス
任意のWebブラウザからhttps://vivago.ai/homeにアクセスし、画面中央か右上の「TRY FOR FREE」をクリックします。
- STEP 2/4
- STEP 3/4
- FINISH
ログイン直後は無料プランに属しており、大体の機能を利用することが可能です。
利用料金について
無料プランでも大体の機能が利用できることは先述の通りですが、高品質な生成モデルの利用や生成効率を上げたい場合はサブスクリプションの登録を検討しても良いでしょう。
画面上部の「Subscribe」をクリックすると以下のようなラインナップが表示され、そのまま登録が可能です。
サブスクリプションの登録により解禁される要素は以下の通り。
- プレミアムワイドモデルが利用可能
- 1日の動画/画像生成数の制限撤廃
- 同時生成数の増加
- 透かしの削除
- 生成速度の加速(待ち時間のスキップ)
- 画像/動画のエンハンス(アップスケール)が可能
- プライベート生成が利用可能
- 高度な設定を利用可能
VIVAGOの使い方
メインページ左側のメニューにある「TOOLS」より各種生成サービスを選択・利用することが可能です。
ここでは主要な機能(動画/画像生成)にフォーカスを当てて使い方を説明していきます。
テキストから動画を生成する
「Video Generation」内の「Text to Video」より、テキストから動画を生成することが出来ます。
- STEP 1/7プロンプトの入力
「Prompt」から動画にしたいシチュエーションなどを英語で入力します。
おおよその動画生成AIで採用されていますが構文の基本は「主題」+「主要要素」であり、単純に言えば普通の英語です。簡単な例だと以下のような内容がプロンプトの基本です。
Japanese office worker drinking beer in the office.
(日本のサラリーマンがオフィスでビールを飲んでいる)また、プロンプト入力の際に「Magic Prompt」を有効化していると入力されたテキストをAIが添削し、動画生成時により詳細なプロンプトに書き換えます。
例えば上記のプロンプトを入力した場合、以下のように改められます。
Close up, static shot: A Japanese office worker, dressed in a suit, sits at a desk cluttered with papers and a computer. He raises a beer can to his lips, taking a sip. Camera focused on his face, capturing the moment of relaxation amidst the busy office environment.
(クローズアップ、静止画:スーツを着た日本の会社員が、書類とコンピュータが散乱した机に座っている。彼はビール缶を唇に近づけ、一口飲む。カメラは彼の顔に焦点を合わせ、忙しいオフィス環境でのリラックスの瞬間を捉えている) - STEP 2/7モデルの選択
「Model」から動画生成に使用するモデルを選択します。
無料プランだと「Essential Vid model」のみ利用可能ですが、Basicプラン以上に加入しているとより高度なモデルである「Premium Vid model」を選択可能です。
- STEP 3/7動きの大きさの指定
「Motion Strength」から生成される動画の動きの大きさを指定します。
パラメータは0(最小)〜30(最大)の間で指定することが可能で、数値が大きいほど動きのある動画が生成されるようになりますが動きすぎて描写が破綻することもあるので、一概に数値を大きくすれば良いというものでもありません。
- STEP 4/7アスペクト比率の指定
「Aspect Ratio」から生成される動画のアスペクト比率を指定します。
選択できる比率は「16:9」「9:16」「1:1」の3種類です。
- STEP 5/7シード値の指定(任意)
「Seed」から動画のシード値を指定することが出来ます。
シード値はざっくり言えば動画の構成などを決める乱数のようなもので、シード値が異なると同じプロンプトを入力した場合でも生成される動画が変化します。
デフォルトは未入力であり、これはシード値がランダムに決まることを意味します。
- STEP 6/7ネガティブプロンプトの入力(任意)
「Negative Prompt」から動画に含めたくない要素を入力することが可能です。
- FINISH
生成された画像は左メニューの「LIBRARY」内にある「Assets」に保存され、プロンプトの確認やダウンロードを含む各種編集が可能です。
選択可能な項目は以下の通り。
項目名 | 説明 |
---|---|
Enhance | 動画を高解像度化(アップスケール)する。 |
Remove Background | 動画の背景を削除する。 |
Extend duration | 動画を延長する。 延長時間はEssential Vid modelだと3秒、Premium Vid modelだと8秒。 なお延長する内容はコントロールできず、AIのさじ加減一つとなります。 |
画像から動画を生成する
「Video Generation」内の「Image to Video」より、画像から動画を生成することが出来ます。
- STEP 1/8
- STEP 2/8プロンプトの入力
「Prompt」から動画にしたいシチュエーションなどを英語で入力します。
設定内容は「テキストから動画を生成する」で記載した内容と同様に「主題」+「主要要素」で構成する必要があります。それはそれとして、なぜかこちらにはMagic Promptがありません。
その代わりなのか、人物の表情に特定の動きを付与する「Wink」と、動かしたい箇所を指定する「Magic Brush」の機能が追加されています。※Magic BrushはPlusプラン以上限定
- STEP 3/8モデルの選択
「Model」から動画生成に使用するモデルを選択します。
無料プランだと「Essential Vid model」のみ利用可能ですが、Basicプラン以上に加入しているとより高度なモデルである「Premium Vid model」を選択可能です。
- STEP 4/8動きの大きさの指定
「Motion Strength」から生成される動画の動きの大きさを指定します。
パラメータは0(最小)〜30(最大)の間で指定することが可能で、数値が大きいほど動きのある動画が生成されるようになりますが動きすぎて描写が破綻することもあるので、一概に数値を大きくすれば良いというものでもありません。
- STEP 5/8カメラの設定
「Camera Control」からカメラの動きを設定します。
動かせる範囲は上下左右に加えてズームイン/アウトであり、それぞれ組み合わせることが可能です。
- STEP 6/8シード値の指定(任意)
「Seed」から動画のシード値を指定することが出来ます。
シード値はざっくり言えば動画の構成などを決める乱数のようなもので、シード値が異なると同じプロンプトを入力した場合でも生成される動画が変化します。
デフォルトは未入力であり、これはシード値がランダムに決まることを意味します。
- STEP 7/8ネガティブプロンプトの入力(任意)
「Negative Prompt」から動画に含めたくない要素を入力することが可能です。
- FINISH動画の生成
各項目を設定後に「Generate」をクリックすると生成が開始されます。
動画の長さは指定したモデルにより異なり、「Essential Vid model」だと5秒、「Premium Vid model」だと10秒の動画となります。
生成された画像は左メニューの「LIBRARY」内にある「Assets」に保存され、プロンプトの確認やダウンロードを含む各種編集が可能です。
選択可能な項目は以下の通り。
項目名 | 説明 |
---|---|
Enhance | 動画を高解像度化(アップスケール)する。 |
Remove Background | 動画の背景を削除する。 |
Extend duration | 動画を延長する。 延長時間はEssential Vid modelだと3秒、Premium Vid modelだと8秒。 なお延長する内容はコントロールできず、AIのさじ加減一つとなります。 |
テキストや画像から画像を生成する
「Image Generation」から、テキストから画像(Text to Image)、または画像から画像(Image to Image)を生成することが出来ます。
- STEP 1/7プロンプトの入力
「Prompt」から動画にしたいシチュエーションなどを英語で入力します。
おおよその動画生成AIで採用されていますが構文の基本は「主題」+「主要要素」であり、単純に言えば普通の英語です。
動画生成よりも簡単な英文で問題は無く、究極的には以下のような内容でも正常に生成されます。
A girl
(女の子)プロンプト入力の際に「Magic Prompt」を有効化していると入力されたテキストをAIが添削し、画像生成時により詳細なプロンプトに書き換えます。
例えば上記のプロンプトを入力した場合、以下のように改められます……が、誇張が過ぎる表現になりがちですね。
A captivating young girl, bathed in soft, ethereal light, stands with a sense of grace and wonder. Her eyes sparkle with curiosity, reflecting the world around her. She is adorned in a simple yet elegant dress, the fabric flowing gently in the breeze. The scene is set in a whimsical forest, with towering trees and vibrant flora, creating a magical atmosphere that encapsulates the spirit of youth and imagination.
(柔らかく幻想的な光に包まれた、魅力的な少女が、優雅さと好奇心を持って立っている。彼女の目は好奇心で輝き、周りの世界を映し出している。彼女はシンプルながらもエレガントなドレスを身につけ、布地がそよ風になびいている。舞台は、そびえ立つ木々と鮮やかな植物が生い茂る、夢幻的な森。若さと想像力の精神を捉えた、魔法のような雰囲気が漂っている)また、「Tags」には画風やレイアウトなどのプリセットが登録されており任意で複数のタグを選択可能です。
さらに、「Upload Image」から手持ちの画像をアップロードすると、アップロードした画像の構図などを参照した画像が新たに生成されます。
- モデルの選択
「Model」から画像生成に使用するモデルを選択します。
選択可能なモデルはアニメ調の表現が得意な「Anime Model」と、アーティスティックな表現が得意な「Polyart Model」の2種類です。
さらに「Polyart Model」では生成速度を重視した「Express」モードか、品質を重視した「Premium」モードを選択できます。※PremiumモードはBasicプラン以上限定
- STEP 3/7アスペクト比率の選択
「Aspect Ratio」から生成される動画のアスペクト比率を指定します。
選択できる比率は動画生成よりも多く、「16:9」「3:2」「4:3」「1:1」「2:3」「3:4」「9:16」の7種類から選択できます。
- STEP 4/7シード値の選択(任意)
「Seed」から画像のシード値を指定することが出来ます。
シード値はざっくり言えば画像の構成などを決める乱数のようなもので、シード値が異なると同じプロンプトを入力した場合でも生成される画像が変化します。
デフォルトは未入力であり、これはシード値がランダムに決まることを意味します。
- STEP 5/7生成枚数の選択
「Input Count」から生成する枚数を1〜4の範囲で選択します。
- STEP 6/7ネガティブプロンプトの入力(任意)
「Negative Prompt」から画像に含めたくない要素を入力することが可能です。
- FINISH画像の生成
各項目を設定後に「Generate」をクリックすると生成が開始されます。
生成された画像は左メニューの「LIBRARY」内にある「Assets」に保存され、プロンプトの確認やダウンロードを含む各種編集が可能です。
選択可能な編集項目は以下の通りで、動画よりも選択できる項目は多いです。
項目名 | 内容 |
---|---|
Enhance | 画像の修正とアップスケールを行う。基本的に実施した方が綺麗になる。 |
Expand | 画像の描画領域を外側に拡大する。またの名をアウトペインティング。 |
Repaint | 画像内の任意の箇所を別のプロンプトで上書きする。 |
Erase | 画像内の任意の箇所を消去し、別の画像に置き換える。 |
Save Character | 画像に映っている人物を保存する。 保存されたキャラクターはTagsに登録され、画像生成時に参照できる。 |
Tips
モデルごとの生成結果比較
動画生成、画像生成のいずれを利用する場合においても2つの生成モデルを選択することが出来ますが、それぞれどのような違いがあるのかを生成結果から比較していきましょう。
動画生成
使用するプロンプトは共通して以下。
Close up, static shot: A Japanese office worker, dressed in a suit, sits at a desk cluttered with papers and a computer. He raises a beer can to his lips, taking a sip. Camera focused on his face, capturing the moment of relaxation amidst the busy office environment.
Essential Vid Model
Premium Vid model
Essential Vid modelも悪くはないですが、Premiumと比較すると流石に見劣りします。Premiumの方はデフォルトで動画の尺が10秒あるのは流石といったところです。
画像生成
使用するプロンプトは共通して以下とし、画像の歪みを補正するためのEnhance 2xを掛けています。特にAnime ModelはEnhanceを掛けないと画像の乱れがなかなかに凄いです。
A captivating young girl, bathed in soft, ethereal light, stands with a sense of grace and wonder. Her eyes sparkle with curiosity, reflecting the world around her. She is adorned in a simple yet elegant dress, the fabric flowing gently in the breeze. The scene is set in a whimsical forest, with towering trees and vibrant flora, creating a magical atmosphere that encapsulates the spirit of youth and imagination.
Anime Model
Polyart Model(Express)
Polyart Model(Premium)
基本的にどのモデルを使用したとしても大きく差が出ることはなさそうです。一つ明らかになったことは、VIVAGOは画像生成も強い……ということですね。
使用した感想
動画や画像の精度は非常に高く、今後も期待が持てるサービスです。
ただ生成速度はやや気になるところで、これを書いている現在Basicプランに加入していますがそれでも若干遅いと感じます。
より上位のプランに加入すると生成速度も加速するようですがそうなるとちょっとコストがね……といったところですが、他の動画生成サービスを使わずVIVAGO一本に絞るのであれば安い方かもしれません。
まぁ……色々なサービスを使ってみたいユーザー(私とか)からすると何とも悩ましいところです。