Sora(ソラ)はWebブラウザ上で利用可能な動画生成AIサービスです。
利用にはサブスクリプション登録が必須となっているものの、2024年時点においては間違いなくトップクラスの表現力と精度を持つ動画生成サービスであり、AI界隈に興味があるならば一度は触れてみても良いかと思われます。
運営組織について
Soraは2015年にアメリカ・カリフォルニアで設立された「OpenAI, Inc.」によって開発・運営されているサービスです。
同社はAIによって世界を支配せんとする勢いで様々なAIサービスの開発・提供を続けており、Sora以外にも「大規模言語モデル」という言葉やAIチャットボット自体の知名度を大幅に引き上げた「ChatGPT」や、高品質な画像生成AIサービスである「DALL-E」など、生成AIを牽引する企業として多大な存在感を誇っています。
これらのサービスはいずれも継続した追加開発が行われており、年に数回は何らかのアップデートが行われていることから総合的な開発力も非常に高い組織と言えるでしょう。
アカウント登録方法
Soraの利用にはアカウントおよび有料サブスクリプションの登録が必須です。Webサイトへのアクセス方法から順に説明していきましょう。
① Soraにアクセスする
任意のWebブラウザからhttps://sora.com/にアクセスし、画面右上の「Log in」をクリックします。
② ログイン方式を選択する
任意のログイン方式を選択します。
2024年12月時点で選択可能なログイン方式は以下の通り。
- Eメールアドレス認証
- Googleアカウント連携
- Microsoftアカウント連携
- Appleアカウント連携
Soraにログインするアカウントですが、サブスクリプションの都合上既にChatGPTを利用している場合は同じアカウントでの登録を強く推奨します。
③ サブスクリプションに登録する
ログイン後、サブスクリプションへの登録を促されるのでSoraを利用する場合は「ChatGPT Plus」か「ChatGPT Pro」のいずれかのプランに登録します。
登録することで結果的にChatGPTの利便性も上がるわけですが、それはそれとしてSoraにおける各プランの違いは以下の通り。
ChatGPT Plus
- 毎月1,000クレジット入手(最大50本の動画を生成可能)
- 選択できる解像度は最大720p
- 選択できる動画時間は最大10秒
ChatGPT Pro
- 毎月10,000クレジット入手(最大500本の動画を生成可能)
- Relaxed modeにより無制限に生成可能
- 選択できる解像度は最大1080p
- 選択できる動画時間は最大20秒
- 同時に5本の動画生成が可能
- 透かしの削除
④ ユーザー名を入力する
任意のユーザー名を入力します。あとから変更も可能であるため何でも良いと思います。
⑤ ログイン確認
メインページに遷移し画面上部にアカウントアイコンが表示されていればログインは正常に完了しています。
利用料金について
「アカウント登録方法」の項で記載した通りSoraの利用にはサブスクリプションの登録が必須ですが、その際の利用料金はChatGPTのサブスクプランがそのまま反映されます。
そこそこなお値段のChatGPT Plus($20/月)はともかく、ChatGPT Pro($200/月)は生成AIサービス全体で見ても高めの金額設定なので、登録するなら何かしら明確な目的は持っておきたいですね。
個人的には$30ぐらいのプランも欲しかったところです。
Soraの使い方
テキストなどから動画を生成する
メインページ下部のテキストボックスに生成したい動画の説明(プロンプト)を入力し「↑」ボタンをクリックすると、所定のクレジットを消費して動画が生成されます。
入力欄下部の各種アイコンはオプションであり、それぞれ以下のような設定を行うことが出来ます。
項目名 | 説明 |
---|---|
画像/動画の追加 (Upload image or video) |
動画生成時に参照する画像/動画を追加することが出来ます。いわゆるI2VやV2Vの機能です。 |
プリセット (Presets) |
あらかじめ設定したテーマや色調などのプリセットを適用出来ます。最初から用意されているプリセットのほか自分で作ることも可能であり、さらに手持ちの画像や動画を読み込ませると内容に沿ったプリセットを自動で生成してくれる機能もあります。 プリセットを活用することで一貫性のある動画を生成することが可能になるかもしれません。 |
アスペクト比率 (Aspect ratio) |
動画のサイズ比を設定します。選択可能な比率は「16:9」「1:1」「9:16」の3種類。 |
画質 (Resolution) |
動画の画質を設定します。Plusプランだと「480p」と「720p」のいずれかから選択できますが、Pro版だと更に上位の「1080p」も選択可能です。 |
長さ (Duration) |
動画の長さを設定します。Plusプランだと最大10秒(480p)か5秒(720p)を選択できますが、Pro版だと最大20秒まで選択可能です。 |
同時生成数 (Variations) |
1度に生成する動画数を設定します。Plusプランの場合は最大2つまで。Proプランの場合は4つまで選択可能です。 |
ストーリーボード (Storyboard) |
動画の内容を詳細に設定することが出来る機能です。任意の秒数(4フレーム毎)に任意のプロンプトや画像/動画の挿入を行うことが可能となっており、手間は掛かりますが動画の中身を自由にコントロールすることが出来るようになります。 |
物は試しということで、以下生成例です。ちなみにプロンプトは日本語にも対応しています。
入力内容
項目名 | 入力内容 |
---|---|
プロンプト | 踊る日本のサラリーマン |
プリセット | なし |
アスペクト比率 | 16:9 |
画質 | 720p |
長さ | 5s |
生成された動画
このように見事なサラリーマンが生成されました。生成された動画は「Library」内に保存されダウンローや各種編集が可能です。
なお、編集の項目にある「View Story」からストーリーボードの内容を確認することが出来ますが、動画生成の際にストーリーボードを使用していなくてもAIがプロンプトの内容に沿ったストーリーを作っていることがわかります。
一通り生成手順を確認したところで、あらためて動画の生成に必要なクレジットを整理していきましょう。クレジットの消費量は画質・アスペクト比率・長さの組み合わせにより異なり、表にまとめると以下のようになっています。
画質 | 比率 | 秒数 | |||
---|---|---|---|---|---|
5s | 10s | 15s | 20s | ||
480p | 1:1 | 20 | 40 | 60 | 80 |
480p | 16:9 | 25 | 50 | 100 | 150 |
480p | 9:16 | 25 | 50 | 100 | 150 |
720p | 1:1 | 30 | 75 | 150 | 225 |
720p | 16:9 | 60 | 180 | 360 | 540 |
720p | 9:16 | 60 | 180 | 360 | 540 |
1080p | 1:1 | 100 | 300 | 650 | 1000 |
1080p | 16:9 | 200 | 600 | 1300 | 2000 |
1080p | 9:16 | 200 | 600 | 1300 | 2000 |
動画を編集する
生成された動画に対し、クレジットを消費して編集を行うことが可能です。ここでは4つの編集機能について実例を交えて解説していきます。
比較用として、以下の動画をベースに各種編集を行ってみます。
① Re-cut
動画を任意の箇所で切り分け、別のプロンプトで上書きする機能です。
画面構成はストーリーボードとほぼ同じであり、タイムライン上の任意の箇所に対してプロンプトで指示を上書きします。
というわけで「赤いスポーツカーとカーチェイスをしている」といった内容のプロンプトを入力した結果が以下。あまりにも唐突すぎる登場ですがプロンプトの内容には沿っています。
② Remix
元の動画に対して追加、変更、削除などの内容を指定し動画を再生成する機能です。
テキストボックスに変更を加えたい要素を入力し、Remixの強度を選択します。
例えばRemixの強度を上げて「マラソンランナーと並走している」と入力した結果が以下。概ね入力したとおりの動画が生成されました。
③ Blend
2種類の動画を融合させ新しい動画を生成する機能です。
ブレンドする動画を選択したあと、それぞれの動画の影響度合いを操作することが出来ます。
曲線は動画全体における各要素の影響度合いを表しており、曲線が高いほどベースの動画の影響度が高く、曲線が低いほど追加した動画の影響度が高くなります。逆に言えば、曲線を真ん中に近づけるとそれぞれの動画の要素が反映されやすくなります。
上の画像の例でいうと、動画の初めの方はスポーツカー動画の影響が高く、動画の中盤以降は急激にサラリーマン動画の影響が出てきます。というわけで以下生成例。
④ Loop
動画の前後を繋げて自然なループを作る機能です。
ループする範囲と削った部分を含めた追加の秒数を指定することでループ動画が生成されます。動画の前後が大きく異なったり動画自体の尺が短かったりすると綺麗にループされなかったりする点には注意が必要でしょう。
一通り編集手順を確認したところで編集に必要なクレジットを以下に整理しますが、編集内容は関係なく画質・アスペクト比率・長さの組み合わせによって消費クレジットが決まる点と、編集範囲1秒毎に掛かるクレジットである点には留意しておきましょう。
画質 | 比率 | 秒数 | |||
---|---|---|---|---|---|
0-5s | 5-10s | 10-15s | 15-20s | ||
480p | 1:1 | 4 | 4 | 4 | 4 |
480p | 16:9 | 5 | 5 | 10 | 10 |
480p | 9:16 | 5 | 5 | 10 | 10 |
720p | 1:1 | 6 | 9 | 15 | 15 |
720p | 16:9 | 12 | 24 | 36 | 36 |
720p | 9:16 | 12 | 24 | 36 | 36 |
1080p | 1:1 | 20 | 40 | 70 | 70 |
1080p | 16:9 | 40 | 80 | 140 | 140 |
1080p | 9:16 | 40 | 80 | 140 | 140 |
使用した感想
さすがはOpenAIが満を持してリリースした動画生成AIといったところで、単純に動画の品質が高いです。映像の乱れやあり得ない挙動などが出る様子もそれほど無く、激しく動きすぎて露骨なモーフィングが出ることもなく、極めて自然な動画が生成されます。生成速度が早いのもナイスです。
ただ、Soraの利用にChatGPTのサブスク登録が必須となっている点はやや微妙なところで、Plusプランに登録してもそれほどクレジットに余裕があるわけではない…といった点はまぁまぁ微妙なところです。
本格的に利用するのであればProプランへの登録がほぼ必須な気がしますが流石に高すぎて……良いAIではあるのですが人に勧めにくいかな…というのが正直なところです。