KLING(クリング)はWebブラウザ上で利用可能な動画生成サービスです。
OpenAI社が革命的な動画生成AIである「Sora」を発表して久しいですが、このKLINGは中国版Soraとも呼べるクオリティである…いや、もはやSoraを越えたAIだ……等といった声がネット上から聞こえてくるぐらいに高品質なサービスと言えます。
基本的な機能は無料で利用可能であるため、興味があるならばまずはアクセスしてみましょう。
運営組織について
KLINGは2011年に中国・北京で設立されたKuaishou(快手) Technologyによって運営されています。
KLING自体は同社が2024年にリリースした動画モデルの総称であり、そのままサービス名にもなっているようですね。
Kuaishou Technologyが中国における一部上場企業であることから資本力・技術力・影響力のいずれも上位に位置する、いわゆる大企業と言っても過言ではありません。
アカウント登録方法
KLINGの利用にはアカウントの登録が必須です。Webサイトへのアクセス方法から順に説明していきましょう。
- 1/4任意のWebブラウザからKLINGにアクセスする
ブラウザからhttps://klingai.com/にアクセスし、画面右上の「Sign In」をクリックします。
- 2/4
- 3/4認証コードを入力する
登録したメールアドレス宛に届いた認証コードを入力して「Sign In」をクリックします。
- FINISH
利用料金について
無料プランでは限定的にサービスを利用することが出来ますが、透かしの削除や品質の向上などを目的とする場合はサブスクリプション登録を検討しても良いでしょう。
トップページ上部の「Purchase a membership plan to get credits」をクリックすることで以下のようなラインナップが表示され登録が可能です。
サブスクリプション登録により解禁される項目は以下の通り。
- 透かしの削除
- Professional Modeが利用可能
- 動画の延長が可能
- 詳細なカメラ制御が可能
- 画像の品質向上
- 新機能へのアーリーアクセス(Proプラン以上)
- 生成速度の向上
本格的に動画を生成する場合は延長の可否が大事な要素だと思うので、多少なりとも継続利用をするのであればまずはStandardプランへ加入しても良いかもしれません。
そうでなくとも、無料プランだと生成に非常に時間が掛かるためStandardプラン以上への加入を個人的には推奨します。
KLINGの使い方
KLINGは動画生成をメインとしているサービスですが画像を生成することも可能です。以下でそれぞれ利用方法を説明していきましょう。
テキストから画像を生成する
トップページから「AI Images」をクリックすると画像生成ページが表示され、各種項目を入力することで画像を生成することが出来ます。
入力項目の詳細は以下の通り。
項目 | 説明 |
---|---|
Prompt | 生成した画像を説明する文章。 入力可能な言語は英語か中国語であり、5W1H(いつ、どこで、だれが、なにを、なぜ、どのように)を意識した文章であればより正確に生成できるとのこと。 |
Reference Image | 参考画像(入力は任意) ここに入力された画像の構図や絵柄などが生成時に反映される。 反映の度合いも調整可能。 |
Setting | アスペクト比率と生成数の設定。 生成1枚につき0.2クレジットを消費 |
それではPromptに適当な文章を入力した結果を見てみます。
入力内容
A magical girl in her mid-teens, flying in the sky with a magic wand, smiling. Sunny day during summer vacation, above a colorful city. She’s excited to use her powers to help others. Vibrant anime style with pastel colors, soft lighting.
(日本語訳)
10代半ばの魔法少女が、魔法の杖を持って空を飛び、微笑んでいる。夏休みの晴れた日、色鮮やかな街の上空。彼女は自分の力を使って他の人を助けることに興奮している。パステルカラーと柔らかな照明を使った鮮やかなアニメスタイル。
生成結果
結果を見てもわかるように、プロンプトの内容に沿って画像が生成されている様子が伝わります。手足の破綻もなく良く出来ているのではないでしょうか。
テキストから動画を生成する
トップページから「AI Videos」を選択後に「Text to Video」タブから各種項目を入力することで動画を生成することが可能です。
入力項目の詳細は以下の通り。
項目 | 説明 |
---|---|
Prompt | 生成した動画を説明する文章。 入力可能な言語は英語か中国語であり、理想的な入力内容は「対象物+動き+シチュエーション+カメラ」とのこと。 |
Creativity/Relevance | プロンプトの反映度合い。 Creativityに寄せると創造性を、Relevanceに寄せると関連性を重視する。 |
Mode | 動画品質。 標準であるStandardと高品質なProfessional(Standard Plan以上)から選択可能。 消費クレジットはStandardだと10、Professionalは35 |
Length | 動画の長さ。 Standardであれば5秒限定、Professionalであれば10秒も選択可能。 なお、10秒にすると消費クレジットも2倍必要。 |
Aspect Ratio | アスペクト比率。 |
Camera Movement | カメラの動き。 |
Negative Prompt | 生成した動画に含めたくない項目(任意) |
それではPromptに適当な文章を入力した結果を見てみましょう。
入力内容
In the dimly lit streets, illuminated only by the faint glow of streetlamps, a young man is desperately fleeing from an unseen pursuer. The camera zooms in on his terrified face.
(日本語訳)
街灯がほのかに照らしている薄暗い夜の街の中で、若い男が何者かに追いかけられており必死の形相で逃げている。カメラは男を正面に捉えフォーカスしている
生成結果
まるで映画のワンシーンみたいな動画が生成されました。このあとの様子が非常に気になりますね。
ちなみに、有料プランに登録しているとここから動画を5秒ずつ延長することが出来ます。
画像から動画を生成する
トップページから「AI Videos」を選択後に「Image to Video」から各種項目を入力することで動画を生成することが可能です。
入力項目の詳細は以下の通り。
項目 | 説明 |
---|---|
Image and Prompt | 動画化したい画像のアップロードと動画を補足する文章(任意) プロンプトの入力規則はText to Videoと同様で、詳細に書くとその分動画に反映されやすい。 また、画像のアップロード後に選択可能なAdd End Frameから追加の画像をアップロードすることで動画の終点を指定することも可能。 |
Creativity/Relevance | プロンプトの反映度合い。 Creativityに寄せると創造性を、Relevanceに寄せると関連性を重視する。 |
Mode | 動画品質。 標準であるStandardと高品質なProfessional(Standard Plan以上)から選択可能。 消費クレジットはStandardだと10、Professionalは35 |
Length | 動画の長さ。 Standardであれば5秒限定、Professionalであれば10秒も選択可能。 なお、10秒にすると消費クレジットも2倍必要。 |
Camera Movement | カメラの動き。 Image to Videoでは選択不可ですが何故か表示されている。 |
Negative Prompt | 生成した動画に含めたくない項目(任意) |
それでは、KLINGのAI Imagesで作った画像を元に動画化してみましょう。
使用画像
生成結果
そこそこ自然な動画が生成されているように思えます。なお、動画生成時のプロンプトに「The girl in the picture is waving and smiling at us.」と入力し、多少は動きをコントロールしています。
また、こちらも有料プランに入っていれば5秒ずつ動画を延長することが出来ます。
Tips(知っていると得をするかもしれない情報)
KLINGのバージョンについて
2024年9月時点において、KLINGにはバージョン1.0のほかに高品質な1.5が選択可能です…が、現時点では以下の制約が掛かっています。
- Professional Mode固定
- Camera Movement設定不可
- 延長不可
上記だけ見るとそれなりに高コストであまり融通も効かないバージョンですので、クレジットに余裕がある利用者向けかと思われます。
そこまでして生成できる動画の品質は実際どの程度なのか…という点ですが、試しに「Text to Video」で比較してみましょう。
入力プロンプト
A scene capturing a Japanese businessman surfing under a clear blue sky. The businessman, dressed in a business suit, skillfully rides the ocean waves with energy and enthusiasm. The waves crash powerfully, and dynamic camera angles capture his movements. Using immersive perspectives and slow-motion effects, the impact of the waves and the surfer’s motions are highlighted
(空の下でサーフィンをしている日本のサラリーマンを撮影したシーン。ビジネススーツを着たサラリーマンが、海の波を乗りこなし、エネルギッシュにサーフィンを楽しんでいる様子。波が力強く打ち寄せ、ダイナミックなカメラアングルでサラリーマンの動きを捉えている。臨場感のある視点とスローモーションを使い、波と人物の動きのインパクトを強調)
バージョン1.0(Standard Mode)
バージョン1.0(Professional Mode)
バージョン1.5
バージョン1.0(Standard Mode)は流石に比較すると品質が良くない気はしますが、動画の内容自体は破綻しておらず及第点以上の仕上がりではあると思います。
バージョン1.0(Professional)やバージョン1.5は流石の品質ですが、人物の表情が良く写っている1.5の方が個人的には好みです。
とはいえ、同じプロンプトでも生成する度に構図は変わるので1回の生成結果だけで結論を出すのは早計ではあります。まずはご参考までに。
使用した感想
簡単な操作で高品質の画像や動画が生成できる点にKLINGの技術力の高さを感じました。
ただ、動画の生成速度に関してはお世辞にも早いとは言い難く、無料プランのまま利用するのはなかなかに非効率な気はします。
冒頭でも記載していますが、継続利用するのであればStandardプラン以上に入った方が精神衛生上にも良いでしょう。