Real-Time Latent Consistency Model(RT-LCM)はWeb上で利用可能なリアルタイム画像生成ツールです。
公式の情報はありませんがツールの制作者はエンジニアのRadamés Ajna氏かと思われ、Twitter(X)やGitHubで同氏がツールの紹介・公開をしています。
このツール名を日本語に訳すと「リアルタイム潜在一貫性モデル」とかそういったことになりますが、この「潜在一貫性モデル」というのが従来の画像生成に使用されている仕組みと異なるようで、結果として高速で画像の生成が可能となっている…とのことです。
正直、完全に専門外の分野なのでそれらしい説明は出来ません。
アカウント登録方法
アカウント登録は不要で、誰でも即時利用可能です。
利用料金について
完全無料で利用可能です。
RT-LCMで出来ること
テキストから画像をリアルタイムで生成
①任意のWebブラウザからRT-LCMにアクセスする
ブラウザからhttps://huggingface.co/spaces/radames/Real-Time-Latent-Consistency-Model-Text-To-Imageにアクセスします。
②StartをクリックしPromptに文字を入力する
「Start」をクリックすることで画像の生成が始まります。プロンプトにサンプルで文字が入っている場合は一旦全部削除してしまうと良いでしょう。
何も入力していない場合は以下のような画像が出るかと思われます。
あとは、プロンプトに文字を入力するたびにリアルタイムで画像が変化していきますので、満足行くまで「潜在一貫性モデル」を堪能すると良いでしょう。
ご参考までに、実際に試してみた様子が以下の通りです。
入力文字列と意味はそれぞれこちら。
入力した文字
high tower, science fiction, space, detailed, intricate, colorful, cinematic lighting, neon, 8K, realistic, red, collapse, shadow
日本語訳
高い塔、SF、宇宙、詳細、複雑、カラフル、映画の照明、ネオン、8K、現実的, 赤色, 崩壊, 影
使用した感想
学術・研究的な要素が強いのでこれ単体でクリエイティブな何かが出来るということではありませんが、リアルタイムで画像が作られるというのはそれだけでなんだか楽しい感じですね。
ちなみに同様の技術を用いているかと思わしきサービスとして、Akuma.aiやLeonardo.Aiなどが挙げられます。今後も類似のサービスが登場することでしょう。