「Follow-Your-Click」と呼ばれる新しいアニメーション ツールが、Microsoft のオープン ソース Web サイト GitHub に登場しました。このツールを使用すると、ユーザーは画像の一部をクリックしてアニメーション ビデオに変換することで、短いアニメーション ビデオを作成できます。 このプロジェクトは、テンセントのHunyuan Group、香港科技大学、中国の清華大学の共同プロジェクトである。 テンセントは4月にこのツールの完全なソースコードをリリースする予定だが、試用版はすでにGitHubで公開されている。 Follow-Your-Click は、画像内の特定のオブジェクトに焦点を合わせるのではなく、シーン全体を移動してしまう傾向がある、市場の他の画像からビデオへの変換モデルの問題を解決するために作成されました。 他の AI モデルでは、ユーザーが画像をどのようにどこに移動させたいかを詳細に説明する必要があります。 「私たちのフレームワークは、従来の方法よりもシンプルでありながらより正確なユーザー制御と、より優れた生成パフォーマンスを可能にします」と研究者らはarXivの投稿に書いている。 テキストからビデオを作成することは、OpenAIが2月15日にSoraを発表して以来、話題となっている。 テンセントは1月に、テキストから動画を作成できるオープンソースの動画編集・作成ツール「VideoCrafter2」をリリースした。これは、2023 年 10 月にリリースされた VideoCrafter1 の更新バージョンですが、2 秒のビデオに制限されています。 テンセントの中国のライバル企業もこの競争に加わった。アリババグループは最近、写真と音声プロンプトを歌ったり話したりする動画に変換するポートレート動画作成ツール「EMO」をリリースした。 同じ頃、ByteDance はテキストをビデオに変換するモデル MagicVideo-V2 をリリースしました。 |
<<: アップル、株主を「落ち着かせる」ために4億9000万ドルを費やす
ベトナム時間3月21日午前2時23分頃、金現物価格は1.2%上昇し、1オンス当たり2,183.02ド...
iOS 17 オペレーティングシステムは、発売後、非常に便利な新機能が多数登場したことにより、ユーザ...
感染拡大前、会計士のジャザレル・シー氏はマレーシア南部のジョホール州と隣国シンガポールを行き来してい...
高速道路の改修に494兆5000億ドン以上2車線高速道路については、運輸省によると、現在313km(...
パラグライダー大会「Discovering the Great Forest - Sa Thay 2...
このフォーラムには、観光と環境分野の第一人者が集まり、ベトナムの観光産業におけるグリーン変革を促進す...
2023~2024年の塩の生産シーズンが半分を過ぎた現在、シーズン初めに比べて塩の価格は下がって...
バンコクのVNA記者によると、会議の開会式でハ・クオック・チ氏は、カインホア省がタイで観光促進会議を...
現在、急速な成長率を誇るTikTokは、多くの企業がブランドを構築し、製品やサービスを宣伝するために...
3月7日、ベトナム高品質商品企業協会は、2024年に消費者投票によるHVNCLC認証を取得した529...
東京都中央区に本社を置くテクノロジー企業、ソフトーツは、固定電話のあるオフィスで働く20歳以上の56...
したがって、第15期国会は、2023年11月29日付第6回国会決議第110/2023/QH15号に基...
オディティ・セントラル(英国)によると、ボルトン・ストリッドでの死亡者数に関する正確な統計はないが、...
スマートフォンは現在、ユーザーに最も人気があり、広く使用されているデバイスであるため、このデバイスの...
Samsung の携帯電話ではメディア サウンドが失われ、デバイスで音楽を聴いたり映画を観たりする...