中国、テキストから動画を作成するAIモデルを発表 - OpenAIのライバル

中国、テキストから動画を作成するAIモデルを発表 - OpenAIのライバル
Vidu アプリによって生成された、テキスト入力付きのデモ クリップからの画像。写真: SCMP

中国は、OpenAIのバイラルアプリSoraに似たテキストを動画に変換する人工知能(AI)ツールを導入したばかりだが、この新しいモデルでは、米国企業の60秒と比べて、16秒を超える動画しか作成できない。

サウス・チャイナ・モーニング・ポスト(SCMP)によると、ソラに追いつくための中国の最大の希望であるViduは、北京の名門大学である清華大学と提携して新興企業のShengshu Technologyによって週末に立ち上げられた。

同社によれば、このモデルは簡単なテキストプロンプトに基づいて1080p解像度のビデオを作成できるという。

「Viduは多くの分野で画期的な進歩を遂げた、自立型イノベーションの最新の成果だ」と、盛樹の主任科学者で清華大学人工知能研究所副所長の朱軍氏は述べた。

Vidu は、主に現実世界のシミュレーション、マルチレンズ言語、高い空間的・時間的一貫性、中国語要素の理解に反映され、ビデオ効果の大幅な改善を実現しています。 Zhu Jun 氏によると、Vidu は「想像力があり」、「物理的な世界をシミュレートでき」、「一貫したキャラクター、シーン、タイムラインを備えた 16 秒のビデオを制作できる」とのことです。同氏は、この人工知能モデルは「中国の要素」も理解できると付け加えた。

このモデルの発売時に、盛書はいくつかのデモ動画を公開した。その中には、草の上に座ってギターを弾くパンダや、湖で泳ぐ子犬などがあり、どちらも鮮明なディテールが映し出されている。

Viduの立ち上げは、マイクロソフトが支援するOpenAIなど、世界有数のAI企業に追いつこうと競争している国で期待を高めている。

2022年11月のリリース後、中国を拠点とする多数の競合他社に刺激を与えたOpenAIのChatGPTとは異なり、Soraが作成し今年2月に公開された印象的なビデオは、中国の大手テクノロジー系スタートアップから同じレベルの熱狂を引き出すことができなかった。

業界の専門家は、この分野での中国企業の成長を阻む要因の一つは計算能力の不足だと指摘する。

北京でスマートコンピューティングの分野で働く技術コンサルタントのリー・ヤンウェイ氏によると、Soraが1分間のクリップを作成するには、8個のNvidia A100グラフィック処理装置(GPU)を3時間以上稼働させる必要があるという。 「ソラが推論するには膨大な計算能力が必要だ」と彼は語った。

米国政府は、AIシステムのトレーニング用として最も需要の高いコンポーネントとなっているA100やH100 GPUなど、NVIDIA製の先進的なチップに対する輸出規制を強化したが、中国への出荷は禁止されている。

テキストプロンプトから Vidu モデルが作成したビデオからの画像。写真: SCMP

北京を拠点とする盛刚は2023年3月に設立され、コアチームは主に清華大学AI研究所のメンバーで構成されており、その他にもアリババグループホールディング、テンセントホールディングス、バイトダンスのメンバーも参加している。サウス・チャイナ・モーニング・ポストを所有するアリババ・グループも、独自のビデオ生成AIモデルの開発に取り組んでいる。

先月、盛樹はQiming Ventures、Zhipu AI、Baidu Venturesなどの投資家から数億元を調達した。

中国初のAIテキスト動画変換モデルは、米国拠点のOpenAIがリリースした同様のモデル「Sora」が世界中で大きな話題となってから約2カ月後、Shengshuによって導入された。

米国と中国という2つの超大国は現在、AIハードウェアとソフトウェアを設計する技術から、AIシステムを動かす原材料に至るまで、人工知能に関連する多くの側面で競争を繰り広げている。

AIは2023年に最も話題になるキーワードの一つですが、7年前、中国は2030年までに世界的な「AIイノベーションセンター」になることを目標とした野心的な開発計画を提案しました。その中で、中国は2025年までに「世界をリードするレベル」を達成し、2030年までに「世界の主要なAIイノベーションセンター」になることを目指しており、AIを産業のアップグレードと経済変革の主な原動力として優先しています。

<<:  AppleのiPadOSはEUの規制強化に直面

推薦する

2030年までの航空インフラ計画

この計画は、波及効果の大きいプロジェクトの実施に重点を置き、省庁、支部、地方自治体間の資源と調整メカ...

Galaxy Z Fold5とGalaxy Z Flip5は予想よりも早く発売される

公式発表はないものの、Samsung Galaxy Z Fold5 256GBとGalaxy Z F...

中国の天才が、博士号取得者6人を4か月間悩ませた問題を無事解決

サウスチャイナ・モーニング・ポストによると、以前、中国の数学博士6人が4か月間、数学モデルの解答を見...

スチームアイロンを適切に洗浄する

スチームアイロンを長期間使用すると、スチームベントに残留物が残り、排水システムが詰まり、衣類が黄ばん...

旧正月のザップ・ティンの後に、8年後にまたテトの30日目が来る理由を説明します。

つまり、2024年以降、次の旧正月30日を迎えるまでには、さらに8年かかることになります。この現象を...

ダイバーが謎の「海竜」に遭遇した息を呑む瞬間

アレクサンダー・セミョーノフ氏が撮影した映像には、海底近くを泳ぐ、ウミウシ科に属するフォルスカリア・...

少女、彼氏との初デートで誤って銀行強盗に加担

CNNはブリストル郡検察局の文書を引用し、銀行強盗の実行犯であるクリストファー・カスティーヨが武装強...

ベトナムの自動車販売は今年最初の月に51%減少した

総販売台数のうち乗用車は14,036台で、49%減少した。商用車は3,174台、59%減少。特殊車両...

iPhone 11 と iPhone 11 Pro の比較: どちらのスマホを買うべきでしょうか?

iPhone 11シリーズが発売されましたが、どのモデルが自分に適しているのかまだ迷っている人も多い...

「スマートファブリック」は汗と動きから電気を生成する

韓国の研究者らが、汗や体の動きで電気を生成できる新しい生地を開発したとコリア・ヘラルド紙が報じた。こ...

LGエアコンコンデンサーの大きな騒音を効果的に解決する方法

LG エアコンのコンデンサーからの大きな騒音は迷惑であり、エアコンを使用する際の快適さに影響を与える...

アメリカ人はTikTokでニュースを読むことを好む傾向が高まっている

具体的には、ピュー・リサーチ・センターは、9月25日から10月1日までの米国の成人8,842人のニュ...

ベトナム料理と特産品ギフトでアジア新記録10個達成

アジアレコード機構がベトナム料理とベトナム料理特産品に関する新たなアジアレコードを発表するのは、ベト...

国民・民間企業向け情報セキュリティ活動

3月9日、ハノイでベトナム情報セキュリティ協会(VNISA)が会員組織、企業、パートナーと会合しまし...

共通の利益と持続可能な開発のためのグローバルテクノロジーフォーラム

このフォーラムには50の国と地域から200人を超える代表者が参加した。 OECD理事会閣僚会合に合わ...