中國獨自開発の動畫生成LLM「Vidu」が全世界リリース

人民網(wǎng)日本語版    2024年8月5日(月) 18時30分

拡大

中國獨自開発の汎用動畫生成大規(guī)模言語モデル(LLM)「Vidu」がこのほど全世界に向けてリリースされた。

(1 / 2 枚)

テキストを入力するか畫像をアップロードすると、すぐにリアルな動畫が生成される。こんなことを可能にした中國獨自開発の汎用動畫生成大規(guī)模言語モデル(LLM)「Vidu」がこのほど全世界に向けてリリースされた。この動畫生成LLMは、テキストから動畫を生成する機能と畫像から動畫を生成する機能の二つのコア機能を備え、動畫は4秒または8秒の長さを選択することができ、畫像の解像度は最高で1080pに達(dá)し、4秒の動畫を生成するのに30秒しかかからない。新華社が伝えた。

その他の寫真

Viduは清華大學(xué)が北京生數(shù)科技と共同で開発したもので、4月に行われた2024年中関村フォーラム年次総會で初めて発表された。清華大學(xué)人工知能(AI)研究院副院長で同社首席サイエンティストの朱軍(ジュウ?ジュン)氏は、「Viduで生成される動畫は長時間、高一貫性、高ダイナミクスという特徴が備わり、テキストと畫像から高解像度の動畫を生成することができ、高い流暢性と高ダイナミクスの畫像効果を維持することができる?,F(xiàn)時點で、Viduは1回當(dāng)たり最長32秒の動畫を生成できる」と説明した。


また、「Viduは実在の物理的世界をシミュレーションすることができ、細(xì)部にこだわり複雑かつ物理法則に合ったシーンを生成することもできる。合理的な光と影の効果、人物の細(xì)かい表情などを生成でき、深みと複雑さを備えたシュールレアリスティックなコンテンツを生み出すこともできる。SF、西部劇、ロマンス、アニメなど複數(shù)タイプの映畫について、Viduはそれぞれのスタイルに合った畫面を生成でき、煙や霧、まぶしい光など、映畫?テレビレベルの視覚効果の畫面も生成できる」と説明した。

Viduはダイナミクスの面で、複雑な動的映像を生成することが可能で、大規(guī)模で正確なアクションを生成でき、畫面の中で遠(yuǎn)景、近景、中景、クローズアップなどのレンズの切り替えが可能で、ロングショット、ズーム、トランジションなどの効果も直接生成できるという。

同社によると、テキストからの動畫生成機能と畫像からの動畫生成機能の二つの基本的機能のほか、ユーザーにより多様で個性を表現(xiàn)できる動畫の創(chuàng)作體験を提供するため、Viduは「アニメスタイル」と「キャラクター一貫性」の二つの新機能をリリースした。畫像からの動畫生成セクションで「キャラ一貫性」機能を利用すると、ユーザーは人の畫像か自分で設(shè)定したキャラクターのイラストをアップロードし、テキストを打ち込み、畫像の中のキャラクターを指定して、好みのシーンで好みのアクションをさせることができる。この機能により動畫制作プロセスが簡略化され、創(chuàng)作の自由度も増した。

Viduを使用するのに申請の必要はなく、ユーザーはメールアドレスを登録すればすぐに體験できる。Viduの技術(shù)的飛躍は開発チームが機械學(xué)習(xí)(マシンラーニング)とマルチモーダル大規(guī)模言語モデルで長年にわたり積み上げてきた成果が土臺になっており、その中核技術(shù)のアーキテクチャはチームが22年に提起し、その後も獨自開発を続けてきたものだ。(提供/人民網(wǎng)日本語版?編集/KS)

※本記事はニュース提供社の記事であり、RecordChinaの立場を代表するものではありません。すべてのコンテンツの著作権は、ニュース提供社に帰屬します。

この記事のコメントを見る

ピックアップ



   

we`re

RecordChina

お問い合わせ

Record China?記事へのご意見?お問い合わせはこちら

お問い合わせ

業(yè)務(wù)提攜

Record Chinaへの業(yè)務(wù)提攜に関するお問い合わせはこちら

業(yè)務(wù)提攜