解碼Sora:“世界模型”看出更多端倪
來源:
|
作者:佚名
|
發(fā)布時(shí)間 :2024-02-26
|
81 次瀏覽:
|
分享到:
繼一年多前發(fā)布ChatGPT在全球引發(fā)AI(人工智能)狂飆之后,全球AI領(lǐng)軍企業(yè)OpenAI又向業(yè)界扔下了一枚新“*炸”——AI文生視頻模型Sora,這距離谷歌發(fā)布多模態(tài)模型Gemini1.5僅過去了幾個(gè)小時(shí)。
繼一年多前發(fā)布ChatGPT在全球引發(fā)AI(人工智能)狂飆之后,全球AI領(lǐng)軍企業(yè)OpenAI又向業(yè)界扔下了一枚新“*炸”——AI文生視頻模型Sora,這距離谷歌發(fā)布多模態(tài)模型Gemini1.5僅過去了幾個(gè)小時(shí)。
在Gemini1.5的演示中,機(jī)器可以“讀懂”人類的各種舉動:當(dāng)測試員拿出一張紙,Gemini1.5立刻回答“你拿出了一張紙”;而Sora可根據(jù)簡短的文字提示生成一段長達(dá)一分鐘的高清視頻,其中包含細(xì)膩復(fù)雜的場景、生動的角色表情以及復(fù)雜的鏡頭運(yùn)動。上海人工智能研究院**分析師方帥表示:“兩個(gè)較新發(fā)布的AI模型表明,機(jī)器在理解人類語言和文字上更近了一步?!?/div>
OpenAI在關(guān)于Sora的詳細(xì)技術(shù)報(bào)告中表示,Sora對自然語言的理解能力很強(qiáng)。OpenAI將其視為能夠理解和模擬現(xiàn)實(shí)世界的模型的基礎(chǔ),相信其能力是實(shí)現(xiàn)AGI(通用人工智能)的重要里程碑。
AI“文生視頻”如何改變未來?正如業(yè)界專家所說,Sora的影響往小了說是文生視頻技術(shù)突破了一個(gè)數(shù)量級,可直接應(yīng)用于短視頻、廣告等行業(yè);往大了說,它提供了理解、重建和模擬這個(gè)世界的可能性。