shafi987@gmail. 發表於 2024-3-18 14:46:37

它生成的视频存在很多错误

浪潮人士表示,Sora的突破再次证明AI是一个系统工程,纯粹静态的参数推测可能没有意义。在视频生成方面,过去的困难在于很难保持视频的连贯性或一致性,因为存在很多违反直觉的东西,例如不正确的光照和阴影、空间变形等,因此业界无法处理长视频。 OpenAI最终是否会采用更大规模的参数,无法根据目前公开的信息来判断,但根据他们的风格,我估计他们肯定会尝试。梁加恩表示,之前OpenAI从GPT走到GPT的时候,就深信只要算法架构是合理的。通过超大规模无监督学习,有可能通过小样本甚至零样本学习击败监督学习。这是OpenAI对规模效应的坚定信念。这次Sora通过算法组合和数据设计,学到了更多符合物理定律的‘知识’,这也符合OpenAI多年来的一贯风格。然而,Sora还不能被称为一个合格的物理世界模拟器。。 OpenAI本身也在一份技术报告中提出,这是一个很有前途的方向。


人们对Sora有不同的需求。如果你现在正在制作数字孪生,最好直接使用 冰岛手机号码数据 物理引擎作为底层来构建它,例如 NVIDIA 的 Omniverse。虽然不完全是物理的,但已经非常准确了。宋健说,但对于视觉艺术来说,它是关于视觉感知的,无论是否违反物理,只要它给每个人足够好的视觉冲击即可。对算力的猜想现在大家对算力的猜测很混乱。一位英伟达人士告诉数字智能前线。由于OpenAI此次发布的信息很少,业界很难评价。视觉模型或多模态模型的计算能力与大型语言模型的计算能力不同。一位人工智能算力资深人士告诉数字智能前沿,尽管Sora可能只有数十亿个参数,但其算力却相当于数千亿。估计几千亿或者几千亿的大型语言模型也差不多。


https://lh7-us.googleusercontent.com/cbQdg1vcuIOkXGaJUsVL_2Nb4l6j2a5R0Cb4WRrsm1QQMT82MNyRaPhbqxLLByUwPSNIjAs-OzwtKakTe4fyExix6vKtsFeSxiACROK12n2qEXtnfhiy5bVj6xRGhKtgWagS3CdIhA2ax8VG


为了进一步分析,他可以参考Vincent图模型Stable Diffusion。参数只有十亿左右,但训练算力却动用了几十台服务器,耗时近一个月。他估计Sora的训练计算能力可能比前者至少大一个数量级,即数百台服务器,而OpenAI肯定会进一步规模化,让Sora模型变得更大。另一方面,这个模型的推理计算能力比大语言要大得多。数据显示,Stable Diffusion 的推理算力消耗与 Llama b(十亿)参数模型相近。换句话说,就推理计算能力而言,10 亿个 Vincent 图模型与 10 亿量级的大型语言模型相差无几。像Sora这样的视频生成模型的推理计算能力肯定比图像生成模型大得多。文本是一维的,视频是三维的,视频的单位计算量要大得多。一位人工智能专家告诉数字智能前沿,他认为需要几千卡路里才有机会。

頁: [1]
查看完整版本: 它生成的视频存在很多错误

一粒米 | 中興米 | 論壇美工 | 設計 抗ddos | 天堂私服 | ddos | ddos | 防ddos | 防禦ddos | 防ddos主機 | 天堂美工 | 設計 防ddos主機 | 抗ddos主機 | 抗ddos | 抗ddos主機 | 抗攻擊論壇 | 天堂自動贊助 | 免費論壇 | 天堂私服 | 天堂123 | 台南清潔 | 天堂 | 天堂私服 | 免費論壇申請 | 抗ddos | 虛擬主機 | 實體主機 | vps | 網域註冊 | 抗攻擊遊戲主機 | ddos |