2024年初,人工智能界的重磅炸弹Sora诞生了。
这个Vincent 视频模型由美国人工智能公司OpenAI 发布,只需输入提示文本即可生成具有多个角色和特定动作类型的高分辨率视频,并且主题和背景基本准确。相比Runway Gen 2 和Pika 等生成连续数秒视频的AI 视频生成应用程序,Sora 可以生成长达60 秒的连续、稳定、高质量视频,提示文字更完整,准确性更高。细节,视频更真实。
然而,出于对潜在滥用的担忧,OpenAI 表示目前没有计划公开Sora。该模型的访问权限仅限于有限数量的研究人员和创建者,以便OpenAI 可以获得有关模型使用的反馈。
目前,Sora 生成的48 个演示视频已在官网更新。这些视频生动逼真的细节和超高的精度不禁让人浮想联翩。这是否意味着具有超人水平智能的通用人工智能(AGI)的到来?
对于AGI研究非常重要
Sora推出后,360集团创始人周鸿祎表示: Sora的到来,提前了AGI的到来。最初预计需要10年,现在可能只需要2-3年。他认为,Sora虽然看似只是一个简单的视频工具,但它实际上是AI感知世界、与世界互动的里程碑,将为整个行业带来巨大进步。
“实现通用人工智能的技术路线是多种多样的,涉及不同的研究方法和应用方向,”所长王金桥博士告诉《科学》杂志。目前学术界和工业界广泛讨论的AGI技术路线主要有3条。首先是信息智能,即“大数据+自监督学习+大规模算力”。该方法依赖大量数据通过自监督学习算法训练模型,需要巨大的计算能力来处理复杂的任务。二是游戏智力。该技术路线侧重于通过人机交互中的强化学习来训练智能体自主学习和决策。三是类脑智能。这种方法试图通过模仿人脑的工作方式来实现AGI。
根据官网的演示视频,在王金桥看来,Sora至少在图像质量、长时间视频生成、多镜头一致性、世界规律学习、多模态融合等方面都取得了突破性的成就。
“Sora能够产生这样的感觉,不仅因为它制作的视频更长、分辨率更高,还因为它们可以在一定程度上模拟物理世界中物体的运动和交互。”王金桥说。这对于AGI 研究至关重要,因为它需要对机器的深入理解和对现实世界的复杂模拟,这是实现AGI 的核心挑战。 ”
记者了解到,Sora被给予了非常大的训练数据,并使用扩散模型等先进算法来精确模拟物理世界。 “对于AGI来说,有了Sora,大家可以确信,无论是在文本模式下,还是在视频模式下,比例效果都是正确的。”北京月之暗面科技有限公司(Moonshot)联合创始人周新宇AI)认为,“通过扩展视频生成模型,我们可以构建通用的物理世界模拟器,这是实现AGI 的必要过程。”
距离真正实现AGI还有很长的路要走
尽管进展显着且令人印象深刻,但Sora 仍然存在一些技术缺陷。
据国际数据公司预测,Sora将首次应用于短视频、广告、互动娱乐、影视制作、传媒等媒体领域。 Sora 的众多功能可帮助这些领域的工作人员更高效地制作视频、加快制作速度并提高产量。这有助于相关行业降低成本、提高效率,进一步优化用户体验。 (记者崔洙)
来源:科技日报
标题:通用人工智能技术,什么叫通用人工智能
链接:https://www.7kxz.com/news/gl/18154.html
版权:文章转载自网络,如有侵权,请联系删除!