2024 年另类 AI 评测标准走红:“威尔・史密斯吃意大利面”领衔

xxn 阅读:73475 2025-01-01 14:02:19 评论:0

据报道称,随着人工智能视频生成技术的不断进步,业界开始流行一种有趣的现象:每当一家公司发布全新的人工智能视频生成器时,总会有人率先利用它来制作威尔・史密斯吃意大利面的视频。这一趋势不仅成为一种网络流行语,更是一种非官方基准,用来评估新型 AI 视频生成器能否逼真地展示史密斯的吃面场景。去年 2 月,史密斯本人甚至在Instagram上发布了一段模仿视频,积极参与了这场网络活动。

值得注意的是,“威尔・史密斯吃意大利面”只是2024年人工智能领域众多奇特“非官方”评测标准之一。此前,一位16岁的开发者开发了一款应用程序,利用人工智能控制《我的世界》游戏,并以此测试其建筑设计能力。同时,英国另一程序员还创建了一个平台,让人工智能在“你画我猜”和“四子棋”等游戏中相互对战。

尽管人工智能领域存在着更加学术化的性能测试,但为何这些略显奇异的测试迅速走红呢?部分原因在于,许多行业标准的人工智能测试对一般大众来说过于晦涩难懂。企业常常宣扬其人工智能在数学竞赛或高难度问题上的解题能力,然而,大多数人使用聊天机器人只是为了聊天或回复电子邮件。

即使是业内广泛采纳的评测方法,也不一定更有效或更具代表性。例如,备受人工智能爱好者和开发者关注的公共基准测试平台“聊天机器人竞技场”允许任何网络用户对AI在特定任务上的表现进行评分,如创建Web应用程序或生成图像。然而,参与评分的用户往往具有偏向性,主要来自科技行业,他们的投票也常受个人喜好影响且难以捉摸。

“四子棋”、“我的世界”和“威尔・史密斯吃面条”等奇特人工智能基准测试显然不是严谨的实证研究,也缺乏普适性。即使AI能够完美生成“威尔・史密斯吃面条”的视频,也并不代表其表现出色地生成汉堡的图像。

这些独特的AI基准测试可能会持续一段时间,因为它们不仅具有娱乐性,而且易于理解。未来,还会有哪些新颖基准测试受到关注呢?

广告声明:文中包含的对外跳转链接,旨在提供更多信息,节省筛选时间,仅供参考。

声明

1.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3.作者投稿可能会经我们编辑修改或补充。

搜索
排行榜
关注我们

扫一扫关注我们,了解最新精彩内容