2024 年另类 AI 评测标准走红：“威尔・史密斯吃意大利面”领衔

xxn 阅读：73560 2025-01-01 14:02:19 评论：0

据报道称，随着人工智能视频生成技术的不断进步，业界开始流行一种有趣的现象：每当一家公司发布全新的人工智能视频生成器时，总会有人率先利用它来制作威尔・史密斯吃意大利面的视频。这一趋势不仅成为一种网络流行语，更是一种非官方基准，用来评估新型 AI 视频生成器能否逼真地展示史密斯的吃面场景。去年 2 月，史密斯本人甚至在Instagram上发布了一段模仿视频，积极参与了这场网络活动。

值得注意的是，“威尔・史密斯吃意大利面”只是2024年人工智能领域众多奇特“非官方”评测标准之一。此前，一位16岁的开发者开发了一款应用程序，利用人工智能控制《我的世界》游戏，并以此测试其建筑设计能力。同时，英国另一程序员还创建了一个平台，让人工智能在“你画我猜”和“四子棋”等游戏中相互对战。

尽管人工智能领域存在着更加学术化的性能测试，但为何这些略显奇异的测试迅速走红呢？部分原因在于，许多行业标准的人工智能测试对一般大众来说过于晦涩难懂。企业常常宣扬其人工智能在数学竞赛或高难度问题上的解题能力，然而，大多数人使用聊天机器人只是为了聊天或回复电子邮件。

即使是业内广泛采纳的评测方法，也不一定更有效或更具代表性。例如，备受人工智能爱好者和开发者关注的公共基准测试平台“聊天机器人竞技场”允许任何网络用户对AI在特定任务上的表现进行评分，如创建Web应用程序或生成图像。然而，参与评分的用户往往具有偏向性，主要来自科技行业，他们的投票也常受个人喜好影响且难以捉摸。

“四子棋”、“我的世界”和“威尔・史密斯吃面条”等奇特人工智能基准测试显然不是严谨的实证研究，也缺乏普适性。即使AI能够完美生成“威尔・史密斯吃面条”的视频，也并不代表其表现出色地生成汉堡的图像。

这些独特的AI基准测试可能会持续一段时间，因为它们不仅具有娱乐性，而且易于理解。未来，还会有哪些新颖基准测试受到关注呢？

广告声明：文中包含的对外跳转链接，旨在提供更多信息，节省筛选时间，仅供参考。

声明

1.本站遵循行业规范，任何转载的稿件都会明确标注作者和来源；2.本站的原创文章，请转载时务必注明文章作者和来源，不尊重原创的行为我们将追究责任；3.作者投稿可能会经我们编辑修改或补充。