AI PS 卷起来了:谷歌 Gemini 动嘴 P 图,马斯克 Grok 上线图像编辑

xxn 阅读:34337 2025-03-22 16:02:08 评论:0

Grok 连夜推出了全新的图片编辑功能,继 Gemini 引发了图片编辑热潮之后,现在只需动动嘴就能实现专业级的 P 图效果,例如「证件照换西装」、「黑发变金发」等。

Grok 最近推出了一项图片编辑功能。

昨晚,Grok 发布了图片编辑功能,用户可以通过简单的文字描述直接修改图片。

用户可以上传个人证件照,然后通过简单的指令让 Grok 帮忙进行 PS,比如让您穿上一套全新的西服。

Grok 还为用户设计了四种不同风格的西服,例如带花纹和不带花纹的领带,效果看起来非常不错。

目前这一功能似乎还在灰度测试中(普通用户暂时还无法看到编辑按钮)。

Grok 移动App 同步上线

Grok 同时发布了X手机App,用户可以在手机上体验图片编辑功能。

比如上传一张照片,让照片中的人物从黑发变成金发。

不过手机版的 Grok 功能还在灰度测试中。

目前关于 Grok 的讨论并不多,可能是因为还处于灰度测试阶段。

但从一些博主的测试作品来看,Grok 对自己的效果颇有信心。

例如拥有6万粉丝的博主Borriss,他的头像原本是穿着黑色高领毛衣的。

经过 Grok 的处理后,他的头像换成了西服。

AI编辑的效果看起来不错,例如「黑毛衣秒变西服」。

还有其他用户发布了使用Grok编辑图片的效果,但其中一个问题是Grok把用户的脸也一起更换了。

用户可以尝试将图片风格改成Egon Shiele的画作风格。

或者给马斯克加上一顶帽子。

大模型竞争,PS软件受挫

Grok 这次迅速推出了图片编辑功能,很可能是受到 Google Gemini 2.0的「动动嘴」PS功能的影响。

Google发布的Gemini-2.0-flash Experimantal版本凭借简单的文本描述就能实现P图的能力吸引了大量用户。

比如将两张照片合成一张并添加人物动作也能实现非常自然的效果。

改变一个人物白色裙子为红色以及加上领带等效果也实现得相当出色。

从Gemin2.0到Grok的图片编辑功能,展示了目前最先进的模型技术依然在竞争发展。

大型模型正在争相吸引用户。

未来提及P图时,人们很可能首先想到的将不再是传统的图片编辑软件Photoshop,而是AI赋予的各种大型模型功能。

图片编辑领域的变化可能预示着一个重要的技术转变,未来很多工作将从复杂操作转变为简单交互。

Gemini、Grok等大型模型将继续降低图片编辑的技术门槛。

从以往需要专业软件和繁琐步骤,到现在只需简单的自然语言指令即可完成高质量的图片编辑。

尽管目前大型模型的P图效果仍处于玩赏阶段,专业图片编辑仍需要专业的UI工程师使用特定软件才能完成。

然而,最先进模型的竞争还在继续。

正如Alvaro Cintas所言,OpenAI尚未发布原生图像生成和编辑功能。

也许很快,ChatGPT将提供编辑原生图片的功能。

参考资料:

  • https://x.com/dr_cintas/status/1903112910735339984

本文来自微信公众号:新智元(ID:AI_era)

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,结果仅供参考。

声明

1.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3.作者投稿可能会经我们编辑修改或补充。

搜索
排行榜
关注我们

扫一扫关注我们,了解最新精彩内容