AI 卷翻科研:DeepMind 36 页报告称全球实验室被「AI 科学家」指数级接管
未来一年内,OpenAI 科学家 Jason Wei 预测AI的关注重点将从推广大众需求转为促进科学发展。DeepMind最新发布的报告显示全球实验室中AI使用正指数级增长,AI for Science进入黄金时代。
在过去两年,AI主要用于用户增长,成功普及大众化。目前,AI的日常应用已接近天花板,对于绝大多数普通查询,许多LLM已能给出相当不错的回答。
速度、流畅性已足够满足大多数用户的需求。即便再优化,提升空间也有限。因此,未来值得关注的是科学和工程领域。
OpenAI 科学家Jason Wei预测,未来五年,AI的关注重点将转向硬核领域,用AI加速科学和工程,推动技术进步。
AI不仅有回答顶尖问题的潜力,还能激发人们思考更大挑战,进一步推动科技飞跃。
普通用户的简单问题改进空间有限。
每个科学前沿领域都有巨大改进空间,AI可以发力解决能推动科技飞跃的顶尖问题。
AI的进展可以加速AI研究本身,帮助AI变得更强。AI的进步是复利的,是正反馈之王。
未来五年将是"AI科学家"和"AI工程师"的时代。
DeepMind最新的一篇论文也暗示了全球实验室中AI使用正在以指数级增长。
报告地址:https://storage.googleapis.com/deepmind-media/DeepMind.com/Assets/Docs/a-new-golden-age-of-discovery_nov-2024.pdf
AI加速科学创新发现的黄金时代
每三位博士后研究员中就有一位使用大语言模型协助完成文献综述、编程和文章撰写等工作。
今年的诺贝尔化学奖颁发给了AlphaFold 2的发明人Demis Hassabis和John Jumper,启发了许多科学家将AI应用到自己的领域中,以谋得更多创新性发现。
过去半个世纪,科学家人数急剧增加,但科技带来的社会进步却放缓。
原因之一是现代科学家面临的规模和复杂性挑战越来越棘手。
不过,深度学习擅长搞定这种复杂局面,可以大幅度压缩科学发现的时间成本。
传统X射线晶体学耗时数年、烧费数十万元才能搞定一个蛋白质结构,而AlphaFold则能迅速生成数亿种预测,秒杀传统方法。
五大机遇
对于在不同科学研究阶段难以突破瓶颈的科学家来说,抓住利用AI的关键机遇或许能促进诞生强有力的新发现。
五个能用AI推进科研的机遇
1. 知识——改变科学家获取和传递知识的方式
科学家要想推动新发现,必须掌握日益专业化、指数增长的知识体系。
这种知识负担让颠覆性发现越来越依赖年长科学家和顶尖大学的跨学科团队,也导致小团队独立撰写论文的比例持续下滑。
然而,大多数科学成果仍采用晦涩难懂、英语为主的论文分享形式,限制了政策制定者、企业和公众的关注与兴趣。
如今,科学家和公众都能通过LLM突破这一局限。
例如,有团队利用谷歌Gemini一天内从20万篇论文中提炼相关见解;普通人也可用LLM轻松摘要和问答,获取专业学术知识,快速拉近与前沿科学的距离。
2. 数据——生成、提取和标注大型科学数据集
尽管我们处于数据爆炸时代,许多自然和社会领域中,科学数据仍相对匮乏,如土壤、深海、大气层和非正式经济。
AI正助力改变这一现状。它能减少在DNA测序、检测样本中具体细胞类型或捕捉动物声音时可能发生的噪声和错误。
科学家们还可以利用LLM日益强大的多模态能力,从科学出版物、档案文件以及视频图像等资源中提取非结构化的科学数据,并将其转化为结构化数据集,以作后续研究。
AI还可以帮助为科学数据添加科学家所需的辅助信息。例如,至少三分之一的微生物蛋白质在执行功能中的细节未能被可靠地注释。
经过可靠性评估验证的AI模型也可以作为新的合成科学数据的来源。例如,AlphaProteo蛋白质设计模型是在AlphaFold 2中超过1亿个AI生成的蛋白质结构以及蛋白质数据库中的实验结构上进行训练的。
3. 实验——模拟、加速并指导复杂实验
科学实验常因成本高、复杂且耗时难以执行。还有一些实验因研究人员无法获得所需的设施、人力或实验材料而无法进行。
例如,核聚变有望提供一种几乎无限、无排放的能源来源,但控制等离子体所需的托卡马克反应堆复杂昂贵。ITER原型从2013年建造,预计2030年代中期才开始实验。
AI可通过模拟加速实验进程。
例如,研究者与洛桑联邦理工合作,用强化学习控制托卡马克等离子体形状,这一方法还可用于粒子加速器、望远镜等设施。
在不同学科中,利用AI模拟实验的方式可能各不相同,但一个共同点是,这些模拟通常用于指导和优化现实实验,而非完全替代它们。
以基因研究为例,普通人平均有9000多个错义变异,大多无害,但少数会致病。现实中只能逐个测试蛋白质的影响。而AlphaMissense能快速分类7100万潜在变异中的89%,帮助科学家聚焦高风险变异,加速疾病研究。
AlphaMissense对所有可能的7100万个错义变体的致病性的预测
4. 模型——建模复杂系统及其组件之间的相互作用
1960年,诺贝尔奖得主物理学家Eugene Wigner感叹数学方程在模拟自然现象(如行星运动)中出乎意料的有效性。
但面对生物学、经济学、天气等复杂系统,传统方程模型逐渐显得乏力,因为这些系统充满动态性、随机性,并常伴涌现和混沌,难以预测和控制。这些方程提供有用但并不完美的近似,而且运行这些方法也要求高昂的计算成本。
AI则能从复杂数据中挖掘规律。例如,谷歌的深度学习系统能快速预测未来10天的天气,速度和准确性都超越传统数值模型。
同时,AI还能帮助减缓气候问题,如用AI预测潮湿区域的出现时间和位置,帮助飞行员避开会加剧全球变暖的凝结尾迹。
即便AI十分强大,它更多是丰富而非取代传统复杂系统建模。
例如,基于智能体的建模通过模拟个体行为者(如企业和消费者)之间的交互,来理解这些交互如何影响更大、更复杂的系统(如社会经济)。
在传统方法中,科学家需要事先规定这些智能体的行为方式。
如今,科学家可以利用大语言模型创建更灵活的生成式智能体,这些智能体能够进行沟通和行动,例如搜索信息或购买,同时还能对这些行动进行推理和记忆。
科学家还可以利用强化学习研究这些智能体如何在更动态的模拟中学习和调整其行为,例如对于新的能源价格或疫情响应政策的反应。
5. 解决方案——为大规模搜索空间问题提出解决方案
许多重要的科学问题伴随着许多几乎无法理解的潜在解决方案。
比如生物学家和化学家需要确定分子(如蛋白质)的结构、特性和功能,才能设计出用作抗体药物、降解塑料的酶或新型材料的一些新分子。
然而,要设计一种小分子药物,科学家需要面对超过10^60种潜在选择;要设计一种由400种标准氨基酸组成的蛋白质,则需要面对20^400种选择。
这种大规模搜索空间不仅限于分子,还广泛存在于许多科学问题中,如寻找数学问题的最佳证明、计算机芯片的最佳设计架构等。
传统上,科学家依赖直觉、试错法、迭代或暴力计算的某种组合来寻找最佳分子、证明或算法。然而,这些方法难以充分遍历庞大的搜索空间,从而无法发现更优的解决方案。
如今,AI能够更好地探索这些庞大的搜索空间,同时更快地聚焦于最有可能可行且有效的解决方案。
今年7月,AlphaProof和AlphaGeometry2成功解决了国际数学奥林匹克竞赛中六道题目中的四道。它们利用Gemini大语言模型架构,为给定的数学问题生成大量潜在解决方案,并结合基于数学逻辑的系统,迭代实现接近最可能正确的候选解决方案。
AI科学家还是AI赋能的科学家?
即便AI系统的能力在不断提升,其最大的边际效益依旧会源于将其应用在能够突显其相对优势的场景之中。
比如快速从海量数据集中快速提取信息,以及帮助解决科学进步中的真正瓶颈问题;而非企图让人类科学家已擅长的任务实现自动化。
1.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3.作者投稿可能会经我们编辑修改或补充。