国内首个:清华大学、腾讯云、英特尔尝试用 AI 让数据库听懂自然语言
IT之家于3月11日报导,腾讯云今天公布了与清华大学及英特尔的最新合作,企图在3月7日于北京正式启动“数据库 AI 联合创新计划”。该计划专注于数据库与大型模型技术的深度交叉研究,旨在推动数据库的智能化升级,并为人工智能的应用构建更为高效的数据基础设施。这成为了国内首个在数据库 AI 领域实现产学研全面协作的项目。
随着大语言模型的快速发展,数据库系统正面临从“被动存储”向“主动服务”的转变挑战。传统数据库依赖于人工撰写复杂的查询语句,而大模型的自然语言处理能力能够显著降低用户的门槛;与此同时,AI训练与推理所需的庞大数据处理也迫切要求数据库在分布式架构与缓存管理等环节实现性能的提升。
IT之家从公告中了解到,针对此趋势,本次合作设定了两大技术攻关方向:
首先,开发基于大模型的智能查询生成与优化系统(Text2SQL),使得用户能够通过自然语言直接与数据库互动,让复杂的数据库技术可以被普通用户理解;
其次,构建适用于大模型推理的分布式缓存解决方案,以应对 AI 任务调度及存储资源分配等关键挑战。
在 Text2SQL 领域,项目团队提出了一个端到端的技术框架,聚焦突破语义理解、模式匹配及SQL验证等重要环节。借助大模型的微调、强化学习(DPO)和检索增强(RAG)技术,系统能够将用户的提问拆解成多级子任务,并动态匹配数据库的表结构,从而生成高精度的SQL语句。
为加速大模型的推理,项目组设计了一个分布式缓存系统,通过两阶段的任务调度、KVCache优化以及GPU直连存储技术,大幅度降低了计算资源的浪费。
清华大学数据库科研团队表示:“未来的数据库不仅仅是一个存储工具,更应成为 AI 产业链的重要数据处理中心。我们期望通过此次合作,为全球数据库技术的进步提供具有中国特色的解决方案。”
广告声明:文中包括的外部链接(涵盖超链接、二维码、口令等多种形式)旨在传递附加信息,以节省用户筛选时间,具体结果仅供参考。
1.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3.作者投稿可能会经我们编辑修改或补充。