中国信通院启动 AI 大模型幻觉评测,总体涉及五种测试维度

xxn 阅读:65478 2025-03-19 18:03:38 评论:0

最新消息显示,中国信息通信研究院人工智能所正式启动大模型幻觉测试,旨在深入探究大模型的幻觉现状,并推动其应用更加深入和实际。

所谓大模型幻觉(AI Hallucination),是指在生成内容或回答问题时,模型造成看似合理但实际与用户输入不符(忠实性幻觉)或违背事实(事实性幻觉)的现象。随着大模型在医疗、金融等重要领域的广泛应用,大模型幻觉可能带来潜在风险,引起了行业广泛关注。

此次幻觉测试将以大语言模型为研究对象,广泛覆盖了事实性幻觉和忠实性幻觉两种类型,评估体系包括:

测试数据包含超过7000条中文样本,测试范围涵盖了信息抽取、知识推理以及事实判别等题型,从人文科学、社会科学、自然科学、应用科学到形式科学等五个维度进行全面评估。

中国信息通信研究院欢迎相关企业共同参与模型评估,共同促进大模型的安全应用。

广告声明:文中包含的跳转链接等仅供参考,用以传递更多信息。

声明

1.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3.作者投稿可能会经我们编辑修改或补充。

搜索
排行榜
关注我们

扫一扫关注我们,了解最新精彩内容