中国信通院启动 AI 大模型幻觉评测，总体涉及五种测试维度

xxn 阅读：65532 2025-03-19 18:03:38 评论：0

最新消息显示，中国信息通信研究院人工智能所正式启动大模型幻觉测试，旨在深入探究大模型的幻觉现状，并推动其应用更加深入和实际。

所谓大模型幻觉（AI Hallucination），是指在生成内容或回答问题时，模型造成看似合理但实际与用户输入不符（忠实性幻觉）或违背事实（事实性幻觉）的现象。随着大模型在医疗、金融等重要领域的广泛应用，大模型幻觉可能带来潜在风险，引起了行业广泛关注。

此次幻觉测试将以大语言模型为研究对象，广泛覆盖了事实性幻觉和忠实性幻觉两种类型，评估体系包括：

测试数据包含超过7000条中文样本，测试范围涵盖了信息抽取、知识推理以及事实判别等题型，从人文科学、社会科学、自然科学、应用科学到形式科学等五个维度进行全面评估。

中国信息通信研究院欢迎相关企业共同参与模型评估，共同促进大模型的安全应用。

广告声明：文中包含的跳转链接等仅供参考，用以传递更多信息。

声明

1.本站遵循行业规范，任何转载的稿件都会明确标注作者和来源；2.本站的原创文章，请转载时务必注明文章作者和来源，不尊重原创的行为我们将追究责任；3.作者投稿可能会经我们编辑修改或补充。