中国信通院启动 AI 大模型幻觉评测,总体涉及五种测试维度
xxn
阅读:65478
2025-03-19 18:03:38
评论:0
最新消息显示,中国信息通信研究院人工智能所正式启动大模型幻觉测试,旨在深入探究大模型的幻觉现状,并推动其应用更加深入和实际。
所谓大模型幻觉(AI Hallucination),是指在生成内容或回答问题时,模型造成看似合理但实际与用户输入不符(忠实性幻觉)或违背事实(事实性幻觉)的现象。随着大模型在医疗、金融等重要领域的广泛应用,大模型幻觉可能带来潜在风险,引起了行业广泛关注。
此次幻觉测试将以大语言模型为研究对象,广泛覆盖了事实性幻觉和忠实性幻觉两种类型,评估体系包括:
测试数据包含超过7000条中文样本,测试范围涵盖了信息抽取、知识推理以及事实判别等题型,从人文科学、社会科学、自然科学、应用科学到形式科学等五个维度进行全面评估。
中国信息通信研究院欢迎相关企业共同参与模型评估,共同促进大模型的安全应用。
广告声明:文中包含的跳转链接等仅供参考,用以传递更多信息。
声明
1.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3.作者投稿可能会经我们编辑修改或补充。