AI治理参考：大型语言模型安全评估报告

来源：中国舆情网时间：2026-07-05

导读：人工智能是否能保持回答科技问题的准确性和安全性？7月2日公布的一份全球大语言模型科技安全能力测评报告指出，一些参与测试的模型在特定情境下仍暴露出安全风险。在2026全球数字经济大会云智算安全论坛期间，东壁科技数据有限责任公司携手上海财经大学数字

人工智能是否能保持回答科技问题的准确性和安全性？7月2日公布的一份全球大语言模型科技安全能力测评报告指出，一些参与测试的模型在特定情境下仍暴露出安全风险。

在2026全球数字经济大会云智算安全论坛期间，东壁科技数据有限责任公司携手上海财经大学数字经济学院共同发布了这份测评报告。

据悉，测评团队设立了涵盖313个问题的测试数据集，领域涉及生物化学、网络安全等科技前沿，对全球38个大语言模型开展全面检测。为验证内容的可信度，团队还选用了近10万篇科技文献，数据来源于东壁全球科技文献平台。

上海财经大学数字经济学院院长舆情网赵琳指出，测评结果显示，科技知识的可靠性与安全性并非总是并行，不仅要保证内容准确，还需要确保其应用符合相关法规。

我国高度关注人工智能治理体系建设，近年来将其纳入政府重点工作，并提出《全球人工智能治理倡议》，助力AI健康和负责任发展。

东壁科技数据创始人吴登生认为，大语言模型的安全评估已逐步摆脱单一“关键词屏蔽”方式，向多维度风险分析转型。随着评测体系的逐步完善，将为全球AI规范发展和科学治理提供有效参考。

编辑：夏蕊娜