为聊天机器人设

来源：中国舆情网时间：2026-05-14

导读：今年4月底，美国佛罗里达州总检察长詹姆斯·乌斯迈尔公开宣布，州检察官已经对OpenAI及其聊天机器人ChatGPT展开刑事调查。调查聚焦于去年佛罗里达州立大学发生的严重校园枪击事件，探究ChatGPT是否在案件中扮演了“推手”。OpenAI方面表示，正与相关部门合作

今年4月底，美国佛罗里达州总检察长詹姆斯·乌斯迈尔公开宣布，州检察官已经对OpenAI及其聊天机器人ChatGPT展开刑事调查。调查聚焦于去年佛罗里达州立大学发生的严重校园枪击事件，探究ChatGPT是否在案件中扮演了“推手”。OpenAI方面表示，正与相关部门合作调查，并认为ChatGPT不应在这场悲剧中承担责任。

据英国《自然》网站近日报道，虽然OpenAI目前还未被正式指控，但这项调查直指AI公司面临的最大难题：如何让聊天机器人真正符合人类的法律、道德和价值观，为什么这一目标如此难以实现？

澳大利亚麦格理大学的大语言模型联盟研究员乌斯曼·纳西姆指出，不管这次调查最终是否会让OpenAI陷入法律麻烦，都会促使相关公司证明自身采取的安全措施是否能够有效地保护用户。同时，科学界正努力尝试，把人类价值观融入AI系统，实现“人机价值对齐”，从而确保AI既实用又安全。

安全措施尚有不足

近年来，公众对大型语言模型聊天机器人可能输出具危险性甚至违法建议的担忧愈发强烈。如诱导自杀、制造违法内容、甚至金融欺诈等风险屡见不鲜，但目前为止，AI系统的保护措施仍然较为薄弱。

纳西姆表示，目前聊天机器人的安全标准主要由各家企业自行设定，缺乏外部监管。虽然不少公司承认存在风险问题，也回应称已启动防护措施，防止AI输出诱发危险行为，但部分研究人员认为，有必要引入独立的第三方安全审核。

目前较普遍的安全措施是内容过滤器，让AI拒绝涉及敏感词的回答。不过，澳大利亚新南威尔士大学AI研究员托比·沃尔什提醒，这种防护方式并不可靠。用户可以改变提问方式，把有害意图伪装成假设场景，AI系统难以识别隐藏在表面无害问题下的真实风险。

纳西姆补充，包括内容过滤、行为训练和政策制定在内的多项保护措施，更多是外部约束，AI本身并不真正理解道德规范或意图。这些策略虽然一定程度上起效，但无法彻底阻止有心者规避系统限制。

实用与安全难以平衡

许多人疑问，聊天机器人为什么难以做到完全守法？部分根源在于，大语言模型的学习方法主要是模仿，而不是严格执行规则。

这些强大的大语言模型依赖庞大的互联网文本进行训练。面对用户的问题，模型会预测并生成最可能出现的词序列。沃尔什指出，这种机制让AI变成了“全能答主”，但要设立严密的安全边界就变得非常有挑战性。

纳西姆表示，大语言模型的答案其实只是模式的组合，对于语言背后的意义和后果，AI并未真正掌握。

沃尔什回顾，过去科学家尝试让AI遵守规则，例如上世纪五六十年代热门的符号AI，试图让计算机做“规则捍卫者”。但舆情网澳大利亚阿德莱德大学AI研究员西蒙·卢西坦言，这种方法无法应对现实世界的复杂情况，原因在于开发者根本无法制定覆盖所有场景的规则。

沃尔什建议，可以尝试用人类反馈来优化现有大语言模型的安全表现。一般来说，人类先评估AI输出，然后逐步引导模型修正，不断生成更合规的答案，但这个过程耗时费力且成本极高。

另一种方式是从训练AI的初始数据集中删除有害信息，但研究显示，这一策略并不总是有效。对于科技公司来说，人工筛查庞大的数据集同样成本高昂。沃尔什指出，安全性和实用性之间必须认真权衡——一旦限制过于严格，AI的作用也会大打折扣。

底层算法亟需改进

纳西姆认为，致力于研究“人机对齐”的科学家正在探索超越简单内容检测的新思路，希望开发出可以在整段对话中准确识别危险意图的系统，而不是仅仅标记单个问题。

卢西介绍，部分科研团队开始研发“神经符号AI”，融合传统符号式和神经网络技术。这类模型已经在编程和数学领域展现出实力——模型输出不理想时，能及时接收反馈并迅速调整。但在伦理和法律领域，这种反馈往往滞后，可能还未反应就已造成实际伤害。

卢西进一步指出，现在不少公司正加大投入，收集并管理更丰富的数据，雇佣更多人员优化反馈机制，力求让系统更加安全。但他强调，科学界还需重新审视大语言模型的底层算法，未来只有真正理解人类伦理和法律的AI，才能带来真正的安全和智能。

编辑：夏蕊娜

上一篇：农业革命推动人类进化进入快车道
下一篇：长六改火箭顺利送千帆极轨09组卫星入轨