法院开始制裁未核验AI引用:律师与法务需要的不是禁用AI,而是可审计工作流
2026年5月27日,纽约州上诉法院第二司法部在 Matter of Julien v Arthur 中给出了一条对法律AI行业极具信号意义的判断:未经核验使用生成式AI起草含有虚假法律依据的上诉文件,属于可被制裁的轻率行为;即使提交者并非律师,而是自诉当事人,也不能以“不懂法律”或“工具看起来可靠”作为免责理由。1
这并不是又一个“AI编造案例”的猎奇故事。它更像是法院系统正在形成的一条新底线:法院并不当然禁止AI进入法律工作,但会要求使用者对AI输出承担与传统法律工作同等甚至更高的核验义务。对律师和企业法务来说,问题已经不再是“能不能用AI”,而是“能不能证明自己以专业、可追溯、可审计的方式使用AI”。
纽约上诉法院在判决中指出,生成式AI可能产生不存在的案例、虚构的引文或对法律的错误陈述,而这些“幻觉”的危险之处不仅在于不准确,更在于它们往往伪装成真实的法律依据,从而浪费对方当事人与法院的时间和资源。1
本案的事实并不复杂。父亲作为自诉人提交上诉状,其中包含一条并不存在的判例引用,并且还出现了多处类似“Appellant to provide...”的占位提示。法院认为,这些迹象高度显示该文件曾由生成式AI辅助起草。面对法院要求说明理由的命令,提交者承认自己使用了看似真实的网络或AI工具信息,但并未完成独立核验。1
| 法院关注点 | 对法律团队的含义 |
|---|---|
| 虚假案例是否进入正式文件 | AI输出进入客户意见、合同审查、诉状、函件前必须经过法律数据库与原文核验 |
| 是否存在合理调查 | 团队不能只保存最终文件,还应保留检索、引用校验、人工复核记录 |
| 是否浪费法院与相对方资源 | AI错误不只是技术瑕疵,而可能转化为程序风险、信誉风险与执业伦理风险 |
| 自诉人是否可被制裁 | 标准正在向所有诉讼参与者扩展,律师和法务更难主张宽免 |
这一判决的重要性在于,它把“AI幻觉”从技术讨论推进到了程序责任层面。过去,法律行业谈AI风险,常常停留在模型会不会编造、提示词如何优化、是否应当披露AI使用等问题上。现在,法院真正追问的是:谁把未经核验的内容提交到了正式法律场景?谁应当承担核验义务?组织是否建立了足以防止错误扩散的流程?
同一周的其他案例也在强化这一趋势。eDiscovery Today 报道的 Miller v. Regions Bank 中,律师因提交被认为包含虚构引文的文件,并在法院要求提供ChatGPT记录后删除账户,被处以公开训诫、取消案件代理资格、六个月暂停在相关法院执业以及移送纪律机构等严厉后果。2 Massachusetts Lawyers Weekly 也报道,Morgan & Morgan律师因过往AI虚假引用制裁披露不足,在哈佛遗体案中被拒绝临时出庭资格。3
这些事件共同说明,法院对AI使用的态度正在发生微妙但明确的变化。第一阶段,法院主要是在个案中发现虚假引用并进行纠错;第二阶段,法院开始要求律师解释AI使用过程;而现在,法院已经进一步关注保存记录、披露完整性、团队监督与事后补救。如果说2023年的AI幻觉案例是在提醒律师“不要盲信模型”,那么2026年的新案例则是在告诉法律组织:没有流程的AI使用,本身就是风险源。
对企业法务而言,这一变化尤其值得警惕。企业内部使用AI的场景往往比诉讼文件更分散,例如合同初审、供应商风险评估、知识产权侵权监测、员工政策问答、监管合规备忘录和争议预案。许多输出不会立即提交法院,却会影响商业决策、谈判立场和证据保全节奏。一旦后续进入争议程序,法务团队可能需要解释当时为什么采纳某一AI结论、依据哪些材料、由谁复核、是否存在相反信息以及是否保留了证据链。
因此,律师和法务不应把“反幻觉”理解为单一功能,而应把它设计为工作流。一个成熟的法律AI流程至少应包括四层控制:第一,输入层要明确数据来源和权限边界,避免把未经授权或含敏感信息的材料随意投入通用模型;第二,生成层要要求模型给出可追溯来源,而不是只给出结论;第三,核验层要对法规、案例、合同条款和事实材料进行原文比对;第四,归档层要保存关键版本、引用来源、人工审核意见和最终采用理由。
| 工作流环节 | 低风险做法 | 高风险做法 |
|---|---|---|
| 法律检索 | 要求AI列明来源,并由律师回到权威数据库核验原文 | 复制AI给出的案例名称和摘要,直接写入文件 |
| 文书起草 | 将AI草稿作为初稿,由律师逐段审查事实、法律与逻辑 | 只做语言润色,不检查引用是否真实存在 |
| 合同审查 | 结合客户风险偏好、交易背景和历史谈判立场复核建议 | 把通用条款建议当成适用于本交易的结论 |
| 争议准备 | 保存检索记录、证据材料、复核意见和版本轨迹 | 出错后无法说明AI输出如何产生、由谁批准 |
这也是为什么法律AI产品的竞争,不会只停留在“生成得更快”。真正能进入律师事务所和企业法务部核心流程的系统,必须解决三个更难的问题:能否理解案件或项目上下文,能否把结论绑定到可验证来源,能否把人的专业判断嵌入系统记录。换言之,法律AI不应替代律师的责任,而应帮助律师把责任履行得更稳定、更可证明。
对律师事务所而言,这意味着AI治理不应只写在内部政策里,而要落到具体操作界面中。初级律师使用AI生成检索思路时,系统应提示其补充原文核验;合伙人审核诉状时,应能看到关键引用的来源状态;知识管理团队沉淀模板时,应区分“可复用表达”和“必须按案核验的法律依据”。对企业法务而言,AI治理同样不能只由信息安全部门负责,法务部门需要参与定义哪些场景可以自动化、哪些结论必须人工复核、哪些记录应当长期留存。
纽约上诉法院这次判决的真正启示,不是让法律人停止使用AI,而是让法律人停止以“试试看”的方式使用AI。法律服务的核心资产是可信度。AI可以提高速度,也可以扩大错误的传播半径;AI可以降低重复劳动,也可以在没有监督时制造更复杂的责任链条。未来的专业优势,将属于那些既能拥抱AI效率,又能把每一步输出纳入法律职业标准的团队。
对于正在搭建AI工作流的律师和企业法务,智律云的 AI Copilot(律师AI助手) 正是围绕这一方向设计:在案件分析、法律检索和文书起草中强调引用可追溯、结论可核验和流程可复用。与此同时,Auto Pilot(IP维权自动化) 将侵权监测、证据固化、策略建议和维权流程连接起来,帮助品牌方把知识产权保护从人工巡查升级为可运营、可审计的自动化体系。AI时代的法律竞争,不只是更快生成答案,而是更可靠地证明答案从何而来、为何可信、由谁负责。