法院开始制裁未核验AI引用：律师与法务需要的不是禁用AI，而是可审计工作流

2026年5月27日，纽约州上诉法院第二司法部在 Matter of Julien v Arthur 中给出了一条对法律AI行业极具信号意义的判断：未经核验使用生成式AI起草含有虚假法律依据的上诉文件，属于可被制裁的轻率行为；即使提交者并非律师，而是自诉当事人，也不能以“不懂法律”或“工具看起来可靠”作为免责理由。1

这并不是又一个“AI编造案例”的猎奇故事。它更像是法院系统正在形成的一条新底线：法院并不当然禁止AI进入法律工作，但会要求使用者对AI输出承担与传统法律工作同等甚至更高的核验义务。对律师和企业法务来说，问题已经不再是“能不能用AI”，而是“能不能证明自己以专业、可追溯、可审计的方式使用AI”。

纽约上诉法院在判决中指出，生成式AI可能产生不存在的案例、虚构的引文或对法律的错误陈述，而这些“幻觉”的危险之处不仅在于不准确，更在于它们往往伪装成真实的法律依据，从而浪费对方当事人与法院的时间和资源。1

本案的事实并不复杂。父亲作为自诉人提交上诉状，其中包含一条并不存在的判例引用，并且还出现了多处类似“Appellant to provide...”的占位提示。法院认为，这些迹象高度显示该文件曾由生成式AI辅助起草。面对法院要求说明理由的命令，提交者承认自己使用了看似真实的网络或AI工具信息，但并未完成独立核验。1

法院关注点	对法律团队的含义
虚假案例是否进入正式文件	AI输出进入客户意见、合同审查、诉状、函件前必须经过法律数据库与原文核验
是否存在合理调查	团队不能只保存最终文件，还应保留检索、引用校验、人工复核记录
是否浪费法院与相对方资源	AI错误不只是技术瑕疵，而可能转化为程序风险、信誉风险与执业伦理风险
自诉人是否可被制裁	标准正在向所有诉讼参与者扩展，律师和法务更难主张宽免

这一判决的重要性在于，它把“AI幻觉”从技术讨论推进到了程序责任层面。过去，法律行业谈AI风险，常常停留在模型会不会编造、提示词如何优化、是否应当披露AI使用等问题上。现在，法院真正追问的是：谁把未经核验的内容提交到了正式法律场景？谁应当承担核验义务？组织是否建立了足以防止错误扩散的流程？

同一周的其他案例也在强化这一趋势。eDiscovery Today 报道的 Miller v. Regions Bank 中，律师因提交被认为包含虚构引文的文件，并在法院要求提供ChatGPT记录后删除账户，被处以公开训诫、取消案件代理资格、六个月暂停在相关法院执业以及移送纪律机构等严厉后果。2 Massachusetts Lawyers Weekly 也报道，Morgan & Morgan律师因过往AI虚假引用制裁披露不足，在哈佛遗体案中被拒绝临时出庭资格。3

这些事件共同说明，法院对AI使用的态度正在发生微妙但明确的变化。第一阶段，法院主要是在个案中发现虚假引用并进行纠错；第二阶段，法院开始要求律师解释AI使用过程；而现在，法院已经进一步关注保存记录、披露完整性、团队监督与事后补救。如果说2023年的AI幻觉案例是在提醒律师“不要盲信模型”，那么2026年的新案例则是在告诉法律组织：没有流程的AI使用，本身就是风险源。

对企业法务而言，这一变化尤其值得警惕。企业内部使用AI的场景往往比诉讼文件更分散，例如合同初审、供应商风险评估、知识产权侵权监测、员工政策问答、监管合规备忘录和争议预案。许多输出不会立即提交法院，却会影响商业决策、谈判立场和证据保全节奏。一旦后续进入争议程序，法务团队可能需要解释当时为什么采纳某一AI结论、依据哪些材料、由谁复核、是否存在相反信息以及是否保留了证据链。

因此，律师和法务不应把“反幻觉”理解为单一功能，而应把它设计为工作流。一个成熟的法律AI流程至少应包括四层控制：第一，输入层要明确数据来源和权限边界，避免把未经授权或含敏感信息的材料随意投入通用模型；第二，生成层要要求模型给出可追溯来源，而不是只给出结论；第三，核验层要对法规、案例、合同条款和事实材料进行原文比对；第四，归档层要保存关键版本、引用来源、人工审核意见和最终采用理由。

工作流环节	低风险做法	高风险做法
法律检索	要求AI列明来源，并由律师回到权威数据库核验原文	复制AI给出的案例名称和摘要，直接写入文件
文书起草	将AI草稿作为初稿，由律师逐段审查事实、法律与逻辑	只做语言润色，不检查引用是否真实存在
合同审查	结合客户风险偏好、交易背景和历史谈判立场复核建议	把通用条款建议当成适用于本交易的结论
争议准备	保存检索记录、证据材料、复核意见和版本轨迹	出错后无法说明AI输出如何产生、由谁批准

这也是为什么法律AI产品的竞争，不会只停留在“生成得更快”。真正能进入律师事务所和企业法务部核心流程的系统，必须解决三个更难的问题：能否理解案件或项目上下文，能否把结论绑定到可验证来源，能否把人的专业判断嵌入系统记录。换言之，法律AI不应替代律师的责任，而应帮助律师把责任履行得更稳定、更可证明。

对律师事务所而言，这意味着AI治理不应只写在内部政策里，而要落到具体操作界面中。初级律师使用AI生成检索思路时，系统应提示其补充原文核验；合伙人审核诉状时，应能看到关键引用的来源状态；知识管理团队沉淀模板时，应区分“可复用表达”和“必须按案核验的法律依据”。对企业法务而言，AI治理同样不能只由信息安全部门负责，法务部门需要参与定义哪些场景可以自动化、哪些结论必须人工复核、哪些记录应当长期留存。

纽约上诉法院这次判决的真正启示，不是让法律人停止使用AI，而是让法律人停止以“试试看”的方式使用AI。法律服务的核心资产是可信度。AI可以提高速度，也可以扩大错误的传播半径；AI可以降低重复劳动，也可以在没有监督时制造更复杂的责任链条。未来的专业优势，将属于那些既能拥抱AI效率，又能把每一步输出纳入法律职业标准的团队。

对于正在搭建AI工作流的律师和企业法务，智律云的 AI Copilot（律师AI助手） 正是围绕这一方向设计：在案件分析、法律检索和文书起草中强调引用可追溯、结论可核验和流程可复用。与此同时，Auto Pilot（IP维权自动化） 将侵权监测、证据固化、策略建议和维权流程连接起来，帮助品牌方把知识产权保护从人工巡查升级为可运营、可审计的自动化体系。AI时代的法律竞争，不只是更快生成答案，而是更可靠地证明答案从何而来、为何可信、由谁负责。

法院开始制裁未核验AI引用：律师与法务需要的不是禁用AI，而是可审计工作流

References