“法观”明日公测：首个通过中国法考的 AI 模型，Lawbench 跑分超过 GPT-4

感谢中国司法大数据研究院官方公众号昨日（8 月 8 日）发布博文，“法观” AI 大模型产品以客观题 182 分及主观题优秀表现，通过中国法律职业资格考试。“万法”大模型中国司法大数据研究院紧跟大模型应用发展趋势，积极开展大模型前瞻布局，致力于为法律界提供专业的知识体系构建、精准的风险分析模型、智能化法律服务等能力。经过一年多的积累和沉淀，中国法研的“万法”大模型已经开始对外提供服务。“法观”大模型简介“法观”基于“万法”大模型，由中国司法大数据研究院、数智枫桥研究院联合设计研发，天同作为实务共建单位共同部署。“法

感谢中国司法大数据研究院官方公众号昨日（8 月 8 日）发布博文，“法观” AI 大模型产品以客观题 182 分及主观题优秀表现，通过中国法律职业资格考试。

“万法”大模型

中国司法大数据研究院紧跟大模型应用发展趋势，积极开展大模型前瞻布局，致力于为法律界提供专业的知识体系构建、精准的风险分析模型、智能化法律服务等能力。

经过一年多的积累和沉淀，中国法研的“万法”大模型已经开始对外提供服务。

“法观”大模型简介

“法观”基于“万法”大模型，由中国司法大数据研究院、数智枫桥研究院联合设计研发，天同作为实务共建单位共同部署。“法观”产品将于 8 月 10 日开放公测。

结果

Lawbench 测试得分为 64.38 分，超过北京大学法学院的 Chatlaw（60.08 分）及美国 OpenAI 的 ChatGPT-4（52.35），暂列全球第一。

“法观”明日公测：首个通过中国法考的 AI 模型，Lawbench 跑分超过 GPT-4

AI在线注：Lawbench 则是一个由南京大学和上海人工智能实验室联合构建的中文法律问答模型评估数据集，旨在全面评估大型语言模型在法律领域的实际性能表现。

该数据集包含三个关键维度：法律知识记忆、法律知识理解、法律知识应用，涵盖 20 个子测评项，覆盖单选、多选、回归、抽取和生成等五大类法律专业任务。

“法观”以客观题 182 分及主观题优秀表现，实测通过中国法律职业资格考试（学习资料中不包括考试题目，属于真考），成为全球首个通过中国法考的人工智能产品。

“法观”明日公测：首个通过中国法考的 AI 模型，Lawbench 跑分超过 GPT-4

以上图源：中国司法大数据研究院

{{userData.name}}已认证

“法观”明日公测：首个通过中国法考的 AI 模型，Lawbench 跑分超过 GPT-4

“万法”大模型

“法观”大模型简介

结果

马斯克偏心 xAI，被曝挖走十多名特斯拉人才训练 Grok AI 模型

乒乓球 AI 机器人赢了人类！正反手灵活转换，擦网球高球都能接，专业教练称达到中级选手水平

细节表现超Sora，网友：真正的国产之光！MiniMax视频模型再上新

快手预告“可灵 AI”导演共创计划作品 12 月 6 日上线：联合李少红、贾樟柯、叶锦添、薛晓路等

关于LLM-as-a-judge范式，终于有综述讲明白了

李飞飞「世界实验室」重磅推出 AI“造物主”：一张图片生成 3D 世界“任意门”

ChatGPT遇到这些人名开始自闭，OpenAI回应了

平安人寿ChatBI：大模型智能化报表的深度实践

李飞飞空间智能首秀：AI靠单图生成3D世界，可探索，遵循基本物理几何规则

字节跳动豆包 AI 文生图“喜提新技能”：App 可生成带有指定文字的图片