“法观”明日公测:首个通过中国法考的 AI 模型,Lawbench 跑分超过 GPT-4

感谢中国司法大数据研究院官方公众号昨日(8 月 8 日)发布博文,“法观” AI 大模型产品以客观题 182 分及主观题优秀表现,通过中国法律职业资格考试。“万法”大模型中国司法大数据研究院紧跟大模型应用发展趋势,积极开展大模型前瞻布局,致力于为法律界提供专业的知识体系构建、精准的风险分析模型、智能化法律服务等能力。经过一年多的积累和沉淀,中国法研的“万法”大模型已经开始对外提供服务。“法观”大模型简介“法观”基于“万法”大模型,由中国司法大数据研究院、数智枫桥研究院联合设计研发,天同作为实务共建单位共同部署。“法
感谢中国司法大数据研究院官方公众号昨日(8 月 8 日)发布博文,“法观” AI 大模型产品以客观题 182 分及主观题优秀表现,通过中国法律职业资格考试。

“万法”大模型

中国司法大数据研究院紧跟大模型应用发展趋势,积极开展大模型前瞻布局,致力于为法律界提供专业的知识体系构建、精准的风险分析模型、智能化法律服务等能力。

经过一年多的积累和沉淀,中国法研的“万法”大模型已经开始对外提供服务。

“法观”大模型简介

“法观”基于“万法”大模型,由中国司法大数据研究院、数智枫桥研究院联合设计研发,天同作为实务共建单位共同部署。“法观”产品将于 8 月 10 日开放公测。

结果

Lawbench 测试得分为 64.38 分,超过北京大学法学院的 Chatlaw(60.08 分)及美国 OpenAI 的 ChatGPT-4(52.35),暂列全球第一。

“法观”明日公测:首个通过中国法考的 AI 模型,Lawbench 跑分超过 GPT-4

AI在线注:Lawbench 则是一个由南京大学和上海人工智能实验室联合构建的中文法律问答模型评估数据集,旨在全面评估大型语言模型在法律领域的实际性能表现。

该数据集包含三个关键维度:法律知识记忆、法律知识理解、法律知识应用,涵盖 20 个子测评项,覆盖单选、多选、回归、抽取和生成等五大类法律专业任务。

“法观”以客观题 182 分及主观题优秀表现,实测通过中国法律职业资格考试(学习资料中不包括考试题目,属于真考),成为全球首个通过中国法考的人工智能产品。

“法观”明日公测:首个通过中国法考的 AI 模型,Lawbench 跑分超过 GPT-4

以上图源:中国司法大数据研究院

相关资讯

欧盟批准全球首部《人工智能法案》

感谢据 CNBC 报道,欧盟理事会周二正式批准了世界上第一部监管人工智能的主要法律。该法案会在走完相关签字流程后予以公布,将在公布了 20 天以后正式实施。欧盟理事会表示,这是一项具有里程碑意义的监管法律,为人工智能技术制定了全面的规则。IT之家整理美国盛德国际律师事务所网站信息,据悉欧盟委员会早在 2021 年 4 月 21 日提出《人工智能法案》提案的谈判授权草案。去年 12 月 8 日,欧洲议会、欧盟成员国和欧盟委员会三方就《人工智能法案》达成协议。今年 1 月 26 日,《人工智能法案》的最终妥协文本发布。

美国 FTC 出手整治 AI 乱象:“机器人律师”公司因虚假宣传被罚款 19.3 万美元

美国联邦贸易委员会(FTC)周二宣布,声称提供“世界第一个机器人律师”的公司 DoNotPay 已同意与该机构达成 193000 美元(AI在线备注:当前约 135.7 万元人民币)的和解协议。此举是 FTC 新推出的执法行动“Operation AI Comply”的一部分,旨在打击使用 AI 服务欺骗或欺诈消费者的公司。根据 FTC 的投诉,DoNotPay 声称将“用人工智能取代价值 2000 亿美元的法律行业”,并表示其“机器人律师”可以取代人类律师的专业知识和产出,生成法律文件。然而,FTC 表示,该公司

CAIL 2024 | 中国法律智能技术评测正式开启,诚邀您参与!

评测简介近年来,随着以裁判文书为代表的司法大数据不断公开,以及自然语言处理技术的不断突破,如何将人工智能技术应用在司法领域,辅助司法工作者提升案件处理的效率和公正性,逐渐成为法律智能研究的热点。中国法律智能技术评测CAIL(Challenge of AI in Law)旨在为研究者提供交叉学科的学术交流平台,推动自然语言处理、智能信息检索等人工智能技术在法律领域的应用,共同促进中国法律智能技术的创新发展,为科技赋能社会治理作出贡献。为了促进智能技术赋能司法,实现更高水平的数字正义,在最高人民法院和中国中文信息学会的指导下,从2018年起,CAIL已连续举办了六届中国法律智能技术评测,先后吸引了来自海内外高校、企业和组织的近5000支队伍参赛,成为中国法律智能技术评测的重要平台。