AI在线 AI在线

“法观”明日公测:首个通过中国法考的 AI 模型,Lawbench 跑分超过 GPT-4

作者:故渊
2024-08-09 12:44
感谢中国司法大数据研究院官方公众号昨日(8 月 8 日)发布博文,“法观” AI 大模型产品以客观题 182 分及主观题优秀表现,通过中国法律职业资格考试。“万法”大模型中国司法大数据研究院紧跟大模型应用发展趋势,积极开展大模型前瞻布局,致力于为法律界提供专业的知识体系构建、精准的风险分析模型、智能化法律服务等能力。经过一年多的积累和沉淀,中国法研的“万法”大模型已经开始对外提供服务。“法观”大模型简介“法观”基于“万法”大模型,由中国司法大数据研究院、数智枫桥研究院联合设计研发,天同作为实务共建单位共同部署。“法
感谢中国司法大数据研究院官方公众号昨日(8 月 8 日)发布博文,“法观” AI 大模型产品以客观题 182 分及主观题优秀表现,通过中国法律职业资格考试。

“万法”大模型

中国司法大数据研究院紧跟大模型应用发展趋势,积极开展大模型前瞻布局,致力于为法律界提供专业的知识体系构建、精准的风险分析模型、智能化法律服务等能力。

经过一年多的积累和沉淀,中国法研的“万法”大模型已经开始对外提供服务。

“法观”大模型简介

“法观”基于“万法”大模型,由中国司法大数据研究院、数智枫桥研究院联合设计研发,天同作为实务共建单位共同部署。“法观”产品将于 8 月 10 日开放公测。

结果

Lawbench 测试得分为 64.38 分,超过北京大学法学院的 Chatlaw(60.08 分)及美国 OpenAI 的 ChatGPT-4(52.35),暂列全球第一。

“法观”明日公测:首个通过中国法考的 AI 模型,Lawbench 跑分超过 GPT-4

AI在线注:Lawbench 则是一个由南京大学和上海人工智能实验室联合构建的中文法律问答模型评估数据集,旨在全面评估大型语言模型在法律领域的实际性能表现。

该数据集包含三个关键维度:法律知识记忆、法律知识理解、法律知识应用,涵盖 20 个子测评项,覆盖单选、多选、回归、抽取和生成等五大类法律专业任务。

“法观”以客观题 182 分及主观题优秀表现,实测通过中国法律职业资格考试(学习资料中不包括考试题目,属于真考),成为全球首个通过中国法考的人工智能产品。

“法观”明日公测:首个通过中国法考的 AI 模型,Lawbench 跑分超过 GPT-4

以上图源:中国司法大数据研究院
相关标签:

相关资讯

消息称字节成立大模型研究院,“氪金”招揽 AI 人才

据 AI 科技评论报道,字节跳动正在秘密筹备成立大模型研究院,并积极招揽人才。知情人士称,已有外部 AI 大牛加入大模型研究院,直接向张一鸣汇报。从去年开始,字节陆续对外公布关于大模型的相关工作进展。据AI在线此前报道,2023 年 8 月,字节自研的底层大模型“云雀”上线,随即推出 AI 对话产品“豆包”。今年 5 月,字节发布“豆包大模型”家族,发起价格战,号称“比行业便宜 99.3%”。报道称,过去字节大模型团队的人才更多来自字节内部业务线,包括搜索、抖音、西瓜、TikTok 等,很少出现从公司外部新招一号位
8/27/2024 1:54:14 PM
沛霖(实习)

“中关村智用人工智能伙伴计划”报名已开放,八大服务助力AI落地

中关村智用人工智能伙伴计划”(简称计划)报名已于2021年3月1日正式开放(报名链接:),并得到了人工智能产业各界的关注。某AI企业联合创始人李先生谈起伙伴计划来满脸兴奋,据他介绍:伙伴计划给他的创业带来了新的曙光,此前他的公司虽然拥有先进的技术,但在寻找落地场景的道路上却一直坎坷,人脸识别等常识性应用场景已经是一片红海,想寻找技术落地的蓝海场景,却又因为团队成员大都是信息技术出身,对其他行业了解不多,既不知道哪些行业可能是潜在用户,即使知道,也缺少相应的资源关系去链接客户,更不要谈深入挖掘需求了。李先生说“第一次
3/29/2021 6:19:00 PM
新闻助手

关于人工智能的未来,张亚勤、张宏江在聊什么

“我们打造一个规模庞大的系统时,更需要具备系统思维,同时拥有动手能力、喜欢搭系统的人才……诞生至今,智源一直肩负着三项重要任务:一是构筑一个社区。二是打造一个真正适合青年科学家成长的平台。三是专注于一些可能产生原始创新与长期影响的领域。”张宏江 北京智源人工智能研究院理事长“在AIR,所有人的工作目标,是确定我们的研究和技术能够对产业有影响力, 或者赋能现有产业,或者孵化新的企业。在数据和AI的世界里, 研究员和工程师的界限更加模糊, 因此我们会跟拥有大量数据和真实场景的企业合作。”张亚勤 清华大学智能产业研究院院
3/30/2021 6:50:00 PM
特邀精选