淘天集团
中国信通院联合淘天集团发布全球首个中文安全领域事实性基准评测集,仅三个大模型达及格线
在当今迅速发展的人工智能时代,大语言模型(LLMs)在各种应用中发挥着至关重要的作用。 然而,随着其应用的广泛化,模型的安全性问题也引起了广泛关注。 探讨如何评估和提升这些模型在复杂的法律、政策和伦理领域的安全性,成为了学术界和工业界亟待解决的重要议题。
哪家AI能成卧底之王?淘天技术团队发布多智能体博弈游戏平台WiS
AIxiv专栏是AI在线发布学术、技术内容的栏目。 过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。 如果您有优秀的工作想要分享,欢迎投稿或者联系报道。
媲美OpenAI事实性基准,这个中文评测集让o1-preview刚刚及格
AIxiv专栏是AI在线发布学术、技术内容的栏目。 过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。 如果您有优秀的工作想要分享,欢迎投稿或者联系报道。
- 1