MATH

通义千问开源Qwen2-Math，成为最先进的数学专项模型
8月9日消息，阿里通义团队开源新一代数学模型Qwen2-Math，包含1.5B、7B、72B三个参数的基础模型和指令微调模型。Qwen2-Math基于通义千问开源大语言模型Qwen2研发，旗舰模型 Qwen2-Math-72B-Instruct在权威测评集MATH上的得分超越GPT-4o、Claude-3.5-Sonnet、Gemini-1.5-Pro、Llama-3.1-405B等，以84%的准…
应用
- 7
- 0
新闻助手8月9日
Qwen2-Math 开源 AI 模型发布：阿里通义千问家族新成员，数学能力超 GPT-4o
感谢阿里通义千问 Qwen2 开源家族迎来新成员 Qwen2-Math，共有 15 亿参数、70 亿参数和 720 亿参数三个版本，是基于 Qwen2 LLM 构建、专门用于数学解题的语言模型。简介Qwen2-Math 是一系列基于 Qwen2 LLM 构建的专门用于数学解题的语言模型，其数学能力显著超越了开源模型，甚至超过了闭源模型（如 GPT-4o），官方希望为科学界解决需要复杂多步逻辑推理的…
应用
- 47
- 0
故渊8月9日
陶哲轩力荐、亲自把关：AI for Math照这个清单学就对了
在 AI for Math 规模，如果你一直找不到合适的资本，这份清单或许会有接济。刚刚，著名数学家陶哲轩的个人博客又更新了，这次他们整治了一份有用的资本列表，该资本专注于 AI for Math，专为那些希望进入数学 AI 规模的人提供接济。这份清单创议时间最早可追溯到去年，创议机构由美国国家科学院、工程院和医学院组织的研讨会「人工智能辅助数学推理」提出，陶哲轩担任研讨会主持人。目前，网址资本已…
AI
- 26
- 0
机器之心4月16日
数学奥赛冠军都做不对的题，却被拿来考ML模型？GPT-3：我不行
为了衡量机器学习模型的数学求解能力，来自 UC 伯克利和芝加哥大学的研究者提出了一个包含 12, 500 道数学比赛难题的新型数据集 MATH，以及帮助模型学习数学基础知识的预训练数据集 AMPS。研究发现，即使是大参数的 Transformer 模型准确率也很低。
AI
- 9
- 0
机器之心21年3月16日