MathPile
为大模型恶补数学,上交开源MathPile语料库,95亿tokens,还可商用
在当前智能对话模型的发展中,强大的底层模型起着至关重要的作用。这些先进模型的预训练往往依赖于高质量且多样化的语料库,而如何构建这样的语料库,已成为行业中的一大挑战。在备受瞩目的 AI for Math 领域,由于高质量的数学语料相对稀缺,这限制了生成式人工智能在数学应用方面的潜力。为了应对这一挑战,上海交通大学生成式人工智能实验室推出了「MathPile」。这是一套专门针对数学领域的高质量、多样化预训练语料库,其中包含约 95 亿 tokens,旨在提升大型模型在数学推理方面的能力。此外,实验室还推出了 MathP
1/12/2024 2:53:00 PM
dd
- 1
资讯热榜
生成式 AI 已过时:英伟达黄仁勋首提 Agentic AI,后续是机器人 Physical AI
FP8模型不再挑卡!DeepSeek推理成本减半速度翻番,清华团队开源「赤兔」推理引擎
早报速读!2025年最新AI视频产品评测&优秀案例
清华团队开源 “赤兔 Chitu” 推理引擎,助力国产 AI 生态发展
无需训练,100%完美检索!LLM练出「火眼金睛」,InfiniRetri超长文本一针见血
OpenAI重磅剧透:GPT-5“很快推出”,CPO预测年内AI代码自动化将达99%!
Anthropic发布MCP传输机制重大升级:告别长连接,迎接更灵活的"Streamable HTTP"
全国首例:一男子利用 AI 撰写色情小说牟利 2 万余元,被判有期徒刑 10 个月罚款 5000 元
标签云
人工智能
OpenAI
AIGC
AI
ChatGPT
AI绘画
DeepSeek
机器人
数据
谷歌
大模型
Midjourney
模型
智能
用户
学习
GPT
开源
微软
AI创作
图像
Meta
技术
论文
Stable Diffusion
马斯克
算法
生成式
蛋白质
Gemini
芯片
代码
神经网络
腾讯
计算
研究
Sora
英伟达
AI设计
3D
AI for Science
GPU
开发者
机器学习
场景
华为
Anthropic
预测
伟达
Transformer
模态
百度
深度学习
AI视频
苹果
驾驶
文本
搜索
神器推荐
xAI
LLaMA
算力
Copilot
人形机器人
安全
科技
视频生成
应用
字节跳动
具身智能
干货合集
2024
视觉
大语言模型
AGI
Claude
特斯拉
亚马逊
语音
架构