量化

精度与通用性不可兼得，北大华为理论证明低精度下scaling law难以实现
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。
工程
- 973
- 0
机器之心11月18日
Meta 推出 Llama 3.2 1B / 3B 模型量化版：功耗更低、可适用更多轻量移动设备
继今年 9 月开源 Llama 3.2 的 1B 与 3B 模型之后，Meta 于 10 月 24 日发布了这两个模型的量化版本，量化后的模型大小平均减少了 56%，RAM 使用量平均减少了 41%，模型速度提高了 2 至 4 倍，同时降低了功耗，使这些模型能够部署到更多移动设备上。 AI在线注：模型量化（Model Quantization）就是通过各种训练方式将浮点模型转为定点模型，可以压缩模…
应用
- 8
- 0
漾仔10月27日
「可损伤编程设计」的超材料，上海交大团队用AI实现材料的自然抗裂机制
编辑 | 萝卜皮人造超材料的断裂行为往往会导致灾难性的破坏，并且对裂纹扩展的抵抗力有限。相比之下，骨头和陶瓷等天然材料具有微观结构，可产生空间可控的裂纹路径，并且增韧材料对裂纹的抵抗力会提高。上海交通大学的研究人员提出了一种受自然强化机制启发的方法，旨在开发一种系统的设计方法，使损伤可编程超材料能够在细胞中具有可工程化的微纤维，从而能够在空间上编程微尺度裂纹行为。机器学习可用于提供有效的设计引擎，…
理论
- 4
- 0
ScienceAI9月19日
浪潮信息发布源 2.0-M32 大模型 4bit / 8bit 量化版：运行显存仅需 23GB，号称性能媲美 LLaMA3
浪潮信息今日发布源 2.0-M32 大模型 4bit 和 8bit 量化版，性能号称“比肩 700 亿参数的 LLaMA3 开源大模型”。4bit 量化版推理运行显存仅需 23.27GB，处理每 token 所需算力约为 1.9 GFLOPs，算力消耗仅为同等当量大模型 LLaMA3-70B 的 1/80。而 LLaMA3-70B 运行显存为 160GB，所需算力为 140GFLOPs。据浪潮信息…
应用
- 28
- 0
汪淼8月23日
苹果 AI 版 iOS 首日火爆：聊天秒变高情商，大模型成最强嘴替，Siri 华丽变身
它来了它来了，苹果的 Apple Intelligence 终于与果粉见面了！随着 iOS 18.1 Beta 版的上线，注册开发者从即日起就能体验到苹果 AI 的部分功能。最明显的一处就是 Siri 的全面换新，变身成了 Apple Intelligence & Siri。另一项重磅更新就是写作功能了，它可以帮忙润色推特评论，三下五除二就能把高级表达方式安排起来。甚至 dirty wor…
应用
- 17
- 0
远洋7月30日
只需单卡RTX 3090，低比特量化训练就能实行LLaMA-3 8B全参微调
AIxiv专栏是机器之心发布学术、手艺内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：[email protected]；[email protected]
理论
- 5
- 0
机器之心5月25日
DeepSpeed ZeRO++：降低4倍网络通讯，显著提高大模型及类ChatGPT模型训练效率
。ZeRO++ 相比 ZeRO 将总通讯量减轻了 4 倍，而不会影响模型质量。
AI
- 5
- 0
机器之心23年6月24日
国内首届量化科技嘉年华亮相上海
5年，增长7倍，这就是量化科技的魅力。在过去5年间，量化私募基金从两千亿的规模，一路增长到2022年底的 1.5 万亿左右，百亿量化私募的数量更从个位数骤增至如今的34家。公募量化对冲也在迎头赶上，目前量化成交量占总体市场规模已超过20%。风云激荡，量化科技也正迈步走在成为主流的道路上。2023年6月2日-3日，“2023·量化科技嘉年华”将在上海召开开，本次大会以「质变·智变」为中心，通过国内外…
AI
- 5
- 0
新闻助手23年5月30日
百亿量化私募“道歉”，AI选股还能信吗？
近两年来，量化投资行业爆发式增长，一批私募范围突破百亿大关，备受商场关注。随着大量资金涌入量化私募，商场竞争亦在不断加剧，尤其是头部私募之间的比拼，纷纷展开军备竞赛。为了保持长期竞争劣势，不少量化私募开始加大人工智能、机器进修方面的加入。与此同时，商场上也有许多疑问。阿尔法狗诞生以后，在围棋、象棋、德州扑克等畛域，人工智能已经彻底打败了人类。那么，在投资畛域人工智能会打败人类吗？近期，知名量化私募…
AI
- 6
- 0
shanshan22年1月10日
服务量化投资，基于学问图谱的事务表征框架钻研入选SIGIR
瞰点科技和上海交大的钻研团队提出了一种服务于量化投资的基于学问图谱的事务表征框架，称为 Knowledge Graph-based Event Embedding Framework（KGEEF）。通过在真实股票市场上进行的大规模试验表明，本文提出的法子显著有助于量化投资的战略提升。
AI
- 6
- 0
机器之心21年8月22日
逼近量化训练？块重修技术打造离线量化新极限
模型量化技术可以有效加速推理，已经成为人工智能芯片的标配，并在工业落地中广泛应用。离线量化（Post-Training Quantization）不需要耦合训练流程，应用成本和时间成本低，往往作为生产量化模型的首选方式，但其可调整空间有限，因此面临更大的准确度挑战，尤其是在一些特殊场景和极端要求下，不得不进一步引入更为复杂的在线量化（Quantization Aware Training）流程挽救…
AI
- 18
- 0
特邀精选21年3月26日
解读阿里云PAI模型收缩技巧落地实时挪动端智能应用
随着挪动端AI应用安排需求的日益增强，模型收缩作为深度学习模型实现轻量化安排的有用手段，在挪动端场景越来越受关注。尤其是剪枝、量化、权重稀疏化与网络结构搜索等算法战略，能够帮助减少深度模型端侧安排时的资源消耗（Latency、Energy与Memory等），始终是学术界与工业界的发展焦点。阿里云机器学习PAI平台模型收缩技巧，在端智能应用场景实现了端侧智能的快速赋能与应用落地。尤其在2020年阿里…
AI
- 6
- 0
特邀精选21年2月18日