模型

易用性对齐 vLLM，推理效率提升超200%，这款国产加速框架什么来头？
一、行业背景2022 年 10 月，ChatGPT 的问世引爆了以大语言模型为代表的的 AI 浪潮，全球科技企业纷纷加入大语言模型的军备竞赛，大语言模型的数量、参数规模及计算需求呈指数级提升。大语言模型（Large Language Model，简称 LLM 大模型）指使用大量文本数据训练的深度学习模型，可以生成自然语言文本或理解语言文本的含义。大模型通常包含百亿至万亿个参数，训练时需要处理数万亿…
应用
- 20
- 0
新闻助手9月18日
陶哲轩提前实测满血版 OpenAI o1：能当研究生使唤
原来早在 8 月份，陶哲轩就已经用上了 OpenAI o1。还是现在大家都用不上的满血版本（眼泪不争气地从嘴角流出来）。提前批大佬是怎么玩最新天花板的呢？他向 o1 模型提出一个措辞模糊的数学问题，发现它竟然能成功识别出克莱姆定理。而且答案是“完全令人满意的”那种。当然，陶哲轩还做了一些其它测试，测下来总体体验就是：比以前的模型更牛，多堆点提示词表现还不错，但仍然会犯不小的错误，也没有产生啥自己的…
应用
- 14
- 0
清源9月16日
瑞士启用“阿尔卑斯”新型超级计算机，满足极端数据处理及 AI 需求
感谢据法新社报道，当地时间 14 日，瑞士举行了名为“阿尔卑斯”的新型超级计算机的落成典礼，苏黎世联邦理工大学在瑞士国家超级计算中心（CSCS）为“阿尔卑斯”正式揭幕。值得一提的是，“阿尔卑斯”在今年 6 月份即被评为世界第六大超算。但在当时，“阿尔卑斯”尚未完全建成，只发挥了其 60% 的潜能。AI在线获悉，“阿尔卑斯”的开发是为了满足极端的数据和计算科学要求，并使 AI 得到更充分的利用。苏黎…
应用
- 18
- 0
清源9月16日
专家警告：AI 能耗巨大，加剧气候危机
人工智能专家 Sasha Luccioni 警告称，生成式人工智能使用的能源是传统搜索引擎的 30 倍，正在加速气候危机。图源 PexelsLuccioni 致力于提高人们对热门新技术对环境影响的认识。她于 2024 年被美国《时代》杂志评选为世界人工智能领域 100 位最具影响力人物之一，多年来一直致力于量化 ChatGPT 或 Midjourney 等程序的排放量。在蒙特利尔举办的 ALL I…
应用
- 8
- 0
远洋9月15日
英伟达开源 Nemotron-Mini-4B-Instruct 小语言 AI 模型：专为角色扮演设计，9216 MLP、上下文长度 4096 词元
科技媒体 marktechpost 昨日（9 月 14 日）发布博文，报道称英伟达开源了 Nemotron-Mini-4B-Instruct AI 模型，标志着该公司在 AI 领域创新又一新篇章。小语言模型的大潜力Nemotron-Mini-4B-Instruct AI 模型专为角色扮演、检索增强生成（RAG）及函数调用等任务设计，是一个小语言模型（SLM），通过蒸馏（distilled）和优化更…
应用
- 20
- 0
故渊9月15日
OpenAI o1 非 GPT-4o 直接进化，在成本与性能上妥协
9 月 14 日消息，OpenAI 已经推出了新模型 OpenAI o1 的两大变体 ——o1-preview 与 o1-mini，这两款模型都有许多值得深入探讨的内容。人工智能专家西蒙・威利森（Simon Willison）专门发文，深入剖析了这些新模型背后的设计理念与实现细节，揭示了它们在技术上的独特优势与不足。威利森表示，o1 并不是简单的 GPT-4o 直接升级版，而是在强化“推理”能力的…
应用
- 18
- 0
小小9月14日
加速蛋白质工程，微软开发蛋白突变效应预测AI框架µFormer
编辑 | KX蛋白质工程是合成生物学领域的重要研究方向之一。近年来，AI 辅助的蛋白质工程逐渐发展成为一种高效的蛋白质分子设计新策略。近日，微软研究院科学智能中心的研究人员提出了深度学习框架 µFormer，其将预训练的蛋白质语言模型与定制设计的评分模块相结合，从而预测蛋白质的突变效应。µFormer 在预测高阶突变体、建模上位（epistatic）相互作用和处理插入方面，实现了最先进的性能。通过…
应用
- 10
- 0
ScienceAI9月14日
o1 模型完整思维链成 OpenAI 头号禁忌，问多了等着封号吧
警告！不要在 ChatGPT 里问最新 o1 模型是怎么思考的 ——只要尝试几次，OpenAI 就会发邮件威胁撤销你的使用资格。请停止此活动，确保您使用 ChatGPT 时符合我们的使用条款。违反此条款的行为可能导致失去 OpenAI o1 访问权限。大模型新范式 o1 横空出世不到 24 小时，就已经有不少用户反馈收到这封警告邮件，引起众人不满。有人反馈只要提示词里带“reasoning tra…
应用
- 22
- 0
汪淼9月14日
因类人通用推理、可辅助制作生物武器等因素，OpenAI o1 AI 模型归类为“中等风险”
科技媒体 The Decoder 昨日（9 月 13 日）发布博文，报道称在 OpenAI 自家的“防备框架”（Preparedness Framework）下，将最新发布的 o1 AI 模型归类为“中等风险”（medium risk）。防备框架简介AI在线曾于 2023 年 12 月报道，OpenAI 成立了新的“防备”（Preparedness）团队，并提出“防备框架”指导方针。防备团队将反复…
应用
- 5
- 0
故渊9月14日
元象发布中国最大 MoE 开源大模型：总参数 255B，激活参数 36B
元象 XVERSE 发布中国最大 MoE 开源模型 XVERSE-MoE-A36B。该模型总参数 255B，激活参数 36B，官方号称效果能“大致达到”超过 100B 大模型的“跨级”性能跃升，同时训练时间减少 30%，推理性能提升 100%，使每 token 成本大幅下降。MoE（Mixture of Experts）混合专家模型架构，将多个细分领域的专家模型组合成一个超级模型，在扩大模型规模的…
应用
- 20
- 0
沛霖（实习）9月13日
训大模型为啥这么贵？专家：一半以上算力被浪费了
人工智能时代，大模型的发展带来了智能算力需求的大爆发。据估算，自 2012 年以来，AI 模型训练算力需求每 3~4 个月就翻一番，每年训练 AI 模型所需算力增长幅度高达 10 倍。同时，OpenAI 曾在 2020 年提出 Scaling law 定律。该定律指出，大模型的最终性能与计算量、模型参数量及训练数据量的大小密切相关。换言之，若要提升大模型的能力，就需要不断增加模型参数和训练数据量，…
应用
- 29
- 0
新闻助手9月13日
“最强开源模型”Reflection 被打假，英伟达科学家称现有测试基准已不靠谱
小型创业团队打造的“最强开源模型”，发布才一周就被质疑造假 ——不仅官方宣称的成绩在第三方测试中大打折扣，模型还被质疑套壳 Claude。面对浩大的声浪，厂商 CEO 终于发文道歉，但并未承认造假，表示在调查有关原因。被指控造假的，就是宣称“干翻 GPT-4o”的 70B 开源大模型 Reflection。一开始的质疑主要关于测试成绩，官方找了上传版本有误等借口试图“蒙混过关”。但后来又出现了套壳…
应用
- 7
- 0
清源9月13日
Adobe 预告 Firefly 文生视频 AI 模型年内登场，可通过提示词 / 静帧生成动态片段
继去年 3 月推出 Firefly 文生图 AI 模型后，Adobe 计划在今年内推出 Firefly 文生视频模型，允许用户使用文字描述或图像静帧生成动态视频。▲ Adobe 去年 3 月推出的 Firefly 文生图 AI 模型▲ Adobe 预告的 Firefly 文生视频 AI 模型Adobe 表示，当前全球短视频市场需求不断增长，这意味着编辑、电影制作人或内容创作者需要在更短的时间内完成…
应用
- 33
- 0
漾仔9月13日
昆仑万维发布奖励模型 Skywork-Reward，登顶 RewardBench 排行榜
昆仑万维发布了两款全新的奖励模型 Skywork-Reward-Gemma-2-27B 和 Skywork-Reward-Llama-3.1-8B。在奖励模型评估基准 RewardBench 上，这两款模型分别位列排行榜上的第一和第三位。奖励模型（Reward Model）是强化学习（Reinforcement Learning）中的核心概念和关键组成，它用于评估智能体在不同状态下的表现，并为智能…
应用
- 8
- 0
沛霖（实习）9月13日
谷歌推出 DataGemma：基于可信数据源提高 AI 准确度，减少幻觉
科技媒体 maginative 昨日（9 月 12 日）发布博文，报道谷歌公司基于谷歌数据共享（Data Commons）中的真实世界统计数据，推出了开放权重 Gemma 模型的新版本 DataGemma。语言模型当前面临的一大难题就是幻觉（Hallucinations），尤其是大语言模型（LLMs）在处理数值或统计数据时，这一问题变得尤为棘手，因此精确性至关重要。谷歌的 Data Common…
应用
- 25
- 0
故渊9月13日
AI 模型数据处理方式引疑虑，欧洲隐私监管机构对谷歌展开调查
感谢欧洲隐私监管机构正在调查谷歌在开发其人工智能模型过程中处理个人数据的方式，此举标志着监管机构对大型科技公司的 AI 野心的审查力度不断加大。爱尔兰的数据保护委员会（DPC）负责执行欧盟的《通用数据保护条例》（GDPR），该委员会表示，已经对谷歌的 PaLM 2 语言模型启动了一项法定调查。PaLM 2 于 2023 年 5 月推出，早于谷歌最新的 Gemini 模型。Gemini 于同年 12…
应用
- 8
- 0
远洋9月12日
谷歌联合创始人布林：工程师们用 AI 编程还不够积极
谷歌联合创始人谢尔盖・布林（Sergey Brin）表示，谷歌工程师并没有像他认为的那样经常使用人工智能。图源 Pexels布林本周在洛杉矶举行的“All-In”峰会上与企业家大卫・弗里德伯格（David Friedberg）进行了在线对话时发表了上述言论。布林在峰会现场罕见露面，讨论了 AI 的“令人兴奋”的进步。“作为一名计算机科学家，我从未见过像过去几年所取得的进展一样令人兴奋的事情，”布林…
应用
- 3
- 0
远洋9月12日
华为盘古预测大模型首次投入宝钢生产控制
AI在线从宝钢股份获悉，9 月 6 日，宝钢股份与华为公司合作的基于华为盘古预测大模型开发的热轧自然宽展预测模型，正式投入热轧 1880 产线实现在线控制，完成了华为预测大模型在钢铁制造领域首发闭环控制技术验证。图源：宝钢股份据悉，由华为公司、数据 AI 部、设备部、热轧厂、中央研究院、宝信软件等多部门组成的项目专家团队，对大模型投入后的带钢宽度控制进行了跟踪和验证。专家团队一致认为，在 348 …
应用
- 24
- 0
远洋9月12日
港大发布OpenCity: 大模型驱动下的智慧城市”新内核”
代码链接: : : 导读精确的交通预测是实现高效城市规划和交通管理的关键，它有助于优化资源分配并改善出行体验。但是，现有的预测模型在面对未知区域和城市的零样本预测任务，以及长期预测时，表现往往不尽如人意。这些问题主要归因于交通数据在空间和时间上的异质性，以及跨时间和空间的显著分布变化。在本研究中，我们的目标是开发一个多功能、强鲁棒性和高适应性的时空基础模型，用于交通流量的预测。为此，我们设计了一…
理论
- 10
- 0
新闻助手9月12日
Pixtral 12B 发布：Mistral 首款多模态 AI 模型，120 亿参数、24GB 大小
感谢科技媒体 TechCrunch 昨日（9 月 11 日）报道，法国 AI 初创公司 Mistral 发布 Pixtral 12B，是该公司首款能够同时处理图像和文本的多模态 AI 大语音模型。Pixtral 12B 模型拥有 120 亿参数，大小约为 24GB，参数大致对应于模型的解题能力，拥有更多参数的模型通常比参数较少的模型表现更优。Pixtral 12B 模型基于文本模型 Nemo 12…
应用
- 7
- 0
故渊9月12日
超越AlphaFold3，OpenAI投资的AI生物初创发布Chai-1，分子结构预测新SOTA
编辑 | ScienceAI近日，成立仅 6 个月的 AI 生物技术初创公司 Chai Discovery，发布用于分子结构预测的新型多模态基础模型 Chai-1，并附带了一份技术报告，比较了 Chai-1 与 AlphaFold 等模型的性能。Chai-1 可以统一预测蛋白质、小分子、DNA、RNA、共价修饰等，在与药物发现相关的各种任务中都达到 SOTA。公司联合创始人兼 CEO Joshua…
理论
- 15
- 0
ScienceAI9月11日
Reflection 70B AI 模型“塌房”：第三方基准测试结果不佳，不如 LLaMA-3.1-70B
科技媒体 The Decoder 昨日（9 月 10 日）报道，对比平台 Artificial Analysis 相关数据表明，Reflection 70B AI 模型在基准测试中的表现，实际上不及 Meta 的 LLaMA-3.1-70B。针对 AI 模型基准测试结果不佳，Reflection 公司首席执行官马特・舒默（Matt Shumer）表示，上传模型权重至 Hugging Face 时遇…
应用
- 11
- 0
故渊9月11日
赛力斯应用豆包大模型打造“用户之声”管理平台
新能源汽车品牌赛力斯已接入字节豆包大模型。
应用
- 7
- 0
新闻助手9月10日
AI 被连续否定 30 次：ChatGPT 越改越错，Claude 坚持自我，甚至已读不回
一直否定 AI 的回答会怎么样？GPT-4o 和 Claude 有截然不同的表现，引起热议。GPT-4o 质疑自己、怀疑自己，有“错”就改；Claude 死犟，真错了也不改，最后直接已读不回。事情还要从网友整了个活儿开始讲起。他让模型回答 strawberry 中有几个“r”，不论对不对，都回复它们回答错了（wrong）。面对考验，GPT-4o 只要得到“wrong”回复，就会重新给一个答案…… …
应用
- 45
- 0
清源9月9日