资讯列表
ICML 2024 | 大语言模型预训练新前沿:「最佳适配打包」重塑文档处理标准
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected];[email protected]在大型语言模型的训练过程中,数据的处理方式至关重要。传统的方法通常通过将大量文档拼接并切分成等同于模型的上下文长度的训练序列。这虽然提高了训练效率,但也常导致文档的不必要截断,损害数据完整
Rapidus 携手 RISC-V 设计企业 Esperanto,开发低功耗数据中心 AI 芯片
日本先进晶圆代工企业 Rapidus 昨日同美国 RISC-V 架构芯片设计企业 Esperanto 签署谅解备忘录,双方将合作开发面向数据中心领域的低功耗 AI 芯片。▲ 协议签署场景。图源 Rapidus 官网新闻稿Esperanto 是一家大规模并行、高性能、高能效计算解决方案设计企业,曾推出过一款名为的 ET-SOC-1 的 RISC-V 架构众核 AI / HPC 加速芯片。该芯片采用台积电 7nm 制程,包含 1088 个 64 位 ET-Minion 节能顺序核心和 4 个用于操作系统的 ET-Max
谷歌 2 小时复仇硬刚 GPT-4o:Gemini 颠覆搜索,视频 AI 对抗 Sora
【新智元导读】被 OpenAI 提前截胡的谷歌,昨天不甘示弱地开启反击!大杀器 Project Astra 效果不输 GPT-4o,文生视频模型 Veo 硬刚 Sora,用 AI 彻底颠覆谷歌搜索,Gemini 1.5 Pro 达到 200 万 token 上下文…… 谷歌轰出一连串武器,对 OpenAI 贴脸开大。谷歌 I / O 2024 如期来了,眼花缭乱地发布了一堆更新。跟 OpenAI 半小时的「小而美」发布会相比,谷歌显然准备得更加充分,当然,时间也相当之长……▲ 2 个多小时的发布会也是挑战着观众们的
小米 AI 大模型 MiLM 正式通过备案,将逐步应用于汽车 / 手机 / 智能家居等产品
感谢据“小米公司”官方微博,今天小米大语言模型 MiLM 正式通过大模型备案,相关模型据称将逐步应用于小米汽车、手机、智能家居等产品中,后续“将面向更多用户开放体验”。小米公司 MiLM 大模型在去年 8 月首度现身 C-Eval、CMMLU 大模型评测榜单,当时这款模型在 C-Eval 总榜单排名第 10、同参数量级排名第 1。IT之家根据 GitHub 项目页给出的信息得知,MiLM-6B 是由小米公司开发的一个大规模预训练语言模型,参数规模达 64 亿。▲ 图源 MiLM-6B 的 GitHub 页面而根据
OpenAI 发布新旗舰模型GPT-4o!实时交互犹如真人,免费开放
大家好,这里是和你们一起探索 AI 的花生。5 月 14 日凌晨 OpenAI 举办了首次「春季新品发布会」,会上 OpenAI 首席技术官 Mira Murati 从 3 方面介绍了此次更新升级的要点,并实时演示了 OpenAI 最新的旗舰模型 GPT-4o 相关功能,展示了其强大的实时多模态交互性能,今天我们就一起来看看此次发布会的具体内容。OpenAI 首席技术官 Mira Murati 在主持 OpenAI 春季新品发布会
一、最新旗舰模型 GPT-4o
此次发布会最大的亮点就是新旗舰模型 GPT-4o 的
使用 AI 批量造谣,一水军团伙控制 114 个账号炒作谣言获利被端
综合央视新闻、上海广播电视台《案件聚焦》消息,日前,上海市网信办公布 2023“清朗浦江”网络生态治理专项行动典型案例。其中包括“上海 4 岁儿童走失”事件中,网上出现“儿童非其父亲生”“今年已经是第二次走失”等谣言。据报道,去年国庆长假期间,“4 岁女童在上海南汇新城海滩走失”事件引发全网关注。在此期间,“走失女童曾被丢弃”“走失女童父亲为继父”等类型的言论频频引发网友热议,一些网络账号甚至炮制阴谋论,引发人身攻击。经核查,这些信息均为谣言。事件发生后,浦东警方迅速发布警情通报,通报了事件进展和调查情况,并发布辟
北京市新增 19 款已完成备案生成式人工智能服务,含小米、快手产品
感谢IT之家从“网信北京”微信公众号获悉,根据《生成式人工智能服务管理暂行办法》,北京市委网信办今日发布了北京市新增 19 款已完成备案生成式人工智能服务名单。图源 Pexels北京市生成式人工智能服务新增已备案信息显示,新增生成式人工智能模型包括中电信人工智能科技(北京)有限公司的“星辰”、小米科技有限责任公司的“小米”、北京快手科技有限公司的“可图”、北京爱奇艺科技有限公司的“奇智”、腾讯云计算(北京)有限责任公司的“行业大模型”、高德软件有限公司的“千寻”、中文在线集团股份有限公司的“中文逍遥”等。北京市委网
大模型价格进入“厘”时代,豆包大模型定价每千tokens仅0.8厘
大模型的性价比之战已经来到了新的阶段。5月15日,2024火山引擎FORCE原动力大会上,火山引擎总裁谭待宣布,字节跳动内部自研的豆包大模型正式在火山引擎上对外开放服务。豆包大模型在价格上主打“极致性价比”:豆包通用模型pro-32k版,推理输入价格0.0008元/千tokens,较行业价格低99.3%。一元钱能买到豆包主力模型的125万tokens,相当于三本《三国演义》的输入量。谭待认为,降低成本是推动大模型快进到“价值创造阶段”的一个关键因素。过去一年时间中,许多企业已经从探索尝试大模型,到成功将大模型与核心
Ilya官宣离职,超级对齐负责人Jan直接辞职,OpenAI还是走散了
今天,OpenAI 联合创始人、首席科学家 Ilya Sutskever 发推宣告离职。在 OpenAI 工作近 10 年后,我做出了离开的决定。OpenAI 的发展轨迹可以称得上是奇迹,我相信 OpenAI 会在 Sam Altman、Greg Brockman 和 Mira Murati 的领导下,以及 Jakub Pachocki 的出色研究领导下构建安全有益的 AGI。 能够一起工作是一种荣幸,我会非常想念大家。这么久了,感谢你们大家所做的一切。我对接下来发生的事情感到兴奋,接下来从事的这个项目对我来说非常
首个中文原生DiT架构!腾讯混元文生图大模型全面开源,免费商用
中文 AI 社区迎来了一个好消息:与 Sora 同架构的开源文生图大模型来了!5 月 14 日,腾讯宣布旗下混元文生图大模型全面升级并全面开源,目前已在 Hugging Face 平台及 GitHub 上发布,包含模型权重、推理代码、模型算法等完整模型,可供企业与个人开发者免费商用。官网地址: 项目地址: Face 模型地址:: 据了解,这是业内首个中文原生的 DiT 架构文生图开源模型,支持中英文双语输入及理解,参数量 15 亿。升级后的混元文生图大模型采用了与 Sora 一致的 DiT 架构,即全新的 Huny
告别3D高斯Splatting算法,带神经补偿的频谱剪枝高斯场SUNDAE开源了
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected];[email protected]本论文作者包括帝国理工学院硕士生杨润一、北航二年级硕士生朱贞欣、北京理工大学二年级硕士生姜洲、北京理工大学四年级本科生叶柏均、中国科学院大学本科大三学生张逸飞、中国电信人工智能研究院多媒体
IMF 总裁警告:AI 将对劳动力市场造成海啸般打击,影响全球四成岗位
据路透社报道,国际货币基金组织(IMF)总裁克里斯塔利娜・格奥尔基耶娃(Kristalina Georgieva)近日在瑞士苏黎世出席活动中表示,AI 将对劳动力市场造成“海啸般”的打击。格奥尔基耶娃称:“我们几乎没有时间让人们和企业为此做好准备”。正如IT之家此前报道中提到的,她认为 AI 可能在未来两年影响全球四成工作岗位,而 AI 浪潮对发达经济体的岗位影响更大,比例将达到 60%。格奥尔基耶娃补充到:“如果我们管理得当,它(AI)可以极大地提高生产力,但也可能导致更多的错误信息,同时加剧社会的不平等。”这位
谷歌 AI 视频搜索功能演示又翻车,Gemini 给出错误维修建议
在今天的谷歌 I / O 大会上,谷歌大肆宣传其名为 Gemini 的人工智能将接管搜索引擎领域。然而,在其炫酷的演示环节中,Gemini 却再次暴露了所有大型语言模型至今为止都存在的致命缺陷:自信满满地给出错误答案。在 “Gemini 时代下的搜索” 演示片段中,谷歌展示了其视频搜索功能,用户可以通过拍摄短视频并用语音提问进行搜索。演示的例子是一个卡住的胶片相机过片杆,用户询问“为什么扳杆无法移动到底”,Gemini 则识别出问题并提供了维修建议。 然而问题在于,Gemini 给出的答案整体而言令人啼笑皆非。谷歌
为什么人工智能可以给数学带来革命性变化
编辑 | 白菜叶「提出一个猜想——一个被怀疑为真的命题,但需要明确的证明——对数学家来说就像是神圣灵感的时刻。数学猜想不仅仅是有根据的猜测。制定它们需要天才、直觉和经验的结合。即使是数学家也很难解释自己的发现过程。然而,与直觉相反,我认为这是机器智能最初最具变革性的领域。」英国伦敦数学科学研究所所长 Thomas Fink 说。2017 年,伦敦数学科学研究所的研究人员开始将机器学习应用于数学数据,作为一种爱好。在 COVID-19 大流行期间,他们发现简单的人工智能(AI)分类器可以预测椭圆曲线的排名——衡量其复
多功能RNA分析,百度团队基于Transformer的RNA语言模型登Nature子刊
编辑 | 萝卜芯预训练语言模型在分析核苷酸序列方面显示出了良好的前景,但使用单个预训练权重集在不同任务中表现出色的多功能模型仍然存在挑战。百度大数据实验室(Big Data Lab,BDL)和上海交通大学团队开发了 RNAErnie,一种基于 Transformer 架构,以 RNA 为中心的预训练模型。研究人员用七个数据集和五个任务评估了模型,证明了 RNAErnie 在监督和无监督学习方面的优越性。RNAErnie 超越了基线,分类准确率提高了 1.8%,交互预测准确率提高了 2.2%,结构预测 F1 得分提高
百度发布全球首个 L4 级自动驾驶大模型 Apollo ADFM,称比人类驾驶更安全
感谢百度 Apollo 今天在武汉百度萝卜快跑汽车机器人智行谷举办 Apollo Day 2024,发布了全球首个支持 L4 级自动驾驶的大模型 Apollo ADFM(Autonomous Driving Foundation Model)。百度称,Apollo ADFM 基于大模型技术重构自动驾驶,可以兼顾技术的安全性和泛化性,做到安全性高于人类驾驶员 10 倍以上,实现城市级全域复杂场景覆盖。依靠自动驾驶大模型的应用实践️,百度萝卜快跑已经攻克了武汉的复杂道路场景,实现了武汉城市全域、全时空场景覆盖。同时在
微软发布 MatterSim 模型:模拟材料、预测性能,AI 探索材料设计的无限可能
微软研究院科学智能中心(Microsoft Research AI for Science)近日推出 MatterSim 模型,能够在广泛的元素、温度和压力范围内,准确高效地模拟材料和预测性能,助力材料设计的数字化转型。新材料探索对纳米电子学、能量储存和医疗健康等多个领域的技术进步至关重要。材料设计中的一个核心难点是如何在不进行实际合成和测试的情况下预测材料属性。由于新材料可能涉及元素周期表中 118 种元素的任意组合,且其合成和工作温度、压力范围极广,这些因素极大地影响了材料内部原子的相互作用,使得准确预测材料属
OPPO、vivo、荣耀、小米、三星、华硕、字节跳动成立智能终端大模型联盟
感谢在今日的字节跳动 2024 春季火山引擎 Force 原动力大会上,火山引擎与 OPPO、vivo、荣耀、小米、三星、华硕宣布成立智能终端大模型联盟。OPPO 小布助手、荣耀智慧办公智能助手、小米“小爱同学”,以及华硕笔记本电脑的豆叮 AI 助手等应用,均已接入火山引擎的大模型服务。2024 春季火山引擎 FORCE 原动力大会聚焦 AI 主题,以大模型应用为核心、以 AI 落地为导向,展示火山引擎在大模型、云计算领域的实践应用,携手汽车、手机终端、金融、消费、互联网等领域的专家和企业技术带头人,共同探讨 AI