AI资讯列表 - AI在线

2024智源大会议程公开丨生成模型

2024年6月14日-15日，第6届北京智源大会将以线下与线上结合的形式召开，线下会场设在中关村国家自主创新示范区会议中心。2024智源大会再次以全球视野，汇聚年度杰出工作研究者，交流新思想，探讨新思路，引领新前沿。目前已正式开放报名渠道。北京智源大会倒计时：11 天生成模型论坛丨6月15日下午生成式建模是人工智能的基础范式之一，是迈向通用人工智能的重要一环。随着生成式建模方法的快速发展和模型规模的急速增长，以自回归模型、扩散概率模型为代表的生成式人工智能（如GPT系列、Sora、Stable Diffusion

2024智源大会议程公开丨大语言模型

2024年6月14日-15日，第6届北京智源大会将以线下与线上结合的形式召开，线下会场设在中关村国家自主创新示范区会议中心。2024智源大会再次以全球视野，汇聚年度杰出工作研究者，交流新思想，探讨新思路，引领新前沿。目前已正式开放报名渠道。大语言模型论坛丨6月14日下午近年来，大语言模型取得了重要的技术进展，成为了人工智能领域最受社会关注的研究方向之一，其应用范围逐渐覆盖了信息产业的多个领域。对其底层原理与训练方法的探索也成为了学术界与工业界的共同关注焦点。本次论坛针对大语言模型相关的基础问题展开相关探讨，主要包

自动化所研发脉冲动态计算的毫瓦级超低功耗异步感算一体类脑芯片

人脑能够运行非常复杂且庞大的神经网络，总功耗却仅为20瓦，远小于现有的人工智能系统。因此，在算力比拼加速，能耗日益攀升的今日，借鉴人脑的低功耗特性发展新型智能计算系统成为极具潜力的方向。近日，中国科学院自动化研究所李国齐、徐波课题组与时识科技公司等单位合作设计了一套能够实现动态计算的算法-软件-硬件协同设计的类脑神经形态SOC（System on Chip，系统级芯片）Speck，展示了类脑神经形态计算在融合高抽象层次大脑机制时的天然优势，相关研究在线发表于《自然·通讯》（Nature Communication

再战Transformer！原作者带队的Mamba 2来了，新架构训练效率大幅提升

自 2017 年被提出以来，Transformer 已经成为 AI 大模型的主流架构，一直稳居语言建模方面 C 位。但随着模型规模的扩展和需要处理的序列不断变长，Transformer 的局限性也逐渐凸显。一个很明显的缺陷是：Transformer 模型中自注意力机制的计算量会随着上下文长度的增加呈平方级增长。几个月前，Mamba 的出现打破了这一局面，它可以随上下文长度的增加实现线性扩展。随着 Mamba 的发布，这些状态空间模型 (SSM) 在中小型规模上已经实现了与 Transformers 匹敌，甚至超越

苏妈杀疯了：移动端最强NPU算力达50TOPS，最强AI芯片挑战英伟达

你方唱罢我登场。一年一度的 Computex 科技大会成为了 GPU 厂商们秀肌肉的舞台，其中当属英伟达和 AMD 最为亮眼。英伟达现场拿出了量产版 Blackwell 芯片，还公布了未来三年的产品路线，包括下一代 Rubin AI 平台。AMD 当然也不甘示弱，CEO 苏姿丰亮出了旗下的 CPU、GPU 产品及路线图，包括全新 Zen 5 架构的桌面端 Ryzen 9000系列 CPU、AI PC 芯片、数据中心芯片和 GPU。苏姿丰全新 Zen

1.8B参数，阿里云首个联合DNA、RNA、蛋白质的生物大模型，涵盖16.9W物种

编辑 | 萝卜皮不久之前，Google DeepMind 发布了 AlphaFold3，再次引发了人们对「AI 生命科学」的讨论。在学界，科学家的目标往往是先认识世界，然后在认识的基础上改造世界。但是在生命科学领域，人类对整个生命的理解与认识还如九牛一毛、冰山一角；建立对生命系统的多维度深刻认识是当前人类研究的重要一步，AI 是达成这一步的重要工具。近期，阿里云飞天实验室发布并开源了业界首个联合 DNA、RNA、蛋白质的生物大模型「LucaOne」。这是一种新型预训练基础模型，旨在综合学习遗传和蛋白质组语言，涵

微软发布首个大气AI基础模型Aurora

编辑 | ScienceAI2023 年 11 月，风暴「夏兰」（Ciarán）袭击欧洲西北部，造成严重破坏。与风暴 Ciarán 相关的低压系统为英格兰创下了新纪录，这是一次极为罕见的气象事件。那场风暴的强度让许多人措手不及，暴露了当前天气预报模型的局限性，并突显出面对气候变化需要更准确的预测。当大家努力应对后果时，一个紧迫的问题出现了：我们如何才能更好地预测和准备应对这种极端天气事件？最近的一项研究表明，即使是最先进的 AI 天气预测模型在捕捉风暴 Ciarán 的快速增强和峰值风速方面也面临的挑战。为了帮助应

Karpathy点赞，这份报告教你如何用 LLaMa 3创建高质量网络数据集

众所周知，对于 Llama3、GPT-4 或 Mixtral 等高性能大语言模型来说，构建高质量的网络规模数据集是非常重要的。然而，即使是最先进的开源 LLM 的预训练数据集也不公开，人们对其创建过程知之甚少。最近，AI 大牛 Andrej Karpathy 推荐了一项名为 FineWeb-Edu 的工作。这项工作将原始 15 万亿个 FineWeb token，经 Llama 3 70B 评判，过滤为 1.3 万亿个高质量（教科级）token。事实证明，LLM 从教育内容中学习会更好更快。部分原因是普通的互联网爬

单个4090可推理，2000亿稀疏大模型「天工MoE」开源

在大模型浪潮中，训练和部署最先进的密集 LLM 在计算需求和相关成本上带来了巨大挑战，尤其是在数百亿或数千亿参数的规模上。为了应对这些挑战，稀疏模型，如专家混合模型（MoE），已经变得越来越重要。这些模型通过将计算分配给各种专门的子模型或「专家」，提供了一种经济上更可行的替代方案，有可能以极低的资源需求达到甚至超过密集型模型的性能。6 月 3 日，开源大模型领域又传来重要消息：昆仑万维宣布开源 2 千亿稀疏大模型 Skywork-MoE，在保持性能强劲的同时，大幅降低了推理成本。Skywork-MoE 基于此前昆仑

AI训练数据的版权保护:公地的悲剧还是合作的繁荣?

就算是 OpenAI 在舆论场也无法逃过版权保护的呼声。GPT-4o内置声音模仿「寡姐」一案闹的沸沸扬扬，虽然以OpenAI发布声明暂停使用疑似寡姐声音的「SKY」的语音、否认曾侵权声音为阶段性结束。但是，一时间「即便是AI，也得保护人类版权」这一话题甚嚣尘上，更刺激起了人们本来就对AI是否可控这一现代迷思的焦虑。近日，普林斯顿大学、哥伦比亚大学、哈佛大学和宾夕法尼亚大学共同推出了一项关于生成式AI版权保护的新方案，题为《An Economic Solution to Copyright Challenges of

鸿海宣布在高雄建造先进算力中心，与英伟达在 AI 等多领域合作

感谢台媒经济日报消息，全球最大 AI 服务器制造商鸿海科技集团今日在台北电脑展宣布，将与英伟达合作，以英伟达 GB200 “超级芯片”为核心，在高雄建造先进算力中心，使用 4608 颗芯片，预计 2026 年完工。鸿海科技集团董事长刘扬伟表示，将与英伟达在 AI、电动车、智能工厂、机器人、智能城市等多领域合作，通过鸿海庞大的制造规模，为行业作出更多贡献。英伟达创始人黄仁勋表示：“随着全球对 AI 需求的爆炸性增长，我们已经步入算力科技的新时代。鸿海在高雄建立的先进算力中心，将使用英伟达的 AI、Digital Tw

英伟达 Jim Fan：具身智能的难点不是硬件，而是「Foundation Agent」

作者丨赖文昕马蕊蕾编辑丨陈彩娴大模型浪潮一起，被视为是大模型最佳载体的机器人，热度也随之飙升，「具身智能」这个在1950年由艾伦·图灵提出的概念，时隔75年再次成为了 AI 界的宠儿。 2024年才过去不到半年，AI 圈就迎来了 Sora、Claude 3、Devin、GPT-4o 等数颗重磅炸弹，文生视频、AI Agent（智能体）、多模态等多个方向都有了显著的进展。但显然，与屡爆惊喜的模型、应用不同，更「硬」的「具身智能」在产业界掀起商业化与资本狂潮的同时，也面临着需要冷静的现实：大模型并未在行业中得到广泛应用。

首个面向气象导航的全球气象大模型，复旦大学发布“伏羲”2.0

IT之家从复旦大学官方公众号获悉，复旦大学和上海科学智能研究院昨日联合举办“走进智能气象”主题活动暨智能气象创新生态联盟成立仪式。成立仪式上，伏羲系列气象大模型 2.0（简称“伏羲”2.0）发布，以“伏羲”2.0 为核心的智能气象创新生态联盟成立。相较于去年推出的 1.0 系列，“伏羲”2.0 的中期天气预报大模型和次季节大模型，面向新能源、航空运输等行业取得进展。“伏羲”2.0 有以下升级：面向气象导航对伏羲大模型进行优化，提高时空分辨率，实现未来 15 天 0.1 度逐小时气象预测构建海气耦合模型，纳入风浪、涌

Adobe 售卖 AI 生成的“安塞尔・亚当斯风格”图片，惹怒摄影师遗产管理方

知名图片素材平台 Adobe Stock 因销售由人工智能 (AI) 生成、模仿已故摄影大师安塞尔・亚当斯 (Ansel Adams) 作品的图片而陷入舆论漩涡。上周五，亚当斯遗产管理委员会在社交媒体上发布了一张截图，显示 Adobe Stock 上有标注为“安塞尔・亚当斯风格”的 AI 生成图片，并公开指责 Adobe 公司这种行为“令人忍无可忍”。IT之家注意到，尽管允许在平台上发布和销售 AI 生成图片，但 Adobe Stock 的用户须拥有上传内容的相应权利或所有权，平台的“贡献者条款”明确禁止 “使用包

斯坦福团队为抄袭清华系面壁智能 AI 模型道歉：Llama3-V 模型将悉数撤下

近日斯坦福大学的 AI 研究团队的 Llama3-V 开源模型被指控抄袭了清华系明星创业公司面壁智能开发的开源模型“小钢炮”MiniCPM-Llama3-V 2.5，在网上引起热议。图源 Pexels5 月 29 日一个斯坦福 AI 团队在网上宣称只需 500 美元就可训练出一个超越 GPT-4V 的 SOTA 多模态大模型，但很快网友就发现该项目使用的模型结构和代码与“小钢炮”高度相似，仅有部分变量名被更改。面壁智能团队在 6 月 2 日深夜确认，斯坦福的模型不仅能识别出“清华简”中的战国古文字，而且连错误的识别

谁最美？全球首届 AI 选美大赛拉开帷幕：入围名单已公布，奖金 1.6 万英镑

根据英国《镜报》报道，全球首届 AI 模特小姐选美大赛 WAICAs 已经于上月拉开帷幕，总奖池达到 1.6 万英镑（IT之家备注：当前约 14.8 万元人民币），全球有超过 1500 个 AI 角色、1 万名 AI 团队成员参与。WAICAs 全称是未来派世界人工智能创造者大奖，由 Fanvue 主办，将会根据 AI 的现实性、影响力和技术性来评判人工智能的影响力。Fanvue 联合创始人威尔・莫南奇（Will Monange）解释说：该奖项显示了 AI 领域创作者的参与程度，入围名单的水准令人难以置信。我们估计

亚马逊推出“侦探”项目：AI 火眼金睛确保商品发货前无瑕疵

为了让顾客收到满意的商品，亚马逊祭出利器 ——“Project PI”（侦探项目）。这项结合生成式 AI 和计算机视觉技术的系统，能够在商品运送给顾客之前，就找出损坏、颜色错误或尺寸不对的产品。具体工作流程是这样的：即将送达的商品会通过一个装有扫描装置的隧道。计算机视觉程序 (一种能分析图像内容的 AI 技术) 会检查商品是否存在瑕疵。如果发现问题，系统就会将这件商品分离出来，并进行缺陷评估，同时检查是否有类似问题存在于其他批次商品中，以便追根溯源。据亚马逊介绍，Project PI 目前已在美国多个仓库投入使用，

OpenCV 4.10.0 版本更新发布，首次支持 Windows ARM64、苹果 VisionOS

OpenCV 是一款跨平台的计算机视觉和机器学习软件平台，在计算机视觉领域广泛使用，是目前人工智能应用中的重要基础平台。OpenCV 4.10.0 版本更新于昨日发布（点此查看），对其深度神经网络（DNN) 模块进行了许多改进、实验性 NumPy 2.0 支持、Android 改进、NVIDIA CUDA 12.4 平台支持、RISC-V 和 ARM 改进、oneAPI 2024 支持、实验性 Windows ARM64 支持、实验性苹果 VisionOS 支持，以及 Linux 上的本机 Wayland 后端。