应用 - AI在线

苹果智能炸裂登场：直接GPT-4o加持，全家桶都上生成式AI，Siri脱胎换骨

还有史诗级更新：iPhone 加通话录音，iPad 加计算器。不止 Siri 或 iPhone，整个苹果，向前迈进了一大步。北京时间 6 月 11 日凌晨，苹果全球开发者大会 WWDC 在库比蒂诺的 Apple Park 正式召开。这场大会，苹果如我们所愿终于带来了覆盖全线产品的生成式 AI 技术，与此同时还有些预料之外的消息。「苹果的目标一直是构建以人为本，最为易用方便的个人设备，提升人们的生活效率。多年来我们一直在应用人工智能、机器学习技术来实现目标，」苹果 CEO 蒂姆・库克说道。「最近大语言模型等 AI 突

这家世界模型公司发布中国版Sora级视频生成大模型，走向世界模型打造新一代数据引擎

Sora 炸场之后，视频生成持续广受关注，不断掀起新的热潮。近日，在奇绩创坛路演日上，世界模型公司「极佳科技」联合清华大学自动化系正式发布中国首个超长时长、高性价比、端侧可用的 Sora 级视频生成大模型「视界一粟 YiSu」，引起社会各界广泛的反响和关注。01 模型原生 16 秒，超长时长，超大运动，超强表现力；不止步于 DiT，自研的视频生成技术路线「视界一粟 YiSu」拥有模型原生的 16 秒超长时长，并可生成至 1 分钟以上；同时还拥有超大运动、超强表现力、懂物理世界等众多优势；更重要的是，YiSu 模型成

CVPR 2024｜让图像扩散模型生成高质量360度场景，只需要一个语言模型

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：[email protected]；[email protected]蔡志鹏博士（）是美国英特尔研究院的研究员，博士毕业于澳大利亚阿德莱德大学。他的研究兴趣包括鲁棒视觉感知，持续学习和生成模型等。他的工作已在领域顶级会议杂志上发表超过15篇。其中5篇文章被选

北上广深等六地政策对比｜中国无人驾驶产业发展背后的城市竞速

2015年5月，国务院发布《中国制造2025》，将发展智能网联汽车正式上升至国家战略高度，无人驾驶也被列为汽车产业未来转型升级的重要方向之一。此后的九年时间里，从工信部、国家发改委、科技部等中央部委到北京、上海、广州、深圳、武汉等重点城市，都将自动驾驶汽车列为重点任务之一，并陆续出台相关法规、政策和标准，逐步构建起智能网联汽车产业的政策体系，为更高阶自动驾驶大规模落地持续铺路。顶层设计的背后，是各个城市对自动驾驶技术发展的重视和支持。同时，各个城市之间也在上演着暗流激荡的产业竞赛。尤其是北京、上海、广州、深圳、武汉

BIOS 遇上大模型，系微推出“业界首款 AI 驱动固件辅助技术”aiBIOS

主要 BIOS 企业之一系微 Insyde 近日在 2024 台北国际电脑展上宣布推出“业界首款 AI 驱动固件辅助技术” aiBIOS，适用于 x86 和 Arm 架构平台。aiBIOS 技术将 AI 同系微的旗舰固件解决方案 InsydeH2O UEFI BIOS 相结合，既可分析电脑的硬件配置，也可借助大语言模型的术语知识库，让用户快速理解 PC 专业术语。此外，aiBIOS 还可根据用户的针对性需求，自动完成 BIOS 配置的修改。总而言之，针对终端用户而言，aiBIOS 技术可帮助电脑“小白”实现必要但较

OpenAI 官宣新任首席财务官、首席产品官，并与苹果达成合作

感谢OpenAI 今日官宣聘请了两名高管，并与苹果建立合作伙伴关系。该公司在博客文章中宣布，Nextdoor 前首席执行官兼 Square 财务总监 Sarah Friar 将加入公司，担任首席财务官（CFO）。Friar 还是斯坦福大学数字经济实验室的联合主席。此外，Kevin Weil 加入 OpenAI 担任首席产品官（CPO）。他将领导一个产品团队，专注于将研究应用于消费者、开发者和企业的产品和服务。他曾经担任 Planet Labs 前总裁、Twitter 产品高级副总裁、Facebook 和 Insta

Copilot Pro 订阅魅力下降，微软 7 月 10 日下线用户自建 GPT 服务

微软今天发布公告，宣布 Copilot Pro 服务将移除 GPT Builder，意味着订阅用户无法继续创建自己的 Copilot GPT。GPT Builder 也称为 Copilot GPT，订阅 Copilot Pro 的用户可以使用文档、外部或内部资源以及自定义指令创建自己的 Copilot GPT。Copilot Pro 是售价 20 美元的 Microsoft Copilot 订阅版本，具有一些附加功能，如 GPT 生成器和 Copilot 在 Word、Excel、PowerPoint 和 Outl

中国第一台全天候激光智能除草机器人落地：哈工大新成果，环境零污染

据华工科技消息，6 月 5 日-7 日，华工科技中央研究院同哈尔滨工业大学机器人技术与系统全国重点实验室（简称哈工大机器人实验室）正式签约并举行专家聘任仪式，中国第一台全天候激光智能除草机器人落地。据介绍，哈工大机器人实验室与华工科技合作研发的中国第一台全天候智能激光除草机器人，以“环境零污染、土地零破坏、昼夜作业”为研发目标，实现了该领域的国内首创，目前已经在黑龙江黑河市爱辉区开展田间试验。据介绍，激光除草是通过激光照射杂草，使草叶内部细胞脱水破裂死亡的物理靶向除草方法。全天候智能激光除草机器人集成深度学习的人工

独家专访Pika：Sora is not very hard to beat，我们的算法能够以小胜大｜AI Pioneers

人类正在迎来人工智能领域的爆炸式更新，技术向未知拓展的每一步，几乎都引起惊人的关注度。在人工智能边界扩张的过程中，重要赛道的技术路线创新与分歧并存。技术先锋者的判断和选择，影响着众多跟随者的脚步。过去一年，机器之心独家率先将月之暗面、生数科技、爱诗科技、无问芯穹等优秀公司介绍给大家，为他们在互联网世界留下了第一份 “万字访谈底稿”。在技术路线尚未收敛的阶段，我们看到了到真正拥有信念、勇气以及系统化认知的 AI 创业者的引领力量。因此，我们推出 “AI Pioneers” 的专栏，希望继续寻找和纪录 AGI 时代人工

Karpathy最新四小时视频教程：从零复现GPT-2，通宵运行即搞定

这是Karpathy「Neural Networks：zero to hero」系列视频的最新内容。AI 大牛 Andrej Karpathy 又「上新」了，这次一口气放出了长达四个小时的视频。视频主题为「让我们来复现 GPT-2（1.24 亿参数）」。Karpathy 表示，此次视频之所以这么长，是因为它很全面：从空文件开始，最后得到一个 GPT-2（124M）模型。具体实现步骤包括如下：首先构建 GPT-2 网络。然后对其进行优化，以便快速训练。然后通过参考 GPT-2 和 GPT-3 论文来设置训练运行优化和

具身智能赋能机器人，「AI+人形机器人」论坛在浦东新区成功举行

6 月 6 日下午，在上海市浦东新区科技和经济委员会指导下，由上海市浦东新区投资促进中心、人形机器人（上海）有限公司主办，上海浦东科技创业中心、机器之心（上海）科技有限公司承办，中国银行股份有限公司上海市分行协办的「AI 人形机器人」论坛暨张江机器人全球生态峰会具身智能开发者论坛在浦东新区张江科学会堂成功举行。来自具身智能、运动控制、云计算以及人形机器人整机等领域高校院所、行业企业以及投资机构的 200 多位嘉宾参加了本次论坛，在线观看人次超 30000。本次论坛邀请了 12 位来自具身智能领域的学者、企业代表

偏微分方程有了基础模型：样本需求数量级减少，14项任务表现最佳

本文提出的 Poseidon 在样本效率和准确率方面都表现出色。偏微分方程（PDEs）被称为物理学的语言，因为它们可以在广泛的时间 - 空间尺度上对各种各样的物理现象进行数学建模。常用的有限差分、有限元等数值方法通常用于近似或模拟偏微分方程。然而，这些方法计算成本高昂，特别是对于多查询问题更是如此，因而人们设计了各种数据驱动的机器学习（ML）方法来模拟偏微分方程。其中，算子学习（ operator learning）算法近年来受到越来越多的关注。然而，现有的算子学习方法样本效率并不高，因为它们需要大量的训练样例才能

大模型的高考数学成绩单：及格已经非常好了

让考生头皮发麻的高考数学，可难倒了顶尖 AI 大模型。一年一度的高考即将落幕，衷心希望各位考生都超常发挥，考出满意的好成绩！！和往年一样，除了让 AI 大模型写写高考作文，我们也选取了六家国内头部大模型公司的产品与考生们一同参与一场客观且公平（让众多考生头皮发麻）的高考数学考试（新课标 Ⅰ 卷），其中包括 GPT-4o、GLM-4、文心一言 4.0、豆包、百小应（百川 4）以及通义千问 2.5。先来瞧一瞧这份「大模型成绩单」：令人惊讶的是，在这次模拟考试中，大模型（产品）的表现并未达到预期，甚至出现了几乎全部不及格

AI降噪耳机，可在嘈杂人群中单独通话，看一眼锁定目标

千万种声音里，只听到你。最近几年来，很多人都在使用降噪耳机。这种设备能让人在吵闹的环境中享受安静，安心地听音乐或工作。通常，降噪耳机会通过内置的芯片算法对外界噪音信号进行计算，然后由喇叭发出反向声波进行抵消的方式创造安静环境。不过安静归安静，大多数情况下人们还是需要交流的，这就带来了不小的挑战。人们曾提出过各种解决方案，比如苹果最新款的 AirPods Pro 就会自动调整，如果耳机感知到人在说话就会停止降噪，但用户是无法控制听谁说话，或何时关掉降噪的。近日，华盛顿大学的一个团队开发了一种 AI 系统，让戴着耳机的

可信度超越GPT-4V，清华&面壁揭秘「小钢炮」模型背后的高效对齐技术

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：[email protected]；[email protected]本文主要作者来自 MiniCPM-V 团队，其中第一作者余天予是清华大学 2021 级硕士研究生，他的主要研究方向是通用多模态基础大模型构建及其对齐方法。近期，由清华大学自然语言处理实验室

深度解析！Midjourney 三大常用参数 --s/c/w 的区别与使用技巧

大家好，这里是和你们一起探索 AI 的花生~ 之前为大家推荐了很多期 midjourney 提示词，然后有小伙伴问我推荐的提示词后跟着的参数，比如 --s 250、--c 6 等，是随便添加的还是有意识地用它们控制出图效果；如果是有意识的，又是如何确定使用哪一项参数和具体数值的。那今天就专门开一篇文章，为大家详细介绍一下 Midjourney 的三大常用参数 stylize、chaos 和 werid 的区别以及使用技巧 (本文中仅讨论仅限于目前最新的 v6 版本) 。相关推荐：一、--Stylize 风格化 S

“AI 预测宝宝长相是不是智商税”上热搜，专家：娱乐性大于准确性

今天下午，一条 #AI 预测宝宝长相是不是智商税#的话题登上了微博热搜，目前位于榜单第 10 位。据极目新闻报道，在电商平台上，利用四维彩超图生成一张宝宝照片最低只需 6.8 元，等待半小时就能出片，最火的商家已接了上万单。在某微信小程序，用户也可自行上传四维彩超图，免费生成预测照片。对此，人工智能领域专业人士郭涛表示，通过一些算法和数据确实可以对图像进行处理和推测，但胎儿在母体发育以及出生后的成长会受到多种因素影响，AI 很难准确预测出最终模样。中国企业资本联盟副理事长柏文喜表示：“不少宝爸宝妈对未出生宝宝怀着好

语音克隆技术引发担忧，OpenAI 再次解释其文本转语音工具

OpenAI 在几个月内第二次就其文本转语音工具进行解释，并再次强调该工具目前并未大范围开放，且未来也可能不会。图源 Pexels“无论我们最终是否会大规模部署这项技术，让世界各地的人们理解这项技术的发展方向都非常重要，”OpenAI 公司周五在其网站上发布的一份声明中表示，“这就是为什么我们想要解释模型的运作方式、我们如何将其用于研究和教育，以及我们如何围绕该技术实施安全措施的原因。”据IT之家了解，去年年底，OpenAI 与一小部分外部用户分享了其“语音引擎”。该引擎利用文本输入和 15 秒的人声音频剪辑，即可