应用

我想给她完整的一生:“全球首个通用智能人”北大小女孩“通通”亮相

9 月 1 日,中央广播电视总台大型公益节目 2024 年《开学第一课》播出,北京大学智能学院、人工智能研究院院长、计算机视觉专家、人工智能专家朱松纯教授携全球首个通用智能人 —— 小女孩(Little Girl)“通通”亮相节目现场。据北京大学介绍,这位名叫“通通”的小女孩拥有三四岁的心智,是一个有“心”的人工智能。她所做的事情不受人为控制,而是由自己“心”里的价值所驱动。在随机的场景中,“通通”会自主地捡起地上的玩具放进收纳盒中,拿起抹布擦去地上的污渍,搬起板凳清洗抹布。通过一系列的行为可以发现,“干净”是她的

刚刚,OpenAI震撼发布o1大模型!强化学习突破LLM推理极限

大模型领域的技术发展,今天起再次「从 1 开始」了。大语言模型还能向上突破,OpenAI 再次证明了自己的实力。北京时间 9 月 13 日午夜,OpenAI 正式公开一系列全新 AI 大模型,旨在专门解决难题。这是一个重大突破,新模型可以实现复杂推理,一个通用模型解决比此前的科学、代码和数学模型能做到的更难的问题。OpenAI 称,今天在 ChatGPT 和大模型 API 中新发布的是该系列中的第一款模型,而且还只是预览版 ——o1-preview。除了 o1,OpenAI 还展示了目前正在开发的下次更新的评估。o

面向软件工程的AI智能体最新进展,复旦、南洋理工、UIUC联合发布全面综述

AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected][email protected]本篇综述的作者包括来自复旦大学 CodeWisdom 团队的研究生刘俊伟、王恺欣、陈逸轩和彭鑫教授、娄一翎青年副研究员,以及南洋理工大学的陈震鹏研究员和伊利诺伊大学厄巴纳 - 香槟分校(U

安卓版谷歌 Gemini Live 免费上线,开启在线 AI 语音畅聊

科技媒体 9to5Google 昨日(9 月 12 日)发布博文,报道谷歌在 1 个月前面向 Advanced 订阅用户推出后,正逐步面向所有安卓用户免费开放 Gemini Live。AI在线曾于 8 月报道,谷歌在 Pixel 9 系列手机发布会上,发布了 Gemini Live,该服务提供了一种移动对话体验,让用户和 Gemini 展开自由流畅的对话。Gemini Live 可以说是对标 OpenAI ChatGPT 最新上线的 Advanced Voice 模式(限量 Alpha 测试),采用了增强型语音引擎

边缘智能的新时代:端侧大模型的研究进展综述

AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected][email protected] Xu : Meta AI科学家,专注大模型和智能眼镜开发。南加州大学博士,Linkedin Top AI Voice,畅销书作家。他的AI科普绘本AI for Babies

文生图 AI Midjourney 雄心:7.0 版未来 1-2 月登场、开发新图像编辑器、探索 3D 系统、踏足硬件领域

科技媒体 The Decoder 昨日(9 月 12 日)发布博文,报道称在最近的“Office Hours”活动中,Midjourney 创始人兼首席执行官 David Holz 在 Discord 分享了当前项目的最新进展,并回答了社区的提问。Midjourney 7.0 版本Holz 更新了 Midjourney 7.0 版本时间表,表示将会在未来 1-2 月内发布。让更多人体验 MidjourneyHolz 表示公司并不急于推出新的 AI 模型,而是提高现有技术的易用性,让工具深入融入到专业人士的日常工作中

安卓和 iOS 版谷歌 Gemini AI 应用新增 Gems 及管理器

科技媒体 testingcatalog 昨日(9 月 12 日)发布博文,报道称 iOS 和安卓版 Gemini 应用新增支持 Gem 和 Gem 管理器。用户现可在主屏幕上查看常规聊天及与 Gems 相关的聊天,此外用户可进入 Gem 管理器,界面采用标签式布局,首屏展示所有 Gems,分为用户自定义 Gems 和谷歌预制的 Gems 两部分。用户如果要编辑或创建新 Gems,用户会被引导打开网页版,该网页版会在同一应用内的网页视图中打开。Gemini 简介AI在线附上官方介绍如下:Gemini 应用是一款实验性

效率暴涨!100万人都在关注的多合一 AI 搜索神器 SeekAll!

大家好我是花生~ 随着 AI 技术的发展成熟,我现在查资料基本都在用 AI 搜索引擎,比如 KimiChat、 腾讯元宝、Perplexity AI 等,它们真的极大提高了我的信息获取效率。不过现在各种 AI 搜索引擎太多了,为了获得更全面的信息,我常常不得不在多个引擎之间来回切换使用,有时也会觉得麻烦。 但最近我发现了一款宝藏工具刚好可以解决我的这个烦恼,它将多个 AI 搜索引擎及知识平台都聚合到了一起,我只需要发送一次提问,就能同时获得多个网站的答案,简直不要太方便!今天就为大家详细介绍这款多合一的 AI 搜索

谷歌推出 DataGemma:基于可信数据源提高 AI 准确度,减少幻觉

科技媒体 maginative 昨日(9 月 12 日)发布博文,报道谷歌公司基于谷歌数据共享(Data Commons)中的真实世界统计数据,推出了开放权重 Gemma 模型的新版本  DataGemma。语言模型当前面临的一大难题就是幻觉(Hallucinations),尤其是大语言模型(LLMs)在处理数值或统计数据时,这一问题变得尤为棘手,因此精确性至关重要。谷歌的 Data Commons 是一个存储库,汇集了来自联合国和疾病控制与预防中心等可信组织收集的超过 2400 亿个数据点。通过利用这一庞大的统计

OpenAI o1 模型登场:开启 AI 通用复杂推理新篇章,国际奥数正确率 83%

感谢OpenAI 传闻中的“草莓”(Strawberry)AI 模型现已面世,正式名称为“o1”,是该公司首款具备“推理”能力的模型。o1 和 o1-miniOpenAI 表示对该模型进行特殊训练,能够比人类更快地回答更复杂的问题。与之同时发布的还有 o1-mini,一个更小、成本更低的版本。OpenAI 表示 o1 模型的发布,是其迈向类人 AI 宏伟目标的关键一步。AI在线注:o1 模型目前处于“预览”阶段,官方强调该模型相关开发尚处于初期阶段,相比较 GPT-4o 模型,使用成本更高且速度更慢,但在编写代码和

产品+AI如何设计?大厂高手总结了这3种方案!

一、前言 当我们一次次被 AI 技术带来的变革所惊艳,当 ChatGPT 一次次宣布其能力已经突破了人类的想象,你是否注意到现有产品与 AI 融合的新趋势?值得注意的是,新技术的出现也一定带来了新的交互体验。本文将以多种产品场景为例,梳理 PC 端多种主流的 AI 融合形态,希望能给大家带来启发。二、多元场景下的主流 AI 形态 目前主流 AI 产品有如下 3 种主要形态,分别为沉浸式的 AI 智能体(Agent)、伴随式的 AI 副驾驶(Co-pilot)、嵌入式的 AI 场景化嵌入(Embedding)。这 3

全球人形机器人约 38% 供应链企业在中国,北上广等地已成立具身智能机器人创新中心

据央视财经报道,9 月 12 日至 16 日,2024 年中国国际服务贸易交易会将在北京举办。报道提到,目前,全球人形机器人约 38% 的供应链企业在中国,北京、上海、广东等地都成立了具身智能机器人创新中心。当前,人形机器人正从“炫技”向“服务”加速转变,逐步进入百姓生活。报道称,在“硬件创新”和“大模型技术”的双重助力下,我国机器人产业蓬勃发展。本届服贸会展现了人形机器人给人类生产生活带来的多种可能性,同时在现实生活中,以人形机器人为代表的智能产品也开始尝试落地应用。据AI在线此前报道,在今年 8 月 21 日开

AI 模型数据处理方式引疑虑,欧洲隐私监管机构对谷歌展开调查

感谢欧洲隐私监管机构正在调查谷歌在开发其人工智能模型过程中处理个人数据的方式,此举标志着监管机构对大型科技公司的 AI 野心的审查力度不断加大。爱尔兰的数据保护委员会(DPC)负责执行欧盟的《通用数据保护条例》(GDPR),该委员会表示,已经对谷歌的 PaLM 2 语言模型启动了一项法定调查。PaLM 2 于 2023 年 5 月推出,早于谷歌最新的 Gemini 模型。Gemini 于同年 12 月推出,现在是其文本和图像生成产品的核心模型。该调查将评估谷歌是否违反了 GDPR 关于处理欧盟和欧洲经济区公民个人数

谷歌联合创始人布林:工程师们用 AI 编程还不够积极

谷歌联合创始人谢尔盖・布林(Sergey Brin)表示,谷歌工程师并没有像他认为的那样经常使用人工智能。图源 Pexels布林本周在洛杉矶举行的“All-In”峰会上与企业家大卫・弗里德伯格(David Friedberg)进行了在线对话时发表了上述言论。布林在峰会现场罕见露面,讨论了 AI 的“令人兴奋”的进步。“作为一名计算机科学家,我从未见过像过去几年所取得的进展一样令人兴奋的事情,”布林说。布林表示,他目前几乎每天都在谷歌。他还称赞了 AI 的多方面能力,特别是在编程方面。布林称:“从头开始编写代码感觉非

华为盘古预测大模型首次投入宝钢生产控制

AI在线从宝钢股份获悉,9 月 6 日,宝钢股份与华为公司合作的基于华为盘古预测大模型开发的热轧自然宽展预测模型,正式投入热轧 1880 产线实现在线控制,完成了华为预测大模型在钢铁制造领域首发闭环控制技术验证。图源:宝钢股份据悉,由华为公司、数据 AI 部、设备部、热轧厂、中央研究院、宝信软件等多部门组成的项目专家团队,对大模型投入后的带钢宽度控制进行了跟踪和验证。专家团队一致认为,在 348 块带钢轧制过程中,华为大模型的预测精度、时延响应均满足目标要求,带钢宽度实时控制正常,验证取得圆满成功。这是基于华为平台

苹果首次分享 Image Playground 生成的图片,由高管为其爱犬制作

苹果公司首次公开展示了即将推出的 Apple Intelligence 功能之一 ——Image Playground 的实际应用示例,这项功能能够根据文本提示生成卡通风格的插图。这个示例图片是由苹果软件工程高级副总裁 Craig Federighi 制作的,以庆祝他的爱犬 Bailey 的生日。苹果公司与《连线》杂志分享了这张照片,该杂志在图片上加上了水印,以表明这张图片是由 AI 生成的。AI在线注意到,图片中是一只可爱的狗狗,戴着生日帽,在生日蛋糕后面微笑。使用 Image Playground 生成的图片文

中昊芯英与深圳联通携手共建广东首个国产 TPU 智算中心

9月9日,在第五届深圳国际人工智能展(GAIE)第二届智能算力发展论坛上,中昊芯英(杭州)科技有限公司(以下简称“中昊芯英”)与中国联合网络通信有限公司深圳市分公司(以下筒称“深圳联通”)联合举办了“智算基建,加速未来”高性能 AI 智算中心项目启动仪式,标志着双方将携手合作共同建设广东地区首个采用国产 TPU 技术的智算中心。 据深圳联通副总经理赵桂标介绍,“项目一期由32个算力节点通过高效互联构建而成,整体算力不低于50P,后期将扩容至千卡规模,形成训推一体化的枢纽,成为中国联通在深圳的核心智算高地的重要组成部分。 ”谈及合作共建智算中心的具体布局,他进一步表示,“中国联通以国家智算能力布局要求和市场实际需求为牵引,根据‘规划先行、市场驱动、适度超前、小步快跑’原则统筹规划构建中国联通智算体系,构建形成‘1 N X’智算能梯次布局。

刚刚,GPT-4o关键人物离职创业!曾在OpenAI最早提出构建「Her」

OpenAI 最早提出构建「Her」的那个人,刚刚宣布离职创业了。今年 5 月份,OpenAI 发布了震惊世界的 GPT-4o。这个模型可以跨越文本、视觉和音频,以一种非常自然的形式和人类语音对话,延迟低到与人类在对话中的响应时间相似。而且,它允许用户随时打断,并能感知和回应用户的情绪。因此,该模型发布后,很多人说科幻电影《Her》中的场景照进了现实。此次离职的 Alexis Conneau 就是 GPT-4o 项目的关键人物之一。离职前,他是 OpenAI 音频 AGI 研究负责人,也是 OpenAI 最早提出