资讯列表

清华、华为等提出iVideoGPT:专攻交互式世界模型

iVideoGPT,满足世界模型高交互性需求。近年来,生成模型取得了显著进展,其中视频生成正在成为一个新的前沿领域。这些生成视频模型的一个重要应用是,在多样化的互联网规模数据上以无监督方式学习,用于构建预测世界模型。这些世界模型有望积累关于世界如何运作的常识性知识,从而能够基于智能体的行为预测潜在的未来结果。 通过利用这些世界模型,采用基于强化学习的智能体可以在世界模型中进行想象、推理和规划,从而在现实世界中通过少量试验就能更安全、更有效地获得新技能。尽管生成模型和世界模型有着基本的联系,但用于视频生成的生成模型和

AI智能体的炒作与现实:GPT-4都撑不起,现实任务成功率不到15%

AI 智能体的宣传很好,现实不太妙。随着大语言模型的不断进化与自我革新,性能、准确度、稳定性都有了大幅的提升,这已经被各个基准问题集验证过了。但是,对于现有版本的 LLM 来说,它们的综合能力似乎并不能完全支撑得起 AI 智能体。多模态、多任务、多领域俨然已成为 AI 智能体在公共传媒空间内的必须要求,但是在具体的功能实践中所展现的真实效果却差强人意,这似乎也再次提醒各个 AI 智能体初创公司以及大型科技巨头认清现实:脚踏实地一点,先别把摊子铺得太大,从 AI 增强功能开始做起。近日,一篇就 AI 智能体在宣传和真

适应多形态多任务,最强开源机器人学习系统「八爪鱼」诞生

一位优秀的相声演员需要吹拉弹唱样样在行,类似地,一个优秀的机器人模型也应能适应多样化的机器人形态和不同的任务,但目前大多数机器人模型都只能控制一种形态的机器人执行一类任务。现在 Octo(八爪鱼)来了!这个基于 Transformer 的模型堪称当前最强大的开源机器人学习系统,无需额外训练就能完成多样化的机器人操控任务并能在一定程度适应新机器人形态和新任务,就像肢体灵活的八爪鱼。在机器人学习方面,一种常用方法是收集针对特定机器人和任务的数据集,然后用其来训练策略。但是,如果使用这种方法来从头开始学习,每一个任务都需

不影响输出质量还能追踪溯源,「大模型无偏水印」入选ICLR 2024 Spotlight

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected][email protected]本文通讯作者为马里兰大学计算机系的博士生胡正冕,其导师为 Heng Huang。他的主要研究方向是采样与机器学习理论,曾在ICML、NeurIPS、ICLR等顶级会议上发表多篇论文。邮箱:

美国最火的两个教育 AI 应用,来自字节跳动和作业帮

感谢在美区 App Store 的前 20 名教育应用程序中,有 5 个是帮助学生完成作业的 AI 工具软件,其中最受欢迎的两款软件 Gauth 和 Question AI ,均为中国公司开发。Gauth 由字节跳动在 2019 年推出,Question AI 则由作业帮开发。自 2023 年问世以来,Question AI 在美区的 App Store 和 Google Play 已被下载六百万次。许多中国实体辅导机构和在线学习应用程序自 2021 年起将重心转向海外,并取得了巨大的成功。外媒 TechCrunc

Netflix CEO:抢你饭碗的不是 AI,而是熟练使用 AI 的人

网飞(Netflix)首席执行官泰德・萨兰多斯(Ted Sarandos)并不认为 AI 未来有一天会取代编剧、演员和导演,但精通 AI 的人可能会取代你的工作。萨兰多斯在接受《纽约时报》采访时表示:“我不相信人工智能程序能创作出比人类顶尖编剧更好的作品,也不相信 AI 未来会取代优秀的演员,更不相信未来我们无法分辨 AI 和人类作品的差别”。萨兰多斯表示 AI 不会抢走你的饭碗,熟练掌握 AI 技能的人才会抢走你的饭碗。萨兰多斯以家庭录像机转变为切入,IT之家翻译相关采访内容如下:还记得大家是如何对抗家庭录像机的

百度文心一言上架统信应用商店

据“统信 UOS”官方公众号,由百度研发的人工智能大语言模型产品文心一言正式上架统信应用商店,用户可通过统信应用商店一键下载、安装并使用文心一言。▲ 图源 “统信 UOS”官方公众号IT之家援引统信官方数据,目前统信 UOS 桌面版发货量累计超过 600 万套,市占率持续保持第一;统信 UOS 服务器版发货量增速为行业第一,服务 70% 党政、80% 央企国企、65% 部委、90% 金融、90% 教育客户及数千万个人用户。UOS AI 已在今年 1 月上架统信 UOS 桌面平台,该 AI 兼容云侧与端侧大模型,支持

“星战之父”乔治・卢卡斯吐槽好莱坞“几乎没有原创思维”,AI 将“不可避免”用于电影制作

《星球大战》系列的创作者乔治・卢卡斯(George Lucas)在 1977 年奠定了电影制作传奇人物的地位,他对当今电影的状况及其发展方向有一些自己的看法。他在 2024 年戛纳电影节上谈到了当前的电影行业。现年 80 岁的卢卡斯在接受法国媒体 Brut FR 采访时表示,“他们(好莱坞)讲的故事只是老电影。让我们拍续集,让我们拍这部电影的另一个版本。而且不仅在电影中,而且在几乎所有事物中,几乎没有原创思维。”2012 年,卢卡斯以略高于 40 亿美元的价格将他的卢卡斯影业卖给了华特迪士尼公司,随着多部电影、游戏

微软 Phi-3-vision 基准测试:和 Claude 3-haiku、Gemini 1.0 Pro 相当

微软在 Build 2024 大会上发布了 Phi-3 家族的最新成员--Phi-3-vision,主打“视觉能力”,能够理解图文内容,同时据称可以在移动平台上流畅高效运行。Phi-3-vision 是一款多模态小型语言模型(SLM),主要用于本地 AI 场景,该模型参数量为 42 亿,上下文长度为 128k token,能够为常规视觉推理任务和其他任务提供支持。那么 Phi-3-vision 有多厉害?微软今天发布了新的论文 [PDF],表示该 SLM 和 Claude 3-haiku、Gemini 1.0 Pr

UI/UX 必看!5 款强大又好用的 AI 原型设计神器

大家好,这里是和你们一起探索 AI 的花生~ 今天为大家推荐 5 款目前较热门的 AI 原型设计工具,与 Sketch、Figma 等 UI 设计工具相比,它们可以实现文本/图像生成 UI 设计、图像智能处理、文案智能重写、设计灵感推荐等操作。这些工具不仅能提升设计师的工作效率,而且对产品经理等非设计专业人员来说也很友好,因此也能为不同部门间的沟通协作提供一种新的、更高效的解决方案。 :一、Galileo AI 网站链接: 详细介绍: Galileo AI 之前专门写文章为大家介绍过了,它是最早提出 “Text

AI又帮我做项目了,效率超高!

去年 AI 在设计界可以说是掀起了翻天覆地的变化,年初社会还在争论不休 AI 的未来,年末市场就已经到处出现 AI 完成的形象和作品了。特别现在 SD 的更新迭代还有 MJ-V6 版本的出现,AI 对画面的控制又进行了升级,生成的图片质量又进一步提高,AI 已经不可避免的成为了新一代设计提效的工具。咱们工作室也在这一年也已经将 AI 工具逐渐融入到设计业务承接当中,再分享一波 AI 辅助整套物料设计的案例。 接下来我将通过这三个步骤给大家详细地分享一下此次设计的思路。AI辅助主视觉 增加细节装饰 同类素材延展一、A

四川:将人工智能作为一号创新工程,发力智算芯片、算法模型等重点领域

综合上海证券报、“四川建设发布”消息,国务院新闻办公室今日上午举行“推动高质量发展”系列主题新闻发布会,四川省委副书记、省长黄强表示,四川把人工智能作为一号创新工程,推动绿氢全产业链发展和推广应用,打造生物技术、卫星网络、智能网联新能源汽车、无人机和工业互联网等战略性新兴产业,大力发展低空经济和商业航天。针对四川将人工智能作为“一号创新工程”具有哪些优势、具体措施等问题,四川省科技厅厅长吴群刚表示,四川是我国“东数西算”工程的重要节点,目前有两家国家级算力平台,有 1100 余家人工智能企业,还有 27 所高校也开

谷歌 CEO 皮查伊:未来几年的 AI 可能会给人一种“具备意识”的假象

谷歌 CEO 桑达尔・皮查伊近日接受 YouTube 科技创作者 Hayls World 采访,讨论了当下正如火如荼的 AI 革命的方方面面,并透露了谷歌对 AI 的愿景。IT之家汇总部分问答如下:在马斯克提出 AI 将使大部分工作变得“可有可无”不久后,皮查伊也表达了类似的观点,强调了 AI 的普遍影响。采访一开始,主持人便问皮查伊“为什么要使用谷歌的 AI”,皮查伊回答说,AI 将为我们所做的一切带来极大影响。“使用 AI 的原因有很多种,它会让你的体验变得更好,它会帮你总结一些内容,帮你节省时间,你还可以和

昆仑万维宣布天工AI每日活跃用户(DAU)超过100万

受益于前瞻性的AI战略布局与领先的AI产品能力,昆仑万维旗下天工AI用户活跃度再创新高。5月27日,昆仑万维集团宣布,天工AI每日活跃用户(DAU)已超过100万,受到广大用户的热情追捧。在初步验证大模型能力之后,天工AI将继续聚焦产品市场匹配度(PMF, Product Market Fit),始终以用户体验为中心,不断优化产品体验,打造出更加贴近用户使用场景的AI产品。根据国内商业智能数据服务商QuestMobile数据,早在2024年3月,昆仑万维天工AI APP的月活跃用户已达近千万,仅次于豆包与文心一言,

荣耀即将推出首款搭载谷歌 Gemini AI 的智能手机,预计面向海外市场

感谢荣耀终端有限公司宣布,即将推出首款搭载谷歌 Gemini AI 及相关功能的智能手机。IT之家援引 CNBC 消息,荣耀一位发言人透露,即将推出的设备将集成谷歌 Gemini AI、文本到图像生成工具 Imagen 2 等生成式 AI 服务,并且由 Google Cloud 提供相关的服务支持。今年初,荣耀终端有限公司推出其新一代的 MagicOS 8.0 中已经嵌入了自研端侧 7B “魔法大模型”,搭配内置的 YOYO 助理,已经实现了场景感知、意图决策、用户理解能力,支持自然语言、语音、图片、手势、眼动等多

两名前董事称 OpenAI 自我管理能力“不可靠”:将会向利润屈服

当地时间周六,两名 OpenAI 前董事海伦・托纳(Helen Toner)和塔莎・麦考利(Tasha McCauley)在《经济学人》杂志撰文称,他们坚持罢免 CEO 阿尔特曼的决定,并援引高层领导称阿尔特曼创造了一种“充斥谎言的毒性文化”,并实施了可被定性为“心理虐待”的行为。IT之家注:二人于去年 11 月阿尔特曼被罢免时宣布辞职,但阿尔特曼在几天之后又迅速官复原职,并于 5 个月后重返董事会。托纳和麦考利在文章中提到,OpenAI 无法为自身负责。“我们还认为,自他(阿尔特曼)重返公司以来的事态发展 ——

软银计划向 AI 项目投资近 90 亿美元,进一步加速“迄今最彻底”转型

据英国《金融时报》当地时间周日报道,软银计划向 AI 项目投资 90 亿美元(IT之家备注:当前约 653.4 亿元人民币),旨在加速其“迄今最彻底”的转型进程。报道称,软银仍在为更大的交易“保留火力”,该公司创始人、CEO 孙正义一直强调自己对人工智能的信仰以及“重塑公司”的必要性。自孙正义宣布软银准备好“发起反攻”以来的过去 12 个月中,软银的投资和承诺支出相比往年已增加了一倍多,达到 89 亿美元(当前约 646.14 亿元人民币)。软银表示,如果有合适的超大型交易,它愿意维持甚至超过这一数额。孙正义相信,

换了30多种方言,我们竟然没能考倒中国电信的语音大模型

不管你来自哪个城市,相信在你的记忆中,都有自己的「家乡话」:吴语柔软细腻、关中方言质朴厚重、四川方言幽默诙谐、粤语古雅潇洒……某种意义上说,方言不只是一种语言习惯,也是一种情感连接、一种文化认同。我们「上网冲浪」遇到的新鲜词汇中,有不少就是来自各地方言。当然,有些时候,方言也是一种交流「壁垒」。在现实生活中,我们经常会看到方言导致的「鸡同鸭讲」,比如这个:如果你关注最近科技圈的动态就会知道,当前的 AI 语音助手已经能达到「实时回复」的水准,甚至比人类反应还快。而且,AI 已经能够充分理解人类的情感,自己也能表现出