应用
AI 内容博弈:OpenAI 在和新闻机构版权纠纷案中赢得首轮胜利
科技媒体 engadget 昨日(11 月 8 日)发布博文,报道称 OpenAI 在与 Raw Story 和 AlterNet 的版权纠纷案件中,赢得首轮胜利。
刚刚,OpenAI安全副总裁、北大校友Lilian Weng宣布离职,有时间写博客了
翁荔的技术博客深入、细致,具有前瞻性,被很多 AI 研究者视为重要的参考资料。 如今,她离开了 OpenAI,开启新的征程。 而且她表示,之后可能有更多时间频繁更新博客。
AI有鼻子了,还能远程传输气味,图像生成香水
众所周知,图像、音乐能用 AI 生成,但出乎意料的是,气味也行。 最近,一个名叫 Osmo 的初创公司宣布,他们成功地将气味数字化了。 第一个成功的案例是「新鲜的夏季李子」,而且复现出的味道「闻起来」很不错。
MetaGPT开源自动生成智能体工作流,4.55%成本超GPT-4o
AIxiv专栏是AI在线发布学术、技术内容的栏目。 过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。 如果您有优秀的工作想要分享,欢迎投稿或者联系报道。
即梦AI首发,字节自研视频生成模型Seaweed开放使用
11月8日,字节跳动旗下的AI内容平台即梦AI宣布,即日起,由字节跳动自研的视频生成模型Seaweed面向平台用户正式开放。 用户登陆后,在“视频生成”功能下,视频模型选择“视频S2.0”即可体验。 图说:即梦AI PC端和App端模型使用入口9月底,字节跳动正式宣布向AI视频领域进军,发布豆包模型家族的两款视频生成模型Seaweed和Pixeldance,并通过即梦AI、火山引擎分别面向创作者和企业客户小范围邀测。
AI时代的BBA来了!小鹏P7+18.68万元起售
“全球首款AI汽车”小鹏P7 正式上市发售。 新车共发布三个版本,包括小鹏P7 长续航Max、超长续航Max以及限定版Max,官方指导售价分别为18.68万元、19.88万元以及21.88万元。 其中,小鹏P7 限定版Max提供星阙哑光灰车身配色、扶摇绿限定内饰色、limited edition标识等专属设计,并采用Alcantara定制座椅面料,首批限量发售500台。
“通用大脑”来了!MIT何恺明用大模型思维玩出机器人预训练新花样
在机器人领域,一场关于“通用智能”的探索正如火如荼地展开。 MIT 的何恺明和 Lirui Wang 等人最近成功在“通用数据”上取得了进展,让机器人离拥有“通用大脑”的目标又近了一步。 机器人数据的异质性问题一直是机器人训练的大难题。
Sim2Real新突破:Jim Fan团队造机器人“修仙”模拟器,挂机50分钟=修炼一整年
天上一天,人间一年——这居然已经不是神话了? Jim Fan 团队的最新成果实现了 10,000 倍的超级加速:机器人在虚拟“道场”里训练了整整一年,但现实里只用了 50 分钟! 而且训练结果无需微调,就直接无缝衔接到现实世界使用。
全球首次:AI 机器人画作首登苏富比拍卖,成交价 108 万美元
英国卫报今天(11 月 8 日)发布博文,报道称由类人机器人创作的艺术品,一幅英国数学家艾伦・图灵(Alan Turing)的肖像画,以 108 万美元(IT之家备注:当前约 772.7 万元人民币)的价格成交。
LeCun赞转!类Sora模型能否理解物理规律?字节豆包大模型团队系统性研究揭秘
视频生成模型虽然可以生成一些看似符合常识的视频,但被证实目前还无法理解物理规律! 自从 Sora 横空出世,业界便掀起了一场「视频生成模型到底懂不懂物理规律」的争论。 图灵奖得主 Yann LeCun 明确表示,基于文本提示生成的逼真视频并不代表模型真正理解了物理世界。
把Waymo玩成GTA游戏!全生成式的车辆行驶轨迹视频合成器来了
AIxiv专栏是AI在线发布学术、技术内容的栏目。 过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。 如果您有优秀的工作想要分享,欢迎投稿或者联系报道。
智能体首次达到Kaggle Grandmaster水平,华为用结构化推理补齐思维链短板
前些时日,AI 大模型开始掌握操作计算机的能力,但整体而言,它们与物理世界互动的能力仍处于早期阶段。 为了提高 LLM 在复杂的现实世界中的表现,研究者们提出了各种提示策略来提升大模型的推理和规划能力,比如思维链、思维树和思维图谱。 这些进步与工具集成一起,推动着通用 AI 智能体的发展,让它们现在已经能够用 LLM 输出的决策策略来解决序列决策问题(不过依然还相对简单)。
谷歌 DeepMind 研究再登 Nature 封面,隐形水印让 AI 无所遁形
近日,谷歌 DeepMind 发表的一项研究登上了 Nature 期刊的封面,研究人员开发了一种名为 SynthID-Text 的水印方案,已经在自家的 Gemini 上投入使用,跟踪 AI 生成的文本内容,使其无所遁形。
杨笛一团队:一个弹窗,就能把AI智能体操控电脑整懵了
弹窗攻击很有效,控制计算机的智能体根本顶不住。 前些天,Anthropic 为 Claude 带来一个极具变革意义的功能:Computer Use,也就是控制用户的计算机。 当时,Anthropic 在博客中写到:「在 OSWorld 这项测试模型使用计算机的能力的评估基准上,Claude 当前的准确度为 14.9%,虽然远远不及人类水平(通常为 70-75%),但却远高于排名第二的 AI 模型(7.8%)。
AMD 发布首个 10 亿开源 AI 模型 OLMo,用 Instinct MI250 GPU 集群训练而成
AMD 公司于 10 月 31 日发布博文,宣布推出首个完全开放的 10 亿参数语言模型系列 AMD OLMo,为开发者和研究人员提供强大的 AI 研究工具。
类Sora模型到底懂不懂物理?字节完成系统性实验,图灵奖得主杨立昆赞转!
Sora爆火以来,“视频生成模型到底懂不懂物理规律”受到热议,但业界一直未有研究证实。 近日,字节跳动豆包大模型团队公布最新论文,研究历时8个月,围绕“视频生成模型距离世界模型有多远”首次在业界完成系统性实验并给出明确结论:视频生成模型可以记忆训练案例,但暂时还无法真正理解物理规律,做到“举一反三”。 图灵奖得主、Meta首席AI科学家杨立昆点赞并转发了该研究,表示“结论不令人意外,但很高兴终于有人做了这个尝试!
数字病理与AI辅助诊断,助力肿瘤精准诊疗
图:前沿对话-数字病理与AI辅助诊断赋能疾病精准诊疗编辑 | ScienceAI作为疾病诊断的「金标准」,病理诊断是指导肿瘤临床治疗、评估预后的最可靠依据,在精准医疗时代,准确、高效的病理诊断所发挥的价值日益凸显。 近年来,数字化浪潮席卷全球,病理诊断领域也积极拥抱数字化、智慧化变革,为提质增效开辟创新路径。 今日,罗氏诊断携整体数字化智慧病理解决方案亮相第七届中国国际进口博览会,并分享与探讨了数字病理和人工智能(AI)辅助诊断在疾病精准诊疗中所发挥的重要价值。
大模型小爱能力升级,多端设备支持「音乐问答」功能
据介绍,该功能基于 AI 能力升级,支持歌曲信息追问、搜索专业音乐知识等内容。用户将小爱同学大模型升级至最新版本后,可在手机、车载端体验。