应用

CMU 具身智能风云榜:从传统到全面

作者 | 赖文昕编辑 | 陈彩娴与位于宇宙中心硅谷湾区的伯克利、斯坦福不同,被视为锈带区复兴唯一希望的卡内基梅隆大学(以下简称“CMU”)坐落在上世纪的工业重镇匹兹堡。 计算机科学学院的机器人研究所(以下简称“RI”)成立于1979年,是世界上第一个致力于机器人研究的大学级研究所。 这座机器人摇篮在 45 年间诞生了无数耀眼成就,但在如今技术更迭到由 AI 方向领衔、以仿真与强化学习算法方为“技术先进”之际,以传统机器人学见长的 CMU 能否跟上具身智能的热潮?

稀宇科技发布并开源新一代 MiniMax 01 系列模型,参数量达 4560 亿

该系列模型首次大规模实现线性注意力机制,打破 Transformer 传统架构记忆瓶颈,能够处理 400 万 token 的输入,可输入长度是 GPT-4o 的 32 倍,Claude-3.5-Sonnet 的 20 倍。

Kimi 多模态图片理解模型 API 发布,1M tokens 定价 12 元起

Vision 模型具备图像识别能力,能够识别出图像中的复杂细节和细微的差别,无论是食物还是动物,能够区分出相似但又不相同的对象。

领跑AI To C赛道 夸克品牌焕新“2亿人的AI全能助手”

1月15日,阿里智能信息事业群旗下夸克升级品牌Slogan—“2亿人的AI全能助手”,亮出加速探索AI To C应用的全新业务态势。 第三方数据显示,夸克用户规模持续保持高速增长,并领跑AI应用赛道,其中00后年轻用户占比超过一半。 00后AI应用第一站经过两年多的快速发展,国内AI大模型已经从比拼“模型参数”到解决“实际问题”。

刚刚,ChatGPT开始有了执行力!

现在 AI 智能体可以 24*7 小时为你打工。 2025 刚过去了半个月,OpenAI 在智能体领域「开大」了。 今天,OpenAI 正在为 ChatGPT 推出一项名为「Tasks」的新测试功能,该功能允许用户安排未来的行动和提醒事项。

会捡垃圾、能干家务,元萝卜“视觉+机械臂”技术扫地机器人应用首秀

在2025开年科技盛宴CES(国际消费电子展)上,AI机器人无疑成为全场焦点,而其中来自中国科技企业展示和发布的仿生多关节机械手技术在扫地机器人产品上的应用,更获得了全球媒体的高度关注。 通过将视觉感知与机械臂技术相结合,能够自主完成拾取垃圾入桶等任务,不仅展示了家用机器人发展的未来形态,也让大众看到了具身智能机器人融入家庭生活的广阔前景。 随着大模型技术和具身智能浪潮汹涌而至,家用机器人正迎来全新发展机遇,中国企业的创新力也愈发凸显。

快手可灵凭什么频繁刷屏?揭秘背后三项重要研究

“可灵(KLING)”,近半年来频繁亮相于国内外各大科技媒体,已然成为科技感与创意的代名词,它代表了快手 AI 团队在视频生成领域的前沿探索。 作为全球首个可公开体验的真实影像级视频生成大模型,可灵于 2024 年 6 月 6 日正式发布并上线。 在短短半年多的时间里,可灵已完成了数十次功能与效果的升级迭代,始终稳居全球视频生成领域的第一梯队,持续引领着行业效果的提升。

OpenAI o1 推理过程出现中文,专家解读 AI 可能只想用最高效的语言来思考

科技媒体 TechCrunch 昨日(1 月 14 日)发布博文,报道称 OpenAI 最新推理模型 o1 在推理过程中,会使用中文、波斯语等多种语言“思考”,引发了 AI 界的关注和猜测。

国内首个端到端语音同传:星火语音同传大模型发布,达到人类专家译员水平

官方演示了通过翻译机进行语音同声传译,可以看到一些专有词汇也能正常翻译。科大讯飞官方还透露,将在 2025 年发布更多翻译机新品。

讯飞星火 4.0 Turbo 底座升级:首发混域知识搜索技术,七大能力全面提升

讯飞星火 4.0 Turbo 在文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力、多模态能力等方面全面提升,并且图文识别能力迎来升级,倾斜少线表格也能够正常识别。

讯飞星火深度推理模型 X1 发布:唯一全国产算力训练,多项指标国内第一

科大讯飞发布国内首个基于全国产算力平台训练的具备深度思考和推理能力的大模型 —— 讯飞星火深度推理模型 X1。

多模态 AI 助力癌症治疗,更准确预测癌症复发概率,生存率等

Nature:斯坦福大学医学院设计的独特人工智能可以预测癌症预后和治疗反应 来自斯坦福医学院的科研团队研发了名为 MUSK 的 AI 模型,结合医学图像和文本数据,可以精准预测癌症患者的预后和治疗反应。 IT之家注:预后(英语:Prognosis)是一个医学名词,是指基于病人当前的状况,结合疾病的了解,例如临床表现、化验结果、影像学检查、病因、病理、病情规律等,以及治疗时机、方法和过程中出现的新情况,来推估治疗后的可能结果。 MUSK 模型的亮点在于,突破性地整合了视觉数据(如病理图像)和文本数据(如病历和临床记录),可以更全面理解患者病情。 MUSK 模型在庞大的非配对多模态数据集上进行预训练,极大地扩展了其学习范围,使其比传统AI模型更具适应性和定制化能力。 该模型通过 5000万张病理图像和超过10亿条医学文本训练,可以准确预测16种癌症类型的患者生存率和治疗反应。 MUSK模型能够分析包括患者人口统计学信息和病史在内数千个数据点,更准确地确定哪些疗法(例如免疫疗法)对个体患者最有效。 该团队表示相比传统方法,其预测生存率的准确性提高了11个百分点,达到75%;预测免疫治疗适用性的准确性从61%提升至77%;预测五年内黑色素瘤复发风险的准确性则提高了12 个百分点,达到83%。 来自斯坦福医学院的科研团队研发了名为 MUSK 的 AI 模型,结合医学图像和文本数据,可以精准预测癌症患者的预后和治疗反应。

全球首个人形机器人马拉松比赛拟于今年 4 月在北京亦庄举办

2025 年北京两会公布,今年北京市将举办世界人形机器人“一会一赛”。“一会”是指世界人形机器人运动会,“一赛”是指机器人半程马拉松比赛,前者拟于今年 8 月举办、后者拟于 4 月举行。

小米澎湃 OS 2「超级小爱」升级计划公布,覆盖超 25 款机型

小米公司官方今日发文宣布,澎湃 OS 2「超级小爱」已向正式版用户开放,其支持手势唤醒、智能理解屏幕内容等能力。

ChatGPT 变身 AI 私人助理:新 Tasks 定时播报全网热点、设置每日学习 / 健身计划

OpenAI 公司今天在 X 平台发布推文,宣布以测试版形式,为 ChatGPT 聊天机器人引入“Tasks”(任务)功能,支持用户设置提醒事项。

研究:训练数据含 0.001% 的错误信息足以“毒害”医学 AI 模型

纽约大学的一项研究揭示了大型语言模型(LLM)在医学信息训练中的潜在风险。研究表明,即使训练数据中仅含有 0.001% 的错误信息,也可能导致模型输出不准确的医学答案。

阿里妈妈推出商用级图生视频应用“淘宝星辰”,对淘宝天猫商家开放使用

用户输入一张静态图片和一段简短 prompt 描述,“淘宝星辰・图生视频”可基于对该图片的理解,生成 5 秒视频,官方号称生成的视频可达到电影级光影效果。

2025,大厂们的「大模型牌桌」战

随着大模型六小虎在AGI上的后撤第一枪被正式打响,中国大模型行业的分水岭快速露出水面、更加清晰。 初创公司在下一代超大规模模型竞争中的局限性开始被广泛关注,大厂「不下桌」的资本筹码变得更加明显。 无论是百度宣布2025年将推出下一代基座模型,还是阿里、字节在AI人才和资金上的继续投入,潮水退去,大模型在决胜战场的主导权还是来到了大厂手中。