AI

前OpenAI CTO 成立思维机器实验室

前OpenAI首席技术官Mira Murati宣布成立新的思维机器实验室(Thinking Machines Lab)。 主要有三个方向:帮助人们调整AI系统以满足他们的具体需求;开发坚实的基础以构建更强大的AI系统;培养开放科学的文化,帮助整个领域理解和改进这些系统。 以下是Thinking Machines Lab的官网介绍:思维机器实验室(Thinking Machines Lab)是一家人工智能研究与产品公司。

​GitLab 再遭投资者诉讼,因 AI 虚假宣传与涨价引发争议

近期,GitLab 及其高管再次面临投资者诉讼,原因是涉嫌对公司的人工智能(AI)能力和市场需求进行虚假宣传。 这是五个月内第三起针对 GitLab 的诉讼,起初的证券投资者诉讼于2024年9月9日提出,随后在2025年2月5日进行了修正,详细说明了更多内容。 紧接着,分别于2025年2月14日和2月19日,提起了两起衍生诉讼。

两万字长文深度解密DeepSeek-R1、Kimi 1.5,强推理模型凭什么火出圈?

刚刚过去的春节,DeepSeek-R1 推理大模型引爆了国内外 AI 社区,并火出了圈。 最近,各个行业又掀起了接入 DeepSeek 的狂潮,大家唯恐落后于人。 北大 AI 对齐团队对包括 DeepSeek-R1、Kimi-K1.5在内的一些强推理模型进行了 2 万字的技术解读,也是此前 o1 解读(北大对齐团队独家解读:OpenAI o1开启「后训练」时代强化学习新范式)的续作。

深推理模型崛起!Together AI融资3.05亿美元助推GPU需求

在 AI 行业,Together AI 最近宣布完成了一轮3.05亿美元的 B 轮融资,这一消息引起了广泛关注。 该公司的崛起与其新推出的深度理模型 DeepSeek-R1密切相关。 与最初的担忧相反,许行业专家认为,深度推理的进步并没有降低对基础设施的需求,反而在不断提升这一需求。

剧本自动生成3D动画!北航中大等提出新方法,破解多人交互难题 | ICLR 2025

设定一个3D场景,你便可以用文字编织你的剧情。 一句话,就能让两个人激烈争吵。 吵完之后,又温馨共舞起来~想怎么排就怎么排,就像影视拍摄或舞台剧的编排一样,只需在剧本中设定角色的行动、互动和环境要素,就能自动生成符合逻辑的3D角色动画,让你的剧情真正“动”起来。

想要提升 DeepSeek 回复质量,会这一招就够了(90%的人不知道)

今天继续介绍deepseek核心技术:反事实推理。 上一篇简要回顾:反事实推理,是一种通过构建与事实相反的假设性情景,探索因果关系和潜在结果的逻辑推理方法;反事实推理,有着严密的数学模型,属于因果推断第三层次:关联,干预,反事实;反事实推理,能帮deepseek突破数据量上限,加强结果解释性,提升回复丰富度;画外音:详见《deepseek凭啥能给出这么丰富的答案 - 反事实推理(上)》。 反事实推理,对我们写提示词,获取更佳的回答质量有什么启示呢?

谷歌豪华阵容打造AI科学家,用测试时间计算加速科学发现,CEO皮猜也来站台了

CEO皮猜亲自站台,谷歌的最新研究狠狠火了——为科学家群体推出“科研搭子”AI co-scientist,一个能够利用高级推理综合大量文献、生成新颖假设,并提出详细研究计划的多智能体AI系统。 划重点,该系统将与OpenAI o1/DeepSeek-R1相似的测试时间计算用来加速科学发现。 据皮猜介绍,这个系统已经在肝脏纤维化治疗、抗菌耐药性和药物再利用等重要研究领域取得了初步成果。

比尔盖茨自述:中学时期就开始偷偷996写代码

57年前的西雅图冬夜,一个瘦削少年翻出卧室窗户,奔向名为“C的立方”的计算机实验室。 比尔·盖茨不会想到,这段在寒夜中追逐代码的岁月,正悄然叩响数字时代的大门。 当湖滨中学的编程少年们以无偿劳动换取珍贵的上机时间时,一场改变人类文明进程的变革已在晶体管与二进制中孕育——在这个数字时代的黎明,一群年轻的先驱者站在了浪潮之巅,他们以智慧和勇气,开辟了一个全新的领域:个人计算机软件。

世界首个「AI CUDA工程师」诞生!AI自己写代码优化CUDA内核,性能狂飙100倍

就在刚刚,由Transformer八大金刚之一Llion Jones创办的Sakana AI,推出了世界上首个「AI CUDA工程师」——The AI CUDA Engineer。 同时,还发布了一个由「AI CUDA工程师」生成的,包含17,000多个已验证CUDA内核的数据集。 论文地址::「AI科学家」之后,一个疑问一直萦绕在团队心头:如果可以使用AI来进行AI研究,是不是也能用AI来研究如何让AI运行得更快?

复旦视频扩散模型综述:覆盖300+文献,探讨近期研究趋势与突破,Github揽星2k+

视频扩散模型新综述来了,覆盖300 文献的那种。 最近,复旦大学、上海市智能视觉计算协同创新中心联合微软等学术机构,在国际顶级期刊《ACM Computing Surveys》(CSUR)上发表了题为《A Survey on Video Diffusion Models》的综述论文。 不仅系统地梳理了扩散模型在视频生成、编辑及理解等前沿领域的进展,还深入探讨了近期的研究趋势与突破,涵盖了该领域近年来的重要成果。

微软Muse秒生游戏登Nature,10亿级画面练出最强AI!千亿游戏市场重洗牌

同一天,微软放出两个核弹,首个拓扑量子芯片,还有首个世界与人类行动模型。 AI离数秒生成游戏视频的未来,又近了一步。 今天,微软团队首次引入了「世界与人类行动模型」(WHAM),并冠以希腊艺术女神「缪斯」(Muse)之名。

企业为何纷纷转向小AI模型?

当科技巨头们还在比拼千亿参数时,一场静悄悄的AI效率革命正在改写商业规则,从医疗诊断到零售库存管理,企业开始用“小模型”解决“大问题”。 大型语言模型因其多功能性、广泛的领域知识和解决复杂多步骤问题的能力而广受欢迎。 相比之下,小型模型为企业提供了一种资源消耗更少的方式,能够利用定制化的专业知识完成特定任务。

全球首家!联想将率先在AIPC端侧本地部署DeepSeek大模型

2025年2月20日,联想集团公布截至2024年12月31日的第三财季业绩,其中营收1351亿人民币,同比增长20%;净利润49.8亿人民币,同比增长达106%。 在公布业绩的同时,联想集团宣布,将在AI PC端侧本地部署DeepSeek大模型,这将成为全球首家端侧部署该大模型的AI PC品牌。 小天个人智能体已全面接入DeepSeek-R1联网满血版大模型此前,联想旗下联想天禧个人智能体系统(天禧AS)中的小天个人智能体已全面接入DeepSeek-R1联网满血版大模型。

钉钉AI企业搜索面向所有用户免费开放

2 月 20 日,钉钉宣布其 AI 企业搜索向所有用户免费开放,同时新增支持慢思考模式和全网搜索,支持移动端、桌面端 7.6.45 及以上钉钉版本。 自钉钉 365 会员权益上线以来,钉钉 AI 企业搜索已经帮助了大量个人用户构建动态的知识网络。 它借助通义大模型的理解、推理和生成能力,可实现自然语言查询信息,并对钉钉内的用户自有信息、企业知识进行整理与提炼,搜索效率较传统搜索方式提升 300%。

小红书等给AI图像检测上难度!数据集均通过人类感知“图灵测试” | ICLR 2025

量:图像分辨率从720P到4K不等,提供了更高质量的图像数据,增加了检测模型的挑战性。 AIDE模型:多专家融合的检测框架在AI生成图像检测领域,现有的检测方法往往只能从单一角度进行分析,难以全面捕捉AI生成图像与真实图像之间的细微差异。 为了解决这一问题,研究者们提出了简单且有效的AIDE(AI-generated Image DEtector with Hybrid Features)模型,该模型通过融合多种专家模块,从低级像素统计和高级语义两个层面全面捕捉图像特征,实现了对AI生成图像的精准检测。

法国核聚变重大突破,等离子体运行1337秒刷新世界纪录!全球核电时代一步之遥

创纪录的1,337秒! 2月12日,法国WEST托卡马克装置,成功实现了创纪录的等离子体持续时间——超过22分钟。 这比几周前中国EAST装置的1066秒提升了25%。

突发,Grok-3免费上线!答对9.11和9.9谁大,1分攻克MIT积分难题

世界首个20万块GPU(另有说法是10万)训出的Grok-3,官宣人人可用了! DeepSearch、Think两大模式,同时上线。 唯独遗憾的是,Big Brain还在雪藏。

Nature认证DeepSeek成科研工具全能者,国内高校如何借力大模型?

DeepSeek的风,也是飘到了科研领域——最新消息,同济大学通过百度智能云千帆大模型平台接入并调用DeepSeek-R1/V3系列模型;包括浙大、北大清华等知名高校也是纷纷出动,要么接入模型推出智能体,又或者出品干货课程、使用手册《从入门到精通》等等,几度都登上热搜。 Nature更是几度发文,因为DeepSeek开源低成本易部署等优势,科学家们纷纷涌向DeepSeek,这种模型已经是科研AI工具中的全能者。 感知到的是,大模型在科研探索中发挥的价值远比以往任何时候都深入。