理论

问同一个问题 DeepSeek-r1 / Grok-3 / Gemini 2.0 / ChatGPT 的结果出乎意料...

最近在写 TS ,希望实现一个类似 .gitignore 的功能,已有代码如下:复制在 JS 层面使用正则匹配,显然不是什么好方案。 于是整理代码和报错信息,找了四个免费的模型,问问思路。 先说结论:DeepSeek-r1 思考了 298 秒,我一度以为其陷入了死循环,但最后其在第一轮给出的方案,被 Grok-3 、 Gemini 2.0 、 ChatGPT 统统认可是最优方案之一。

以突破性创新加速推动AI赋能千行百业!第三届北京人工智能产业创新发展大会成功举办

第三届北京人工智能产业创新发展大会于2025年2月28日在国家会议中心二期成功举办。 大会持续聚焦人工智能前沿技术及从“算力”到“大模型”到“革命性快速发展”的人工智能产业发展特征,以“好用、易用、愿用—以突破性创新加速推动AI赋能千行百业”为主题,由北京市科学技术委员会、中关村科技园区管理委员会,北京市经济和信息化局,北京市广播电视局主办;北京市门头沟区人民政府、华为技术有限公司承办,共计5000余名行业大咖、业界精英、专家学者和企业代表受邀出席。 当前,北京人工智能产业创新发展大会已成为北京最具影响力的人工智能领域产业活动。

如何安全地使用第三方应用程序访问DeepSeek

译者 | 张哲刚审校 | 重楼AI编码助手改变了开发人员编写软件的方式。 它们可以自动执行重复性的任务,及早发现错误,进而加快开发进度。 但是,并不是所有的AI 编码工具在构建时都考虑到了安全性这个重要的问题。

一个半月内加速药物设计,浙大侯廷军团队提出深度先导化合物优化AI新方法

编辑 | 萝卜皮通过系统性改造来优化有前途的候选药物的化学结构,以提高药效和物理化学性质,这是药物发现过程中至关重要的一步。 与成熟的从头生成方案相比,专门针对先导化合物优化的计算方法仍未得到充分探索。 先前的模型通常仅限于解决特定的子任务,例如生成二维分子结构,而忽略了三维空间中至关重要的蛋白质-配体相互作用。

无需侵入,一键重构细胞「电活动」,AI革新药物心脏毒性评估

编辑丨&细胞内电生理学在神经科学、心脏病学和药理学中对于研究细胞的电特性至关重要。 纳米电极阵列 (NEA) 通过以高通量同时进行细胞内和细胞外动作电位 (iAP 和 eAP) 记录,提供了一种很有前途的替代方案。 虽然,使用 NEA 获取细胞内电位仍颇具具有挑战性,但美国斯坦福大学与加州大学的联合研究团队提出了一种 AI 支持的技术,该技术利用来自 NEA 上干细胞衍生心肌细胞的数千个同步 eAP 和 iAP 对。

OpenAI自爆:GPT-4.5 并非前沿模型!奥特曼称OpenAI的GPU已用光,还透露了一个“转型”思路?

编辑 | 伊风"GPT-4.5 并非前沿模型,但它是OpenAI最大的 LLM,比 GPT-4 的计算效率提高了 10 倍以上"。  图片这句话就这么水灵灵地出现在GPT-4.5官方给的System Card(系统卡)中。 ,竟然等来一句“不是前沿模型”这么让人失望的话。

DeepSeek太给力了!自家的大模型秘方开源到底!国产大模型雄起

出品 | 51CTO技术栈(微信号:blog51cto)DeepSeek “开源周”第五天,依旧保持了一如既往地“务实”风,满满的诚意。 先来回忆下前四天,源神的慷慨发布——第一天,2月24日,最为外界称道的MLA技术率先开源,这项解码加速器FlashMLA技术能够让英伟达Hopper架构GPU跑得更快,效果更好! 紧接着,25日,直接亮出首个面向MoE模型的开源专家并行通信库DeepEP,实现了MoE训练推理的全栈优化;第三天,则进一步祭出一项跨时代的发布:FP8通用矩阵乘法加速库,从底层让模型训练、微调变得更加流畅丝滑;第四天,也就是昨天的并行优化“三剑客”:DeepSeek-V3和R1 模型背后的并行计算优化技术——DualPipe(双向流水线并行算法,让计算和通信高效协同)、EPLB ( 专家并行负载均衡器,让每个 GPU 都“雨露均沾”)、profile-data (性能分析数据,可以理解成V3/R1 的并行优化的分析经验)可以说前四天的发布聚焦在算力通信、模型架构优化,也就是算力和算法的层面,而接下来第五天的开源则补上了AI三驾马车的最后一块,也是用户体验感知更为明显的一块优化动作:高性能分布式文件系统(数据存储层面的改进)。

DeepSeek开源周最后一天:让数据处理「从自行车升级到高铁」

DeepSeek 的开源周终于迎来了最后一天。 今天他们开源了一个名为 3FS(Fire-Flyer File System)的系统。 这是一种并行文件系统,它利用现代固态硬盘(SSD)和远程直接内存访问(RDMA)网络的全部带宽,能够加速和推动 DeepSeek 平台上所有数据访问操作。

81%的美国人对AI说“不”:科技圈的“打脸”时刻?

在科技巨头们纷纷砸下重金布局人工智能的时代,你有没有想过,那些身处职场的美国上班族们,到底有没有把AI用起来呢? 最近,皮尤研究中心的一项调查给出了答案:大多数美国人,其实还在AI的门外徘徊。 这项调查在2024年10月进行,涵盖了5273名美国在职成年人。

不同神经网络之间的区别,仅仅只是网络结构的不同,明白了这个你才能知道应该怎么学习神经网络

在学习神经网络技术的过程中,会有多种不同的神经网络架构;如常见的RNN,CNN等;因此,我们很多人都会被这些乱七八糟的神经网络架构给迷惑住,即想学习神经网络又不知道应该怎么入手;面对各种各样的网络模型,也不知道应该去学习哪种。 但是,我们从问题的最本质出发,不同的神经网络唯一的区别就是网络结构的不同;之所以有多种神经网络模型的原因就在于不同的网络架构能够完成不同的任务。 比如,RNN适合文本处理,机器翻译;CNN适合图像处理等。

DeepSeek 开源进度 5/5:高性能并行文件系统 3FS 实现聚合吞吐 6.6 TiB/s

2 月 28 日消息,DeepSeek 在开源周第五天发布了 3FS(Fire-Flyer File . System),这是一个专为充分利用现代 SSD 和 RDMA . 网络带宽而设计的并行文件系统,具备惊人的数据访问性能,为深度学习等数据密集型应用提供了强大的支持。

AI未来的机遇与潜力在哪?世界经济论坛联合埃森哲、毕马威发布权威报告

随着科技浪潮的奔涌向前,人工智能(AI)已从前沿概念深度融入社会经济的方方面面,成为推动产业变革与创新发展的核心力量。 在这样的时代背景下,世界经济论坛(WEF)联合埃森哲、毕马威发布报告,无疑为我们洞察 AI 未来的发展脉络提供了权威视角。 该报告汇聚了多方智慧,通过深入的行业调研、前沿的技术分析以及对全球趋势的精准把握,为我们全方位呈现 AI 在未来的机遇与潜力。

加速度计成本暴降1/400!哈工大首次突破精度、量程瓶颈|AAAI 2025 Oral

低成本加速度计凭借体积小、易集成、可穿戴及量产化优势,在工业自动化、医疗监测和消费电子等领域广泛应用,但其精度受限、噪声显著且量程范围狭窄的问题严重制约了高动态场景下的应用。 为此,哈尔滨工业大学的研究人员提出HEROS-GAN,首次通过生成式深度学习将低成本加速度计信号映射为高成本等效信号,突破其精度与量程瓶颈。 目前,论文已被顶会AAAI 2025接收为Oral,具有一定的理论价值和启发性。

语音合成也遵循Scaling Law,太乙真人“原声放送”讲解论文 | 港科大等开源

活久见,太乙真人给讲论文了噻! 咳咳,诸位道友且听我一番唠叨。 老道我闭关数日,所得一篇妙诀,便是此Llasa之法。

疯了!居然有人试图让我搞懂,什么是 DeepGEMM

DeepSeek开源周,继DeepEP之后,开源了第三弹DeepGEMM。 今天简单来说说:吃瓜:DeepGMEE是干嘛的? 技术:DeepGMEE是怎么做到的?

DeepSeek-R1自写CUDA内核跑分屠榜!斯坦福学霸狂飙GPU编程自动化挑战人类

近日,来自斯坦福和普林斯顿的研究者发现,DeepSeek-R1已经能生成自定义CUDA内核了,而且还在一众推理模型中,直接拿下了TOP 1! 紧随其后,OpenAI o1和Claude 3.5 Sonnet分别排第二和第三。 具体过程,就是给定一个PyTorch程序,让模型对其优化,然后生成一个包含自定义CUDA内核的PyTorch版本。

机器人8小时速成物流分拣员!Figure-02大规模上岗只用30天

好家伙! 机器人已入厂打工分拣快递,手法娴熟和人类一模一样。 前几天,Figure推出了端到端通用控制模型——Helix,能让机器人像人一样感知、理解和行动。

大模型训练或无需“纯净数据”!北大团队新研究:随机噪声影响有限,新方法让模型更抗噪

传统的大语言模型训练需要依赖”纯净数据”——那些经过仔细筛选、符合标准语法且逻辑严密的文本。 但如果这种严格的数据过滤,并不像我们想象中那般重要呢? 这就像教孩子学语言:传统观点认为他们应该只听语法完美的标准发音。