AI
推理模型爆火,阿里国际站拿出了第一个产业应用:做外贸
过去一个多月DeepSeek、通义千问的Qwen等模型的推理能力大幅升级,AI彻底破圈,各种消息层出不穷,但对商家来说,最好的消息可能还是这个:2月28日,阿里国际宣布旗下面向全球B2B买家的首个AI搜索引擎Accio接入DeepSeek等最先进的推理模型,正式上线深度研究、商业探索等功能。 而此前,阿里国际站为中国外贸商家推出的AI工具“生意助手”也已全面接入推理模型。 简单来说,就是阿里国际站已经在让最先进的AI推理模型,帮商家做外贸了。
Ideogram 2a 图像模型正式上线:速度更快、成本更低,AI 图像生成迎来新突破
加拿大 AI 图像生成公司 Ideogram 今日宣布,其全新图像模型 Ideogram2a 正式上线,并已在 Ideogram 官网、API 以及合作伙伴平台全面开放使用。 这一发布迅速在 X 平台引发热议,被视为 AI 文生图领域的一次重要升级。 Ideogram2a 以更快的生成速度、更低的成本以及优化的图形设计和摄影能力,吸引了全球创作者和开发者的目光。
荣耀与阿里在AI领域展开合作 千问、万相等已接入YOYO智能体
荣耀公司宣布,与阿里在人工智能领域达成合作,为全球用户提供更为智能化的服务。 通过此次合作,多个先进的 AI 模型,如千问(Qwen)和万相(Wan)等,已经接入荣耀的 YOYO 智能体。 用户可以通过 Magic7系列手机等终端,体验到更加丰富和智能的 AI 功能。
DeepSeek太给力了!自家的大模型秘方开源到底!国产大模型雄起
出品 | 51CTO技术栈(微信号:blog51cto)DeepSeek “开源周”第五天,依旧保持了一如既往地“务实”风,满满的诚意。 先来回忆下前四天,源神的慷慨发布——第一天,2月24日,最为外界称道的MLA技术率先开源,这项解码加速器FlashMLA技术能够让英伟达Hopper架构GPU跑得更快,效果更好! 紧接着,25日,直接亮出首个面向MoE模型的开源专家并行通信库DeepEP,实现了MoE训练推理的全栈优化;第三天,则进一步祭出一项跨时代的发布:FP8通用矩阵乘法加速库,从底层让模型训练、微调变得更加流畅丝滑;第四天,也就是昨天的并行优化“三剑客”:DeepSeek-V3和R1 模型背后的并行计算优化技术——DualPipe(双向流水线并行算法,让计算和通信高效协同)、EPLB ( 专家并行负载均衡器,让每个 GPU 都“雨露均沾”)、profile-data (性能分析数据,可以理解成V3/R1 的并行优化的分析经验)可以说前四天的发布聚焦在算力通信、模型架构优化,也就是算力和算法的层面,而接下来第五天的开源则补上了AI三驾马车的最后一块,也是用户体验感知更为明显的一块优化动作:高性能分布式文件系统(数据存储层面的改进)。
戴尔预测2026财年利润率下降,受AI服务器成本上涨影响
在竞争激烈的市场环境中,戴尔公司(Dell)于本周四发布了2026财年的业绩展望,预计其调整后的毛利率将出现下降。 这主要是由于用于生产人工智能(AI)服务器的成本上升所致。 此外,戴尔的个人电脑业务在需求疲软的背景下也表现不佳。
华为AI助手小艺网页版上线 支持问答、写作、编程等
今日,华为小艺家族再添新成员,继原生鸿蒙版小艺App上架后,华为小艺网页版也正式迎来了上架。 华为小艺网页版(网址:)是一款功能全面的人工智能在线服务平台。 用户只需通过网页浏览器即可轻松访问并使用其多样化的功能,包括但不限于小艺问答、小艺识图、小艺阅读、小艺翻译以及小艺写作等。
在线杂货巨头Ocado裁员500人 用 AI 技术降低成本
在线杂货巨头Ocado近日宣布,将在其技术和财务部门裁减500个职位,这是该公司为降低运营成本而采取的措施。 作为一家在财务上亏损的公司,Ocado正在利用人工智能(AI)技术来提升工程团队的生产力,以应对财务压力。 Ocado目前的员工总数约为2万人,去年的裁员人数已经达到1000人。
DeepSeek开源周最后一天:让数据处理「从自行车升级到高铁」
DeepSeek 的开源周终于迎来了最后一天。 今天他们开源了一个名为 3FS(Fire-Flyer File System)的系统。 这是一种并行文件系统,它利用现代固态硬盘(SSD)和远程直接内存访问(RDMA)网络的全部带宽,能够加速和推动 DeepSeek 平台上所有数据访问操作。
Meta计划推出独立AI聊天机器人应用,力图拓展用户基础
Meta近日宣布,计划推出一款专门的 AI 聊天机器人独立应用。 这一消息源于 CNBC 的报道,The Verge 也对此进行了确认。 据悉,这款独立应用预计将在今年第二季度上线,成为 AI 应用市场上又一新成员,加入 OpenAI 的 ChatGPT、谷歌的 Gemini 以及微软的 C opilot 等竞争者的行列。
不同神经网络之间的区别,仅仅只是网络结构的不同,明白了这个你才能知道应该怎么学习神经网络
在学习神经网络技术的过程中,会有多种不同的神经网络架构;如常见的RNN,CNN等;因此,我们很多人都会被这些乱七八糟的神经网络架构给迷惑住,即想学习神经网络又不知道应该怎么入手;面对各种各样的网络模型,也不知道应该去学习哪种。 但是,我们从问题的最本质出发,不同的神经网络唯一的区别就是网络结构的不同;之所以有多种神经网络模型的原因就在于不同的网络架构能够完成不同的任务。 比如,RNN适合文本处理,机器翻译;CNN适合图像处理等。
DeepSeek 开源进度 5/5:高性能并行文件系统 3FS 实现聚合吞吐 6.6 TiB/s
2 月 28 日消息,DeepSeek 在开源周第五天发布了 3FS(Fire-Flyer File . System),这是一个专为充分利用现代 SSD 和 RDMA . 网络带宽而设计的并行文件系统,具备惊人的数据访问性能,为深度学习等数据密集型应用提供了强大的支持。
AI未来的机遇与潜力在哪?世界经济论坛联合埃森哲、毕马威发布权威报告
随着科技浪潮的奔涌向前,人工智能(AI)已从前沿概念深度融入社会经济的方方面面,成为推动产业变革与创新发展的核心力量。 在这样的时代背景下,世界经济论坛(WEF)联合埃森哲、毕马威发布报告,无疑为我们洞察 AI 未来的发展脉络提供了权威视角。 该报告汇聚了多方智慧,通过深入的行业调研、前沿的技术分析以及对全球趋势的精准把握,为我们全方位呈现 AI 在未来的机遇与潜力。
加速度计成本暴降1/400!哈工大首次突破精度、量程瓶颈|AAAI 2025 Oral
低成本加速度计凭借体积小、易集成、可穿戴及量产化优势,在工业自动化、医疗监测和消费电子等领域广泛应用,但其精度受限、噪声显著且量程范围狭窄的问题严重制约了高动态场景下的应用。 为此,哈尔滨工业大学的研究人员提出HEROS-GAN,首次通过生成式深度学习将低成本加速度计信号映射为高成本等效信号,突破其精度与量程瓶颈。 目前,论文已被顶会AAAI 2025接收为Oral,具有一定的理论价值和启发性。
语音合成也遵循Scaling Law,太乙真人“原声放送”讲解论文 | 港科大等开源
活久见,太乙真人给讲论文了噻! 咳咳,诸位道友且听我一番唠叨。 老道我闭关数日,所得一篇妙诀,便是此Llasa之法。
疯了!居然有人试图让我搞懂,什么是 DeepGEMM
DeepSeek开源周,继DeepEP之后,开源了第三弹DeepGEMM。 今天简单来说说:吃瓜:DeepGMEE是干嘛的? 技术:DeepGMEE是怎么做到的?
DeepSeek-R1自写CUDA内核跑分屠榜!斯坦福学霸狂飙GPU编程自动化挑战人类
近日,来自斯坦福和普林斯顿的研究者发现,DeepSeek-R1已经能生成自定义CUDA内核了,而且还在一众推理模型中,直接拿下了TOP 1! 紧随其后,OpenAI o1和Claude 3.5 Sonnet分别排第二和第三。 具体过程,就是给定一个PyTorch程序,让模型对其优化,然后生成一个包含自定义CUDA内核的PyTorch版本。
Grok 3疯狂实测,满屏都是马斯克!3D乒乓球破屏,火星殖民实时播报
各位坐稳了,AI的世界开始变得疯狂起来了! 自从上周马斯克发布Grok 3以来,其热度一直不减。 它可不仅仅是另一个聊天机器人,这家伙正在扭曲现实!
DeepSeek“出圈”了,鹅厂人怎么看?
话题背景在人工智能领域,大型语言模型的快速发展引发了无数关于技术革新和未来趋势的讨论。 随着各类AI技术的不断突破,越来越多的创新模型开始崭露头角,而最近备受关注的DeepSeek更是成为了热议的焦点。 它被一些人称为“AI技术的重大突破”,甚至被认为是下一代人工智能发展的重要方向。