理论
DeepSeek一夜把百度干回20年前,网友:还有这好事?
没完了,刚刚接入DeepSeek的百度,又双叒叕搞事情了。 最新消息,“百度一下 你就知道”这条2005年开始伴随着中国用户度过了互联网黄金岁月的Slogan,回归了。 有意思的是,这种“炒冷饭”的行为在大厂中已经出现了人传人的现象。
企业RAG落地避坑指南:自主开发 vs 三大框架,核心配置与选型全解析
这个项目原是春节期间在老家给一个企业做 RAG 项目咨询的精简版本,使用 Gradio 构建 Web 界面供大家测试使用。 本是希望大家在这个基础上根据个人或者企业需求进行二次开发,但是在小红书、微信收到一些后台私信里,在集中咨询关于自行开发和现有主流 RAG 框架的区别。 所以,有了这篇。
多行业拥抱DeepSeek,全不顾它身上的“刺”
在数字化浪潮席卷全球的今天,技术革命的脚步正以指数级速率重构人类社会发展轨迹。 而DeepSeek的出现,毫无疑问重塑了商业世界的运行法则——从产业上游的芯片制造到终端消费者的移动支付,从医疗影像的毫厘级诊断到教育资源的跨时空共享,算法与数据的交织已然突破想象力的边界。 当下,众多产业正在与人工智能产生"化学反应",这种由技术创新引发的链式反应,正在三百六十度解构既有行业秩序,催生出"生产力跃迁2.0"时代的全新商业生态。
当AI更加理解人类语言可能预示提示工程终结
多年来,大型语言模型(LLM)的兴起要求用户学习一种新技能:提示工程。 为了得到人工智能有用的回应,人们不得不精心设计他们的查询问题,学习人工智能如何理解语言的细微差别。 但这种情况可能正在发生变化。
如何用AI预测性维护数据中心降低40%故障率
数据中心故障困境:传统维护的力不从心在数字化浪潮汹涌澎湃的当下,数据中心已然成为现代业务运营的中流砥柱。 从金融机构的在线交易处理,到电商平台的订单管理与物流追踪;从社交媒体的海量数据存储与实时交互,到医疗行业的患者信息管理与远程诊疗支持,数据中心支撑着各个领域的关键业务流程,其重要性不言而喻。 一旦数据中心出现故障,带来的后果将是灾难性的。
从零到一打造商用 AI Agent(智能体)
Hi,大家好,我叫秋水,当前专注于 AI 智能体和 AI 工作流自动化经常有朋友问我,如何打造一个商用 AI Agent(智能体)? 是选择 Coze? 还是 LangGraph ?
AI时代的头号安全威胁:机器身份
2025年以DeepSeek为代表的生成式AI技术迅猛发展,为企业带来了前所未有的创新机遇,也带来了新的安全风险。 其中,非人类身份(Non-Human Identities, NHI)——如API密钥、令牌、加密密钥和服务账户——已成为网络安全的重大盲点。 根据OWASP最新发布的《非人类身份十大风险》(NHI Top 10),NHI数量可能比人类身份多出10至50倍,是网络攻击的主要攻击面。
单提示生成「主体一致」图像,且无需训练!已斩获ICLR 2025 Spotlight
现在的AI画图工具,比如文图生成模型,已经能根据文字描述创作出高质量的图像了。 但是,当我们需要用模型来画故事,并且希望故事中的人物在不同场景下都保持一致时,这些模型就有点犯难了。 目前,为了解决人物不一致的问题,通常需要用海量数据进行额外训练,或者对模型本身进行比较复杂的修改。
不用GAN不用扩散,无需训练解锁AI生图新境界!判别模型成神秘第三极
判别模型与生成模型长期以来彼此独立,前者专注于分类和识别,后者用于数据生成。 最近一项名为「直接上升合成」(Direct Ascent Synthesis,DAS)的独立研究,颠覆了这一传统观念,揭示出判别模型中隐藏着令人惊叹的生成能力。 论文链接:。
8分钟,Grok 3破解美国本科生最难数赛题!马斯克要用100万GPU反超「星际之门」?
上周,马斯克发布了其号称「地表最强」的Grok 3模型。 一经发布便引爆全网,经过网友实测,发现其性能果然强悍! 物理学家Luis Batalha在x上表示,2025年的普特南竞赛上,即使是前500名的顶尖选手,也无人能完整攻克下面这道难题。
DeepSeek开源周“第一刀”砍向算力!重磅开源FlashMLA,挑战H800算力极限,网友直呼:极致的工程设计!
编辑 | 伊风出品 | 51CTO技术栈(微信号:blog51cto)上周五,DeepSeek刚刚预告了重磅开源周! 周一一早,DeepSeek就履行承诺,开源了针对 Hopper GPU 的高效 MLA 解码内核——FlashMLA! 图片根据DeepSeek介绍,FlashMLA内核针对变长序列进行了优化,是已投入生产的核心技术。
南大钱超团队攻克百亿晶体管难题,斩获EDA顶会2025最佳论文!AI学院本硕博生联手
据南京大学人工智能学院网站报道,南大LAMDA组钱超教授团队在DATE 2025发表的芯片设计优化论文「Timing-Driven Global Placement by Efficient Critical Path Extraction」获会议最佳论文奖。 电子设计自动化(Electronic Design Automation,EDA)是芯片设计的基石产业,被誉为「芯片之母」。 欧洲设计自动化与测试会议(Design, Automation and Test in Europe Conference,DATE)是EDA领域的顶级国际学术会议。
从理论到实践:学会如何商用 DeepSeek,收藏这一篇就够了
Hi,大家好,我叫秋水,当前专注于 AI Agent 和 AI 工作流自动化。 近期 DeepSeek,全球闻名,大家纷纷在讨论,我看过很多文章和视频,很多说的有点夸张,23 年 AI 刚来的那些内容,又重新说了一遍,只是把 AI 两个字母换成了 DeepSeek。 在我看来,DeepSeek 出圈的主要原因是能力强、价格低、开源、可以本地部署,这个好处在于企业在 AI 方面的应用会加速落地,我们国内的用户不需要那么麻烦的出海使用 ChatGPT 了。
浏览器智能体崛起:Convergence Proxy为何会碾压OpenAI Operator?
一股新的AI浏览器智能体浪潮正改变企业与网络的互动。 一股新的AI驱动的浏览器智能体浪潮正在兴起,有望改变企业与网络的互动方式。 这些智能体能够自主浏览网站、检索信息,甚至完成交易——但早期测试显示,其承诺的性能与实际表现之间存在显著差距。
DeepSeek开源放大招:FlashMLA让H800算力狂飙!曝光低成本秘笈
就在刚刚,DeepSeek放出了开源周首日的重磅炸弹——FlashMLA。 这是DeepSeek专为英伟达Hopper GPU打造的高效MLA解码内核,特别针对变长序列进行了优化,目前已正式投产使用。 经实测,FlashMLA在H800 SXM5平台上(CUDA 12.6),在内存受限配置下可达最高3000GB/s,在计算受限配置下可达峰值580 TFLOPS。
“源神”DeepSeek!突破H800性能上限,FlashMLA重磅开源,算力成本还能降
DeepSeek开源周第一天,降本大法公开——FlashMLA,直接突破H800计算上限。 网友:这怎么可能? ?
魔发奇缘,3D发型生成新突破!TANGLED:可用任意样式和视点的图像生成 3D 发束
在数字时代,发型不仅是时尚的标志,更是个人文化身份的彰显。 但传统3D发型生成技术往往难以捕捉复杂发型的细腻之美。 为此,上海科技大学和华中科技大学推出了ANGLED技术,能从任意风格、视角的图像中,轻松生成逼真3D发型。
ChatGPT 写 C# 代码翻车现场:这五个坑只有老司机才懂
在AI技术飞速发展的当下,像ChatGPT这样的AI编程工具给开发者带来了便利,输入需求就能快速生成代码。 但它并非完美无缺,在生成C#代码时,会出现不少问题,一些隐患只有经验丰富的老程序员才能洞察。 接下来,就让我们一起看看那些容易翻车的场景。