AI - AI在线

再谈什么是神经网络，透过现象看本质

面对着网络上各种各样关于神经网络的内容，很多想学习神经网络的人都无从下手，包括作者自己；面对各种乱七八糟的概念，名词，很多人都被这些东西蒙住了眼睛。所以，今天我们就抛开各种高大上的概念，从本质出发来学习什么网络；我们今天不讨论CNN，RNN，Transformer，LSTM等各种神经网络架构；只讨论什么是神经网络。神经网络对神经网络有过了解的人应该都知道，神经网络就是仿生学的一种实现，使用的是数学模型模拟人类的大脑神经系统；具体的可以看一下上一篇文章——从一个简单的神经网络模型开始。

DeepSeek公务员上岗！公务员铁饭碗不保？

图片2月18日，“AI公务员上岗”冲上热搜第一名，在深圳福田区率先推出基于DeepSeek开发的AI数字员工，首批70名上岗。这一事件标志着智能体技术从实验室走向社会治理的第一线，开启人机协作的新纪元。据介绍，福田这70名新员工可实现:公文格式修正准确率超 95%，审核时间缩短90%错误率控制在 5%以内;“执法文书生成助手”将执法笔录秒级生成执法文书初稿;民生诉求分拨准确率从70%提升至95%;“AI招商助手”企业分析筛选效率提升 30%……“幸福福田”官微显示，广东深圳福田区推出基于DeepSeek开发的AI数智员工，上线福田区政务大模型2.0版，除了有DeepSeek通用能力外，还结合各部门各单位实际业务流程，量身定制个性化智能体，首批满足240个业务场景使用。

从一个简单的神经网络模型开始

关于神经网络的文章写的也不少了，但一直没弄明白神经网络到底是怎么运作的；而现有的神经网络模型又太复杂，如Transformer，CNN，RNN，以及各种应用场景(NLP，CV，分类任务，回归任务等等)；导致我们无法看到神经网络最本质的东西。所以，今天我们就来从最简单的神经网络开始学起。简单神经网络神经网络的基本原理很简单，那就是模仿由人类大脑神经元构成的神经网络；神经元结构如下图所示：上图是生物学中神经元的基本结构，神经元由树突和轴突以及细胞核组成；而不同神经元之间通过轴突进行连接；当然这些都是中学生物学的基础，就不多说了。

「诺奖风向标」2025斯隆奖公布，清华姚班大神霸榜！8位华人计算机科学家入选

2025斯隆研究奖，最新名单刚刚出炉！今年，126位杰出的职业生涯早期科学家，荣获「诺奖风向标」斯隆研究奖。这些学者凭借卓越的成就和巨大的发展潜力，成功跻身美国和加拿大新一代科学领军人物的行列。

李彦宏最新财报会议内容流出：百度从DeepSeek身上学到了一件事；调用量涨30倍百度AI搜索的打法；50亿股票回购回馈股东

编辑 | 言征出品 | 51CTO技术栈（微信号：blog51cto）开年，各大科技巨头都被DeepSeek狠狠冲击已经近三周。本周将会迎来各大公司的2024的Q4财报会议。百度率先公开了过去三个月取得的成绩。

中国高温超导新突破登Nature，薛其坤院士领衔，南方科大成果

中国高温超导，再迎新突破！南方科技大学校长薛其坤院士领衔的团队，最新研究成果加急发表在了Nature。不同于经典的铜或铁基超导，这项成果首次让镍基化合物突破了麦克米兰极限（40K）。

奥特曼押注惨败，爆火Ai Pin已死！ChatGPT版iPhone终结，惠普1.16亿美元接盘

谁也没想到，曾红极一时爆火硬件Ai Pin直接挂了！刚刚，惠普以1.16亿美元收购了前苹果夫妻高管联手创办的AI初创Humane。曾经，AI硬件这个领域被奥特曼寄予厚望，为此他大力投资了消费硬件初创Humane。

宇树机器人跳舞被疑AI合成，王兴兴发新视频自证，小红书：还是疑似AI合成

“这机器人绝对是AI或CG合成的！ ”“这也太假了。 ”在一片质疑声之下，宇树科技CEO王兴兴在小红书上发了段自家机器人的最新视频：这段视频是宇树G1机器人的实拍，最大特点就是在机器人后边放了块大镜子。

一句话，满足两个广告商！谷歌最新「Token拍卖模型」，多LLM联合创作广告词

当多个LLM智能体共同创作内容时，它们会如何协调彼此的「话语权」？想象一下，在广告投放中，A航空公司和B度假村都希望吸引用户的目光，但单独宣传各自的服务可能不如联合推广来得有吸引力。那么，如何让AI智能体像人类一样展开博弈，在竞争与合作之间找到最佳平衡？

英伟达CEO老黄预言：未来，每个人都有自己的AI导师！

AI导师时代来临，学习门槛将大幅降低！在近日接受《财富》杂志采访时，黄仁勋直言：「AI的迅猛发展正在彻底改变知识获取的方式。」以往学习一门新技能或进入陌生领域，需要投入大量时间和精力，而AI导师的出现让这一切发生了翻天覆地的变化。

DeepSeek满血微调秘籍开源！站在巨人肩膀打造私有模型，一手教程在此

DeepSeek爆火甚至引发API低价内卷……但是别忘了开源模型的最大好处是提供了“巨人的肩膀”啊！微调DeepSeek-V3/R1，低成本打造高质量私有模型、提高业务竞争力，或许才是当下行业内更迫切的需求。就在刚刚，已收获近4万GitHub StarColossal-AI发布开源大模型后训练工具箱，它包含：DeepSeek-V3/R1满血671B LoRA低成本SFT微调；完整的强化学习工具链PPO、GRPO、DPO、SimPO等；无缝适配DeepSeek系列蒸馏模型在内的HuggingFace开源模型；兼容支持英伟达GPU、华为昇腾NPU等多种硬件；支持混合精度训练，gradient checkpoint等训练加速降低成本；灵活的训练配置接口，支持自定义奖励函数、损失函数等；提供灵活的并行策略配置接口，包括数据并行、模型并行、专家并行、ZeRO和Offload等，以适应不同硬件规模。