AI
再谈什么是神经网络,透过现象看本质
面对着网络上各种各样关于神经网络的内容,很多想学习神经网络的人都无从下手,包括作者自己;面对各种乱七八糟的概念,名词,很多人都被这些东西蒙住了眼睛。 所以,今天我们就抛开各种高大上的概念,从本质出发来学习什么网络;我们今天不讨论CNN,RNN,Transformer,LSTM等各种神经网络架构;只讨论什么是神经网络。 神经网络对神经网络有过了解的人应该都知道,神经网络就是仿生学的一种实现,使用的是数学模型模拟人类的大脑神经系统;具体的可以看一下上一篇文章——从一个简单的神经网络模型开始。
DeepSeek公务员上岗!公务员铁饭碗不保?
图片2月18日,“AI公务员上岗”冲上热搜第一名,在深圳福田区率先推出基于DeepSeek开发的AI数字员工,首批70名上岗。 这一事件标志着智能体技术从实验室走向社会治理的第一线,开启人机协作的新纪元。 据介绍,福田这70名新员工可实现:公文格式修正准确率超 95%,审核时间缩短90%错误率控制在 5%以内;“执法文书生成助手”将执法笔录秒级生成执法文书初稿;民生诉求分拨准确率从70%提升至95%;“AI招商助手”企业分析筛选效率提升 30%……“幸福福田”官微显示,广东深圳福田区推出基于DeepSeek开发的AI数智员工,上线福田区政务大模型2.0版,除了有DeepSeek通用能力外,还结合各部门各单位实际业务流程,量身定制个性化智能体,首批满足240个业务场景使用。
从一个简单的神经网络模型开始
关于神经网络的文章写的也不少了,但一直没弄明白神经网络到底是怎么运作的;而现有的神经网络模型又太复杂,如Transformer,CNN,RNN,以及各种应用场景(NLP,CV,分类任务,回归任务等等);导致我们无法看到神经网络最本质的东西。 所以,今天我们就来从最简单的神经网络开始学起。 简单神经网络神经网络的基本原理很简单,那就是模仿由人类大脑神经元构成的神经网络;神经元结构如下图所示:上图是生物学中神经元的基本结构,神经元由树突和轴突以及细胞核组成;而不同神经元之间通过轴突进行连接;当然这些都是中学生物学的基础,就不多说了。
「诺奖风向标」2025斯隆奖公布,清华姚班大神霸榜!8位华人计算机科学家入选
2025斯隆研究奖,最新名单刚刚出炉! 今年,126位杰出的职业生涯早期科学家,荣获「诺奖风向标」斯隆研究奖。 这些学者凭借卓越的成就和巨大的发展潜力,成功跻身美国和加拿大新一代科学领军人物的行列。
李彦宏最新财报会议内容流出:百度从DeepSeek身上学到了一件事;调用量涨30倍百度AI搜索的打法;50亿股票回购回馈股东
编辑 | 言征出品 | 51CTO技术栈(微信号:blog51cto)开年,各大科技巨头都被DeepSeek狠狠冲击已经近三周。 本周将会迎来各大公司的2024的Q4财报会议。 百度率先公开了过去三个月取得的成绩。
中国高温超导新突破登Nature,薛其坤院士领衔,南方科大成果
中国高温超导,再迎新突破! 南方科技大学校长薛其坤院士领衔的团队,最新研究成果加急发表在了Nature。 不同于经典的铜或铁基超导,这项成果首次让镍基化合物突破了麦克米兰极限(40K)。
奥特曼押注惨败,爆火Ai Pin已死!ChatGPT版iPhone终结,惠普1.16亿美元接盘
谁也没想到,曾红极一时爆火硬件Ai Pin直接挂了! 刚刚,惠普以1.16亿美元收购了前苹果夫妻高管联手创办的AI初创Humane。 曾经,AI硬件这个领域被奥特曼寄予厚望,为此他大力投资了消费硬件初创Humane。
宇树机器人跳舞被疑AI合成,王兴兴发新视频自证,小红书:还是疑似AI合成
“这机器人绝对是AI或CG合成的! ”“这也太假了。 ”在一片质疑声之下,宇树科技CEO王兴兴在小红书上发了段自家机器人的最新视频:这段视频是宇树G1机器人的实拍,最大特点就是在机器人后边放了块大镜子。
一句话,满足两个广告商!谷歌最新「Token拍卖模型」,多LLM联合创作广告词
当多个LLM智能体共同创作内容时,它们会如何协调彼此的「话语权」? 想象一下,在广告投放中,A航空公司和B度假村都希望吸引用户的目光,但单独宣传各自的服务可能不如联合推广来得有吸引力。 那么,如何让AI智能体像人类一样展开博弈,在竞争与合作之间找到最佳平衡?
英伟达CEO老黄预言:未来,每个人都有自己的AI导师!
AI导师时代来临,学习门槛将大幅降低! 在近日接受《财富》杂志采访时,黄仁勋直言:「AI的迅猛发展正在彻底改变知识获取的方式。 」以往学习一门新技能或进入陌生领域,需要投入大量时间和精力,而AI导师的出现让这一切发生了翻天覆地的变化。
DeepSeek满血微调秘籍开源!站在巨人肩膀打造私有模型,一手教程在此
DeepSeek爆火甚至引发API低价内卷……但是别忘了开源模型的最大好处是提供了“巨人的肩膀”啊! 微调DeepSeek-V3/R1,低成本打造高质量私有模型、提高业务竞争力,或许才是当下行业内更迫切的需求。 就在刚刚,已收获近4万GitHub StarColossal-AI发布开源大模型后训练工具箱,它包含:DeepSeek-V3/R1满血671B LoRA低成本SFT微调;完整的强化学习工具链PPO、GRPO、DPO、SimPO等;无缝适配DeepSeek系列蒸馏模型在内的HuggingFace开源模型;兼容支持英伟达GPU、华为昇腾NPU等多种硬件;支持混合精度训练,gradient checkpoint等训练加速降低成本;灵活的训练配置接口,支持自定义奖励函数、损失函数等;提供灵活的并行策略配置接口,包括数据并行、模型并行、专家并行、ZeRO和Offload等,以适应不同硬件规模。
Spring Boot + DeepSeek:解锁 AI 开发新姿势
在当今数字化时代,人工智能(AI)技术正以前所未有的速度改变着我们的生活和工作方式。 作为开发者,我们一直在寻找更高效、更智能的方式来构建应用程序。 今天,我们要为大家介绍一个强大的组合:Spring Boot DeepSeek,这将为你的应用注入智能新动力,开启 AI 开发的新篇章。
2025年网络安全投资的六大关键考量:应对新威胁的智慧决策
尽管在2021年至2022年间,网络安全预算有所增长,但近几年的增长势头已明显放缓。 这意味着,网络安全领导者在采购决策时,必须更加审慎地考虑如何改善当前的安全和合规状况,以确保每一分投入都能带来实实在在的效益。 那么,如何在2025年优化企业的网络安全预算,以有效应对不断演变的威胁呢?领导层需要深入了解当前的网络安全格局,并明确哪些举措能够帮助他们恰当地缓解风险。
DeepSeek-V3深入解读!
上一篇文章对DeepSeek-R1进行了详细的介绍,今天来看看DeepSeek-R1的基座模型DeepSeek-V3。 项目地址::现有的开源模型在性能和训练成本之间往往难以达到理想的平衡。 一方面,为了提升模型性能,需要增加模型规模和训练数据量,这会导致训练成本急剧上升;另一方面,高效的训练和推理架构对于降低计算资源消耗至关重要。
豪掷20万块GPU训练Grok-3,马斯克“大力出奇迹”了吗?
当时间周一,埃隆·马斯克旗下的xAI公司正式发布了最新大模型Grok-3。 这次,马斯克不仅带来了性能更强的AI,还秀了一把“肌肉”——20万块GPU组成的超级计算集群。 这背后,到底是真正的技术突破,还是一场“大力出奇迹”的豪赌呢?
Meta首席AI科学家LeCun 的新研究:AI 仅需观看视频即可掌握物理规律
近日,Meta 的 AI 首席科学家 Yann LeCun 领导的一项研究揭示了人工智能如何通过观看视频来培养基本的物理学理解。 这项研究由 Meta FAIR、巴黎大学及 EHESS 的科学家们共同完成,显示出 AI 系统能够在没有预设规则的情况下,通过自我监督学习获得直观的物理知识。 研究团队采用了一种名为视频联合嵌入预测架构(V-JEPA)的新方法,与 OpenAI 的 Sora 等生成型 AI 模型相比,V-JEPA 的工作原理更接近人脑的信息处理方式。
OpenAI推出真实世界百万报酬AI编程能力测试基准:实测Claude 3.5 最强!
OpenAI 联合一众大佬发布了一项重磅研究,直接把目光瞄准了 真实世界的软件工程! 🔥 他们推出了一个全新的、价值百万美元的超硬核 benchmark —— SWE-Lancer! 具体是啥,我们来扒一扒划重点:什么是 SWE-Lancer?
Deepseek 这么厉害,普通人怎么用好它?
最近,Deepseek 的风头可谓是一时无两,相关消息一波接着一波。 它强大的能力让人惊叹不已,写代码、做翻译、生成文案……简直无所不能! 不少小伙伴跃跃欲试,却又担心自己不是程序员、不会写代码,用不好这么“高大上”的工具。