网络

强化学习也涌现？自监督RL扩展到1000层网络，机器人任务提升50倍

虽然大多数强化学习（RL）方法都在使用浅层多层感知器（MLP），但普林斯顿大学和华沙理工的新研究表明，将对比 RL（CRL）扩展到 1000 层可以显著提高性能，在各种机器人任务中，性能可以提高最多 50 倍。论文标题：1000 Layer Networks for Self-Supervised RL: Scaling Depth Can Enable New Goal-Reaching Capabilities论文链接：链接：，强化学习的重要性因为 DeepSeek R1 等研究再次凸显出来，该方法通过试错让智能体学会在复杂环境中完成任务。尽管自监督学习近年在语言和视觉领域取得了显著突破，但 RL 领域的进展相对滞后。

3/22/2025 9:01:00 PM

机器之心

终于把卷积神经网络算法搞懂了！！！

大家好，我是小寒今天给大家分享一个强大的算法模型，卷积神经网络算法卷积神经网络算法（CNN）是一种专门用于处理具有网格结构数据（如图像）的深度学习模型，广泛应用于图像分类、目标检测、语义分割等任务。 CNN 的核心思想是通过模拟生物视觉皮层处理视觉信息的方式，能够自动从图像中提取特征，从而进行分类、检测等任务。卷积神经网络的基本组成CNN 主要包括卷积层、池化层和全连接层。

2/21/2025 8:29:07 AM

程序员小寒

Transformer 的三大优化技术！！

Transformer 是一种基于自注意力（Self-Attention）机制的深度学习模型，最早由 Vaswani 等人在 2017 年的论文《Attention Is All You Need》中提出。与传统的循环神经网络（RNN）和长短期记忆网络（LSTM）不同，Transformer 丢弃了递归计算结构，而是通过自注意力机制并行处理输入序列，从而大大提高了计算效率。 Transformer 广泛用于自然语言处理（NLP）和计算机视觉（CV）领域，如机器翻译、文本生成、文本分类、目标检测等。

2/20/2025 12:28:59 AM

程序员小寒

DeepSeek本地部署教程，小白也能搞定！

安装环境操作系统：Windows 10及以上准备工具：轻量级AI模型调用工具Ollama，调用AI模型为deepseek-r1AI 模型管理工具Cherry-Studio或AnythingLLM（二选一）资源链接：复制安装步骤第一步、下载安装Ollama并修改环境变量要运行大模型，首先需要一个好用的工具，推荐使用 Ollama ，它是一个轻量级的工具，支持快速安装和运行大语言模型（如deepseek、Llama、Qwen 等）。 ollama下载地址：官网链接（文章开头）选择合适的操作系统下载，默认安装完成即可。这里注意，ollama安装完成后先不要启用，因为它默认是会将模型下载到C盘的，deepseek、Qwen等模型最小也有好几个GB会占用C盘空间，所以需要先设置ollama的环境变量。

2/10/2025 11:11:47 AM

小云君网络

人工智能生成的攻击对云的影响较小

过去几年，人们非常关注人工智能 (AI) 技术的发展状况及其对网络安全的影响。在许多行业中，与人工智能攻击相关的风险仍然存在且令人担忧，尤其是全球平均数据泄露成本比去年增加了 10% 。然而，根据 IBM X-Force 团队发布的最新《云威胁形势报告》，针对云计算环境的人工智能攻击的近期威胁实际上相对较低。

12/25/2024 9:30:02 AM

铸盾安全

终于把图神经网络算法搞懂了！！！

今天给大家分享一个强大的算法模型，GNN。图神经网络（GNN）是一类专门处理图结构数据的深度学习模型。在传统的深度学习中，输入数据通常是结构化的（如图像、文本、时间序列等），这些数据都可以表示为一个规则的网格或序列。

12/12/2024 12:29:03 AM

程序员小寒

视觉开源 AI 推理库 YOLOv11 遭供应链投毒：模型训练成挖矿，官方已撤回问题版本

科技媒体 techtarget 昨日（12 月 6 日）发布博文，报道称 Ultralytics 公司的 YOLOv11 AI 模型遭遇供应链攻击，v8.3.41 和 v8.3.42 两个版本被植入加密挖矿软件。

12/7/2024 10:24:47 AM

故渊

华为发布星河 AI 自动驾驶网络解决方案：业界首个 L4 自动驾驶网络

在华为全联接大会 2024“星河 AI 自动驾驶网络”论坛上，华为发布了业界首个 L4 自动驾驶网络 —— 星河 AI 自动驾驶网络解决方案。▲ 图源华为华为数据通信产品线 NCE 数据通信领域总裁王辉在演讲中表示，该方案包括智能网元、数字孪生和智慧大脑三层架构，以集成百亿语料通信大模型、云图算法仿真等底层根能力，打造风险自识别、故障自闭环、变更自验证的 L4 自动驾驶网络，为金融、高校等多个行业打造了 AI 值守的运维专家。AI在线附三层架构如下：智能网元：毫秒级感知业务、流量、应用等全量数据，为整网智能化提供数

9/24/2024 8:30:43 PM

沛霖（实习）

华为发布星河 AI 电力网络，覆盖“发、输、变、配、调”等场景

8 月 15 日，2024 电力信息通信新技术大会在北京召开。会上，华为数据通信产品线能源行业解决方案总监杨新峰发表“华为星河 AI 电力网络，构筑电力智能化发展的通信基座”主题演讲，发布华为星河 AI 电力网络。据杨新峰介绍，华为星河 AI 电力网络解决方案包含 7 大子方案，覆盖“发、输、变、配、调”等电力场景，AI在线汇总信息如下：1、星河 AI 数据中心网络：NSLB 算法实现全网负载均衡，网络吞吐量提升至 95%。独家 iReliable 三级极速切换。网络数字地图打造超智运维，故障分钟级定位。2、智能

8/16/2024 10:36:57 AM

汪淼

Meta 构建分布式 RoCEv2 网络：探索串联数万片 GPU，训练千亿参数级 AI 模型

Meta 公司于 8 月 5 日发布博文，表示为了满足大规模分布式 AI 训练对网络的需求，构建了基于 RoCEv2 协议的大规模 AI 网络。RoCEv2 的全称是 RDMA Over Converged Ethernet version 2，是一种节点间通信传输方式，用于大部分人工智能容量。Meta 公司已成功扩展了 RoCE 网络，从原型发展到部署了众多集群，每个集群可容纳数千个 GPU。这些 RoCE 集群支持广泛的生产型分布式 GPU 训练工作，包括排名、内容推荐、内容理解、自然语言处理和 GenAI 模

8/7/2024 7:35:32 AM

故渊

中共中央：建立人工智能安全监管制度

新华社受权发布《中共中央关于进一步全面深化改革推进中国式现代化的决定》。图源 Pixabay其中提到，要健全网络综合治理体系。深化网络管理体制改革，整合网络内容建设和管理职能，推进新闻宣传和网络舆论一体化管理。完善生成式人工智能发展和管理机制。加强网络空间法治建设，健全网络生态治理长效机制，健全未成年人网络保护工作体系。要加强网络安全体制建设，建立人工智能安全监管制度。其中提到，深化人才发展体制机制改革。实施更加积极、更加开放、更加有效的人才政策，完善人才自主培养机制，加快建设国家高水平人才高地和吸引集聚人才平台。

7/21/2024 5:37:52 PM

远洋

使用 AI 批量造谣，一水军团伙控制 114 个账号炒作谣言获利被端

综合央视新闻、上海广播电视台《案件聚焦》消息，日前，上海市网信办公布 2023“清朗浦江”网络生态治理专项行动典型案例。其中包括“上海 4 岁儿童走失”事件中，网上出现“儿童非其父亲生”“今年已经是第二次走失”等谣言。据报道，去年国庆长假期间，“4 岁女童在上海南汇新城海滩走失”事件引发全网关注。在此期间，“走失女童曾被丢弃”“走失女童父亲为继父”等类型的言论频频引发网友热议，一些网络账号甚至炮制阴谋论，引发人身攻击。经核查，这些信息均为谣言。事件发生后，浦东警方迅速发布警情通报，通报了事件进展和调查情况，并发布辟

5/15/2024 9:58:03 PM

清源

李玟母亲声明：AI 侵权内容 7 日内必须下架，维护逝者尊严

3 月 28 日，已故知名歌手李玟的母亲委托广东梦海律师事务所就部分网络用户制作、传播“AI 复活李玟”相关短视频事宜，公开发布了一则律师声明。该声明称，根据已掌握的证据资料显示，近期部分网络用户未经李玟女士近亲属同意，利用李玟肖像制作、发布“AI 复活李玟”系列短视频，以温情之名非法牟利，借机售卖 AI 服务、恶意转评引流推广个人业务。此类视频的广泛传播已经对李玟母亲及其家人的工作和生活造成了严重干扰，同时也给本就深陷痛苦的李玟母亲及家人带来了巨大的心理冲击和二次伤害。IT之家附声明主要内容：严正警告涉嫌侵权责任

3/31/2024 11:19:05 AM

浩渺

13层网络拿下83%精度，华为诺亚新型神经网络架构VanillaNet「简约」到极致

深度学习模型架构越复杂越好吗？

5/27/2023 12:10:00 PM

机器之心

可重用性报告：使用图神经网络捕获生物对象的属性及其关系

编辑 | 萝卜皮图神经网络（GNN），尤其是图卷积网络（GCN），已越来越多地用于对复杂交互进行建模。GNN 背后的一个基本思想是，对象的某些属性（由图中的节点表示）由与其直接或间接交互的对象的属性反映，其中直接交互由图中的边表示。在生物医学中，GNN 已被用于各种应用，例如预测蛋白质功能和药物-疾病关联。之前，Schulte-Sasse 团队提出了 GCN 在生物医学中的新用途：识别癌症基因。他们的方法 EMOGI（可解释的多组学图集成）通过在蛋白质-蛋白质相互作用（PPI）网络上聚合信息来集成多组数据。综合信息

3/28/2022 6:44:00 PM

ScienceAI

神经网络debug太难了，这里有六个实用技巧

神经网络的 debug 过程着实不容易，这里是一些有所帮助的 tips。

6/11/2021 2:24:00 PM

机器之心

资讯热榜

企业级模型推理部署工具vllm使用指南 - 部署最新deepseek-v3-0324模型上海AI实验室开源InternVL3系列多模态大型语言模型 50组多风格提示词，全面测评Midjourney V7生图效果！全日程揭晓！ICLR 2025论文分享会我们北京见斯坦福2025 AI指数出炉！中美AI对决差距仅剩0.3%，DeepSeek领衔 5分钟直出46页论文！谷歌Deep Research完爆OpenAI，最强Gemini 2.5加持击败DeepSeek-R1！豆包新推理模型仅用前者参数量1/3！还将开源两个基准，瞄准通用推理能力！ ChatGPT重大更新，能翻出所有历史对话，网友被AI聊破防了

标签云

人工智能 OpenAI AIGC AI ChatGPT DeepSeek AI绘画数据机器人谷歌模型大模型 Midjourney 智能用户学习开源 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达神经网络腾讯计算研究 Sora AI for Science 3D AI设计 Anthropic 机器学习 GPU 开发者场景华为预测伟达 Transformer 百度深度学习苹果模态 AI视频驾驶文本 xAI 搜索人形机器人大语言模型 Copilot 神器推荐 LLaMA 字节跳动具身智能 Claude 算力安全应用视频生成科技视觉亚马逊干货合集 2024 AGI 特斯拉 DeepMind 训练