资讯列表

分类

标签

Dify+RAGFlow:1+1＞2的混合架构，详细教程+实施案例

企业在落地 RAG 知识库时， Dify 和 RAGFlow 这两个开源框架应该选择哪个？这也是我一直以来做RAG咨询时，经常被企业方问到的问题之一。一般来说，如果需要处理特别复杂的文档和非结构化数据，RAGFlow 是优选。

4/7/2025 7:00:00 AM

韦东东

Llama 4开源王者归来！推理、编码打平DeepSeek V3但参数减一半，一张H100就能跑，还有巨兽2万亿参数模型！

编辑 | 李美涵出品 | 51CTO技术栈（微信号：blog51cto）深夜，Meta如期发布了全新的开源大型模型系列——Llama 4，并未出现任何“跳票”传闻中的推迟情况！图片此次发布也标志着Meta与近来崛起的开源新王 DeepSeek 正面硬钢。 Meta官推更是表示：表示：“今天开启了原生多模态AI创新的新时代”。

4/7/2025 7:00:00 AM

李美涵

模态编码器|EVA改进之EVA-02

来自智源曹越团队在EVA的优化改进方面的工作EVA-02，项目地址：：在CV领域，训练、调优和评估非常大的视觉模型需要大量的计算资源，限制了许多研究人员和开发者的参与。因此，本研究主要目的是提供一种高效且性能强大的预训练方法，不仅能够在多种下游任务中展现出色的迁移学习能力，而且还能显著减少参数数量和计算成本。 01、模型架构EVA-02的基础是一个改进版的纯Transformer架构，该架构在原始ViT的基础上进行了若干重要的修改，以更好地适应大规模预训练任务的需求。

4/7/2025 6:30:00 AM

Goldma

模态编码器|CLIP技术改进之EVA-CLIP

上一篇看了EVA，趁热打铁，今天来看EVA-CLIP，同样是智源曹越团队的工作，主要研究主题是结合EVA改进CLIP。研究动机：训练CLIP模型面临计算成本高和训练不稳定等挑战，尤其是在扩大模型规模时。因此，这项工作的研究动机是提供一种高效且有效的解决方案，以促进更大规模CLIP模型的训练和发展。

4/7/2025 5:30:00 AM

Goldma

一文掌握 MCP 上下文协议：从理论到实践

MCP模型上下文协议（Model Context Protocol，简称 MCP）是一种开放标准，旨在标准化大型语言模型（LLM）与外部数据源和工具之间的交互方式。由 Anthropic 于 2024 年 11 月推出，MCP 通过定义统一的接口，使 AI 应用能够安全、灵活地访问和操作本地及远程数据资源，提升模型的功能性和可扩展性。图片Transports（传输层）在 MCP 协议中，传输层提供了客户端与服务器之间通信的基础，其负责处理消息的发送与接收的底层机制。

4/7/2025 5:01:00 AM

陈明勇

DeepSeek R1 vs OpenAI O3 vs Gemini 2 Pro—谁最适合做客服主管的AI

Deepseek在2025年1月颠覆了全球人工智能模型，但谷歌和OpenAI很快发布了Gemini2 Pro和O3。这就产生了一个问题，应该使用哪种人工智能模型来进行客户服务？为了评估这些模型在客户服务任务上的表现，我们必须更深入地了解它们在各种AI基准上的表现。

4/7/2025 5:00:00 AM

晓晓

模态编码器|EVA探索掩码视觉表征学习的极限

今天来看一篇经典的视觉表征学习的方法EVA，来自智源研究院发表在2023年CVPR的一篇工作。项目地址：：自然语言处理（NLP）领域通过扩展预训练语言模型（PLMs）取得了革命性的成功，作者希望将这种成功从语言领域转移到视觉领域，即扩展一个视觉中心的基础模型，以便于视觉和多模态下游任务。另外，视觉模型预训练和扩展的方法主要依赖于监督或弱监督训练，需要数百万个（通常是不可公开访问的）标注数据。

4/7/2025 4:30:00 AM

Goldma

人工智能在物联网中的挑战和局限性

虽然人工智能在物联网中的集成提供了诸多好处，但也带来了一定的挑战和限制。了解并解决这些问题对于确保人工智能在物联网系统中的成功部署和利用非常重要。让我们探讨一些关键挑战：人工智能驱动的物联网系统中的安全和隐私问题人工智能驱动的物联网设备中连接性和数据交换的增加引发了安全和隐私问题。

4/7/2025 4:00:00 AM

chris han

DeepSeek R2来了？全新推理时Scaling论文联手清华震撼发布！

DeepSeek R2，果然近了。最近，DeepSeek和清华的研究者发表的这篇论文，探讨了奖励模型的推理时Scaling方法。图片论文地址：，强化学习（RL）已广泛应用于LLM的大规模后训练阶段。

4/7/2025 3:44:00 AM

新智元

模态编码器|CLIP详细解读

下面来详细了解一下多模态大模型模态编码器部分。今天首先来看下CLIP，OpenAI发表在2021年ICML上的一篇工作。项目地址：：在自然语言处理（NLP）领域，通过大规模的文本数据预训练模型（如GPT-3）已经取得了显著的成果，但在计算机视觉领域，预训练模型仍然依赖于人工标注的图像数据集，严重影响了其在未见类别上的泛化性和可用性（需要用额外的有标注数据）。

4/7/2025 3:30:00 AM

Goldma

DeepMind闭关修炼「我的世界」，自学成才挖钻登Nature！人类玩家瑟瑟发抖

AI又进化了，在没有任何人类数据的参与下，自己玩《我的世界》还能找到钻石！在刚刚登上Nature的论文中，谷歌DeepMind的智能体通过纯·自我学习，顺利完成了收集钻石的任务。图片论文链接：，DeepMind的计算机科学家Danijar Hafner表示：「Dreamer是一个重要的里程碑，标志着AI又朝着通用人工智能前进了一大步。

4/7/2025 3:00:00 AM

新智元

自动驾驶行业现状，端到端大模型，训练，数据合成方法

自动驾驶行业现状1、当前行业主要玩家有第一梯队有：华为，momenta，元戎第二梯队有：鉴智, 绝影智能等2、主机厂现在都要求自动驾驶厂商白盒交付，本质上就是前两年依赖供应商，后面打算自己做。整个行业基本上是赔本赚吆喝的阶段。没有收入，每年还要自己投入几个亿进行模型的训练，人才等。

4/7/2025 3:00:00 AM

朱洁

GPT-4.5创造力比GPT-4o弱！浙大上海AI Lab发布新基准，寻找多模态创造力天花板

近来风头正盛的GPT-4.5，不仅在日常问答中展现出惊人的上下文连贯性，在设计、咨询等需要高度创造力的任务中也大放异彩。当GPT-4.5在创意写作、教育咨询、设计提案等任务中展现出惊人的连贯性与创造力时，一个关键问题浮出水面：多模态大模型（MLLMs）的“创造力天花板”究竟在哪里？写一篇基于图片的短篇小说、分析一张复杂的教学课件、甚至设计一份用户界面……这些对于人类驾轻就熟的任务，对于现有的部分多模态大模型却往往是“高难动作”。

4/7/2025 2:33:00 AM

基于 DeepSeek GRPO 的 1.5B Rust 代码生成模型训练实战

群组相对策略优化（Group Relative Policy Optimization，GRPO）已被证明是一种有效的算法，可用于训练大语言模型（LLMs），使其具备推理能力并在基准测试中持续提升性能表现。 DeepSeek-R1 展示了如何通过监督式微调（Supervised Fine-Tuning）与 GRPO 技术的结合，引导模型达到与 OpenAI 的 o1 等顶尖模型相竞争的水平。为了进一步探索其实践应用，我们尝试将这些技术应用于现实场景中。

4/7/2025 2:25:00 AM

智能体|基于ReAct框架：构建极简智能体实践的探索

基于ReAct的方式，手动制作了一个最小的Agent结构（其实更多的是调用工具）。完整代码可以参考：：ReAct: Synergizing Reasoning and Acting in Language Models1、Step 1: 构造大模型首先我们需要一个大模型，这里我使用智谱的glm-4。 glm-4是基于Decoder-Only的通用对话大模型，可以使用API_key来调用模型。

4/7/2025 2:00:00 AM

人工智能催生“零知识”威胁行为者

人工智能是一把双刃剑。一方面，人工智能帮助人们更好更快地完成工作；另一方面，它也使心怀恶意的人成为诈骗者、黑客分子和网络罪犯。零知识威胁行为者的崛起网络犯罪业务利润丰厚；然而，传统上，只有拥有先进技术技能的人才能从事这一行业。

4/7/2025 1:45:00 AM

何威风

物联网人工智能关键技术和技巧

人工智能在实现物联网功能方面发挥着至关重要的作用。让我们探索推动人工智能和物联网融合、赋能智能和自主系统的关键技术和技巧。使用人工智能分析物联网数据的机器学习算法机器学习构成了物联网人工智能的基础，使设备能够学习模式、做出预测并适应不断变化的环境。

4/7/2025 1:30:00 AM

chris han

PandasAI：当数据分析遇上自然语言处理

数据科学的新范式在数据爆炸的时代，传统的数据分析工具正面临着前所未有的挑战。数据科学家们常常需要花费70%的时间在数据清洗和探索上，而真正的价值创造时间却被大幅压缩。 PandasAI的出现，正在改变这一现状——它将生成式AI的强大能力注入到经典的Pandas生态中，创造了一种全新的对话式数据分析体验。

4/7/2025 1:25:00 AM

云朵君

资讯热榜

上海AI实验室开源InternVL3系列多模态大型语言模型 Haisnap横空出世，小白用户也能轻松打造AI应用「交交」媲美GPT-4o！上海交大推出口语对话情感大模型，首个纯学术界自研！ OpenAI开源超Agent:Codex CLI,五小时内破 5000 颗星 ChatGPT重磅更新：新增图像库功能，可查看自己用GPT生成的所有图片 kimi开源视觉语言模型 Kimi-VL 与 Kimi-VL-Thinking，多项基准超越 GPT-4o OpenAI 发布“智能体构建实战指南”实用性文档（附文档资源） OpenAI发布34页智能体实践指南：从网络搜索到代码编写

标签云

人工智能 OpenAI AIGC AI ChatGPT DeepSeek AI绘画数据机器人谷歌模型大模型 Midjourney 智能用户学习开源 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达腾讯神经网络计算研究 Sora AI for Science 3D Anthropic AI设计机器学习 GPU 开发者场景华为预测伟达 Transformer 人形机器人百度苹果深度学习 AI视频模态字节跳动 xAI 驾驶文本搜索大语言模型 Claude Copilot 具身智能神器推荐 LLaMA 算力安全应用视频生成科技视觉亚马逊干货合集 2024 AGI 特斯拉大型语言模型训练