资讯列表

分类

标签

DeepSeek AI时代下，数字化转型的本质：拼的不是技术了，是人

你见过多少数字化转型的尝试，最终变成了买软件、堆硬件的采购工程？又有多少企业花了大价钱引入先进系统，却发现员工仍在用Excel表格手动录入数据？数字化转型已成为每个企业的必修课，但成功率却惊人地低。

4/7/2025 1:00:00 AM

大数据AI智能圈

DeepSeek再好，还得先进行数据清洗！

数据分析师的日常，有大半时间都在和数据"搏斗"。每当接到一份数据，第一反应往往是叹气： "这数据质量...又得清洗半天。 " 数据清洗就像是数据分析的"地基工程"，地基不牢，上层再漂亮也会坍塌。

4/7/2025 12:30:00 AM

C#搞AI？用ML.NET实现ChatGPT本地化部署！代码全开源

在人工智能蓬勃发展的当下，ChatGPT这类大型语言模型吸引了全球目光。它强大的自然语言处理能力，能实现智能对话、文本生成等多种功能。但在实际应用中，出于数据安全、网络限制等因素考量，将ChatGPT本地化部署成为众多开发者的迫切需求。

4/7/2025 12:22:00 AM

conan

OpenAI 的新 GPT-4o 图像生成技术绝对会改变游戏规则

GPT-4o 的图像生成功能刚刚发布就直接开始摧毁传统行业，甚至让 OpenAI 的 CEO 山姆·奥特曼（Sam Altman）都直呼：“我也看不懂眼前发生的一切！ ”图片传统的设计软件，比如 Photoshop，现在可真是如临大敌了。一、图像融合的能力彻底超越传统工具来看一个让人震惊的图像融合实例：图片传统的 Photoshop 顶多就是简单地将人物图层叠加到背景图上，对光影和角度的细节通常还要手动调整。

4/7/2025 12:00:00 AM

dev

多模态模型结构与训练总结

01、模型结构一般的多模态模型架构包含5个部分，分别是：模态编码器、输入映射器、大模型骨干、输出映射器以及模态生成器。模态编码器（Modality Encoder, ME）将多种模态输入编码成特征表示，公式如下X表示模态，表示各种预训练好的编码器。目前模态主要分为：视觉模态、语音模态、3D点云模态，其中视觉模态主要包括图像和视频，对于视频，视频通常被均匀采样成5帧图像，然后进行与图像相同的预处理。

4/7/2025 12:00:00 AM

Goldma

Meta LIama 4 重夺开源第一：DeepSeek 同等代码能力但参数减半，一张 H100 就能跑，还有两万亿参数超大杯

Meta 官推激情表示，这些 Llama 4 模型标志着 Llama 生态系统新时代 —— 原生多模态 AI 创新的开始。

4/6/2025 10:48:30 PM

汪淼

中科大华为发布生成式推荐大模型：昇腾 NPU 可部署，背后认知一同公开

近期，中科大与华为合作开发了推荐大模型部署方案，可应用于多个场景。探索过程中还有哪些经验与发现？最新公开分享来了。

4/6/2025 10:41:25 PM

汪淼

Meta深夜开源Llama 4！首次采用MoE，惊人千万token上下文，竞技场超越DeepSeek

Meta 选择在周六日，发布了最新 AI 模型系列 ——Llama 4，这是其 Llama 家族的最新成员。该系列包括 Llama 4 Scout、Llama 4 Maverick 和 Llama 4 Behemoth。所有这些模型都经过了大量未标注的文本、图像和视频数据的训练，以使它们具备广泛的视觉理解能力。

4/6/2025 10:18:00 AM

机器之心

从0到1玩转MCP：AI的「万能插头」，代码手把手教你！

在人工智能飞速发展的今天，LLM 的能力令人叹为观止，但其局限性也日益凸显 —— 它们往往被困于训练数据的「孤岛」，无法直接触及实时信息或外部工具。 2024 年 11 月，Anthropic 推出了开源协议 MCP（Model Context Protocol，模型上下文协议），旨在为 AI 模型与外部数据源和工具之间的交互提供一个通用、标准化的连接方式。 MCP 的开源性质也迅速吸引了开发社区的关注，许多人将其视为 AI 生态系统标准化的重要一步。

4/6/2025 10:14:00 AM

机器之心

大语言模型变身软体机器人设计「自然选择器」，GPT、Gemini、Grok争做最佳

大型语言模型 (LLM) 在软体机器人设计领域展现出了令人振奋的应用潜力。密歇根大学安娜堡分校的研究团队开发了一个名为「RoboCrafter-QA」的基准测试，用于评估 LLM 在软体机器人设计中的表现，探索了这些模型能否担任机器人设计的「自然选择器」角色。这项研究为 AI 辅助软体机器人设计开辟了崭新道路，有望实现更自动化、更智能的设计流程。

4/6/2025 9:58:00 AM

机器之心

清明假期广西高速公路启用 AI 治理拥堵：可提前 30 分钟预测堵点

广西交通投资集团“路网先知”智慧交通大模型启用，可提前30分钟精准预测车流高峰和拥堵路段。还启用“空天地”协同治堵模式，提升疏导效率。##广西高速AI治堵##

4/6/2025 8:49:24 AM

远洋

OpenAI 遭实锤：研究称其 AI 模型“记住”了受版权保护的内容

华盛顿大学等研究为OpenAI用受版权保护内容训练模型指控提供依据。研究人员用新方法测试，发现GPT - 4记住部分小说和《纽约时报》文章内容。#OpenAI版权争议#

4/6/2025 8:23:40 AM

远洋

安卓版微软 Copilot 集成“MSN 资讯”，探索盈利新招

微软在安卓版Copilot中整合MSN资讯，通过个性化新闻推荐和广告探索AI盈利新模式。用户可基于浏览历史获取精准内容，界面设计简洁。此外，Copilot还将新增深度研究、页面策划和视觉功能。#微软Copilot##AI商业化#

4/6/2025 6:47:22 AM

远洋

Meta 发布 Llama 4 系列 AI 模型，引入“混合专家架构”提升效率

Meta推出Llama 4系列AI模型，含Scout、Maverick和尚在训练的Behemoth。已上架Scout和Maverick，性能各有亮点。#Meta #Llama4系列AI模型#

4/6/2025 5:34:53 AM

漾仔

全网都在猜，这些视频是不是字节AI生成的：该跟动捕说再见了？

在 GPT-4o 的风到处吹时，X 平台（原推特）上有好多带视频的帖子爆了。到底是什么引来了一百万的浏览量？没错，是玛丽莲・梦露「活了过来」。

4/5/2025 5:28:00 PM

机器之心

CVPR 2025 Oral | 多模态交互新基准OpenING，新版GPT-4o杀疯了？

不必纠结了！人类大脑天然具备同时理解和创造视觉与语言信息的能力。一个通用的多模态大语言模型（MLLM）理应复刻人类的理解和生成能力，即能够自如地同时处理与生成各种模态内容，实现多模态交互，这也是向通用人工智能（AGI）迈进的关键挑战之一。

4/5/2025 5:24:00 PM

机器之心

7B扩散LLM，居然能跟671B的DeepSeek V3掰手腕，扩散vs自回归，谁才是未来？

语言是离散的，所以适合用自回归模型来生成；而图像是连续的，所以适合用扩散模型来生成。在生成模型发展早期，这种刻板印象广泛存在于很多研究者的脑海中。但最近，这种印象正被打破。

4/5/2025 5:21:00 PM

机器之心

微软诞生50周年，比尔・盖茨撰文忆往昔，并发布了Altair BASIC源代码

1975 年 4 月 4 日，比尔・盖茨和保罗・艾伦在美国新墨西哥州阿尔伯克基市创立了微软公司。到今天，半个世纪过去了，微软早已成长为一家超级科技巨头。近日，比尔・盖茨亲自撰文回忆了微软的诞生和他们的第一笔业务，同时还通过一份 157 页的 PDF 文件分享了他们为这项业务编写的 Altair BASIC 源代码。

4/5/2025 5:13:00 PM

机器之心

资讯热榜

上海AI实验室开源InternVL3系列多模态大型语言模型 Haisnap横空出世，小白用户也能轻松打造AI应用「交交」媲美GPT-4o！上海交大推出口语对话情感大模型，首个纯学术界自研！ OpenAI开源超Agent:Codex CLI,五小时内破 5000 颗星 ChatGPT重磅更新：新增图像库功能，可查看自己用GPT生成的所有图片 kimi开源视觉语言模型 Kimi-VL 与 Kimi-VL-Thinking，多项基准超越 GPT-4o OpenAI 发布“智能体构建实战指南”实用性文档（附文档资源） OpenAI发布34页智能体实践指南：从网络搜索到代码编写

标签云

人工智能 OpenAI AIGC AI ChatGPT DeepSeek AI绘画数据机器人谷歌模型大模型 Midjourney 智能用户学习开源 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达腾讯神经网络计算研究 Sora AI for Science 3D Anthropic AI设计机器学习 GPU 开发者场景华为预测伟达 Transformer 人形机器人百度苹果深度学习 AI视频模态字节跳动 xAI 驾驶文本搜索大语言模型 Claude Copilot 具身智能神器推荐 LLaMA 算力安全应用视频生成科技视觉亚马逊干货合集 2024 AGI 特斯拉大型语言模型训练