资讯列表
DeepSeek AI时代下,数字化转型的本质:拼的不是技术了,是人
你见过多少数字化转型的尝试,最终变成了买软件、堆硬件的采购工程? 又有多少企业花了大价钱引入先进系统,却发现员工仍在用Excel表格手动录入数据? 数字化转型已成为每个企业的必修课,但成功率却惊人地低。
4/7/2025 1:00:00 AM
大数据AI智能圈
DeepSeek再好,还得先进行数据清洗!
数据分析师的日常,有大半时间都在和数据"搏斗"。 每当接到一份数据,第一反应往往是叹气: "这数据质量...又得清洗半天。 " 数据清洗就像是数据分析的"地基工程",地基不牢,上层再漂亮也会坍塌。
4/7/2025 12:30:00 AM
C#搞AI?用ML.NET实现ChatGPT本地化部署!代码全开源
在人工智能蓬勃发展的当下,ChatGPT这类大型语言模型吸引了全球目光。 它强大的自然语言处理能力,能实现智能对话、文本生成等多种功能。 但在实际应用中,出于数据安全、网络限制等因素考量,将ChatGPT本地化部署成为众多开发者的迫切需求。
4/7/2025 12:22:00 AM
conan
OpenAI 的新 GPT-4o 图像生成技术绝对会改变游戏规则
GPT-4o 的图像生成功能刚刚发布就直接开始摧毁传统行业,甚至让 OpenAI 的 CEO 山姆·奥特曼(Sam Altman)都直呼:“我也看不懂眼前发生的一切! ”图片传统的设计软件,比如 Photoshop,现在可真是如临大敌了。 一、图像融合的能力彻底超越传统工具 来看一个让人震惊的图像融合实例:图片传统的 Photoshop 顶多就是简单地将人物图层叠加到背景图上,对光影和角度的细节通常还要手动调整。
4/7/2025 12:00:00 AM
dev
多模态模型结构与训练总结
01、模型结构一般的多模态模型架构包含5个部分,分别是:模态编码器、输入映射器、大模型骨干、输出映射器以及模态生成器。 模态编码器(Modality Encoder, ME)将多种模态输入编码成特征表示,公式如下X表示模态,表示各种预训练好的编码器。 目前模态主要分为:视觉模态、语音模态、3D点云模态,其中视觉模态主要包括图像和视频,对于视频,视频通常被均匀采样成5帧图像,然后进行与图像相同的预处理。
4/7/2025 12:00:00 AM
Goldma
Meta LIama 4 重夺开源第一:DeepSeek 同等代码能力但参数减半,一张 H100 就能跑,还有两万亿参数超大杯
Meta 官推激情表示,这些 Llama 4 模型标志着 Llama 生态系统新时代 —— 原生多模态 AI 创新的开始。
4/6/2025 10:48:30 PM
汪淼
中科大华为发布生成式推荐大模型:昇腾 NPU 可部署,背后认知一同公开
近期,中科大与华为合作开发了推荐大模型部署方案,可应用于多个场景。探索过程中还有哪些经验与发现?最新公开分享来了。
4/6/2025 10:41:25 PM
汪淼
Meta深夜开源Llama 4!首次采用MoE,惊人千万token上下文,竞技场超越DeepSeek
Meta 选择在周六日,发布了最新 AI 模型系列 ——Llama 4,这是其 Llama 家族的最新成员。 该系列包括 Llama 4 Scout、Llama 4 Maverick 和 Llama 4 Behemoth。 所有这些模型都经过了大量未标注的文本、图像和视频数据的训练,以使它们具备广泛的视觉理解能力。
4/6/2025 10:18:00 AM
机器之心
从0到1玩转MCP:AI的「万能插头」,代码手把手教你!
在人工智能飞速发展的今天,LLM 的能力令人叹为观止,但其局限性也日益凸显 —— 它们往往被困于训练数据的「孤岛」,无法直接触及实时信息或外部工具。 2024 年 11 月,Anthropic 推出了开源协议 MCP(Model Context Protocol,模型上下文协议),旨在为 AI 模型与外部数据源和工具之间的交互提供一个通用、标准化的连接方式。 MCP 的开源性质也迅速吸引了开发社区的关注,许多人将其视为 AI 生态系统标准化的重要一步。
4/6/2025 10:14:00 AM
机器之心
大语言模型变身软体机器人设计「自然选择器」,GPT、Gemini、Grok争做最佳
大型语言模型 (LLM) 在软体机器人设计领域展现出了令人振奋的应用潜力。 密歇根大学安娜堡分校的研究团队开发了一个名为「RoboCrafter-QA」的基准测试,用于评估 LLM 在软体机器人设计中的表现,探索了这些模型能否担任机器人设计的「自然选择器」角色。 这项研究为 AI 辅助软体机器人设计开辟了崭新道路,有望实现更自动化、更智能的设计流程。
4/6/2025 9:58:00 AM
机器之心
清明假期广西高速公路启用 AI 治理拥堵:可提前 30 分钟预测堵点
广西交通投资集团“路网先知”智慧交通大模型启用,可提前30分钟精准预测车流高峰和拥堵路段。还启用“空天地”协同治堵模式,提升疏导效率。##广西高速AI治堵##
4/6/2025 8:49:24 AM
远洋
OpenAI 遭实锤:研究称其 AI 模型“记住”了受版权保护的内容
华盛顿大学等研究为OpenAI用受版权保护内容训练模型指控提供依据。研究人员用新方法测试,发现GPT - 4记住部分小说和《纽约时报》文章内容。#OpenAI版权争议#
4/6/2025 8:23:40 AM
远洋
安卓版微软 Copilot 集成“MSN 资讯”,探索盈利新招
微软在安卓版Copilot中整合MSN资讯,通过个性化新闻推荐和广告探索AI盈利新模式。用户可基于浏览历史获取精准内容,界面设计简洁。此外,Copilot还将新增深度研究、页面策划和视觉功能。#微软Copilot##AI商业化#
4/6/2025 6:47:22 AM
远洋
Meta 发布 Llama 4 系列 AI 模型,引入“混合专家架构”提升效率
Meta推出Llama 4系列AI模型,含Scout、Maverick和尚在训练的Behemoth。已上架Scout和Maverick,性能各有亮点。#Meta #Llama4系列AI模型#
4/6/2025 5:34:53 AM
漾仔
全网都在猜,这些视频是不是字节AI生成的:该跟动捕说再见了?
在 GPT-4o 的风到处吹时,X 平台(原推特)上有好多带视频的帖子爆了。 到底是什么引来了一百万的浏览量? 没错,是玛丽莲・梦露「活了过来」。
4/5/2025 5:28:00 PM
机器之心
CVPR 2025 Oral | 多模态交互新基准OpenING,新版GPT-4o杀疯了?
不必纠结了! 人类大脑天然具备同时理解和创造视觉与语言信息的能力。 一个通用的多模态大语言模型(MLLM)理应复刻人类的理解和生成能力,即能够自如地同时处理与生成各种模态内容,实现多模态交互,这也是向通用人工智能(AGI)迈进的关键挑战之一。
4/5/2025 5:24:00 PM
机器之心
7B扩散LLM,居然能跟671B的DeepSeek V3掰手腕,扩散vs自回归,谁才是未来?
语言是离散的,所以适合用自回归模型来生成;而图像是连续的,所以适合用扩散模型来生成。 在生成模型发展早期,这种刻板印象广泛存在于很多研究者的脑海中。 但最近,这种印象正被打破。
4/5/2025 5:21:00 PM
机器之心
微软诞生50周年,比尔・盖茨撰文忆往昔,并发布了Altair BASIC源代码
1975 年 4 月 4 日,比尔・盖茨和保罗・艾伦在美国新墨西哥州阿尔伯克基市创立了微软公司。 到今天,半个世纪过去了,微软早已成长为一家超级科技巨头。 近日,比尔・盖茨亲自撰文回忆了微软的诞生和他们的第一笔业务,同时还通过一份 157 页的 PDF 文件分享了他们为这项业务编写的 Altair BASIC 源代码。
4/5/2025 5:13:00 PM
机器之心