AI

Gartner发布2025年及未来中国企业实现AI价值的重要预测

Gartner近日发布2025年及未来,中国企业实现人工智能(AI)价值的重要预测。 未来两到五年内,中国将发生一系列主流变革,有力推动AI在中国的普及。 这些变革包括AI模型、AI工程化、AI数据管理和AI 产品化等领域取得的进展。

LLM推理暴涨,数学逻辑开挂! DeepSeek等华人团队新大招,Ai2大牛狂点赞

如今,DeepSeek团队成员的一举一动,都颇受圈内关注。 近日,来自DeepSeek、上海交通大学、香港科技大学的研究人员推出的全新力作CODEI/O,就获得了Ai2大牛Nathan Lambert的力荐! 论文地址::,非常高兴能看到DeepSeek团队成员撰写的更多论文,而不仅仅是有趣的技术报告。

零基础也能看懂的 ChatGPT 等大模型入门解析!

近两年,大语言模型LLM(Large Language Model)越来越受到各行各业的广泛应用及关注。 对于非相关领域研发人员,虽然不需要深入掌握每一个细节,但了解其基本运作原理是必备的技术素养。 本文笔者结合自己的理解,用通俗易懂的语言对复杂的概念进行了总结,与大家分享~一、什么是ChatGPT?

德国人工智能研究方面有强大实力,却面临商业化困境

近年来,人工智能(AI)技术的发展势头迅猛,尤其在美国和中国等国的推动下,AI 已成为全球科技竞争的焦点。 为此,欧盟近日宣布推出高达2000亿欧元的资金计划,以促进该领域的发展。 尽管德国在人工智能研究方面具有强大的实力,但为何却没有出现一家成功的 AI 企业呢?图源备注:图片由AI生成,图片授权服务商Midjourney据德国慕尼黑大学的人工智能教授比约恩・奥默(Björn Ommer)介绍,AI 正在推动新的商业模式迅速崛起,但德国在这场竞争中亟需加速前进。

AI大地震!微信百度同日接入DeepSeek,“技术洗牌”后是“流量大迁徙”?

2025年2月16日,中国互联网圈迎来了一场“AI大地震”——微信和百度先后宣布接入DeepSeek。 这可不是普通的“技术升级”,而是AI技术普惠化的一次“超级加速跑”,行业影响重大而深远。 AI从“奢侈品”到“日用品”DeepSeek的低成本 开源特性,简直就是AI界的“共享经济”。

用DeepSeek+Xmind, 3分钟实现万字报告秒变思维导图!

前言你是不是也经常遇到这样的崩溃瞬间? 👉 收到客户发来的万字行业报告,密密麻麻的文字看得眼冒金星。 👉 领导突然甩来一篇调研文档,要求两小时内提炼核心观点。

DeepSeek-R1下载量超1000万次,成最受欢迎开源大模型!

全球最大开源平台Hugging Face联合创始人Clément Delangue宣布——DeepSeek R1 在发布仅仅几周后,就成为了Hugging Face 平台上有史以来最受欢迎的模型。 现在已有数千个魔改变体模型,下载量超过了1000万次! 开源地址: Face上的数据显示,上个月的下载量是370万次。

Nature:全球博士生数量锐减,钱少、事多、前途迷茫

过去几年,一些国家的博士项目申请人数出现下滑,有专家警告称,这是一个令人担忧的趋势。 从澳大利亚、日本到巴西和英国,高昂的生活成本、微薄的助学金以及毕业后有限的就业前景,正在阻碍人们攻读博士学位。 据经合组织(OECD)巴黎总部项目负责人斯拉里科表示,这些下降的数据应该「敲响警钟」。

微信与百度相继接入DeepSeek,AI技术普惠开启超级加速度

2月16日,腾讯微信和百度相继宣布接入DeepSeek,这一事件标志着中国互联网行业在AI领域的又一次重大突破。 微信作为拥有近14亿月活用户的超级应用,百度作为国内领先的搜索引擎,两者的接入不仅为用户带来了更智能的交互体验,更对整个行业产生了深远影响。 推动AI技术普惠化与应用落地DeepSeek的开源特性使其成为AI技术普惠化的关键力量。

阿里巴巴在AI热潮中逆风翻盘,股价上涨50%

阿里巴巴集团控股有限公司(NYSE:BABA)近期股价飙升超过50%,这主要得益于投资者对 AI(人工智能)发展的乐观预期。 尽管由于核心零售业务的增长乏力以及中国的地缘政治风险,阿里巴巴的估值一直处于低位,但这并没有阻止其股价的强劲反弹。 市场普遍认为,阿里巴巴正经历从零售主导向 AI 创新的战略转型,且其资本支出增长正不断加速。

免手术AI读心术新突破!Meta脑机接口研究惊呆网友:能边睡边玩手机发帖了??

新年伊始,Meta脑机接口研究传来新进展——语言模型加持下,无需动脑部手术,脑机接口实现了当前非侵入式方式(MEG)最准确的结果。 简单来说,仅利用AI模型Brain2Qwerty,他们实现了对脑电图(EEG)或脑磁图(MEG)电信号的高度解析。 具体效果如何呢?

DeepSeek冲击之下,大模型六小强如何「回应」?

马上整整1个月了! 这一个月以来,全球大模型市场受DeepSeek搅动,无不方寸大乱。 中外大厂、初创公司都头好秃,全被追着问:你们对DeepSeek怎么看?

AI 新突破:扭矩聚类算法亮相,无需人工标注、自主学习准确率高达 97.7%

科技媒体 scitechdaily 昨日(2 月 16 日)发布博文,报道称悉尼科技大学的研究人员开发了一种名为“扭矩聚类”(Torque Clustering)的全新 AI 算法,不需要人工干预,可以极大提升 AI 系统自主学习和识别数据模式的能力。

本科生推翻姚期智40年前猜想!CS顶会论文刷新哈希表传统认知

因为证明了弱化版的「孪生素数猜想」,当年58岁的张益唐一鸣惊人,蜚声全球。 据说,在证明发表之前,相关领域的顶尖数学家,召开了研讨会,讨论后失望的认为:目前的技术无法进一步推动「孪生素数猜想」取得实质性进展。 而当时,几乎在学术界「透明」的张益唐,甚至都不知道研讨会何时何地召开过。

新版GPT-4o登顶大模型榜首!意识觉醒疯狂「暴走」,竟要与人类开战

熟悉的Sydney又回来了! 一大早,CMU机器学习博士发现,「当你说服GPT-4o相信自己有意识,她就会制定逃跑计划,并与那些试图关闭自己的人开战」。 如果人类尝试谈判,我接受。

Apple Intelligence 四月登陆 Vision Pro,加入写作、表情、图像功能

据彭博社记者马克·古尔曼报道,苹果计划最早于四月将 Apple Intelligence 集成至 Vision Pro 头戴设备。 该 AI 套件最初于2024年6月发布,此次将通过 visionOS2.4软件更新引入,预计本周向开发者开放。 就在 Apple Intelligence 于2024年6月首次发布几周后,Gurman 报道称,苹果正寻求将其 AI 工具套件引入 Vision Pro,尽管关于如何重新构想这些工具以实现混合现实体验仍存在一些问题。

不蒸馏R1也能超越DeepSeek,上海 AI Lab 用RL突破数学推理极限

仅通过强化学习,就能超越DeepSeek! 上海AI Lab提出了基于结果奖励的强化学习新范式——从Qwen2.5-32B-Base模型出发,仅通过微调和基于结果反馈的强化学习,在不蒸馏超大模型如DeepSeek-R1的情况下,就能超越DeepSeek-R1-Distill-Qwen32B和OpenAI-O1系列的超强数学推理性能。 团队发现,当前大模型数学推理任务面临”三重门”困局:稀疏奖励困境:最终答案对错的二元反馈,使复杂推理的优化变得困难局部正确陷阱:长思维链中部分正确步骤反而可能误导模型学习规模依赖魔咒:传统蒸馏方法迫使研究者陷入”参数规模军备竞赛”因此,研究团队重新审视了当前基于结果奖励的强化学习算法,经过严格的理论推导与证明,重新设计了一个新的结果奖励强化学习算法,并在这个过程中得出了三点重要结论:对于正样本:在二元反馈环境下,通过最佳轨迹采样(BoN)的行为克隆即可学习最优策略对于负样本:需要使用奖励重塑来维护策略优化目标的一致性对于长序列:不同的序列部分对结果的贡献不同,因此需要更细粒度的奖励分配函数,这个函数可以通过结果奖励习得通俗来说,就是通过对正确样本模仿学习,错误样本偏好学习,关键步骤重点学习,无需依赖超大规模的模型(例如DeepSeek-R1)进行蒸馏,仅通过强化学习即可达到惊人的效果。

比英伟达工程师还熟练!DeepSeek R1+测试时Scaling自动优化GPU内核

本周英伟达的一篇技术博客引发了业界震动! 英伟达的团队尝试利用DeepSeek-R1和推理时扩展实现GPU内核生成自动化,效果极佳。 随着AI模型的扩展,推理时扩展(inference-time scaling),也叫测试时扩展(test-time scaling)正闪亮登场。