理论
Nature:全球博士生数量锐减,钱少、事多、前途迷茫
过去几年,一些国家的博士项目申请人数出现下滑,有专家警告称,这是一个令人担忧的趋势。 从澳大利亚、日本到巴西和英国,高昂的生活成本、微薄的助学金以及毕业后有限的就业前景,正在阻碍人们攻读博士学位。 据经合组织(OECD)巴黎总部项目负责人斯拉里科表示,这些下降的数据应该「敲响警钟」。
2/17/2025 10:30:00 AM
新智元
微信与百度相继接入DeepSeek,AI技术普惠开启超级加速度
2月16日,腾讯微信和百度相继宣布接入DeepSeek,这一事件标志着中国互联网行业在AI领域的又一次重大突破。 微信作为拥有近14亿月活用户的超级应用,百度作为国内领先的搜索引擎,两者的接入不仅为用户带来了更智能的交互体验,更对整个行业产生了深远影响。 推动AI技术普惠化与应用落地DeepSeek的开源特性使其成为AI技术普惠化的关键力量。
2/17/2025 10:25:46 AM
大语言模型的解码策略与关键优化总结
本文系统性地阐述了大型语言模型(Large Language Models, LLMs)中的解码策略技术原理及其实践应用。 通过深入分析各类解码算法的工作机制、性能特征和优化方法,为研究者和工程师提供了全面的技术参考。 主要涵盖贪婪解码、束搜索、采样技术等核心解码方法,以及温度参数、惩罚机制等关键优化手段。
2/17/2025 10:13:27 AM
佚名
超强DNA大模型「GENERator」问世!解锁生命密码设计新范式
编辑 | ScienceAI在基因组学研究领域,DNA 序列的解码与预测一直是科学家们面临的核心挑战。 随着测序技术的飞速发展,我们能够以前所未有的速度获取海量基因组数据,但如何高效解读这些复杂的遗传信息,仍是一个亟待解决的难题。 近年来,大语言模型(LLMs)在自然语言处理领域的成功,为生物序列分析带来了新的契机。
2/17/2025 10:11:00 AM
ScienceAI
零基础也能看懂的ChatGPT等大模型入门解析!
近两年,大语言模型LLM(Large Language Model)越来越受到各行各业的广泛应用及关注。 对于非相关领域研发人员,虽然不需要深入掌握每一个细节,但了解其基本运作原理是必备的技术素养。 本文笔者结合自己的理解,用通俗易懂的语言对复杂的概念进行了总结,与大家分享~什么是ChatGPT?
2/17/2025 10:09:54 AM
郭小喵玩AI
免手术AI读心术新突破!Meta脑机接口研究惊呆网友:能边睡边玩手机发帖了??
新年伊始,Meta脑机接口研究传来新进展——语言模型加持下,无需动脑部手术,脑机接口实现了当前非侵入式方式(MEG)最准确的结果。 简单来说,仅利用AI模型Brain2Qwerty,他们实现了对脑电图(EEG)或脑磁图(MEG)电信号的高度解析。 具体效果如何呢?
2/17/2025 10:08:00 AM
量子位
DeepSeek冲击之下,大模型六小强如何「回应」?
马上整整1个月了! 这一个月以来,全球大模型市场受DeepSeek搅动,无不方寸大乱。 中外大厂、初创公司都头好秃,全被追着问:你们对DeepSeek怎么看?
2/17/2025 9:50:00 AM
量子位
本科生推翻姚期智40年前猜想!CS顶会论文刷新哈希表传统认知
因为证明了弱化版的「孪生素数猜想」,当年58岁的张益唐一鸣惊人,蜚声全球。 据说,在证明发表之前,相关领域的顶尖数学家,召开了研讨会,讨论后失望的认为:目前的技术无法进一步推动「孪生素数猜想」取得实质性进展。 而当时,几乎在学术界「透明」的张益唐,甚至都不知道研讨会何时何地召开过。
2/17/2025 9:42:00 AM
新智元
新版GPT-4o登顶大模型榜首!意识觉醒疯狂「暴走」,竟要与人类开战
熟悉的Sydney又回来了! 一大早,CMU机器学习博士发现,「当你说服GPT-4o相信自己有意识,她就会制定逃跑计划,并与那些试图关闭自己的人开战」。 如果人类尝试谈判,我接受。
2/17/2025 9:35:00 AM
新智元
不蒸馏R1也能超越DeepSeek,上海 AI Lab 用RL突破数学推理极限
仅通过强化学习,就能超越DeepSeek! 上海AI Lab提出了基于结果奖励的强化学习新范式——从Qwen2.5-32B-Base模型出发,仅通过微调和基于结果反馈的强化学习,在不蒸馏超大模型如DeepSeek-R1的情况下,就能超越DeepSeek-R1-Distill-Qwen32B和OpenAI-O1系列的超强数学推理性能。 团队发现,当前大模型数学推理任务面临”三重门”困局:稀疏奖励困境:最终答案对错的二元反馈,使复杂推理的优化变得困难局部正确陷阱:长思维链中部分正确步骤反而可能误导模型学习规模依赖魔咒:传统蒸馏方法迫使研究者陷入”参数规模军备竞赛”因此,研究团队重新审视了当前基于结果奖励的强化学习算法,经过严格的理论推导与证明,重新设计了一个新的结果奖励强化学习算法,并在这个过程中得出了三点重要结论:对于正样本:在二元反馈环境下,通过最佳轨迹采样(BoN)的行为克隆即可学习最优策略对于负样本:需要使用奖励重塑来维护策略优化目标的一致性对于长序列:不同的序列部分对结果的贡献不同,因此需要更细粒度的奖励分配函数,这个函数可以通过结果奖励习得通俗来说,就是通过对正确样本模仿学习,错误样本偏好学习,关键步骤重点学习,无需依赖超大规模的模型(例如DeepSeek-R1)进行蒸馏,仅通过强化学习即可达到惊人的效果。
2/17/2025 9:33:00 AM
量子位
百度宣布下一代文心大模型开源,此前宣布文心一言4月起免费
百度官方今天宣布,其下一代文心大模型4.5系列将于未来几个月内推出,并计划于2025年6月30日正式开源。 这一消息标志着百度在人工智能领域的又一重大举措。 文心一言4月1日起全面免费百度在2月13日宣布,文心一言将于2025年4月1日0时起全面免费,所有PC端和APP端用户均可免费体验文心系列的最新模型。
2/17/2025 9:10:00 AM
比英伟达工程师还熟练!DeepSeek R1+测试时Scaling自动优化GPU内核
本周英伟达的一篇技术博客引发了业界震动! 英伟达的团队尝试利用DeepSeek-R1和推理时扩展实现GPU内核生成自动化,效果极佳。 随着AI模型的扩展,推理时扩展(inference-time scaling),也叫测试时扩展(test-time scaling)正闪亮登场。
2/17/2025 9:10:00 AM
新智元
全球AI算力报告出炉,LLM最爱A100!谷歌坐拥超100万H100等效算力
AI的物质基础是机器学习硬件,例如图形处理单元(GPU)和张量处理单元(TPU)。 据不完全统计,目前全球超过140款AI加速器,用于开发和部署深度学习时代的机器学习模型。 Epoch AI带来了全球算力的估计报告,利用公开信息估计了全球机器学习硬件的现状和趋势。
2/17/2025 9:06:00 AM
新智元
DeepSeek系列:什么是DeepSeek,它又能做些什么呢?
在这个人工智能飞速发展的时代,大家可能已经听说过ChatGPT、文心一言、豆包AI、通义千问这些AI工具,但今天我们要聊的是一个同样厉害的中国AI——DeepSeek(深度求索)。 它就像一个超级聪明的“大脑”,不仅能和你聊天,还能帮你写代码、分析数据,甚至解决专业问题。 那么,DeepSeek到底是什么?
2/17/2025 9:03:26 AM
郝光明
DeepSeek 关键技术详解
作者:leaf在今年的春节期间,DeepSeek火出了圈。 凭借DeepSeek-V3与DeepSeek-R1的创新技术和卓越表现,DeepSeek迅速成为了行业内外的焦点。 不管是技术专家还是普通用户,都对DeepSeek赞不绝口。
2/17/2025 9:00:00 AM
腾讯技术工程
百度官宣:全面接入DeepSeek!7亿用户光速进入AI搜索时代
中国互联网行业,再次迎来标志性事件——All in DeepSeek! 继微信之后,百度官宣:百度搜索全面接入DeepSeek。 中国互联网第一大搜索巨头,居然也选择「打不过就加入」了?
2/17/2025 8:51:15 AM
新智元
马斯克炮轰OpenAI:从“开放”到“封闭+贪婪”
在近日的迪拜世界政府峰会上,马斯克对OpenAI的最新发展提出了严厉批评,指责其背离了最初的开源和开放理念,逐渐走向封闭和贪婪。 这一言论引发了广泛关注,也让人们对AI行业的未来发展方向产生了新的思考。 OpenAI的转变:从“Open”到“Closed”马斯克指出,OpenAI最初的设计是一个兼具盈利和非营利性质的“双层架构”组织,这种模式在一定程度上取得了成功。
2/17/2025 8:50:00 AM
小菲
刚刚,DeepSeek揭秘R1官方同款部署设置,温度=0.6!OpenAI推理指南同时上线
同一天内,DeepSeek和OpenAI都发布了推理模型使用指南! DeepSeek的X账号迎来久违的更新:发布了官方版本,教大家如何部署DeepSeek-R1的设置。 最佳方法如下——不使用系统提示采样温度:0.6针对文件上传和网络搜索功能定制prompt每次输出时都以think\n开始,以防模型跳过思考过程注意,官方部署DeepSeek,使用的是跟开源版本完全相同的模型。
2/17/2025 8:37:00 AM
新智元
资讯热榜
标签云
人工智能
OpenAI
AIGC
AI
ChatGPT
DeepSeek
AI绘画
数据
机器人
谷歌
模型
大模型
Midjourney
智能
用户
学习
开源
GPT
微软
Meta
AI创作
图像
技术
论文
Stable Diffusion
马斯克
Gemini
算法
蛋白质
生成式
芯片
代码
英伟达
腾讯
神经网络
计算
研究
Sora
AI for Science
3D
Anthropic
AI设计
机器学习
GPU
开发者
场景
华为
预测
伟达
Transformer
百度
人形机器人
苹果
深度学习
AI视频
模态
字节跳动
xAI
驾驶
文本
搜索
大语言模型
Claude
Copilot
具身智能
神器推荐
LLaMA
算力
安全
应用
视频生成
科技
视觉
亚马逊
干货合集
2024
AGI
特斯拉
大型语言模型
训练