AI

推理时也能做偏好优化,无需额外重训练,来自上海AI Lab港中文等

随着大语⾔模型(LLMs)在各类任务中展现出令人瞩目的能力,如何确保它们⽣成的回复既符合预期又安全,始终是⼀项关键挑战。 传统的偏好对⻬⽅法,如基于⼈类反馈的强化学习(RLHF)和直接偏好优化(DPO),依赖于训练过程中的模型参数更新,但在⾯对不断变化的数据和需求时,缺乏⾜够的灵活性来适应这些变化。 为了突破这⼀瓶颈,上海人工智能实验室、香港中文大学等联合提出了推理时偏好优化(TPO)方法,通过在推理阶段与奖励模型交互,借助可解释的文本反馈,迭代优化模型输出,实现了即时的模型对⻬,⽽⽆需重新训练。

DeepSeek上线国家超算平台!671B满血版,三大运营商接入,平头哥芯片适配

DeepSeek的含金量还在上升,一个半个周末过去发生这些大事:国家超算互联网平台上线DeepSeek-R1,最高支持671B的满血版。 平头哥玄铁芯片成功适配DeepSeek-R1系列蒸馏模型,在RISC-V架构CPU和端侧平台打开新的应用空间。 再加上春节期间的三大运营商全面接入DeepSeek等消息,它的影响力已不仅限于AI和互联网,正在往产业更深层进发。

Meta新视频生成框架拿捏倒立杂技,双人舞也能完美同步!运动一致性暴增近20%,可无缝集成DiT模型

针对视频生成中的运动一致性难题,Meta GenAI团队提出了一个全新框架VideoJAM。 VideoJAM基于主流的DiT路线,但和Sora等纯DiT模型相比,动态效果直接拉满:哪怕变化又大又迅速、动作又复杂的舞蹈,也看起来像真的一样,而且还是两个人同步:像倒立这样的操作,同样可以轻松驾驭:而且不需要额外数据或缩放,就能无缝集成到不同规模的DiT模型当中,带来运动效果的提升。 有网友表示,第一眼看上去就和真的一样,也许到今年年底,我们看不到区别了。

LLM实现自回归搜索!MIT哈佛等提出「行动思维链」COAT,推理能力大提升

OpenAI o1发布后,为提升LLM的推理能力,研究者尝试了多种方法。 比如用强大的教师模型进行知识蒸馏、采用蒙特卡洛树搜索(MCTS),以及基于奖励模型的引导搜索。 近日,来自MIT、新加坡科技设计大学、哈佛大学等机构的华人研究者探索了全新的方向:让LLM拥有自回归搜索能力。

诺奖得主DeepMind CEO放话:DeepSeek是中国最好AI模型,但没任何科学进步

就在今天,谷歌DeepMind的首席执行官Demis Hassabis对DeepSeek进行了一番「捧杀」——「它可能是中国最好的工作,但没有展示任何新的科学进展。 」Hassabis首先称DeepSeek的模型是「一项令人印象深刻的工作」,然后便一改口风说道:「从技术角度来看,这并不是一个重大变革」,同时还特别强调「炒作有点夸大了」。 「尽管炒作很多,但实际上并没有新的科学突破,它使用的都是已知的AI技术。

马克龙豪掷1090亿开欧洲「星际之门」,Mistral狂飙登顶法国APP榜首!

就在刚刚,Le Chat登顶法国免费APP榜首! 在效率榜中,ChatGPT屈居第二,DeepSeek仅排第三在美国效率榜排名35(ChatGPT第一,DeepSeek第二)欧洲开发者们一片欢腾:恭喜Mistral AI,让欧洲的AI竞赛中终于(在欧洲)有了一席之地。 之前,不管是OpenAI还是DeepSeek,都光芒太盛。

AI 语音诈骗分子冒充意大利国防部长,盯上多名商界精英

据彭博社报道,近日意大利发生了一起利用人工智能语音工具实施诈骗的事件。诈骗分子伪装成意大利国防部长克罗塞托(Guido Crosetto)及其团队成员,试图说服意大利一些顶级企业家向海外汇款。

沙特宣布149亿美元AI投资计划,巩固全球技术领导地位

近日,LEAP2025旗舰活动在沙特阿拉伯利雅得正式启动,汇聚全球技术与创新领袖。 据沙特通讯社报道,活动首日宣布了一项总额超过149亿美元的人工智能(AI)领域投资和项目,标志着沙特阿拉伯在全球数字化未来塑造中的领先地位。 此次投资将促进数字技能发展,支持科技初创企业的成长,并激励沙特国内的创新。

DeepSeek本地部署教程,小白也能搞定!

安装环境操作系统:Windows 10及以上准备工具:轻量级AI模型调用工具Ollama,调用AI模型为deepseek-r1AI 模型管理工具Cherry-Studio或AnythingLLM(二选一)资源链接:复制安装步骤第一步、下载安装Ollama并修改环境变量要运行大模型,首先需要一个好用的工具,推荐使用 Ollama ,它是一个轻量级的工具,支持快速安装和运行大语言模型(如deepseek、Llama、Qwen 等)。 ollama下载地址 :官网链接(文章开头)选择合适的操作系统下载,默认安装完成即可。 这里注意,ollama安装完成后先不要启用,因为它默认是会将模型下载到C盘的,deepseek、Qwen等模型最小也有好几个GB会占用C盘空间,所以需要先设置ollama的环境变量。

Deepseek4j再更新:Java应用一行代码集成DeepSeek

deepseek4j 是什么deepseek4j() 是一个专为 Java 开发者打造的 DeepSeek 模型集成框架。 通过优雅的 API 设计,只需一行代码,即可实现接入 DeepSeek,并获得以下核心能力:完整思维链保留:完美保留 DeepSeek 模型的推理过程,让 AI 的思考过程可追溯流式输出体验:基于 Reactor 实现的流式响应,带来类 ChatGPT 的打字机效果复制使用 deepseek4j,您可以专注于业务逻辑开发,而无需关心底层细节。 一、v1.3 更新内容1.1 联网搜索支持1739118403新版本最重要的更新是引入了联网搜索能力,这一功能带来三个关键优势:突破时间边界:模型不再受限于预训练数据的时间范围,可以获取和处理最新信息实时信息获取:通过高质量信息源获取实时资讯,提供更精准的问答服务差异化竞争:在大模型同质化严重的当下,联网搜索成为关键的差异化竞争点复制1.2 智能系统提示词1739118117系统提示词(System Prompt)是基于模型开发的应用程序内置的指令,让决定了模型在特定上下文中的表现方式、回答风格和功能范围。

刚刚,奥特曼给出AGI三个判断:Scaling Law保持不变,没理由放缓投资

刚刚,OpenAI奥特曼的最新AI观察出炉:Scaling Law将保持不变,短时间内没有理由停止对AI进行指数增长级的投资! 具体共有3点1、AI能力与投入资源呈对数关系2、AI使用成本每年降低约10倍3、AI带来的社会经济价值呈超级指数增长图片在最新发布的博客里,他给出对于AGI当下及未来的细致判断。 等到2035年,每个人都可以调动相当于2025年所有人智慧总和的能力。

刚刚,Sam Altman深夜发文,AI Agent将重塑世界经济

今天凌晨5点,OpenAI联合创始人兼首席执行官Sam. Altman在其个人博客,发布了一篇深度文章《Three Observations》。 主要对AI世界提出了3点观察,AI模型的智能水平大致等于用于训练和运行它的资源的对数;使用特定水平AI的成本大约每12个月下降10倍,而更低的价格会带来更多的使用;线性增长的智能所创造的社会经济价值是超指数增长。

​法国总统马克龙宣布1090亿欧元人工智能投资计划

法国总统埃马纽埃尔・马克龙近日在巴黎宣布,未来几年将投入1090亿欧元用于人工智能(AI)领域的发展。 这一计划的推出正值巴黎举办的 AI 行动峰会,该峰会吸引了包括 OpenAI 首席执行官萨姆・阿尔特曼在内的众多全球领导者和 AI 企业高管的参与。 此次投资计划的发布,显示出欧洲希望在迅速发展的人工智能行业中占据一席之地,尤其是在美国和中国的强大竞争下。

SFT并非必需!推理模型仅靠RL就能获得长思维链能力,清华CMU团队破解黑盒

DeepSeek-R1慢思考、长推理的表现,展现了训练步骤增加,会导致长CoT的涌现。 它通过模拟人类思维逐步推导答案,提升了AI大模型的推理能力和可解释性。 但长CoT的触发条件是什么?

谷歌 DeepMind CEO 称 DeepSeek 是“中国最好作品”,AGI 或在 5 年内到来

谷歌旗下 DeepMind 公司首席执行官德米斯・哈萨比斯(Demis Hassabis)表示,Deepseek 的 AI 模型可能是“我见过的来自中国最好的作品(I think its probably the best work I've seen come out of China)”。然而他强调,尽管 Deepseek 的模型展示了出色的工程能力,并在地缘政治层面产生了影响,但从技术角度来看,这并非一项重大的变革。他指出,Deepseek 的模型并未带来新的科学进展,而是使用了已知的人工智能技术,外界对其的炒作可能“有点夸大了”。

OpenAI内部模型曝光!编程能力跻身全球Top50程序员,年底不再有人类对手

除了o1/o3,OpenAI另一个尚未公开的内部推理模型曝光了。 爆料者正是CEO奥特曼本人。 据他透露,与全球顶尖程序员相比,当前这一内部模型的编程能力已达Top50,甚至今年年底将排名第一。

斯坦福华人博士生打破58年僵局!牛顿提出的亲吻数问题有了新突破

牛顿想出的“球体亲吻数”(kissing number)难题,华人学者取得新进展。 n维空间中,给定一个n维球体,最多有几个相同的球体可以与它接触而不重叠? 斯坦福博士生Anqi Li在微软实习期间完成这项研究,导师Henry Cohn本意是让她用计算机辅助,她却创造性地找到了数学上的新解法。

OpenAI CEO 阿尔特曼最新思考:AI 普惠与 AGI 的挑战

在个人博客上发表的一篇新文章中,OpenAI 首席执行官山姆・阿尔特曼提出了包括“计算预算”在内的多项“听起来有些奇怪”的想法,旨在“让地球上的每个人都能广泛使用人工智能”,并确保该技术的益处能够广泛分配。