AI - AI在线

推理时也能做偏好优化，无需额外重训练，来自上海AI Lab港中文等

随着大语⾔模型（LLMs）在各类任务中展现出令人瞩目的能力，如何确保它们⽣成的回复既符合预期又安全，始终是⼀项关键挑战。传统的偏好对⻬⽅法，如基于⼈类反馈的强化学习（RLHF）和直接偏好优化（DPO），依赖于训练过程中的模型参数更新，但在⾯对不断变化的数据和需求时，缺乏⾜够的灵活性来适应这些变化。为了突破这⼀瓶颈，上海人工智能实验室、香港中文大学等联合提出了推理时偏好优化（TPO）方法，通过在推理阶段与奖励模型交互，借助可解释的文本反馈，迭代优化模型输出，实现了即时的模型对⻬，⽽⽆需重新训练。

DeepSeek上线国家超算平台！671B满血版，三大运营商接入，平头哥芯片适配

DeepSeek的含金量还在上升，一个半个周末过去发生这些大事：国家超算互联网平台上线DeepSeek-R1，最高支持671B的满血版。平头哥玄铁芯片成功适配DeepSeek-R1系列蒸馏模型，在RISC-V架构CPU和端侧平台打开新的应用空间。再加上春节期间的三大运营商全面接入DeepSeek等消息，它的影响力已不仅限于AI和互联网，正在往产业更深层进发。

Meta新视频生成框架拿捏倒立杂技，双人舞也能完美同步！运动一致性暴增近20%，可无缝集成DiT模型

针对视频生成中的运动一致性难题，Meta GenAI团队提出了一个全新框架VideoJAM。 VideoJAM基于主流的DiT路线，但和Sora等纯DiT模型相比，动态效果直接拉满：哪怕变化又大又迅速、动作又复杂的舞蹈，也看起来像真的一样，而且还是两个人同步：像倒立这样的操作，同样可以轻松驾驭：而且不需要额外数据或缩放，就能无缝集成到不同规模的DiT模型当中，带来运动效果的提升。有网友表示，第一眼看上去就和真的一样，也许到今年年底，我们看不到区别了。

LLM实现自回归搜索！MIT哈佛等提出「行动思维链」COAT，推理能力大提升

OpenAI o1发布后，为提升LLM的推理能力，研究者尝试了多种方法。比如用强大的教师模型进行知识蒸馏、采用蒙特卡洛树搜索（MCTS），以及基于奖励模型的引导搜索。近日，来自MIT、新加坡科技设计大学、哈佛大学等机构的华人研究者探索了全新的方向：让LLM拥有自回归搜索能力。

诺奖得主DeepMind CEO放话：DeepSeek是中国最好AI模型，但没任何科学进步

就在今天，谷歌DeepMind的首席执行官Demis Hassabis对DeepSeek进行了一番「捧杀」——「它可能是中国最好的工作，但没有展示任何新的科学进展。」Hassabis首先称DeepSeek的模型是「一项令人印象深刻的工作」，然后便一改口风说道：「从技术角度来看，这并不是一个重大变革」，同时还特别强调「炒作有点夸大了」。「尽管炒作很多，但实际上并没有新的科学突破，它使用的都是已知的AI技术。

马克龙豪掷1090亿开欧洲「星际之门」，Mistral狂飙登顶法国APP榜首！

就在刚刚，Le Chat登顶法国免费APP榜首！在效率榜中，ChatGPT屈居第二，DeepSeek仅排第三在美国效率榜排名35（ChatGPT第一，DeepSeek第二）欧洲开发者们一片欢腾：恭喜Mistral AI，让欧洲的AI竞赛中终于（在欧洲）有了一席之地。之前，不管是OpenAI还是DeepSeek，都光芒太盛。

AI 语音诈骗分子冒充意大利国防部长，盯上多名商界精英

据彭博社报道，近日意大利发生了一起利用人工智能语音工具实施诈骗的事件。诈骗分子伪装成意大利国防部长克罗塞托（Guido Crosetto）及其团队成员，试图说服意大利一些顶级企业家向海外汇款。

沙特宣布149亿美元AI投资计划，巩固全球技术领导地位

近日，LEAP2025旗舰活动在沙特阿拉伯利雅得正式启动，汇聚全球技术与创新领袖。据沙特通讯社报道，活动首日宣布了一项总额超过149亿美元的人工智能（AI）领域投资和项目，标志着沙特阿拉伯在全球数字化未来塑造中的领先地位。此次投资将促进数字技能发展，支持科技初创企业的成长，并激励沙特国内的创新。

DeepSeek本地部署教程，小白也能搞定！

安装环境操作系统：Windows 10及以上准备工具：轻量级AI模型调用工具Ollama，调用AI模型为deepseek-r1AI 模型管理工具Cherry-Studio或AnythingLLM（二选一）资源链接：复制安装步骤第一步、下载安装Ollama并修改环境变量要运行大模型，首先需要一个好用的工具，推荐使用 Ollama ，它是一个轻量级的工具，支持快速安装和运行大语言模型（如deepseek、Llama、Qwen 等）。 ollama下载地址：官网链接（文章开头）选择合适的操作系统下载，默认安装完成即可。这里注意，ollama安装完成后先不要启用，因为它默认是会将模型下载到C盘的，deepseek、Qwen等模型最小也有好几个GB会占用C盘空间，所以需要先设置ollama的环境变量。

Deepseek4j再更新：Java应用一行代码集成DeepSeek

deepseek4j 是什么deepseek4j() 是一个专为 Java 开发者打造的 DeepSeek 模型集成框架。通过优雅的 API 设计，只需一行代码，即可实现接入 DeepSeek，并获得以下核心能力：完整思维链保留：完美保留 DeepSeek 模型的推理过程，让 AI 的思考过程可追溯流式输出体验：基于 Reactor 实现的流式响应，带来类 ChatGPT 的打字机效果复制使用 deepseek4j，您可以专注于业务逻辑开发，而无需关心底层细节。一、v1.3 更新内容1.1 联网搜索支持1739118403新版本最重要的更新是引入了联网搜索能力，这一功能带来三个关键优势：突破时间边界：模型不再受限于预训练数据的时间范围，可以获取和处理最新信息实时信息获取：通过高质量信息源获取实时资讯，提供更精准的问答服务差异化竞争：在大模型同质化严重的当下，联网搜索成为关键的差异化竞争点复制1.2 智能系统提示词1739118117系统提示词（System Prompt）是基于模型开发的应用程序内置的指令，让决定了模型在特定上下文中的表现方式、回答风格和功能范围。

刚刚，奥特曼给出AGI三个判断：Scaling Law保持不变，没理由放缓投资

刚刚，OpenAI奥特曼的最新AI观察出炉：Scaling Law将保持不变，短时间内没有理由停止对AI进行指数增长级的投资！具体共有3点1、AI能力与投入资源呈对数关系2、AI使用成本每年降低约10倍3、AI带来的社会经济价值呈超级指数增长图片在最新发布的博客里，他给出对于AGI当下及未来的细致判断。等到2035年，每个人都可以调动相当于2025年所有人智慧总和的能力。

刚刚，Sam Altman深夜发文，AI Agent将重塑世界经济

今天凌晨5点，OpenAI联合创始人兼首席执行官Sam. Altman在其个人博客，发布了一篇深度文章《Three Observations》。主要对AI世界提出了3点观察，AI模型的智能水平大致等于用于训练和运行它的资源的对数；使用特定水平AI的成本大约每12个月下降10倍，而更低的价格会带来更多的使用；线性增长的智能所创造的社会经济价值是超指数增长。

法国总统马克龙宣布1090亿欧元人工智能投资计划

法国总统埃马纽埃尔・马克龙近日在巴黎宣布，未来几年将投入1090亿欧元用于人工智能（AI）领域的发展。这一计划的推出正值巴黎举办的 AI 行动峰会，该峰会吸引了包括 OpenAI 首席执行官萨姆・阿尔特曼在内的众多全球领导者和 AI 企业高管的参与。此次投资计划的发布，显示出欧洲希望在迅速发展的人工智能行业中占据一席之地，尤其是在美国和中国的强大竞争下。

SFT并非必需！推理模型仅靠RL就能获得长思维链能力，清华CMU团队破解黑盒

DeepSeek-R1慢思考、长推理的表现，展现了训练步骤增加，会导致长CoT的涌现。它通过模拟人类思维逐步推导答案，提升了AI大模型的推理能力和可解释性。但长CoT的触发条件是什么？

谷歌 DeepMind CEO 称 DeepSeek 是“中国最好作品”，AGI 或在 5 年内到来

谷歌旗下 DeepMind 公司首席执行官德米斯・哈萨比斯（Demis Hassabis）表示，Deepseek 的 AI 模型可能是“我见过的来自中国最好的作品（I think its probably the best work I've seen come out of China）”。然而他强调，尽管 Deepseek 的模型展示了出色的工程能力，并在地缘政治层面产生了影响，但从技术角度来看，这并非一项重大的变革。他指出，Deepseek 的模型并未带来新的科学进展，而是使用了已知的人工智能技术，外界对其的炒作可能“有点夸大了”。

AI

推理时也能做偏好优化，无需额外重训练，来自上海AI Lab港中文等

DeepSeek上线国家超算平台！671B满血版，三大运营商接入，平头哥芯片适配

Meta新视频生成框架拿捏倒立杂技，双人舞也能完美同步！运动一致性暴增近20%，可无缝集成DiT模型

LLM实现自回归搜索！MIT哈佛等提出「行动思维链」COAT，推理能力大提升

诺奖得主DeepMind CEO放话：DeepSeek是中国最好AI模型，但没任何科学进步

马克龙豪掷1090亿开欧洲「星际之门」，Mistral狂飙登顶法国APP榜首！

AI 语音诈骗分子冒充意大利国防部长，盯上多名商界精英

沙特宣布149亿美元AI投资计划，巩固全球技术领导地位

DeepSeek本地部署教程，小白也能搞定！

Deepseek4j再更新：Java应用一行代码集成DeepSeek

刚刚，奥特曼给出AGI三个判断：Scaling Law保持不变，没理由放缓投资

刚刚，Sam Altman深夜发文，AI Agent将重塑世界经济

法国总统马克龙宣布1090亿欧元人工智能投资计划

SFT并非必需！推理模型仅靠RL就能获得长思维链能力，清华CMU团队破解黑盒

谷歌 DeepMind CEO 称 DeepSeek 是“中国最好作品”，AGI 或在 5 年内到来

OpenAI内部模型曝光！编程能力跻身全球Top50程序员，年底不再有人类对手

斯坦福华人博士生打破58年僵局！牛顿提出的亲吻数问题有了新突破

OpenAI CEO 阿尔特曼最新思考：AI 普惠与 AGI 的挑战

AI

推理时也能做偏好优化，无需额外重训练，来自上海AI Lab港中文等

DeepSeek上线国家超算平台！671B满血版，三大运营商接入，平头哥芯片适配

Meta新视频生成框架拿捏倒立杂技，双人舞也能完美同步！运动一致性暴增近20%，可无缝集成DiT模型

LLM实现自回归搜索！MIT哈佛等提出「行动思维链」COAT，推理能力大提升

诺奖得主DeepMind CEO放话：DeepSeek是中国最好AI模型，但没任何科学进步

马克龙豪掷1090亿开欧洲「星际之门」，Mistral狂飙登顶法国APP榜首！

AI 语音诈骗分子冒充意大利国防部长，盯上多名商界精英

沙特宣布149亿美元AI投资计划，巩固全球技术领导地位

DeepSeek本地部署教程，小白也能搞定！

Deepseek4j再更新：Java应用一行代码集成DeepSeek

刚刚，奥特曼给出AGI三个判断：Scaling Law保持不变，没理由放缓投资

刚刚，Sam Altman深夜发文，AI Agent将重塑世界经济

​法国总统马克龙宣布1090亿欧元人工智能投资计划

SFT并非必需！推理模型仅靠RL就能获得长思维链能力，清华CMU团队破解黑盒

谷歌 DeepMind CEO 称 DeepSeek 是“中国最好作品”，AGI 或在 5 年内到来

OpenAI内部模型曝光！编程能力跻身全球Top50程序员，年底不再有人类对手

斯坦福华人博士生打破58年僵局！牛顿提出的亲吻数问题有了新突破

OpenAI CEO 阿尔特曼最新思考：AI 普惠与 AGI 的挑战

法国总统马克龙宣布1090亿欧元人工智能投资计划