资讯列表

分类

标签

Kimi 数理化能跟 o1 掰手腕了？新模型 k1 有点儿强

最直接的实测例子是：当我们把杨振宁、伽利略等世界知名科学家的研究手稿拍照、上传后，k1 居然能识别图片中的文字，生动解读背后的物理、天文学等科学知识，从而回答用户的提问并给出清晰完整的推理思考过程。例如，当我们上传杨振宁的手稿并向 k1 提问，k1 给出了超乎小编知识范畴所能辨真伪的答案：这是杨振宁的手稿图片——这是我们的询问：这是物理学家杨振宁的手稿照片，请你一步一步分析，杨振宁在计算什么，他可能在想什么，当时可能是什么背景？这是 k1 的回答：上下滑动查看长图虽然小编既不懂电磁场、也不懂粒子动力学，但看完 k1 的答案着实大吃一惊！

12/16/2024 6:37:00 PM

张进

Ilya错了，预训练没结束！LeCun等反击，「小模型时代」让奥特曼预言成真

最近，Ilya在NeurIPS 2024中宣布：预训练结束了！在他看来，数据如同化石燃料般难以再生，因此训练模型需要的海量数据即将枯竭。作为前OpenAI首席科学家，Ilya的这番话，有可能影响之后数十年的AI发展方向。

12/16/2024 6:20:32 PM

新智元

两个用于科研的开源 AI Agent，改变知识研究的方式

想象一下，如果可以让爱因斯坦、埃隆·马斯克、费曼、史蒂夫·乔布斯、简·古道尔和尤瓦尔·诺亚·赫拉利和你一起合作共同研究并编写研究报告，这是一种什么感受？我们每天产生的信息比过去一年产生的信息还要多，假如研究人员想在一个小时内访问一万个网站、研究分析数据、并编写报告，这实际上是不可能的。如今，随着AI 大模型技术的发展，使用AI Agent却可以轻松地做到这一点。

12/16/2024 6:04:11 PM

zone7

国产万卡系统究竟怎么样了？中国工程院院士郑纬民：国产万卡很重要，但也很难，异地卡联合训练不太可行

编辑 | 言征出品 | 51CTO技术栈（微信号：blog51cto）临近年底，业内曝出了不少大新闻，比如大模型撞墙、谷歌的Gemini 2 Flash和量子芯片Willow，再比如英伟达面临着中国反垄断调查的危机等，所有这些，让国产AI算力的话题再次成为圈内的热议点。那么，国产算力中心构建究竟什么情况？背后支撑大模型训练和推理的计算机系统现在都面临着怎样的难题？

12/16/2024 5:50:22 PM

言征

图像领域再次与LLM一拍即合！idea撞车OpenAI强化微调，西湖大学发布图像链CoT

OpenAI最近推出了在大语言模型LLM上的强化微调（Reinforcement Finetuning，ReFT），能够让模型利用CoT进行多步推理之后，通过强化学习让最终输出符合人类偏好。无独有偶，齐国君教授领导的MAPLE实验室在OpenAI发布会一周前公布的工作中也发现了图像生成领域的主打方法扩散模型和流模型中也存在类似的过程：模型从高斯噪声开始的多步去噪过程也类似一个思维链，逐步「思考」怎样生成一张高质量图像，是一种图像生成领域的「图像链CoT」。与OpenAI不谋而和的是，机器学习与感知（MAPLE）实验室认为强化学习微调方法同样可以用于优化多步去噪的图像生成过程，论文指出利用与人类奖励对齐的强化学习监督训练，能够让扩散模型和流匹配模型自适应地调整推理过程中噪声强度，用更少的步数生成高质量图像内容。

12/16/2024 5:44:18 PM

新智元

英国测试 AI 摄像头抓酒驾：可通过驾车行为和道路使用情况判断

据BBC当地时间14日报道，英国交通管理部门正在德文郡和康沃尔郡测试一种新型摄像头，利用人工智能技术识别可能存在酒驾或毒驾行为的驾车者。

12/16/2024 4:31:23 PM

清源

全球首个全模态理解开源端模型：长语音自动总结，图文音啥都会！300%推理速度领先，来自无问芯穹

全球首个端侧全模态理解开源模型来了！在菜单里帮忙选奶茶，不在话下：还能帮忙轻松提炼长语音，再也不用对着一串几十秒语音头皮发麻（doge）。就在刚刚，无问芯穹宣布开源目前世界上首个端侧全模态理解的开源模型Megrez-3B-Omni，不仅体积轻巧，速度飞快，更是一个多才多艺的全能选手，能够轻松处理图片、音频、文本三种模态数据。

12/16/2024 4:10:15 PM

Kimi又上新！抢先实测视觉思考模型k1，甚至比o1更聪明

用强化学习，改变大模型技术范式。国产大模型，正在引领 AI 技术新方向。今天上午，月之暗面 Kimi 正式发布了视觉思考模型 k1，并已经上线了最新版的网页版以及安卓和 iOS APP。

12/16/2024 3:50:00 PM

机器之心

谷歌 CEO 皮查伊：特斯拉和 Waymo 是自动驾驶领域前两名

在纽约时报 DealBook 峰会上，谷歌首席执行官桑达尔・皮查伊（Sundar Pichai）高度评价特斯拉在自动驾驶领域的领先地位，并将其与 Waymo 并列为行业翘楚。

12/16/2024 2:59:26 PM

远洋

与1500多支国内外队伍同台竞技，快手在NeurIPS 2024顶级大赛中上演双杀

这几天，学术圈的小伙伴肯定都很关注正在加拿大温哥华举办的机器学习顶会——NeurIPS 2024。本届会议于今日落下帷幕，共接收 15671 篇有效论文投稿，比去年增长了 27%，最终接收率为 25.8%。本届会议上同样值得关注的，还有一项重要的赛事，它就是「NeurIPS 2024 Auto-Bidding in Large-Scale Auctions」（大规模拍卖中的自动出价），旨在探索当前火热的强化学习、生成模型、Agent 等前沿 AI 技术在广告投放以及决策智能场景的应用。

12/16/2024 2:56:00 PM

机器之心

企业大模型落地关键是什么？这家领先的大模型技术和应用公司给出答案

12 月 12 日，由中国人工智能产业发展联盟（AIIA）指导、北京中关村科金技术有限公司主办的【2024 大模型技术与应用创新论坛】在北京成功举办。论坛现场，中关村科金总裁喻友平正式发布大模型时代的 “三级引擎战略”，推出重磅升级的得助大模型平台 2.0，以及一系列大模型应用。其中，得助大模型平台 2.0 具备算力统一调度能力、一站式模型训推、应用快速构建三大核心能力，并基于企业级最佳实践沉淀上百个全场景套件，能够帮助各类企业快速构建和部署自己的大模型应用，显著降低企业大模型落地成本。

12/16/2024 2:48:00 PM

机器之心

世界模型进入4D时代！单视角视频构建的自由视角4D世界来了

人工智能技术正以前所未有的速度改变着我们对世界的认知与构建方式。近期，李飞飞教授团队通过单张图片生成三维物理世界的研究，再次向世界展示了空间智能技术的巨大潜力。单图生成三维世界，不仅让人们能以交互方式探索静态图像，更标志着 AI 在重建与理解物理场景方面迈入全新阶段。

12/16/2024 2:40:00 PM

机器之心

AI病理助手来了！浙大OmniPT上岗，3秒锁定癌症病灶，准确率超95%

病理是疾病诊断的「金标准」，而我国面临病理诊断人才严重匮乏窘境。近年来癌症发病率不断攀升，如何借助 AI 赋能医生精准诊断，提高工作效率及医疗质量，成为当前世界病理学科的前沿热点。近日，浙江大学发布了视觉与语言模型融合的人机交互 AI 病理万能助手 - OmniPT，该模型已在浙江大学医学院附属第一医院（以下简称「浙大一院」）病理科进行临床应用验证，病理诊断技术进入了智能化与个性化的新时代。

12/16/2024 2:39:00 PM

机器之心

沟通无限，服务无界：科大讯飞携手中国银行四川省分行在天府机场应用多语种AI透明屏

四川中行创新上线科大讯飞多语种 AI 透明屏。

12/16/2024 2:36:00 PM

新闻助手

无问芯穹发布全球首个端侧全模态理解的开源模型Megrez-3B-Omni，小巧全能，极速推理

12月16日，无问芯穹宣布正式开源其“端模型端软件端IP”端上智能一体化解决方案中的小模型——全球首个端侧全模态理解开源模型Megrez-3B-Omni，并同步开源了纯语言版本模型Megrez-3B-Instruct。据介绍，Megrez-3B-Omni是一个为端而生的全模态理解模型，选择了最适合手机、平板等端侧设备的30亿参数黄金尺寸，结构规整，推理速度最大领先同精度模型300%。作为一个全模态模型，Megrez-3B-Omni同时具备图片、音频、文本三种模态数据的处理能力，并在三个模态的多种测评基准中取得了最优性能。

12/16/2024 2:26:00 PM

新闻助手

AI新奇应用案例与及其对房地产行业的影响

在人类创造力这片神圣的空间中，AI的崛起(特别是以ChatGPT等技术为代表)堪称我们集体智慧的浓缩与回响，是智能与人工设计的融合。它既是工程领域的一大奇迹，也深刻映射出人类社会的当前状况。生成式AI及其错综复杂的算法网络体现出了现代性的导论。

12/16/2024 2:23:50 PM

OpenAI启动ChatGPT Projects，让你可以组织文件、分组聊天

OpenAI最新发布的ChatGPT . Projects，解决了在ChatGPT上整理文件和对话的需求，该功能与谷歌广受欢迎的NotebookLM应用类似。在“OpenAI 12日”直播活动的第六天，该公司推出了ChatGPT .

12/16/2024 2:20:55 PM

Emilia David

Bengio参与的首个《AI安全指数报告》出炉，最高分仅C、国内一家公司上榜

图片安全话题，在人工智能（AI）行业一向备受关注。尤其是诸如 GPT-4 这样的大语言模型（LLM）出现后，有不少业内专家呼吁「立即暂停训练比 GPT-4 更强大的人工智能模型」，包括马斯克在内的数千人纷纷起身支持，联名签署了一封公开信。这封公开信便来自生命未来研究所（Future of Life Institute），该机构由麻省理工学院教授、物理学家、人工智能科学家、《生命 3.0》作者 Max Tegmark 等人联合创立，是最早关注人工智能安全问题的机构之一，其使命为 “引导变革性技术造福生活，避免极端的大规模风险”。

12/16/2024 2:20:00 PM

机器之心

资讯热榜

纳米AI发布MCP万能工具箱，简化AI工具集成与调用即梦3.0海外版发布，电影级视觉与精准英文排版引领AI创作新高度 Mac也能跑Qwen3，一文看懂本地部署qwen 3配置要求 AI视频资讯早读！7个产品更新+8个案例精选 Manus开源平替！Kortix-AI正式发布开源通用AI智能体平台Suna Ollama 支持全线的 Qwen 3 模型 Qwen3正式发布，优化编码与代理能力，强化MCP支持引领AI新潮流 DeepWiki：AI驱动的GitHub代码库百科全书正式亮相

标签云

人工智能 OpenAI AIGC AI ChatGPT AI绘画 DeepSeek 数据机器人模型谷歌大模型 Midjourney 智能开源用户学习 GPT 微软 Meta 图像 AI创作技术论文 Stable Diffusion Gemini 马斯克算法蛋白质芯片生成式代码英伟达腾讯神经网络研究计算 Anthropic Sora 3D AI for Science AI设计机器学习 GPU 开发者 AI视频场景华为预测人形机器人百度苹果伟达 Transformer 深度学习 xAI 模态字节跳动 Claude 大语言模型搜索具身智能驾驶神器推荐文本 Copilot LLaMA 算力安全视觉视频生成干货合集应用训练大型语言模型科技亚马逊特斯拉 2024 AGI