资讯列表

分类

标签

vLLM架构到底是个啥？一文全面认知视觉大语言模型~

毕业一年了，一直在从事大模型推理相关的工作。工作中最常拿来比较的LLM推理框架就是vLLM，最近抽出时间详细的研究了一下vLLM的架构，希望能对vLLM有一个更详细和全面的认识。架构总览vLLM python 工程目录如图标出的文件是vLLM python侧的工程目录中核心的组件，按照层次间的依赖关系，可以大致拆解为如下结构：LLM 类为顶层用户应用， LLM 类控制 LLM Engine类负责总管推理全流程，LLM Engine中包含 Scheduler 类和 Worker类。

1/6/2025 11:10:00 AM

CalebDu

天工大模型 4.0 o1 版 / 4o 版上线，App 及网页可免费使用

天工大模型4.0 o1版号称国内首款具备中文逻辑推理能力的o1模型，不仅包含上线即开源的模型，还有两款性能更强的专用版本。其能够熟练处理各种推理挑战，包括数学、代码、逻辑、常识、伦理决策等问题。

1/6/2025 10:49:12 AM

清源

研究报告：98.4%组织计划在2025年扩大AI和数据投资

一篇刊登在哈佛商业评论(Harvard Business . Review)最的最新研究表明，98.4%的组织2025年计划增加对AI和数据驱动战略的投资。根据Data & AI Leadership .

1/6/2025 10:33:54 AM

Adobe发布TurboEdit：可以通过文本来编辑图像，编辑时间<0.5秒！

今天给大家介绍Adobe研究院新的研究TurboEdit，可以通过文本来编辑图像，通过一句话就能改变图像中的头发颜色、衣服、帽子、围巾等等。而且编辑飞快，0.5秒。简直是图像编辑的利器。

1/6/2025 10:30:00 AM

Zongze Wu等

「停止雇佣人类」广告牌爆火，OpenAI放惊人言论：每月2000刀，AI淘汰人类！

随着人工智能的日益强大，最令人担心的事情终于还是发生了。旧金山一家科技公司已经开始明目张胆地宣布「停止雇佣人类」！就在旧金山密西西比街的一侧，一些酒店从业者为了争取更高待遇与更多工作机会的罢工运动已经持续了数月。

1/6/2025 10:23:00 AM

新智元

OCR-Omni来了！字节&华师提出统一的多模态生成模型TextHarmony

本文经AIGC Studio公众号授权转载，转载请联系出处。在人工智能领域，赋予机器类人的图像文字感知、理解、编辑和生成能力一直是研究热点。目前，视觉文字领域的大模型研究主要聚焦于单模态生成任务。

1/6/2025 10:00:00 AM

AIGC Studio

千寻智能高阳：RobotGPT-1阶段已至，4年后达到3.5阶段 | MEET 2025

我对于具身智能的定义很简单，就是能帮人类做各种事，比如帮我们的爷爷奶奶养老。 ……现在定义具身智能的L1-L5级没有意义，核心标准还是我们的机器人能解决哪些实际问题。具身智能趋势大热，敢于给断言的人不多，高阳是一个。

1/6/2025 9:45:00 AM

量子位

字节 & 清华大学提出 AnyDressing ：通过潜在扩散模型实现可定制的多服装虚拟试穿。

今天的文章来自公众号粉丝投稿，清华大学联合字节提出了一项虚拟试穿新方法AnyDressing: 可以利用参考的服饰和文本prompt定制化人物，核心是解决多服饰组合搭配、文本响应以及服饰细节的问题。 • 可靠性： AnyDressing 适合各种场景和复杂的服装。 • 兼容性： AnyDressing 兼容 LoRA 以及 ControlNet 和 FaceID 等插件。

1/6/2025 9:30:00 AM

AIGC Studio

SHMT：通过潜在扩散模型进行自监督分层化妆转移（阿里&武汉理工）

本文经AIGC Studio公众号授权转载，转载请联系出处。当前的妆容转移技术面临两个主要挑战：缺乏成对数据，导致模型训练依赖于低质量的伪配对数据，从而影响妆容的真实感；不同妆容风格对面部的影响各异，现有方法难以有效处理这种多样性。今天给大家介绍的方法是由阿里联合武汉理工等提出的自监督层次化妆转移方法（SHMT），可以将多样化的妆容风格自然且精准地应用于给定的面部图像。

1/6/2025 9:00:00 AM

Zhaoyang Sun等

CMU等曝光GitHub「地下产业链」！450万个Star都是刷的

什么？ Github的star居然都能是假的了，甚至数量达到了惊人的450万！大多数的研究人员都会将自己的项目发布到Github中，以增加曝光度。

1/6/2025 8:50:00 AM

新智元

OpenAI最大秘密，竟被中国研究者破解？复旦等惊人揭秘o1路线图

就在今天，国内的一篇论文，引得全球AI学者震惊不已。推上多位网友表示，OpenAI o1和o3模型背后究竟是何原理——这一未解之谜，被中国研究者「发现」了！注：作者是对如何逼近此类模型进行了理论分析，并未声称已经「破解」了这个问题实际上，在这篇长达51页的论文中，来自复旦大学等机构的研究人员，从强化学习的角度分析了实现o1的路线图。

1/6/2025 8:30:00 AM

新智元

PC-BEV：巧用多坐标系融合策略，实现点云分割170倍加速，精度显著提升！

本文经3D视觉之心公众号授权转载，转载请联系出处。论⽂题目：PC-BEV: An Efficient Polar-Cartesian BEV Fusion Framework for LiDAR Semantic Segmentation论文作者：Shoumeng Qiu, Xinrun Li, Xiangyang Xue, Jian Pu论文地址：，其目标在于精细地理解周围环境的语义信息。目前，该领域的方法主要分为三类：基于点的方法、基于体素的方法和基于投影的方法。

1/6/2025 8:20:00 AM

Shoumeng Qiu

陶哲轩自述被拒稿是常事，「大牛名字」不是通行证！

著名数学家、菲尔兹奖得主陶哲轩在个人社交网站上分享了自己被拒稿的经历，出发点是有人曾表示「陶哲轩被拒稿」很不可思议，但其实自己每年都会被拒稿。拒稿事件在经过几天发酵后，登上了Hacker News热榜：让网友感到惊奇的是，原来「大牛名字」也不保中，进而引发了关于「审稿制度」合理性的讨论。下面是陶哲轩发布的原文：今天我投稿的一篇论文被期刊拒绝了，他们礼貌地回信说虽然他们觉得这篇论文有趣，但并不适合他们的期刊。

1/6/2025 8:00:00 AM

新智元

斯坦福打脸大模型数学水平：题干一改就集体降智，强如o1也失准，能力涌现怕不是检索题库

只是换一下数学题的变量名称，大模型就可能集体降智？？斯坦福大学最新研究表明，在他们最新提出的Putnam-AXIOM测试集上，仅仅是更换一下原题目的变量名称、变量取值范围，模型的准确率就直线下降。

1/6/2025 7:50:00 AM

全网都在扒的DeepSeek团队，是清北应届生撑起一片天

DeepSeek-v3大模型横空出世，以1/11算力训练出超过Llama 3的开源模型，震撼了整个AI圈。紧接着，“雷军开千万年薪挖DeepSeek研究员罗福莉”的传闻，也使得人们把目光聚焦向DeepSeek的人才。这下不只科技圈，全网都在好奇，连小红书上都有人发帖询问，这究竟是一只怎样的团队？

1/6/2025 7:45:00 AM

破解大模型隐私防线，华科清华联手实现微调数据90%精准识别

微调大模型的数据隐私可能泄露？最近华科和清华的研究团队联合提出了一种成员推理攻击方法，能够有效地利用大模型强大的生成能力，通过自校正机制来检测给定文本是否属于大模型的微调数据集。 NeurIPS24论文《Membership inference attacks against fine-tuned large language models via self-prompt calibration》，提出了一种基于自校正概率波动的成员推理攻击算法SPV-MIA，首次在微调大模型场景下将攻击准确度提高至90%以上。

1/6/2025 7:40:00 AM

AGI-Eval团队：AI视频生成模型年度横评，Sora大饼落地，但国产模型仍然领先！

说到2024年AI圈的热门话题，当然不能错过视频生成模型了！即使是在12月，国内外视频模型的更新脚步依旧没有放缓。其中以Sora、可灵AI为代表。

1/6/2025 7:30:00 AM

追觅全球首创仿生多关节机械手技术正式亮相：支持自动拾物、隐藏收纳等操作

追觅仿生多关节机械手技术的载体为一款类似扫地机器人的设备，其顶部拥有一条机械臂，支持转动、下探、夹取等操作。机械臂还可通过联动设备顶部的遮盖件，实现隐藏式收纳。

1/6/2025 7:04:16 AM

归泷（实习）

资讯热榜

Mac也能跑Qwen3，一文看懂本地部署qwen 3配置要求 Ollama 支持全线的 Qwen 3 模型 Qwen3正式发布，优化编码与代理能力，强化MCP支持引领AI新潮流即梦3.0海外版发布，电影级视觉与精准英文排版引领AI创作新高度纳米AI发布MCP万能工具箱，简化AI工具集成与调用 AI视频资讯早读！7个产品更新+8个案例精选小米开源“Xiaomi MiMo”大模型：为推理而生，以 7B 参数超越 OpenAI o1-mini 小米首个推理大模型Xiaomi MiMo开源

标签云

人工智能 OpenAI AIGC AI ChatGPT AI绘画 DeepSeek 数据模型机器人谷歌大模型 Midjourney 智能用户开源学习 GPT 微软 Meta 图像 AI创作技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质芯片代码生成式英伟达腾讯神经网络研究计算 Anthropic 3D Sora AI for Science AI设计机器学习开发者 GPU AI视频华为场景人形机器人预测百度苹果伟达 Transformer 深度学习 xAI 模态字节跳动 Claude 大语言模型搜索驾驶具身智能神器推荐文本 Copilot LLaMA 算力安全视觉视频生成训练干货合集应用大型语言模型科技亚马逊智能体 DeepMind 特斯拉