资讯列表

单幅图像合成 360° 3D场景的新方法:PanoDreamer,可同时生成全景图像和相应的深度信息。

论文介绍了一种从单幅图像合成 360° 3D 场景的新方法。 该方法以连贯的方式生成全景图及其相应的深度,解决了现有最先进方法(如 LucidDreamer 和 WonderJourney 的局限性。 这些方法按照生成轨迹依次添加细节,通常在循环回输入图像时导致可见的接缝。

Windsurf:面向未来的 AI编程工具详解

一、 Windsurf 简介近期随着 Cursor 的爆火,AI 编程领域再次聚焦了诸多开发者的目光,当许多人认为这就是 AI 编程的终极产品时,Windsurf 的横空出世让这个赛道变得更加生动和多元化,随着这些创新产品的持续涌现,我们相信未来 AI 不再仅仅是一个聊天辅助工具,而将成为编程过程中人手必备的一位重要伙伴。 Windsurf 是 Codeium 公司推出的一款 AI 辅助编程工具,凭借创新的设计理念和先进技术,正在引领编程工具的新变革。 它不仅是智能编程助手,还是一个集成了深度上下文感知、多模型 AI、实时协作和高效代码管理的综合开发环境(IDE)。

1/10训练数据超越GPT-4o!清华等提出隐式过程奖励模型PRIME,在线刷SOTA

告诉我,我会忘记,教我,我会记住,让我参与,我就能学会。                  ——本杰明·富兰克林  打破数据墙,我们还能做些什么? 近日,来自清华UIUC等机构的研究者提出了PRIME(Process Reinforcement through IMplicit REwards):通过隐式奖励来进行过程强化。

0 Token 间间隔 100% GPU 利用率,百度百舸 AIAK 大模型推理引擎极限优化 TPS

什么是大模型推理引擎大模型推理引擎是生成式语言模型运转的发动机,是接受客户输入 prompt 和生成返回 response 的枢纽,也是拉起异构硬件,将物理电能转换为人类知识的变形金刚。 大模型推理引擎的基本工作模式可以概括为,接收包括输入 prompt 和采样参数的并发请求,分词并且组装成 batch 输入给引擎,调度 GPU 执行前向推理,处理计算结果并转为词元返回给用户。 和人类大脑处理语言的机制类似,大模型首先会把输入的 prompt 进行统一理解,形成具有记忆能力的上下文。

Dynamic GPU Fractions(动态 GPU 分配),知多少?

随着人工智能和高性能计算需求的爆炸式增长,图形处理器(GPU)已成为支撑复杂计算任务的关键基础设施。 然而,传统的 GPU 资源分配方式通常采用静态分配模式,即在任务启动时预先分配固定的 GPU 资源。 这种静态分配方式往往导致资源利用率低下,尤其是在工作负载波动较大或资源需求不确定的场景中,造成宝贵的计算资源闲置浪费。

语义分析3.0&新版雷池重磅发布,开启“AI+数据驱动”WAF新纪元​

1月7日,长亭科技语义分析3.0暨雷池30巡回发布会首站在北京举行。 发布会上展示了长亭语义分析技术的最新成果、雷池(SafeLine)全新升级30版本以及WAF的最佳实践,体现了长亭在网络安全与人工智能技术融合应用的全新突破。 此外,IDC中国高级研究经理赵卫京以全球网络安全技术热点与趋势为主题进行了分享,为发布会提供了国际化视角。

MinT: 第一个能够生成顺序事件并控制其时间戳的文本转视频模型。

本文经AIGC Studio公众号授权转载,转载请联系出处。 MinT 是第一个能够生成顺序事件并控制其时间戳的文本转视频模型。 使用 MinT 生成时间控制的多事件视频。

PyTorch vs PyTorch Lightning 框架对比

在不断发展的深度学习领域,PyTorch 已经成为开发者和研究人员家喻户晓的名字。 其动态计算图、灵活性以及广泛的社区支持使其成为构建从简单神经网络到复杂前沿模型的首选框架。 然而,灵活性也带来了编写大量样板代码的责任——尤其是在训练循环、日志记录和分布式学习方面。

【多模态&LLM】POINTS多模态大模型浅谈

NaViT概述NaViT利用序列打包训练,处理任意分辨率和长宽比的输入,在大规模监督和对比图像文本预训练中提高了训练效率,可以用于图像和视频分类、目标检测和语义分割,并在鲁棒性和公平性基准测试中取得了改进的结果。 图片下面对NaViT在数据处理、模型架构和训练策略方面的优化总结:数据预处理:如上图展示了NaViT在处理任意分辨率的方法,将不同分辨率的图像分割成补丁(patches),然后应用令牌丢弃(token drop)操作,类似于dropout,以加速训练过程。 预处理后,将三张图像生成的补丁展平为一个序列,不足的部分用填充(padding)补充。

不容错过的十个优秀AI代码生成器

译者 | 涂承烨审校 | 重楼AI的兴起极大地影响了编码和开发领域。 AI驱动的代码生成器有助于简化编码过程,自动化日常任务,甚至预测和建议代码片段。 下面,我们将介绍一些好用的AI代码生成器,包括它们的独特功能,以及它们如何彻底改变你的编程体验。

如何使用Ollama在个人计算机上运行开源LLM

译者 | 刘涛审校 | 重楼如今,AI工具已变得司空见惯,你可能每天都在使用它们。 保护你的个人和商业机密数据的关键途径之一,就是在自己的基础配置上运行自己的AI。 本指南将向你介绍如何在自己的计算机上托管一个开源大语言模型(LLM)。

NVIDIA在CES 2025发布一系列重磅技术和产品:引领AI与物理AI革命

2025年1月6日,NVIDIA在国际消费电子展(CES)上发布了一系列的创新技术和产品,旨在加速人工智能(AI)计算,推动AI和物理AI的发展。 NVIDIA创始人兼首席执行官黄仁勋(Jensen. Huang)在主题演讲中揭示了NVIDIA在AI和物理AI领域的最新进展。

2025年美妆行业如何规模化应用GenAI

美不再取决于观察者的眼光,而是掌握在GenAI提示者的指尖。 仅根据其对美妆行业的影响,GenAI就可能为全球经济贡献90亿至100亿美元,而早期行动者已经开始测试这项技术,但考虑到GenAI创新的速度,扩大这些实验规模将是一项挑战。 一旦美妆行业的领导者成功大规模部署GenAI,落后者与领导者之间的差距只会越来越大。

2024年12月AI微信公众号排行榜

AI在线 发布第 7 期「AI行业微信公众号排行榜」 TOP50 榜单

只会害羞转头的AI宠物卖70美元?看完演示,我居然心动了

AI好好用报道编辑:杨文这个70美元的AI挂件除了可爱一无是处,但已经有人等不及剁手了。 日本人总是钟情于一些稀奇古怪的小玩意。 在 2025 年消费电子展(CES)上,一家名叫 Yukai Engineering 的日本初创公司,推出了两款造型奇特的小机器人。

零售业未来AI将无处不在

具有前瞻性的零售商已经在利用人工智能来帮助他们在经济不确定性、环境压力和地缘政治不稳定的情况下维持和增长利润率。 然而,只有当他们在整个业务中全面应用人工智能时,他们才会意识到人工智能的全部潜力。 零售商必须为其人工智能能力制定更具战略性和综合性的方法,重点关注商业价值创造的两个关键杠杆:收入增长和成本降低。

揭开工业 AI Agent的神秘面纱

随着生成式人工智能(AI)在工业领域的大肆宣传,似乎几乎每天都有新的流行语出现。 最新的流行语是什么? “Industrial AI Agent”,也被称为工业人工智能体,这个词在工业领域几乎还没有标准定义,但这个定义已经很接近了:工业AI Agent是一种灵活而强大的软件实体,能够智能地代表和管理工业组织的功能和能力。

传音控股与阿里云达成合作,通义千问大模型搭载于前者旗下 AI 手机

传音控股(以下简称传音)已与阿里云达成合作,通义千问大模型已经搭载在传音旗下科技品牌 TECNO 推出的 AI 手机 PHANTOM V Fold2 中,打造了深度本地化的“实用型 AI”。通过机身上特定的 AI 按键,用户可一键调用端侧大模型,在离线环境中依然可以流畅运行多轮 AI 对话,并实现文档及通话摘要。