资讯列表

再也不怕显存爆炸了!高效重建「几何精准」的大规模复杂三维场景,中科院提出CityGaussianV2

三维场景重建旨在基于围绕目标场景拍摄的一组图像恢复出场景的三维结构,其核心追求是精准的几何结构以及逼真的图像渲染。 随着近两年的发展,3D Gaussian Splatting(3DGS)因其训练和渲染效率上的优势逐渐成为该领域的主流算法。 这一技术使用一组离散的高斯椭球来表示场景,并使用高度优化的光栅器进行渲染。

字节跳动与北京大学成立豆包大模型联合实验室

联合实验室的科研将基于字节跳动豆包大模型展开。来自高校和企业的科研人员将在实验室内,重点围绕大模型的训练、推理等开展科研工作。

微软推出 14B 参数小语言模型 Phi-4:专攻数学等领域复杂推理

微软今天宣布推出14B参数“最先进”小型语言模型(SLM)Phi-4,除了传统的语言处理外,它还擅长数学等领域的复杂推理。Phi-4是Phi系列小型语言模型的最新成员,官方表示其展示了微软继续探索SLM边界的可能性。

扩散模型=流匹配?谷歌DeepMind博客深度详解这种惊人的等价性

扩散模型和流匹配实际上是同一个概念的两种不同表达方式吗? 从表面上看,这两种方法似乎各有侧重:扩散模型专注于通过迭代的方式逐步去除噪声,将数据还原成清晰的样本。 而流匹配则侧重于构建可逆变换系统,目标是学习如何将简单的基础分布精确地映射到真实数据分布。

信通院报告:飞桨等国产深度学习框架将迎新发展机遇

近日,中国信息通信研究院(简称“中国信通院”)对外发布《人工智能发展报告(2024年)》。 报告指出,随着国产深度学习框架技术能力不断完善,百度飞桨等国产框架正快速崛起,基于国产框架的行业解决方案向垂直领域快速渗透。 未来,人工智能逐步进入大规模赋能新型工业化阶段,国产深度学习框架将迎来新一轮发展机遇,继续加强渗透。

ChatGPT「睁眼」了!OpenAI版「Her」满血上线,还有圣诞限定彩蛋

OpenAI直播第六天,可以说是把圣诞氛围拉满了。 在高级语音模式中,不仅加入了视频聊天,而且还有限定版圣诞老人语音。 这就意味着,通过设备共享摄像头摄取到的内容,我们就可以和「Her」实时视频对话了!

CCF-CV携手合合信息打造技术分享论坛,聚焦大模型时代中的视觉安全前沿热点

近期,《咬文嚼字》杂志发布了2024年度十大流行语,“智能向善”位列其中,过去一年时间里,深度伪造、AI诈骗等话题屡次登上热搜,AI技术“野蛮生长”引发公众担忧。 今年9月,全国网络安全标准化技术委员会发布了《人工智能安全治理框架》,指出人工智能既面临自身技术缺陷、不足带来的内生风险,也面临不当使用、滥用甚至恶意利用带来的外部风险。 为探寻AI安全治理道路,近期,由中国计算机学会计算机视觉专委会主办,合合信息承办,中国运筹学会数学与智能分会协办的《打造大模型时代的可信AI》论坛(简称“论坛”)顺利举行。

闭环仿真日新月异的今天,如何紧跟节奏?自动驾驶3DGS最新综述!

写在前面NeRF技术兴起于2020年,自此掀起了三维重建领域新一轮的革新风暴。 三年时间飞逝,新的算法和改进层出不穷,其视觉质量逐步提高突破。 并且在该技术的支持下,许多领域都取得了突破性的成果。

《2024年度AI十大趋势报告》发布:技术创新、产品洗牌、行业动态一文看尽

站在年尾来看,奔涌的AI浪潮呈现出怎样的趋势? 又给2025年留下了什么样的伏笔? 3个视角维度,10大年度趋势,在量子位智库今日重磅发布的《2024年度AI十大趋势报告》中清晰详尽地呈现。

AI 助你防诈:微软 Edge 浏览器被曝测试新型在线诈骗拦截器

根据长期挖掘浏览器功能的博主Leopeva64今天凌晨发布的X帖子,微软似乎正在通过Edge浏览器测试一款名为“Scareware Blocker”(恐吓软件拦截器)的新功能。

谷歌成功狙击 OpenAI:ChatGPT Vision 深夜紧急上线,OpenAI 还能守住江山吗

昨天谷歌放大招发布Gemini 2并提供免费服务后,OpenAI 今天(12天发布会Day6)紧随其后,推出了鸽了很久的 ChatGPT Vision 功能,为用户带来更丰富的多模态交互体验。 除了原有的高级语音模式外,现在你可以与 ChatGPT 进行视频通话、共享屏幕,也可以与圣诞老人实时互动! 11分钟发布会乏善可陈,感觉有点拉先说重点:ChatGPT Vision 有哪些新功能?

每月3500的AI码农Devin,还是140的编程神器Cursor?实测来了

以下是评测结果,我整理总结了一下分享给大家Devin 主要基于 Slack 工作流:Devin 主要通过 Slack 交互,而非 IDE 集成。 用户在 Slack 中标记 @devin 并提出请求,例如更新代码、修复 bug 等。 Devin 的界面包括远程服务器、浏览器、VS Code 编辑界面和计划器,用户可以逐步查看 Devin 的操作和进度Devin 的实际测试:Steve首先测试了一个可以在消费级硬件上运行的小型图像生成模型。

计算机视觉项目实战:提升简历,精进技能

在计算机视觉领域,实践是检验理论、提升技能的试金石。 无论是初学者还是希望进一步提升自己的专业人士,通过参与实际项目都是至关重要的。 本文将引导您探索一系列计算机视觉项目,这些项目按照难度分类,旨在帮助您构建并展示您的专业技能。

原来机器学习那么简单—SVR

一、算法介绍       支持向量回归(SVR)是一种监督学习算法,用于解决回归问题。 其核心思想是找到一个超平面,这个超平面能够以最小的误差包含所有的训练样本。 与支持向量机处理分类问题类似,支持向量回归的目标是确保尽可能多的数据点位于由超平面决定的边界内。

哈佛大学、谷歌发布 100 万本公共领域书籍,为 AI 训练提供合法数据

早在今年3月,哈佛大学就曾透露其“机构数据计划(IDI)”,并表示这一计划旨在为AI提供“合法数据的可信通道”。直到正式启动后,该计划才确认得到了微软和OpenAI的资金支持。

ChatGPT崩溃4小时!DDL打工人、期末大学生全慌了

今天上午8点左右,ChatGPT突然崩了。 与此同时,Sora也未能幸免。 简单的两行字,诛杀了多少赶DDL人的心还未修复好时候的红温状态来自故障跟踪网站DownDetector.com今天下午1点左右的时候,已经官宣完全恢复正常了!

适用于 .NET 的官方OpenAI库:稳定且强大的AI集成工具

在.NET开发领域,随着人工智能技术的快速发展,如何将先进的AI功能无缝集成到.NET应用程序中成为了开发者们关注的焦点。 OpenAI官方推出的适用于.NET的稳定库,为.NET开发者提供了一个便捷且强大的接口,使他们能够轻松访问和使用OpenAI的REST API,从而集成各种前沿的AI模型和功能。 一、核心功能特点1.

在大模型时代,智能化推荐怎么做呢?

自2022年11月30日OpenAI发布ChatGPT以来,大模型技术掀起了新一轮人工智能浪潮。 ChatGPT在各个领域(如人机对话、文本摘要、内容生成、问题解答、识图、数学计算、代码编写等)取得了比之前算法好得多的成绩,很多方面都超越了人类专家的水平,特别是人机对话具备了一定的共情能力,这让AI领域的工作者和普通大众都相信AGI(Artificial General Intelligence,通用人工智能)时代马上就要来临了。  大模型除了对话能力达到了跟真正互动的水准,更厉害的是当模型参数规模达到一定量(100B ,这里B是billion,十亿的意思)时,会涌现出新的能力,即大模型具备举一反三、任务分解、逻辑推理、解决未知任务的能力,这在之前的机器学习范式中是从没见到过的。