资讯列表

全球首个“AI 程序员”Devin 全面开放:可独立开发 / 修复 bug,月费 500 美元

Devin 能够熟练运用多种编程语言,独立完成网站和应用程序的构建与部署,甚至能够自主发现并修复代码缺陷。官方表示,其已通过多家 AI 公司的实践性工程师面试,并成功在 Upwork 等自由职业平台上完成实际项目。

谷歌推出 AI 代码助手 Jules,可帮助开发者修复代码错误

谷歌今日宣布推出一款名为“Jules”的实验性 AI 代码助手,旨在帮助开发者自动修复代码错误。该工具今日与 Gemini 2.0 一同发布,其使用更新后的谷歌人工智能模型来创建多步骤计划,以解决问题、修改多个文件,并为 GitHub 工作流中的 Python 和 Javascript 编码任务准备拉取请求。

3DDFA-V3:引领三维人脸重建新纪元

一、引言从二维图像中重建三维人脸是计算机视觉和图形学领域的一项重要任务,它在虚拟现实(VR)、增强现实(AR)、计算机生成图像(CGI)等领域有着广泛的应用。 近年来,随着深度学习技术的不断发展,三维人脸重建技术取得了显著的进步。 本文将对最新提出的3DDFA-V3算法进行详细介绍,展示其如何凭借创新的几何引导策略和面部区域分割技术,实现高精度和高鲁棒性的三维人脸重建。

如何在安卓手机上本地安装和运行LLM?

译者 | 布加迪审校 | 重楼了解如何将AI的力量径直带入到你的安卓手机上:没有云,没有互联网,只有纯粹的设备端智能! 在安卓手机上本地运行大语言模型(LLM)意味着你可以在不依赖云服务器或互联网连接的情况下访问人工智能(AI)模型。 这种本地环境通过确保数据安全、并在设备端来确保隐私。

谷歌称 Project Astra 将开启测试,部分人员通过智能眼镜体验 AI 助手

在 Gemini 2.0 发布前的媒体简报会上,谷歌 DeepMind 团队的产品经理 Bibo Xu 透露,“一小部分人将通过原型眼镜测试 Project Astra,我们认为这是体验此类 AI 最强大、最直观的方式之一。”这部分测试人员将隶属于谷歌的 Trusted Tester 项目,该项目通常能够接触到这些早期原型,其中许多原型最终并不会公开发布。据悉,部分测试人员将通过安卓手机使用 Astra,而另一部分则通过眼镜进行体验。

谷歌“狙击”OpenAI,发布新一代大模型!主打Agent+多模态

继量子芯片之后,谷歌又来抢“OpenAI双12直播”的流量了! 就在刚刚,谷歌新一代大模型Gemini 2.0突然登场,再次由谷歌CEO皮猜亲自官宣。 新一代模型专为AI Agent而打造,谷歌表示目前已经将2.0版本提供给了一些开发者内测,正在迅速将其集成在Gemini和搜索等产品线中。

OpenAI下一代模型突遭泄露!「半GPT-5」旗舰模型猎户座要来了?

OpenAI的新模型,竟被意外泄露了? 圣诞马拉松第四天,网友们从OpenAI研究员Karina Nguyen介绍Canvas功能的帖子里,发现了蛛丝马迹。 一个名叫「ChatGPT ε」的模型,现身了。

终于把图神经网络算法搞懂了!!!

今天给大家分享一个强大的算法模型,GNN。 图神经网络(GNN)是一类专门处理图结构数据的深度学习模型。 在传统的深度学习中,输入数据通常是结构化的(如图像、文本、时间序列等),这些数据都可以表示为一个规则的网格或序列。

【多模态&文档智能】OCR-free感知多模态大模型技术链路及训练数据细节

目前的一些多模态大模型的工作倾向于使用MLLM进行推理任务,然而,纯OCR任务偏向于模型的感知能力,对于文档场景,由于文字密度较高,现有方法往往通过增加图像token的数量来提升性能。 这种策略在增加新的语言时,需要重新进行训练,计算开销较大,成本较高。 因此,本文再来看看vary和got这两个衔接工作,看看其完整的技术链路。

谷歌深夜炸场:Gemini 2.0 正式发布,号称迄今智能体时代最有能力的 AI 模型

谷歌正式发布Gemini 2.0,号称迄今为止为智能体时代最有能力的AI模型,带来了增强的性能、更多的多模态性和新的原生工具使用。

Sora终于来了,但卷王可灵已经「拍」上了AI电影

6个月迭代10余次,快手可灵一路狂飙。 这次,轮到名导们下场整活了。 短片一开场就相当震撼:钟馗手持一把斩鬼剑,穿行在一片乌漆麻黑、虬枝盘曲的密林中。

田渊栋团队论文火了!连续思维链优于CoT,打开LLM推理新范式

一个非常简单的更改,就能提高 LLM 推理能力。 在认知科学领域,关于语言是用于思考还是用于交流的辩论一直持续。 随着 LLM 和 CoT 的兴起,语言已经成为机器推理的默认媒介 —— 但它真的是最佳方法吗?

NeurIPS 2024 | LLM智能体真能模拟人类行为吗?答案有了

AIxiv专栏是AI在线发布学术、技术内容的栏目。 过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。 如果您有优秀的工作想要分享,欢迎投稿或者联系报道。

云深处科技自研国产机器狗 X30 交付新加坡电网,预估每年节省 480 小时人工隧道检查时间

云深处科技宣布,与 Eastern Green Power(EGP)合作,自研的 X30 四足机器人和数字化技术,交付新加坡能源集团(下称 SP 集团)电力隧道巡检解决方案。

数字比你想得更复杂——一文带你了解大模型数字处理能力的方方面面

AIxiv专栏是AI在线发布学术、技术内容的栏目。 过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。 如果您有优秀的工作想要分享,欢迎投稿或者联系报道。

重构人工智能代码:好的、坏的和奇怪的

在软件开发领域,生成式人工智能不再是一个新鲜事物:它越来越多地被用作编写在现实生产中运行的代码的助手。 但是每个开发人员都知道从头开始编写新代码只是他们日常工作的一小部分。 开发人员的大部分时间都花在维护现有代码库和重构其他人编写的代码上。

消息称字节跳动提升即梦产品优先级,尝试打造“AI 时代的抖音”

据“智能涌现”今日援引知情人士消息称,字节跳动已经提升了即梦的产品优先级,尝试用新的路径打造“AI时代的抖音”。

NeurIPS 2024最佳论文开奖!北大字节NUS夺冠,Ilya连续三年获奖

刚刚,NeurIPS 2024最佳论文放榜了! 不出所料,今年两篇最佳论文分别颁给了北大字节团队,和新加坡国立大学Sea AI Lab团队。 除此之外,大会还公布了「数据集与基准」赛道的最佳论文,以及主赛道最佳论文奖委员会,数据集和基准赛道最佳论文奖委员会。