资讯列表

智谱版o1终于也来了:直接拿下考研数学,一句话就能做小游戏!

终于,在2024年的最后一天,智谱版o1也来了! 名字叫做GLM-Zero-Preview,Zero推理模型(下文简称Zero模型),自称是擅长通过逻辑推理来解决数理问题。 既然如此,那么我们就直接一套2024年考研数学真题来伺候一下吧~规则也很简单,就是把真题的题目以截图的方式“喂”给Zero模型,这样也可以顺便考验一下它的视觉理解能力。

更真实的协同感知!EI-Drive:协同感知和融合通信特征的智驾平台

本文对EI-Drive: A Platform for Cooperative Perception with Realistic Communication Models进行介绍,EI-Drive将协同感知和通信延迟与误差融合,打造了一个更贴近车间通信(V2V Communication)真实部署环境的自动驾驶平台,为抗通信干扰的相关自动驾驶算法提供了测试和训练的平台。 项目详情:::,协同感知(Cooperative perception)得到了越来越多的关注,它使多个车辆或RSU能够共享传感器数据,从而增强其对环境的感知。 这种方法对克服传感器遮挡、视野受限以及噪声等限制尤为重要,这些限制可能导致障碍物的遗漏或决策上的致命错误。

中科院最新DrivingGPT:利用多模态自回归方法统一驾驶世界模型和规划双任务!

写在前面&笔者的个人理解目前,驾驶世界模型已获得了来自工业界和学术界的广泛关注,因为基于模型的搜索和规划被广泛认为是实现人类级智能的重要途径。 这些模型有多种用途,包括训练数据增强、稀有场景生成。 大多数当前世界模型都是通过微调现有的扩散模型来开发的,利用视频生成基础模型的泛化能力。

G行人工智能与大模型技术的应用与发展

一、人工智能与大模型技术在银行业的普遍应用1. 客户服务和智能客服客户服务是人工智能应用的核心领域之一。 传统银行客户服务依赖专业的人工客服,虽然能提供较高的情感交互,但因响应时间较长、服务覆盖面有限以及成本较高,难以满足现代客户对高效、便捷服务的需求。

“意图经济”来袭:新研究称 AI 工具将操纵用户在线决策

剑桥大学的研究人员指出,人工智能(AI)工具可能被用于操纵在线用户的决策,影响范围涵盖购物选择、投票对象等诸多方面。

图像相似度估计 | 结合三元组损失的暹罗网络

在机器学习领域,确定图像之间的相似度在各种应用中至关重要,从检测重复项到面部识别。 解决这个问题的一个强大方法是使用暹罗网络结合三元组损失函数。 在本文中,我们将探索如何构建和训练暹罗网络以估计图像相似度,并通过一个来自GitHub仓库的实际示例进行说明。

三星斥资 2670 亿韩元成韩国机器人公司 Rainbow Robotics 最大股东,并成立未来机器人办公室

韩国机器人公司 Rainbow Robotics 在周二的一份监管文件中表示,三星电子已成为该公司的最大股东。三星电子在另一份声明中同时宣布,通过此次收购,正成立一个直接向首席执行官汇报的“未来机器人办公室”。

减少LLM幻觉的五大技巧和方法

译者 | 布加迪审校 | 重楼本文介绍了使用LangGraph减少LLM幻觉的简单技巧。 如果你使用过LLM,就知道它们有时会产生幻觉。 这意味着它们生成的文本要么毫无意义,要么与输入数据相矛盾。

苹果布局人形机器人:“自我为中心”感知系统动态避障,比英伟达cuRobo计算效率提升26倍

苹果要搞人形机器人这事儿现在传得沸沸扬扬。 最近他们确实有新动作——开发了一套机器人感知系统! 系统名为ARMOR,软硬件协同增强机器人的“空间意识”,能动态防碰撞的那种。

一张图生成高质量广视野3D场景,还可控制摄像轨迹

只需一张图,就能生成高质量、广范围的3D场景! 泰迪熊、花园、山谷都从平面图片变成了仿佛触手可及的立体物品。 这就是来自多伦多大学、Snap和UCLA的研究团队推出的全新模型——Wonderland。

LeCun:对人工智能末日的担忧被夸大了,Meta正在构建超级智能助手

AI末日将近? 深度学习三巨头之一、被称为AI教父的Hinton教授在最新演讲中指出,技术的发展速度远远超出了他的预期,如果再不加以监管人类将会在10年内灭绝:不过,同为深度学习三巨头之一的LeCun教授则表示:夸大了。 在最新采访中,LeCun表示,自己还是非常看好人工智能的未来的。

Pytorch 核心操作全总结!零基础必备!

在深度学习与人工智能领域,PyTorch已成为研究者与开发者手中的利剑,以其灵活高效的特性,不断推动着新技术的边界。 对于每一位致力于掌握PyTorch精髓的学习者来说,深入了解其核心操作不仅是提升技能的关键,也是迈向高级应用与创新研究的必经之路。 本文精心梳理了PyTorch的核心操作,这不仅是一份全面的技术指南,更是每一个PyTorch实践者的智慧锦囊,建议收藏!

先进的基础模型将如何扩展AI的功能以及对2025年的其他预测

为何要读非Sam Altman和非AI博士的AI预测?其实,早期风投每天与比我们聪明得多的人打交道,这些人在AI可能性的最前沿工作,这让我们得以一窥未来的某种面貌。 在我30多年的技术生涯中,我从未见过一项技术——尤其是基础模型及其周边技术的进步——能在如此多的方面产生如此迅速且巨大的影响,它重塑了我对团队构建方式和公司创造价值方式的预期。 我们尝试限制AI我喜欢Mustafa Suleyman提出的AI数字物种推论,因为它恰当地框定了限制AI的问题。

Meta 计划为 Facebook 引入 AI 角色机器人,可与用户互动评论

外媒《金融时报》采访 Meta 的 AI 产品副总裁 Connor Hayes 获悉,Meta 计划将 AI 生成的角色整合到 Facebook 社交平台中,据报道,Meta 将通过提示词打造这些 AI 角色,相关角色将拥有独立个人资料卡,能够与用户进行互动评论,有点类似微博平台的“评论罗伯特”。

15个Cursor小技巧,让你精通AI编程

今天介绍Cursor的15个核心特性,帮助开发者更高效、更智能地编写代码。 1.无缝VS Code迁移想从VS Code平滑过渡到Cursor,只需简单几步:打开Cursor的设置,进入“常规”选项卡,找到“账户”部分。 选择“从VS Code导入”功能。

获欧盟批准后,英伟达 7 亿美元收购 AI 初创公司 Run:ai

Run:ai 在博客中透露计划将其软件开源。“虽然目前 Run:ai 仅支持英伟达的 GPU,但软件开源将有助于将应用范围扩展到整个人工智能生态系统。”

Meta 首席科学家杨立昆:实现 AGI 最乐观需至少五到六年

他表示,目前AI的负面影响被过度放大,其能力目前仍非常有限。“在最乐观的情况下,AGI的实现至少尚需5-6年。”

豆包大模型发布各领域技术进展,首次披露 300 万长文本能力

字节跳动旗下豆包大模型今日对外公布了2024年全领域的技术进展,宣称自5月15日首次亮相的7个月以来,在通用语言、视频生成、语音对话、视觉理解等方面模型能力已经跨入国际第一梯队。