资讯列表

RTX 4090 笔记本 0.37 秒直出大片:英伟达联手 MIT 清华祭出 Sana 架构,速度秒杀 FLUX

一台 4090 笔记本,秒生 1K 质量高清图。英伟达联合 MIT 清华团队提出的 Sana 架构,得益于核心架构创新,具备了惊人的图像生成速度,而且最高能实现 4k 分辨率。一台 16GB 的 4090 笔记本,仅需 0.37 秒,直接吐出 1024×1024 像素图片。

英伟达开源模型 Nemotron-70B 超越 GPT-4o 和 Claude 3.5,仅次于 OpenAI o1

刚刚,英伟达开源了超强模型 Nemotron-70B,后者一经发布就超越了 GPT-4o 和 Claude 3.5 Sonnet,仅次于 OpenAI o1!AI 社区惊呼:新的开源王者又来了?业内直呼:用 Llama 3.1 训出小模型吊打 GPT-4o,简直是神来之笔!

从威尔・史密斯鬼畜吃面到「Her」,这些幕后技术正在推动AI视频时代的到来

还记得「威尔・史密斯吃意大利面」的 AI 鬼畜视频吗?在这些视频里,威尔・史密斯的面部表情、动作都非常夸张,还充满了扭曲、变形。一年多以前,大部分 AI 视频生成模型确实只能达到这样的水平。

英伟达开源最新大模型Nemotron 70B后,只有OpenAI o1一个对手了

英伟达不仅要做显卡领域的领先者,还要在大模型领域逐渐建立起自己的优势。今天,英伟达又开源了一个性能超级强大的模型 —— Llama-3.1-Nemotron-70B-Instruct,它击败了 OpenAI 的 GPT-4o 等闭源模型和 Anthropic 的 Claude-3.5 sonnet 等开源模型。从命名来看,显然 Llama-3.1-Nemotron-70B-Instruct 是基于 Llama-3.1-70B 打造而成。

LoD-Loc:利用城市白模进行无人机六自由度定位!

论文信息论⽂全称:LoD-Loc: Aerial Visual Localization using LoD 3D Map with Neural Wireframe Alignment录⽤会议:NeurIPS 2024论⽂地址::: 基于三维城市⽩模地图(LoD 3D Map) 的⼀种使⽤神经线框对⻬进⾏空中视觉定位的新⽅法论⽂概要:LoD-Loc 基于城市⽩模模型Level of Detail 3D Map (LoD 3D Map)提出⼀种城市⽆⼈机空中定位新范式。 区别于基于SfM / SLAM / Mesh等复杂三维地图的传统定位⽅法 ,LoD 三维地图具有储存容量低 ,能提供隐私保护等优点。然⽽ , 由于 LoD 地图缺乏纹理,使⽤之前传统定位基线进⾏ LoD 地图空中定位并不简单。

全模态对齐框架align-anything来了:实现跨模态指令跟随

AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。

中国电信和移动发起、高通联发科等支持,GSMA 启动制定生成式 AI 移动终端需求规范

全球移动通信系统协会(GSMA)今日发文,随着生成式 AI 越来越多进入手机、平板等终端设备,考虑到生成式 AI 终端良好的市场前景,定义生成式 AI 手机新需求规范的最佳时机正在到来。GSMA 终端工作组(Terminal Steering Group)宣布,由中国电信和中国移动发起,沃达丰、DU、高通、联发科、中兴和荣耀共同支持的生成式 AI 移动终端需求规范正式立项,这将有助于在行业内达成对生成式 AI 手机所能提供的能力和 AI 服务体验的共识,并提升消费者对这些设备的理解。该项目旨在制定一系列规范,专注于终端设备,明确生成式 AI 在端到端架构中的角色,为设备制造商和服务提供商提供指南。

NeurIPS 2024 | FaceChain团队新作,开源拓扑对齐人脸表征模型TopoFR

AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。

萌化了!日本造了个AI宠物,卖2800元被疯抢

AI好好用报道编辑:杨文天呐,要被这群AI小机器人萌化了。大家还记得小时候养过的「电子宠物」吗?在那个比手掌还小的彩色塑料壳里,养着一只欢蹦乱跳的像素小动物。

人形机器人公司星动纪元完成近 3 亿元 Pre-A 轮融资:阿里巴巴联合领投,联想追投

具身智能公司星动纪元 10 月 16 日宣布,近期完成近 3 亿元 Pre-A 融资。本轮投资由清流资本、元璟资本、阿里巴巴联合领投,策源资本跟投,老股东联想创投、世纪金源、金鼎资本、泽羽资本、清控天诚持续追投,华兴资本继续担任本轮独家财务顾问。星动纪元公司称,本轮融资将主要加速具身智能技术的原生性突破性研发以及通用人形机器人的商业化进程,并持续巩固公司人才、技术壁垒和市场领先地位。

支付宝发布“湾事助手”支小宝智能体:AI 带你看广交会

支付宝今日宣布,在中国进出口商品交易会(AI在线注:简称广交会)期间,广东省政务服务和数据管理局联合支付宝,发布首款服务广交会全球供采商的“湾事助手”支小宝智能体。逛展用户可通过支付宝 App 首页下拉找到 AI 生活管家“支小宝”,或直接登入支小宝 App 唤醒“湾事助手”智能体,体验由 AI 全程提供的看展攻略、讲解、出行、展品查询等服务,并获取关于参展期间吃、住、行、游等线上信息。此外,该智能体还可为粤港澳大湾区居民提供多项服务,如内地电话卡办理地图、换汇地图、酒店、外卖、快递、景区等 10 余项双语生活服务,以及大湾区日常支付、出行、生活、政务等即时解答和引导服务。

端侧 AI 崛起:Mistral 发布 Ministral 3B / 8B,“全球最好的边缘模型”

Mistral 公司最新推出了 Ministral 3B 和 Ministral 8B 两款 AI 模型,并不需要连接云服务器,重点提高笔记本电脑和智能手机等设备的本地化 AI 体验,官方声称是“世界上最好的边缘模型”。Mistral 公司表示越来越多的企业希望能够在个人设备上运行 AI 模型,一方面确保安全的数据处理,另一方面也提高响应速度。上述两个模型可在没有互联网接入的情况下,执行翻译服务、本地分析和机器人等多项服务。

.ai 域名卖爆,小岛安圭拉 2023 年意外躺赚 3200 万美元

感谢随着人工智能产业的火热,AI 域名也成为了新的热门,包括 .ai 后缀等自然是交易重点。据美联社 10 月 16 日报道,.ai 域名卖爆也为加勒比海的一个小岛 —— 安圭拉带来了一笔横财。AI在线查询公开资料获悉,安圭拉(英语:Anguilla)是英国 14 个海外领土之一,位于加勒比海小安的列斯群岛北部,面积 91 平方公里,在 1650 年成为英国殖民地,后续经历一系列波折,于 1980 年成为单独的英国属地。

百度李彦宏:AI 泡沫难以避免,会有 1% 的企业脱颖而出

百度创始人李彦宏 10 月 16 日晚在《HBR Live:商业未来》与哈佛商业评论英文版总编辑殷阿笛(Adi Ignatius)对谈时表示,正如历史上的所有技术浪潮,在经历过最初的兴奋期之后,泡沫难以避免,但泡沫过后,会有 1% 的企业脱颖而出,为社会创造巨大价值。在与 Adi Ignatius 对谈中,李彦宏谈及 AI 近期发展趋势、是否存在泡沫、AI 与人类关系等多项 AI 相关的热点话题。他认为,过去 18 个月,大模型领域的最大变化是回答问题的准确性,此前,人们总是担心大模型的幻觉,但现在这一问题已基本被解决。

AI 尽头是核电?继微软和谷歌之后,亚马逊大规模投资模块化核反应堆

科技媒体 NeoWin 昨日(10 月 16 日)发布博文,报道称继甲骨文、微软、谷歌等公司之后,亚马逊也宣布投资核电,支持在美国开发小型模块化核反应堆(SMRs)。报道指出亚马逊目前已和 3 家公司展开合作,虽然合作新闻稿中并未提及 AI,但从未来的发力方向来看,这些核电资源应该是推进亚马逊的各项 AI 服务的。Energy Northwest亚马逊与华盛顿州的公共事业财团 Energy Northwest 达成首个协议,资助初步可行性研究,计划在 2030 年代初期在现有核电站附近建设四个小型模块化核反应堆。

零一万物新旗舰模型 Yi-Lightning 发布:LMSYS 测试国产首次超越 GPT-4o,中国第一、世界第六

感谢李开复创办的 AI 公司零一万物于 10 月 16 日对外发布新旗舰模型 Yi-Lightning。在盲测榜单 LMSYS 上,Yi-Lightning 超越 OpenAI、Anthropic 所发布的 GPT-4o-2024-05-13、 Claude 3.5 Sonnet,排名世界第六,中国第一。零一万物表示,这是在 LMSYS 这一全球大模型必争的公开擂台上,中国大模型首度实现“超越 OpenAI GPT-4o ”的最佳成绩(AI在线注:此处 GPT-4o 为 OpenAI 于 5 月发布的 GPT-4o-2024-05-13)。

丰田研究所与波士顿动力合作,推进机器人大规模行为模型等研究

波士顿动力与丰田研究所(AI在线注:简称 TRI)当地时间 16 日宣布达成合作,双方将在人工智能与机器人技术领域展开合作。此次合作将结合 TRI 的大规模行为模型与波士顿动力的 Atlas 机器人,旨在加速通用人形机器人的开发。据介绍,波士顿动力旗下拥有 Atlas 机器人,其具备优良的运动能力和双手操作能力,TRI 在扩散策略上也拥有“开创性”的工作:首次成功地将生成式 AI 应用于提高机器人灵巧操作能力。

谷歌 AI 又闯祸:错把游戏开发者个人电话当公司电话公布致其被骚扰

谷歌搜索的实验性 AI 功能“Overview(概述)”再次闯祸,该功能曾因提供错误和有害搜索结果而备受批评,而其最新失误更是导致了一名游戏开发者的个人电话号码被错误地公开。Skybound Games 高级环境艺术家 Rogelio Delgado 在社交媒体 X 上分享了一段他接到一个愤怒的孩子家长电话的经历,该家长抱怨他在儿子玩的《流放者柯南》中发现了不合适的内容,这是一款 2017 年的 M 级开放世界生存游戏,由制作《沙丘:觉醒》的 Funcom 工作室开发。该家长称他通过谷歌搜索找到了 Delgado 的电话号码,因为后者曾于八年前在 Funcom 工作过。