资讯列表

全模态对齐框架align-anything来了:实现跨模态指令跟随

AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。

中国电信和移动发起、高通联发科等支持,GSMA 启动制定生成式 AI 移动终端需求规范

全球移动通信系统协会(GSMA)今日发文,随着生成式 AI 越来越多进入手机、平板等终端设备,考虑到生成式 AI 终端良好的市场前景,定义生成式 AI 手机新需求规范的最佳时机正在到来。GSMA 终端工作组(Terminal Steering Group)宣布,由中国电信和中国移动发起,沃达丰、DU、高通、联发科、中兴和荣耀共同支持的生成式 AI 移动终端需求规范正式立项,这将有助于在行业内达成对生成式 AI 手机所能提供的能力和 AI 服务体验的共识,并提升消费者对这些设备的理解。该项目旨在制定一系列规范,专注于终端设备,明确生成式 AI 在端到端架构中的角色,为设备制造商和服务提供商提供指南。

NeurIPS 2024 | FaceChain团队新作,开源拓扑对齐人脸表征模型TopoFR

AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。

萌化了!日本造了个AI宠物,卖2800元被疯抢

AI好好用报道编辑:杨文天呐,要被这群AI小机器人萌化了。大家还记得小时候养过的「电子宠物」吗?在那个比手掌还小的彩色塑料壳里,养着一只欢蹦乱跳的像素小动物。

人形机器人公司星动纪元完成近 3 亿元 Pre-A 轮融资:阿里巴巴联合领投,联想追投

具身智能公司星动纪元 10 月 16 日宣布,近期完成近 3 亿元 Pre-A 融资。本轮投资由清流资本、元璟资本、阿里巴巴联合领投,策源资本跟投,老股东联想创投、世纪金源、金鼎资本、泽羽资本、清控天诚持续追投,华兴资本继续担任本轮独家财务顾问。星动纪元公司称,本轮融资将主要加速具身智能技术的原生性突破性研发以及通用人形机器人的商业化进程,并持续巩固公司人才、技术壁垒和市场领先地位。

支付宝发布“湾事助手”支小宝智能体:AI 带你看广交会

支付宝今日宣布,在中国进出口商品交易会(AI在线注:简称广交会)期间,广东省政务服务和数据管理局联合支付宝,发布首款服务广交会全球供采商的“湾事助手”支小宝智能体。逛展用户可通过支付宝 App 首页下拉找到 AI 生活管家“支小宝”,或直接登入支小宝 App 唤醒“湾事助手”智能体,体验由 AI 全程提供的看展攻略、讲解、出行、展品查询等服务,并获取关于参展期间吃、住、行、游等线上信息。此外,该智能体还可为粤港澳大湾区居民提供多项服务,如内地电话卡办理地图、换汇地图、酒店、外卖、快递、景区等 10 余项双语生活服务,以及大湾区日常支付、出行、生活、政务等即时解答和引导服务。

端侧 AI 崛起:Mistral 发布 Ministral 3B / 8B,“全球最好的边缘模型”

Mistral 公司最新推出了 Ministral 3B 和 Ministral 8B 两款 AI 模型,并不需要连接云服务器,重点提高笔记本电脑和智能手机等设备的本地化 AI 体验,官方声称是“世界上最好的边缘模型”。Mistral 公司表示越来越多的企业希望能够在个人设备上运行 AI 模型,一方面确保安全的数据处理,另一方面也提高响应速度。上述两个模型可在没有互联网接入的情况下,执行翻译服务、本地分析和机器人等多项服务。

.ai 域名卖爆,小岛安圭拉 2023 年意外躺赚 3200 万美元

感谢随着人工智能产业的火热,AI 域名也成为了新的热门,包括 .ai 后缀等自然是交易重点。据美联社 10 月 16 日报道,.ai 域名卖爆也为加勒比海的一个小岛 —— 安圭拉带来了一笔横财。AI在线查询公开资料获悉,安圭拉(英语:Anguilla)是英国 14 个海外领土之一,位于加勒比海小安的列斯群岛北部,面积 91 平方公里,在 1650 年成为英国殖民地,后续经历一系列波折,于 1980 年成为单独的英国属地。

百度李彦宏:AI 泡沫难以避免,会有 1% 的企业脱颖而出

百度创始人李彦宏 10 月 16 日晚在《HBR Live:商业未来》与哈佛商业评论英文版总编辑殷阿笛(Adi Ignatius)对谈时表示,正如历史上的所有技术浪潮,在经历过最初的兴奋期之后,泡沫难以避免,但泡沫过后,会有 1% 的企业脱颖而出,为社会创造巨大价值。在与 Adi Ignatius 对谈中,李彦宏谈及 AI 近期发展趋势、是否存在泡沫、AI 与人类关系等多项 AI 相关的热点话题。他认为,过去 18 个月,大模型领域的最大变化是回答问题的准确性,此前,人们总是担心大模型的幻觉,但现在这一问题已基本被解决。

AI 尽头是核电?继微软和谷歌之后,亚马逊大规模投资模块化核反应堆

科技媒体 NeoWin 昨日(10 月 16 日)发布博文,报道称继甲骨文、微软、谷歌等公司之后,亚马逊也宣布投资核电,支持在美国开发小型模块化核反应堆(SMRs)。报道指出亚马逊目前已和 3 家公司展开合作,虽然合作新闻稿中并未提及 AI,但从未来的发力方向来看,这些核电资源应该是推进亚马逊的各项 AI 服务的。Energy Northwest亚马逊与华盛顿州的公共事业财团 Energy Northwest 达成首个协议,资助初步可行性研究,计划在 2030 年代初期在现有核电站附近建设四个小型模块化核反应堆。

零一万物新旗舰模型 Yi-Lightning 发布:LMSYS 测试国产首次超越 GPT-4o,中国第一、世界第六

感谢李开复创办的 AI 公司零一万物于 10 月 16 日对外发布新旗舰模型 Yi-Lightning。在盲测榜单 LMSYS 上,Yi-Lightning 超越 OpenAI、Anthropic 所发布的 GPT-4o-2024-05-13、 Claude 3.5 Sonnet,排名世界第六,中国第一。零一万物表示,这是在 LMSYS 这一全球大模型必争的公开擂台上,中国大模型首度实现“超越 OpenAI GPT-4o ”的最佳成绩(AI在线注:此处 GPT-4o 为 OpenAI 于 5 月发布的 GPT-4o-2024-05-13)。

丰田研究所与波士顿动力合作,推进机器人大规模行为模型等研究

波士顿动力与丰田研究所(AI在线注:简称 TRI)当地时间 16 日宣布达成合作,双方将在人工智能与机器人技术领域展开合作。此次合作将结合 TRI 的大规模行为模型与波士顿动力的 Atlas 机器人,旨在加速通用人形机器人的开发。据介绍,波士顿动力旗下拥有 Atlas 机器人,其具备优良的运动能力和双手操作能力,TRI 在扩散策略上也拥有“开创性”的工作:首次成功地将生成式 AI 应用于提高机器人灵巧操作能力。

谷歌 AI 又闯祸:错把游戏开发者个人电话当公司电话公布致其被骚扰

谷歌搜索的实验性 AI 功能“Overview(概述)”再次闯祸,该功能曾因提供错误和有害搜索结果而备受批评,而其最新失误更是导致了一名游戏开发者的个人电话号码被错误地公开。Skybound Games 高级环境艺术家 Rogelio Delgado 在社交媒体 X 上分享了一段他接到一个愤怒的孩子家长电话的经历,该家长抱怨他在儿子玩的《流放者柯南》中发现了不合适的内容,这是一款 2017 年的 M 级开放世界生存游戏,由制作《沙丘:觉醒》的 Funcom 工作室开发。该家长称他通过谷歌搜索找到了 Delgado 的电话号码,因为后者曾于八年前在 Funcom 工作过。

摩托罗拉 Moto AI 开启便捷生活新篇章:点咖啡、叫网约车等一句话搞定

科技媒体 Android Authority 今天(10 月 16 日)发布博文,报道称在 2024 联想科技世界大会上,摩托罗拉推出了 Moto AI 功能,增强用户互动并提供个性化的帮助。摩托罗拉在去年的联想科技世界大会上宣布 Moto AI,宣布正开发相关的 AI 助手;今年 6 月,摩托罗拉和谷歌公司合作,在 Razr 2024 系列手机中引入了 Moto Magic Canvas(云端文生图 AI 模型)和 Style Sync(AI 壁纸创建器)两项 AI 功能。摩托罗拉在今年联想科技世界大会上,宣布进一步扩充 Moto AI 功能,AI在线附上相关改进如下:自然语言交互:Moto AI 将支持用户通过自然语言指令进行操作。

OpenAI 最新 53 页论文:ChatGPT 看人下菜碟,对“小美”和“小帅”回答不一致

AI 对待每个人类都一视同仁吗?现在 OpenAI 用 53 页的新论文揭示:ChatGPT 真的会看人下菜碟。根据用户的名字就自动推断出性别、种族等身份特征,并重复训练数据中的社会偏见。

补齐Transformer规划短板又不放弃快速思考,田渊栋团队的Dualformer融合System 1和2双重优势

一个 token 就能控制模型快些解答或慢点思考。OpenAI ο1 模型的发布掀起了人们对 AI 推理过程的关注,甚至让现在的 AI 行业开始放弃卷越来越大的模型,而是开始针对推理过程进行优化了。今天我们介绍的这项来自 Meta FAIR 田渊栋团队的研究也是如此,其从人类认知理论中获得了灵感,提出了一种新型 Transformer 架构:Dualformer。

实测13个类Sora视频生成模型,8000多个案例,一次看个够

AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。

阿里国际 Marco 翻译大模型发布:支持中英日韩西法等 15 种主流语言

感谢据阿里国际 AI 团队 AIDC-AI,阿里国际最新研发的翻译大模型 Marco 于今日正式上线,支持中、英、日、韩、西、法等 15 种全球主流语种。官方称其基于目前广泛使用的开源评测数据集 Flores,Marco 翻译大模型在 BLEU 自动评测指标上,领先于市面上的标杆翻译产品,如 Google 翻译、DeepL、GPT-4 等。“你的宝贝正在路上”,不会再被翻译成“Your baby is on the way”。