资讯列表
小技巧大功效,「仅阅读两次提示」让循环语言模型超越Transformer++
在当前 AI 领域,大语言模型采用的主流架构是 Transformer。不过,随着 RWKV、Mamba 等架构的陆续问世,出现了一个很明显的趋势:在语言建模困惑度方面与 Transformer 较量的循环大语言模型正在快速进入人们的视线。令人兴奋的是,这些架构在推理期间使用了恒定量的内存。不过,受制于有限的内存,循环语言模型(LM)无法记忆并使用长上下文中的所有信息,这导致了上下文学习(in-context learning,ICL)质量的不佳。因此,获得高效大语言模型的关键挑战在于选择存储或者丢弃哪些信息。在最
开发者利器!XREAL Air 2 ULTRA开售,沉浸式体验AI开发
北京时间7月31日下午2点整,XREAL系列AR眼镜的最新成员XREAL Air 2 Ultra在国内正式发售,目前在京东、天猫和抖音等平台都已上线,首发价3999元。这款AR眼镜是主要面向开发者群体打造的旗舰级产品,旨在降低广大开发者进入空间计算的门槛,推动空间计算领域革新,建立更繁荣的AR生态体系。赋能开发者六大核心能力作为XREAL第二款6 DoF(Six Degrees of Freedom,六自由度)全功能眼镜,XREAL Air 2 Ultra也是目前业界唯一通过双环境感知传感器(SLAM Camera
红外夜视、AI 识别,新设备可精准定位蚊子
以色列初创公司 Bzigo 推出了一款名为 Iris 的智能灭蚊设备,这款产品自 2020 年原型问世以来备受关注,如今终于正式上市,售价 339 美元(AI在线备注:当前约 2438 元人民币)。Iris 的工作原理十分智能,它通过广角摄像头和计算机视觉技术不间断扫描房间内的情况,即使在黑暗中,红外 LED 灯也能帮助它准确捕捉蚊子。Iris 的 AI 系统能够精准识别蚊子,不会误判为飞蛾或尘埃。一旦发现蚊子,Iris 会持续追踪其位置,直到蚊子停落。随后,设备会用 1 级人眼安全红色激光笔精确标出蚊子的落脚点,
Transformer作者回流谷歌,Character.AI创始团队被「收购」,只要人不要公司
AI 初创者的归宿还是大厂?一觉醒来,生成式 AI 的「吃鸡大赛」再次缩圈了。初创公司 Character.AI 周五宣布已与谷歌签署协议,谷歌将获得 Character.AI 的大型语言模型(LLM)技术的非独家许可。谷歌还宣布重新雇佣 Noam Shazeer 和 Daniel De Freitas。其中,Noam Shazeer 是 Character.AI 的创始人、CEO,也是 Transformer 论文作者之一,他曾在谷歌任首席软件工程师。而 Daniel De Freitas 是 Character
ICML 2024演讲爆火!Meta朱泽园揭秘大模型内心世界:不同于人类的2级推理
AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected];[email protected]大语言模型 (LLM) 是如何解数学题的?是通过模板记忆,还是真的学会了推理思维?模型的心算过程是怎样的?能学会怎样的推理技能?与人类相同,还是超越了人类?只学一种类型的数学题,是会对通用
英特尔股价暴跌 26%,40 年来最大跌幅
财报披露一系列消息:业绩不及预期、裁员、暂停派发股息。北京时间今天凌晨,英特尔股价暴跌逾 26%,单日总市值蒸发达 323.7 亿美元(约合 2317 亿元人民币),经历了 40 年来表现最差的交易日之一。本周四,英特尔刚刚公布了低于预期的第二季度财报,报告显示收益低于华尔街预期,公司宣布暂停派息,同时计划实施更广泛的重组计划。在周五的交易日中,英特尔盘中跌幅曾一度接近 30%,据彭博社提供的数据,这是该股自 1982 年以来表现最差的一次。英特尔在财报中表示,在第二季度的营收为 128 亿美元,同比下降 1%,(
从现在起,GitHub上超1亿开发者可直接访问全球顶级大模型,构建AI应用
GitHub 推出的全新功能「GitHub Models」将有望加快 AI 工程师时代的到来。什么?大家熟悉的代码托管平台 GitHub 又进化了!该平台也开始提供 AI 大模型的 Playgroud 了。所有你能叫得上名字的业界流行大模型,包括微软的 Phi-3、OpenAI 的 GPT-4o、Meta 的 Llama 3.1、Cohere 的 Command R 、Mistral AI 的 Mistral Large,都可以在一个交互式沙盒中试用。在未来几个月,Github 也将添加更多语言、视觉以及其他类型的
首届大模型顶会COLM 高分论文:偏好搜索算法PairS,让大模型进行文本评估更高效
AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected];[email protected]文章作者皆为来自剑桥大学语言技术实验室,一作为三年级博士生刘胤宏,导师为教授 Nigel Collier 和 Ehsan Shareghi。他的研究兴趣是大模型和文本评估,数据生成等。共同
特斯拉得州超级计算集群命名“Cortex”,拥有 10 万颗英伟达芯片
埃隆・马斯克 (Elon Musk) 周末在参观了最近建成的得克萨斯州超级计算集群后,透露了该工厂的名称。周六,马斯克在 X 上写道,得州超级工厂的超级计算集群被命名为“Cortex”,并指出他刚刚完成了新设施的演练。“Cortex”拥有约 10 万颗英伟达 H100 和 H200 芯片,用于训练全自动驾驶(FSD)和人形机器人擎天柱(Optimus)的神经网络。AI在线注意到,马斯克此前还详细介绍了 Cortex 超级计算集群的巨大冷却需求,并解释说该集群今年将需要约 130 MW 的电力,未来 18 个月内更是
日本创企“人机一体”研发人形机器人,可自动保持身体平衡
据共同社报道,日本机器人创新企业“人机一体”和立命馆大学 1 日公开展示其最新开发的人形机器人。该机器人由人类进行远程控制,可在事先未掌握周围环境的情况下自动保持身体平衡并安全运作。据介绍,该公司力争在 5 年内在高处等危险场地投入使用。AI在线汇总该机器人主要信息如下:参数方面,该机器人高约 2 米、宽约 70 厘米、重约 90 公斤。操作方面,该机器人由人类使用操纵杆控制手脚动作,通过机体的摄像头判断外界环境。上半身的动作由人控制,下半身会自动保持平衡,以便在人类不便控制的、脚下较难行走的地方运作。机器人足底装
AI 大语言模型价格战将启?谷歌本月下调 Gemini 1.5 Flash 费用:降幅最高 78.6%
大语言模型的价格战要来了吗?谷歌公司昨日(8 月 2 日)更新价格页面,宣布将于 2024 年 8 月 12 日开始,Gemini 1.5 Flash 模型每百万输入 tokens 成本为 0.075 美元、每百万输出 tokens 成本为 0.3 美元(AI在线备注:当前约 2.2 元人民币)。这让 Gemini 1.5 Flash 模型的使用成本,比 OpenAI 的 GPT-4o mini 便宜近 50%。根据计算,Gemini 1.5 Flash 模型费用输入费用比此前降低 78.6%,输出费用比此前降低
DeepMind 研究成本大起底,一篇 ICML 论文烧掉 1290 万美元
【新智元导读】DeepMind 最近被 ICML 2024 接收的一篇论文,完完全全暴露了他们背靠谷歌的「豪横」。一篇文章预估了这项研究所需的算力和成本,大概是 Llama 3 预训练的 15%,耗费资金可达 12.9M 美元。发一篇顶会论文,需要多少实验预算?最近,DeepMind 发表了一项研究,对 LLM 扩大规模时各种算法和架构细节,比如参数和优化器的选择,进行了广泛的实证调查。这篇论文已被 ICML 2024 接收。论文地址: 页的论文涵盖了数以万计的模型,备选方案包括 3 种优化器、4 种参数化方案、几
英国 AI 雄心受挫,13 亿英镑计算基础设施项目被搁置
根据 CNBC 报道,英国当局已搁置价值 13 亿英镑(AI在线备注:当前约 119.38 亿元人民币)的计算基础设施项目,意味着让英国成为世界人工智能领导者的雄心遭受重挫。政府发言人证实,为了优先考虑其它财政计划,政府将搁置两项由纳税人出资的重大支出承诺,价值分别为 5 亿英镑和 8 亿英镑。英国去年承诺提供 5 亿英镑,用于人工智能研究资源(AI Research Resource);此外去年还宣布提供 8 亿英镑,为爱丁堡大学创建下一代超大规模计算机提供资金,该计算机每秒能够执行 1 万亿次计算。这些举措将提
谷歌勇攀 AI 新高峰,邀测最强 Gemini 1.5 Pro 模型:Arena 竞技场跑分超 GPT-4o
谷歌 AI Studio 产品总监 Logan Kilpatrick 昨日(8 月 2 日)在 X 平台发布推文,推出了实验版 Gemini 1.5 Pro AI 模型(0801),并邀请用户通过 AI Studio 和 Gemini API 测试和反馈。AI在线援引 Kilpatrick 后续推文,他表示在 LMSYS 的聊天机器人竞技场(Chatbot Arena)比赛中,无论是文本还是多模态,实验版 Gemini 1.5 Pro AI 模型(0801)均取得了第一名。实验版 Gemini 1.5 Pro AI
英伟达新 AI 芯片被曝因设计缺陷“跳票”至少 3 个月,微软、谷歌或受影响
感谢据《The Information》北京时间今天上午报道,帮助生产英伟达新 AI 芯片和服务器硬件的两位知情人士透露,由于存在“设计缺陷”,英伟达新型 AI 芯片的发布将被推迟三个月甚至更长时间。报道指出,这一缺陷可能会影响 Meta、谷歌、微软等一系列“大客户”,因为他们都已订购了价值数百亿美元的芯片。另外,还有一名微软员工和另一名知情人士透露,英伟达本周向微软和另一家大型云计算提供商发出通报,其新款 Blackwell 芯片中最先进的 AI 芯片将会“跳票”。据悉,微软是英伟达最大的客户之一。而据AI在线此
全球首例,AI “牙医”上岗:15 分钟搞定牙冠准备,耗时是人类牙医的 1/8
牙科行业迎来历史性时刻,AI 控制的自动机器人完成了全球首例牙科手术,且速度比人类牙医快大约八倍。该 AI 机器人由波士顿公司 Perceptive 制造,使用手持式三维容积扫描仪,通过光学相干断层扫描(OCT)建立详细的口腔三维模型,包括牙齿、牙龈甚至牙齿表面下的神经。OCT 只使用光束来建立体积模型,模型的分辨率很高,能自动检测出空腔,准确率约为 90%,且避免了有害的 X 射线辐射。 该 AI 机器人完成的首例手术是牙冠准备牙齿:会进行局部麻醉,以帮助麻醉您的牙齿和周围的牙龈,以获得最佳的舒适度,然后修剪原来
贾扬清一吐为快:要想赚钱,AI模型到底该大该小?
最近的AI社区,关于模型规模的讨论有些活跃。 一方面,此前在大模型开发奉为“圣经”的Scaling Law,似乎正在褪去光环。 去年大家还在猜测GPT-5的规模“可能会大到想不到”,现在这种讨论几乎绝迹。
新王登基,Gemini 1.5 Pro再度更新,超越GPT 4o和Claude-3.5
8月2日,lmsys官方在推特发布一则消息,恭喜DeepMind研发的Gemini 1.5 Pro 实验版 (0801)在Chatbot Arena排名登顶,超越GPT 4o和Claude-3.5夺得第一。 这是继今年3月Claude 3 “超大杯”Opus版本短暂超越GPT-4以来,OpenAI第二次让出Chatbot Arena的Overall ranking宝座。 Gemini 1.5 Pro 实验版 (0801)在Chatbot Arena测试一周后。