AI资讯列表 - AI在线

微软、国科大开启1Bit时代：大模型转三进制，速度快4倍能耗降至1/41

革命性的提升来了。把大模型的权重统统改成三元表示，速度和效率的提升让人害怕。今天凌晨，由微软、国科大等机构提交的一篇论文在 AI 圈里被人们争相转阅。该研究提出了一种 1-bit 大模型，实现效果让人只想说两个字：震惊。如果该论文的方法可以广泛使用，这可能是生成式 AI 的新时代。对此，已经有人在畅想 1-bit 大模型的适用场景，看起来很适合物联网，这在以前是不可想象的。人们还发现，这个提升速度不是线性的 —— 而是，模型越大，这么做带来的提升就越大。还有这种好事？看起来英伟达要掂量掂量了。近年来，大语言模型（L

LLaMa 3或将推迟到7月发布，剑指GPT-4，从Gemini吸取教训

LLaMa 3 正寻找安全与可用性的新平衡点。过去的图像生成模型常被人们诟病人物主要以「白人」为主，而谷歌 Gemini 正在因为它的矫枉过正而深陷翻车风波。它「过度谨慎」的文生图结果会与历史事实出现极大偏差，让用户们瞠目结舌。谷歌表示，该模型变得比开发者预期的更加谨慎。这不仅体现在生成图片的问题上，还体现在常常将一些提示认作敏感提示，从而拒绝回答。在此事不断发酵时，这项安全与可用性如何平衡的难题也给 Meta 提出了巨大挑战。LLaMA 2 是开源领域的「强中手」，更是 Meta 的招牌模型，一经发布即改变了大模

想训练类Sora模型吗？尤洋团队OpenDiT实现80%加速

作为 2024 开年王炸，Sora 的出现树立了一个全新的追赶目标，每个文生视频的研究者都想在最短的时间内复现 Sora 的效果。根据 OpenAI 披露的技术报告，Sora 的核心技术点之一是将视觉数据转化为 patch 的统一表征形式，并通过 Transformer 和扩散模型结合，展现了卓越的扩展（scale）特性。在报告公布后，Sora 核心研发成员 William Peebles 和纽约大学计算机科学助理教授谢赛宁合著的论文《Scalable Diffusion Models with Transform

ICLR 2024 Spotlight｜厦门大学、Intel、大疆联合出品，从网络视频中学习零样本图像匹配大模型

图像匹配是计算机视觉的一项基础任务，其目标在于估计两张图像之间的像素对应关系。图像匹配是众多视觉应用如三维重建、视觉定位和神经渲染 (neural rendering) 等的基础和前置步骤，其精确度和效率对于后续处理十分重要。传统算法（SIFT）在面临长基线或极端天气等复杂场景时，其匹配的准确度和密度往往有限。为了解决这些问题，近年来，基于深度学习的匹配模型逐渐流行。然而，由于缺乏大规模且多样化的具有真值标签的训练数据，目前的匹配模型通常是在 ScanNet 和 MegaDepth 上分别训练室内和室外两个模型。这

2024国际自动驾驶挑战赛正式开始

新赛题：七大赛道，赛题新颖，全方位覆盖相关领域最新最热话题，充分挖掘大模型在自动驾驶及具身智能垂直领域中的应用。高奖金：总奖金池超过12万美金，单赛道最高奖金可达2.7万美金。据不完全统计，奖金额度在CVPR 2024百个论坛中最高。重原创：加强基础研究探索，坚持四个面向。以原创性与科学研究价值作为主要衡量指标，并不单靠成绩排名。采取原创方案加性能指标两者结合的方式进行综合排序。2024年3月1号，2024国际自动驾驶挑战赛正式启动。本次挑战赛由上海人工智能实验室主办，并联合多家国内外机构共同举办。多位国内外知名专

火山引擎弹性容器实例：从节点中心转型 Serverless 化架构的利器

在 Kubernetes 和容器化技术愈发成熟的今日，越来越多企业开始将业务应用迁移到云上，采用云原生架构支持业务高速稳定地发展。而随着云计算向开发流程纵深发展，Serverless 架构的成熟让云原生技术进入全新阶段——Serverless 把公有云弹性伸缩、免运维、快速接入等特性发挥到了极致，极大降低了用户的使用成本，让用户和企业只需要专注于其业务逻辑，实现真正意义上的敏捷开发。为了更好帮助企业业务应用真正践行 Serverless 化的新型云原生思想，火山引擎云原生团队正在从理念、系统设计、架构设计等多方面推

SDXL-Lightning 来啦！让AI出图速度提升 10 倍！

大家好，这里是和你们一起探索 AI 绘画的花生~ AI 绘画自出现以来一直在不断发展，最明显的体现就是图像生成质量越来越高，还有很重要的一点就是出图速度的提升。比如之前为大家介绍过的 LCM 和 SDXL Turbo，仅用 1-4 步就能完成图像推理，使模型出图速度比之前快了 8-10 倍。最近，字节又推出了一个新的模型 SDXL-Lightning，它同样能在几秒之内就生成 1024px 的图像，且出图质量比 LCM 和 Turbo 都要好，今天就为大家介绍一下 Lightning 的功能和用法。相关推荐：

知名AI研究者深挖谷歌Gemma：参数不止70亿，设计原则很独特

想要了解谷歌 Gemma 与 Llama 2、Mistral 有哪些异同吗？这篇文章值得一读。就在几天前，开源大模型领域迎来了重磅新玩家：谷歌推出了全新的开源模型系列「Gemma」。相比 Gemini，Gemma 更加轻量，同时保持免费可用，模型权重也一并开源了，且允许商用。谷歌发布了包含两种权重规模的模型：Gemma 2B 和 Gemma 7B。尽管体量较小，但 Gemma 已经「在关键基准测试中明显超越了更大的模型」，包括 Llama-2 7B 和 13B，以及风头正劲的 Mistral 7B。与此同时，关于

反转？OpenAI：纽约时报「黑客攻击」了ChatGPT，要求驳回版权诉讼

去年年底，《纽约时报》向微软和 OpenAI 提起侵犯版权诉讼，指控其违规使用了《纽约时报》的内容来进行人工智能开发。在这份起诉书中，《纽约时报》列出了 GPT-4 输出「抄袭」《纽约时报》的「证据」，GPT-4 的许多回答与《纽约时报》的报道段落几乎完全一致：《纽约时报》指责 OpenAI 和微软试图「搭《纽约时报》对其新闻业的巨额投资的便车」，并创建报纸的替代品。彼时，《纽约时报》发言人在一份电子邮件声明中表示：「如果微软和 OpenAI 想要将我们的作品用于商业目的，法律要求他们首先要获得我们的许可，但他们没

苹果10年造车梦「夭折」，数十亿美元打水漂，特斯拉或成最大赢家

这下子，苹果再也不用频繁变更汽车的预计发布时间了。终于，近 3 万亿美元市值的苹果在电动汽车这个赛道「折戟沉沙」，成了正在消亡的车企大军中的一员。图源：appsystem今天凌晨，据彭博社等多家外媒报道，苹果公司高管在与造车团队的内部会议上宣布正式放弃名为「Project Titan」泰坦计划，由此宣告了苹果努力十年、耗资数十亿美元的电动汽车梦破碎。苹果首席运营官 Jeff Williams 和负责汽车项目的副总裁 Kevin Lynch 向员工通报了造车项

数量即力量！腾讯揭秘：Agent数量越多，大语言模型效果越好

来自腾讯的研究者们做了一个关于 agent 的scaling property（可拓展性）的工作。发现：通过简单的采样投票，大语言模型（LLM）的性能，会随着实例化agent数量的增加而增强。其第一次在广泛的场景下验证了该现象的普遍性，与其他复杂方法的正交性，以及研究了其背后的原因，并提出进一步促成scaling发挥威力的办法。论文标题：More Agents Is All You Need论文地址：：，来自腾讯的研究者发现：只需通过一种简单的采样投票法，大语言模型的性能就会随着实例化 agent 的数量的增大而增

AI 让公益事半功倍，第四届 Light・技术公益创造营开幕

社会的痛点就是公益的起点。

苹果汽车，虽死犹生

机器之能报道编辑：吴昕马斯克曾开玩笑说苹果是特斯拉的墓地，现在看来，结果恰好相反。就在国内新能源汽车理想实现历史最佳业绩、小米新车即将亮相之际，另一则在苹果公司内部披露的消息震惊了近 2000 名员工。研究近十年后，苹果取消了其最为神秘的电动汽车项目。彭博社消息称，该公司将缩减电动汽车团队规模，一些苹果员工可能会转到生成 AI 团队。此举是由苹果 COO Jeff Williams 和副总裁 Kevin Lynch 宣布的，他们自 2021 年以来一直领导汽车项目。马斯克曾打算把特斯拉卖给苹果。他也有句名言，“我们

AlphaFold 预测细菌生存所需的 1402 种蛋白互作，最完整的细菌必需相互作用图谱

革兰氏阴性必需相互作用组。（来源：eLife）编辑 | 紫罗细菌蛋白质组平均由约 4000-5000 个蛋白质组成，这意味着相互作用组可能多达 2000 万个相互作用。据估计，大肠杆菌中大约有 12,000 种物理相互作用。然而，并非所有这些相互作用都对细菌的生存至关重要。对生物体中蛋白质相互作用的研究，是理解生物过程和中心代谢途径的基础。然而，我们对细菌相互作用组的了解仍然有限。近日，西班牙巴塞罗那自治大学（Universitat Autònoma de Barcelona，UAB）的研究人员使用人工智能工具 A

仅用 53 秒，商汤办公小浣熊就能助你化身高级打工人

作者丨郭思编辑丨陈彩娴继推出ChatGPT后，龙年伊始，OpenAI公司又推出了最新人工智能文生视频大模型Sora，其火爆效果被誉为即将重塑视频内容创作的未来。而无论是ChatGPT还是Sora，众多身处职场的「男工女工」都在一边期待一边害怕，工作方式被彻底颠覆。这一切都是因为AI可以通过现有的网络、数据、资料、知识，展示出超出一般人类的记忆、逻辑、分析、综合能力，如果它能够突破与人交互的界面（语言也是一种界面），那这种能力不仅会超过人类，而且超过几万倍，能较大限度地提高生产效率，也可能会取代部分传统工种。

优刻得为智谱AI构建千卡推理集群，助力全球用户畅享大模型智能生活

时光倒回到 2021 年的那个夜晚。一位妈妈灵感枯竭，无法继续她的小说创作；一旁的爸爸正忙碌于代码的世界，他想要在工作之余开发一款小游戏，却困于代码调试；而他们的孩子，正眉头紧锁地趴在书桌上，为一道奥数题苦思冥想。2024 年的今天，AI 大模型的出现让这一切发生改变。在「智谱清言」的助力下，妈妈的小说创作焕发新生，她只需将自己的创意和构思输入给大模型，就可以生成自然生动的故事情节和对话；爸爸用大模型进行代码编程和调试，通过分析代码逻辑，大大减少了开发的繁琐流程，减轻了一大半的⼯作量；大模型也成为了小朋友学习上的得

重磅发布！Stable Video 零基础使用教程及应用案例

前言上周 Stable Video 开放公测，可以生成 4s 视频，我第一时间体验了一波。相比 Sora 可生成 60s 多角度多机位多角色的视频，Stable Video 效果没有那么惊艳。但是相比市面上主流的 AI 视频 Runway、pika 等还是有一定优势的，下文中我也会进行效果对比。目前 Stable Video 对所有用户都可以免费开发，每天可领 150 积分，图生视频每使用一次消耗 10 积分，文生视频消耗 11 积分，还可以付费升级。接下来让我们一起来试一试吧。关于 Sora：一、初步体

讲个鬼故事：这台机器人终于“强”成了我要的模样

机器之能报道编辑：吴昕不同于昨日介绍的公司，Ameca 代表了另一种人形机器人的发展路径，也正取得重要进展。当被要求描述一下周遭环境时，Ameca 先用宝蓝色的眼睛盯住自己的老板（视频中与之对话的长者），接着，最有趣的一幕来了：视频链接：一番左顾右盼，然后开始滔滔不绝：房间的窗户开着，光线太亮有点让人睁不开眼；书架上摆放着很多书，不知道是主人学问好还是在装样子；至于桌椅，是人类生产力工具还是拖延症帮手，视情况而定......好一番调侃。老板接着发问，你看我手里拿着啥？Ameca 看了一眼，闭眼思考片刻后，再度开