AI资讯列表 - AI在线

将偏好学习引入模型训练，北大李戈团队新框架，可显著提升代码准确性与执行效率

代码模型SFT对齐后，缺少进一步偏好学习的问题有解了。北大李戈教授团队与字节合作，在模型训练过程中引入偏好学习，提出了一个全新的代码生成优化框架——CodeDPO。在部分模型上，相比于单独使用SFT，CodeDPO能够将模型的HumanEval得分再多提升10个百分点，最高增幅接近1/3。

Hugging Face 发布 SmolVLM 开源 AI 模型：20 亿参数，用于端侧推理，体积小、速度快

Hugging Face 平台昨日（11 月 26 日）发布博文，宣布推出 SmolVLM AI 视觉语言模型（VLM），仅有 20 亿参数，凭借其极低的内存占用在同类模型中脱颖而出。

HuggingFace工程师亲授：如何在Transformer中实现最好的位置编码

在 Transformer 模型中，位置编码（Positional Encoding）被用来表示输入序列中的单词位置。与隐式包含顺序信息的 RNN 和 CNN 不同，Transformer 的架构中没有内置处理序列顺序的机制，需要通过位置编码显式地为模型提供序列中单词的位置信息，以更好地学习序列关系。位置编码通常通过数学函数生成，目的是为每个位置生成一个独特的向量。

国产大模型首发中文逻辑推理，「天工大模型4.0」o1版来了

没想到，技术发展得竟然这么快。最近，人们已经开始畅想 AI 时代后的生活了。上周末，摩根大通 CEO 杰米・戴蒙（Jamie Dimon）表示，由于人工智能技术，未来几代人每周可以只工作三天半，活到一百岁。

跨模态大升级！少量数据高效微调，LLM教会CLIP玩转复杂文本

在当今多模态领域，CLIP 模型凭借其卓越的视觉与文本对齐能力，推动了视觉基础模型的发展。 CLIP 通过对大规模图文对的对比学习，将视觉与语言信号嵌入到同一特征空间中，受到了广泛应用。然而，CLIP 的文本处理能力被广为诟病，难以充分理解长文本和复杂的知识表达。

创意无限：谷歌推出 GenChess，可 AI 定制国际象棋棋子

谷歌 DeepMind 团队于 11 月 25 日发布博文，为迎接 2024 年国际象棋世界冠军赛（11 月 25 日至 12 月 13 日），推出了名为 GenChess 的全新 AI 工具，让用户自由定制国际象棋棋子。

Uber“零工经济”扩展至数据标注，已对 Niantic 等外部客户提供服务

Uber 本月在多国同独立承包商签约，通过承包商派发来自其 Scaled Solotions 服务的付费人工数据标注任务。

从灯塔到弃子：波士顿动力为何被追随者反超

李子柒复出，川普正当任，仿佛回到了 2018 年自己还不是毒妇的时候。 2018 年，李子柒凭借视频在 YouTube 涨粉百万，一举成名。同年，有个机器人也抓住 YouTube 的东风火了一把。

2024 生成式 AI 市场报告：企业支出增长率超 600%，安全性和 ROI 成关键决策点

最近，Menlo Ventures 针对拥有 50 名以上员工的公司的 600 名企业 IT 决策者进行调查，发布了一份名为《2024 年生成式 AI 现状》的企业市场报告。 2024 年，生成式 AI 市场的整体支出飙升至 138 亿美元，相比 2023 年的 23 亿美元增长了 6 倍以上，体现出企业对 AI 工具的强大信心和需求。报告显示，72% 的 IT 决策者计划在未来更广泛地采用生成式 AI 工具，进一步释放 AI 在商业生产力提升中的潜力。

Sora就这么泄露了三小时，网友调侃Altman急拔网线，艺术家们也在抗议被「白嫖」

一觉醒来，挺突然的，Sora API 就这么泄露了。坏消息：三个小时后，OpenAI 就关闭了访问权限。好消息：大家伙把该测的都测完了。

提示工程：更好地释放LLM的能力

提示工程，正如其名，主要聚焦于探究如何创作提示词。存在提示工程的一个关键缘由在于，大模型在不同人群的视角下所发挥的作用差异显著。普通使用者往往仅将大模型视作聊天机器人，他们着重关注的是大模型能否迅速且精准地予以反馈。

AI 公司格灵深瞳总经理赵勇辞职：第三季度亏损同比扩大两倍

AI 公司格灵深瞳 11 月 26 日发布公告，于近日收到董事长、总经理赵勇先生的书面辞职报告，因公司业务发展需要，赵勇先生申请辞去公司总经理职务，其辞职报告自送达董事会之日起生效。

专为自动驾驶而生！DeSiRe-GS：彻底摒弃3D框，动静态重建完美解耦（UC Berkeley最新）

本文经自动驾驶之心公众号授权转载，转载请联系出处。写在前面 & 个人理解UC Berkeley最新的工作，提出了DeSiRe GS。全新自监督高斯飞溅表示，可以在复杂的驾驶场景中实现有效的静态-动态分解和高保真表面重建。

无人机都能送外卖了！是谁在支撑低空经济快速发展呢？

“我的意中人是个盖世英雄，有一天他会踩着七彩祥云前来......”你的意中人还没等来，你的外卖倒是先腾云驾雾赶过来了还没来及恭喜无人机加入外卖小哥的大家庭，庆祝以后在人行道和马路上化身头文字D主角的外卖小哥可能会变少，另一个问题就困扰了我们。作为吗喽或者花花草草，以前只要担心被月光宝盒砸到，而现在砸到我们头上的还可能是“飞机”和它配送的牛杂、汤粉或者烤串了。 ......我发誓！

10 秒 1080P：部分艺术家指控 OpenAI 压榨，怒而泄露 Sora 视频生成 AI 模型

科技媒体 TechCrunch 昨日（11 月 26 日）发布博文，报道称名为“Sora PR Puppets”的组织为抗议 OpenAI 的“欺骗行为”和“艺术洗白”，于本周二在 Hugging Face 平台泄露了对 OpenAI 视频生成模型 Sora 的访问权限。

如何借助Cortex运行本地LLM

译者 | 布加迪审校 | 重楼AI行业正在经历一场转变，转向更小巧更高效的大语言模型（LLM），从而使用户能够在本地机器上运行模型，无需功能强大的服务器。本教程将指导你借助Cortex运行本地LLM，着重介绍其独特的功能和易用性，使任何拥有标准硬件的人都可以享用AI。注意：Cortex目前正在积极开发中，这可能会导致bug或某些功能无法正常运行。

一文读懂如何利用 AI 打造爆款营销

Hello folks，我是 Luga，今天我们来聊一下人工智能应用场景 - 基于 Chatbots(聊天机器人)如何提高营销活动投资回报率...在竞争激烈的市场环境下，如何提升营销活动的有效性，最大化营销投资回报率(ROI)是每一位营销人关注的焦点。而 . Chatbots(聊天机器人)作为一种新兴的营销工具，以其独特的优势为营销人员提供了解决方案。

Anthropic 公布 Model Context Protocol 开源协议，利用统一接口“一统 AI 数据库”

Claude AI 开发商 Anthropic 于 11 月 25 日宣布了一项名为 Model Context Protocol 的开源协议，该协议号称是为业界 AI 助理与模型数据库提供一套标准化接口，允许各大助理通过单一协议访问各种数据源，从而加速模型响应速度与生成质量。