资讯列表

将偏好学习引入模型训练,北大李戈团队新框架,可显著提升代码准确性与执行效率

代码模型SFT对齐后,缺少进一步偏好学习的问题有解了。 北大李戈教授团队与字节合作,在模型训练过程中引入偏好学习,提出了一个全新的代码生成优化框架——CodeDPO。 在部分模型上,相比于单独使用SFT,CodeDPO能够将模型的HumanEval得分再多提升10个百分点,最高增幅接近1/3。

Hugging Face 发布 SmolVLM 开源 AI 模型:20 亿参数,用于端侧推理,体积小、速度快

Hugging Face 平台昨日(11 月 26 日)发布博文,宣布推出 SmolVLM AI 视觉语言模型(VLM),仅有 20 亿参数,凭借其极低的内存占用在同类模型中脱颖而出。

HuggingFace工程师亲授:如何在Transformer中实现最好的位置编码

在 Transformer 模型中,位置编码(Positional Encoding) 被用来表示输入序列中的单词位置。 与隐式包含顺序信息的 RNN 和 CNN 不同,Transformer 的架构中没有内置处理序列顺序的机制,需要通过位置编码显式地为模型提供序列中单词的位置信息,以更好地学习序列关系。 位置编码通常通过数学函数生成,目的是为每个位置生成一个独特的向量。

国产大模型首发中文逻辑推理,「天工大模型4.0」o1版来了

没想到,技术发展得竟然这么快。 最近,人们已经开始畅想 AI 时代后的生活了。 上周末,摩根大通 CEO 杰米・戴蒙(Jamie Dimon)表示,由于人工智能技术,未来几代人每周可以只工作三天半,活到一百岁。

跨模态大升级!少量数据高效微调,LLM教会CLIP玩转复杂文本

在当今多模态领域,CLIP 模型凭借其卓越的视觉与文本对齐能力,推动了视觉基础模型的发展。 CLIP 通过对大规模图文对的对比学习,将视觉与语言信号嵌入到同一特征空间中,受到了广泛应用。 然而,CLIP 的文本处理能力被广为诟病,难以充分理解长文本和复杂的知识表达。

创意无限:谷歌推出 GenChess,可 AI 定制国际象棋棋子

谷歌 DeepMind 团队于 11 月 25 日发布博文,为迎接 2024 年国际象棋世界冠军赛(11 月 25 日至 12 月 13 日),推出了名为 GenChess 的全新 AI 工具,让用户自由定制国际象棋棋子。

Uber“零工经济”扩展至数据标注,已对 Niantic 等外部客户提供服务

Uber 本月在多国同独立承包商签约,通过承包商派发来自其 Scaled Solotions 服务的付费人工数据标注任务。

从灯塔到弃子:波士顿动力为何被追随者反超

李子柒复出,川普正当任,仿佛回到了 2018 年自己还不是毒妇的时候。 2018 年,李子柒凭借视频在 YouTube 涨粉百万,一举成名。 同年,有个机器人也抓住 YouTube 的东风火了一把。

2024 生成式 AI 市场报告:企业支出增长率超 600%,安全性和 ROI 成关键决策点

最近,Menlo Ventures 针对拥有 50 名以上员工的公司的 600 名企业 IT 决策者进行调查,发布了一份名为《2024 年生成式 AI 现状》的企业市场报告。 2024 年,生成式 AI 市场的整体支出飙升至 138 亿美元,相比 2023 年的 23 亿美元增长了 6 倍以上,体现出企业对 AI 工具的强大信心和需求。 报告显示,72% 的 IT 决策者计划在未来更广泛地采用生成式 AI 工具,进一步释放 AI 在商业生产力提升中的潜力。

Sora就这么泄露了三小时,网友调侃Altman急拔网线,艺术家们也在抗议被「白嫖」

一觉醒来,挺突然的,Sora API 就这么泄露了。 坏消息:三个小时后,OpenAI 就关闭了访问权限。 好消息:大家伙把该测的都测完了。

提示工程:更好地释放LLM的能力

提示工程,正如其名,主要聚焦于探究如何创作提示词。 存在提示工程的一个关键缘由在于,大模型在不同人群的视角下所发挥的作用差异显著。 普通使用者往往仅将大模型视作聊天机器人,他们着重关注的是大模型能否迅速且精准地予以反馈。

AI 公司格灵深瞳总经理赵勇辞职:第三季度亏损同比扩大两倍

AI 公司格灵深瞳 11 月 26 日发布公告,于近日收到董事长、总经理赵勇先生的书面辞职报告,因公司业务发展需要,赵勇先生申请辞去公司总经理职务,其辞职报告自送达董事会之日起生效。

专为自动驾驶而生!DeSiRe-GS:彻底摒弃3D框,动静态重建完美解耦(UC Berkeley最新)

本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面 & 个人理解UC Berkeley最新的工作,提出了DeSiRe GS。 全新自监督高斯飞溅表示,可以在复杂的驾驶场景中实现有效的静态-动态分解和高保真表面重建。

无人机都能送外卖了!是谁在支撑低空经济快速发展呢?

“我的意中人是个盖世英雄,有一天他会踩着七彩祥云前来......”你的意中人还没等来,你的外卖倒是先腾云驾雾赶过来了 还没来及恭喜无人机加入外卖小哥的大家庭,庆祝以后在人行道和马路上化身头文字D主角的外卖小哥可能会变少,另一个问题就困扰了我们。 作为吗喽或者花花草草,以前只要担心被月光宝盒砸到,而现在砸到我们头上的还可能是“飞机”和它配送的牛杂、汤粉或者烤串了。 ......我发誓!

10 秒 1080P:部分艺术家指控 OpenAI 压榨,怒而泄露 Sora 视频生成 AI 模型

科技媒体 TechCrunch 昨日(11 月 26 日)发布博文,报道称名为“Sora PR Puppets”的组织为抗议 OpenAI 的“欺骗行为”和“艺术洗白”,于本周二在 Hugging Face 平台泄露了对 OpenAI 视频生成模型 Sora 的访问权限。

如何借助Cortex运行本地LLM

译者 | 布加迪审校 | 重楼AI行业正在经历一场转变,转向更小巧更高效的大语言模型(LLM),从而使用户能够在本地机器上运行模型,无需功能强大的服务器。 本教程将指导你借助Cortex运行本地LLM,着重介绍其独特的功能和易用性,使任何拥有标准硬件的人都可以享用AI。 注意:Cortex目前正在积极开发中,这可能会导致bug或某些功能无法正常运行。

一文读懂如何利用 AI 打造爆款营销

Hello folks,我是 Luga,今天我们来聊一下人工智能应用场景 - 基于 Chatbots(聊天机器人)如何提高营销活动投资回报率...在竞争激烈的市场环境下,如何提升营销活动的有效性,最大化营销投资回报率(ROI)是每一位营销人关注的焦点。 而 . Chatbots(聊天机器人)作为一种新兴的营销工具,以其独特的优势为营销人员提供了解决方案。

Anthropic 公布 Model Context Protocol 开源协议,利用统一接口“一统 AI 数据库”

Claude AI 开发商 Anthropic 于 11 月 25 日宣布了一项名为 Model Context Protocol 的开源协议,该协议号称是为业界 AI 助理与模型数据库提供一套标准化接口,允许各大助理通过单一协议访问各种数据源,从而加速模型响应速度与生成质量。