模型

腾讯推出 Hunyuan-Large 大模型：389B 总参数，业界已开源基于 Transformer 的最大 MoE 模型
腾讯今日宣布推出 Hunyuan-Large 大模型，官方表示这是目前业界已经开源的基于 Transformer 的最大 MoE 模型，拥有 3890 亿总参数（389B）和 520 亿激活参数（52B）。腾讯今日在 Hugging Face 开源了 Hunyuan-A52B-Pretrain 、 Hunyuan-A52B-Instruct 和 Hunyuan-A52B-Instruct-FP8…
应用
- 7
- 0
沛霖（实习）11月5日
无需参数访问！CMU用大模型自动优化视觉语言提示词 | CVPR’24
视觉语言模型（如 GPT-4o、DALL-E 3）通常拥有数十亿参数，且模型权重不公开，使得传统的白盒优化方法（如反向传播）难以实施。那么，有没有更轻松的优化方法呢？就在最近，卡内基梅隆大学（CMU）的研究团队对于这个问题提出了一种创新的“黑盒优化”策略——通过大语言模型自动调整自然语言提示词，使视觉语言模型在文生图、视觉识别等多个下游任务中获得更好的表现。
理论
- 968
- 0
量子位11月5日
Llama版o1来了，来自上海AI Lab，强化学习代码已开源，基于AlphaGo Zero范式
复刻OpenAI o1推理大模型，开源界传来最新进展：LLaMA版o1项目刚刚发布，来自上海AI Lab团队。简介中明确：使用了蒙特卡洛树搜索，Self-Play强化学习，PPO，以及AlphaGo Zero的双重策略范式（先验策略价值评估）。在2024年6月，o1发布之前，团队就开始探索蒙特卡洛树搜索提高大模型数学能力，积累了一些关注。
理论
- 968
- 0
量子位11月5日
AI开源项目 | FastGPT- 深入解析 FastGPT 的知识库逻辑与检索机制：让 AI 更聪明的秘密
如何让 AI 更加智能化、精准化，成为了研究者和开发者们关注的焦点。 FastGPT 作为一款前沿的 AI 模型，其知识库逻辑与检索机制无疑是其成功的关键所在。本文将为您详细解析 FastGPT 的知识库逻辑与检索机制，并结合知识库的特性，提供实用的教学意义，帮助您更好地理解这一技术背后的原理与应用。
理论
- 968
- 0
hpstream11月5日
携程弱网识别技术探索
网络优化一直是移动互联网时代的热议话题，弱网识别作为弱网优化的第一步，受到的关注和讨论也是最多的。本文从设计、开发、落地详尽的分享了携程在弱网识别方面的实践经验，如果你也有类似需求，这篇文章会是一个不错的实操指南。一、背景二、技术方案2.1 数据采集2.2 数据处理2.3 结果输出三、落地效果四、未来展望一、背景自从2010年携程推出”无线战略“，并发布移动端APP以来，无线研发团队对于客户端…
理论
- 968
- 0
Aaron11月5日
车道线再出发！SinLane：孪生Transformer如何破局（上交&浙大）
本文经自动驾驶之心公众号授权转载，转载请联系出处。写在前面 & 笔者的个人理解车道检测是自动驾驶系统中一项重要但具有挑战性的任务。基于Visual Transformer的发展，早期基于Transformer的车道检测研究在某些场景下取得了有前景的结果。
理论
- 968
- 0
自动驾驶Daily11月5日
解决真实GitHub Issue能力登顶，字节豆包MarsCode团队分享背后工程实践，踩过的坑也分享了
解决真实GitHub Issue的基准测试，字节家的豆包MarsCode Agent悄悄登顶了。 SWE-Bench，一个由普林斯顿大学提出的极具挑战性的Benchmark，近期受到工业界、学术界和创业团队的广泛关注。在其子集SWE-Bench Lite排行榜上，豆包MarsCode Agent近期冲上第一。
理论
- 968
- 0
量子位11月4日
字节跳动内测 AI 模型分享社区“炉米 Lumi”，据称集成 LLM 分享 / 搭建 / 训练等功能
字节跳动悄悄推出了一个名为“炉米 Lumi”的 AI 模型分享社区，相关平台据称集成了模型分享、Workflow 搭建以及 LoRA 训练等多种功能，用户可以上传自己开发的 AI 模型，并在社区中与其他人分享，平台还支持用户搭建 AI 工作流程。不过AI在线注意到，该平台目前还处于内部测试阶段，目前主流搜索引擎均未收录相关网站，但可以通过“artistrylab.net”网页地址直接访问，但尝试…
应用
- 13
- 0
漾仔11月4日
慢思考准确率反降30%！普林斯顿揭示思维链某些任务上失效的秘密
OpenAI o1彻底带火慢思考和思维链（CoT）方法，但CoT在某些任务上反而会降低模型表现。比如给生造的词分类任务，GPT-4在zero-shot提示下的准确率高达94%，换成CoT的准确率却断崖式下跌到64.4%。内置CoT的o1-preview准确率更是只有57.7%。
理论
- 969
- 0
admin11月4日
大语言模型时代，提示词才是王道：堪比专业翻译软件的提示词
先给大家看看最终效果：商人罗伯特·洛卡西奥，开了个名叫EqualAI的非营利组织，专门应对人工智能开发中那些看不见、摸不着的无意识偏见。这名字听起来倒是光鲜，然而，他却在《Fast Company》上发了一篇文章，讲的是什么“提示工程”的局限。事情的由头不过是一个普普通通的提示语：“写篇750字的文章，说说人工智能怎么成了品牌的‘数字门面’，要写得像《Fast Company》的文章那样。
理论
- 970
- 0
rocLv11月4日
程序员又又又要失业了？有反转！Google CEO称1/4的代码是AI写的！谷歌员工在线打脸：数据明显掺水，工程都是我们做的
编辑 | 伊风出品 | 51CTO技术栈（微信号：blog51cto）谷歌不止Q3的财报很强劲。 CEO “劈柴”更是在财报电话会议里曝了个猛料！图片他指出：谷歌超过四分之一的新代码都是由人工智能生成的！
理论
- 968
- 0
伊风11月4日
研究人员绕过 GPT-4o 模型安全护栏，利用“十六进制字符串”成功令其编写漏洞攻击程序
网络安全公司 0Din 的研究员 Marco Figueroa 发现了一种新型 GPT 越狱攻击手法，成功突破了 GPT-4o 内置的“安全护栏”措施，能够使其编写出恶意攻击程序。参考 OpenAI 介绍，ChatGPT-4o 内置了一系列“安全护栏”措施，以防止该 AI 遭到用户不当使用，相关防护措施会分析输入的提示文本，判断用户是否要求模型生成恶意内容。 ▲ 图源 Marco Figuero…
应用
- 9
- 0
漾仔11月4日
大模型也冲“奥斯卡”：港科大腾讯等提出AI角色扮演全景综述，四方面剖析关键细节
AI界也有了自己的“奥斯卡”，哪家大模型角色扮演更入戏？来自香港科技大学、腾讯、新加坡管理大学的团队提出新综述——不仅系统性地回顾了角色扮演语言模型的发展历程，还对每个阶段的关键进展进行了深入剖析，展示了这些进展如何推动模型逐步实现更复杂、更逼真的角色扮演。 AI世界如同不断扩展的“舞台”，语言模型则是这个舞台上不断精进的“演员”。
理论
- 968
- 0
量子位11月4日
o1满血版泄露！奥数题图片推理手拿把掐，奥特曼上线剧透o2
o1满血版泄露了！没想到，OpenAI还搁那儿“今年一定”呢，不少网友已经率先上手体验到了（doge）。事情是酱婶的：有网友发现，OpenAI已经在ChatGPT官网上部署了完整版o1，大家伙儿还都能卡bug直接用！
理论
- 968
- 0
量子位11月4日
微软清华改进Transformer：用降噪耳机原理升级注意力，一作在线答疑
Transformer自问世后就大放异彩，但有个小毛病一直没解决：总爱把注意力放在不相关的内容上，也就是信噪比低。现在微软亚研院、清华团队出手，提出全新改进版Differential Transformer，专治这个老毛病，引起热议。论文中介绍，整体思路类似差分放大电路或降噪耳机，用两个信号的差值来滤除共模噪声。
理论
- 968
- 0
量子位11月4日
大模型玩你画我猜：Claude6局3胜，GPT-4o表现迷惑
一群大模型玩你画我猜，人类一旁围观超起劲儿。就像下面这张图展示的，由Grok画长颈鹿，一堆大模型根据生成内容猜答案。参赛选手包括GPT-4o、Claude、Llama、Gemini、Grok等。
理论
- 968
- 0
量子位11月4日
GPT-5 要等到明年？OpenAI CEO：今年无法同时发布那么多东西
美国时间周四，OpenAI 首席执行官萨姆・奥特曼（Sam Altman）透露，该公司的下一个大型人工智能模型可能不会在今年面世，原因是其正“优先开发”当前专注于推理与难题解决的模型。在参与 Reddit 网站的网友问答活动时，奥特曼指出：“所有模型都变得越来越复杂，我们无法像我们希望的那样同时发布那么多东西。 ”他还解释称，在为“众多卓越创意”分配计算资源时，公司面临着“诸多限制和艰难抉择”。
应用
- 4
- 0
小小11月3日
苹果 AI 研究：“猕猴桃”简单算术考倒 o1 和 Llama 等 20 多个最先进模型
《洛杉矶时报》昨日（11 月 1 日）发布博文，报道称苹果研究团队测试了 20 个最先进的 AI 模型，发现在有干扰项存在的情况下，它们处理简单的算术问题时表现不佳，甚至不如小学生。苹果公司用以下这道简单的算术题测试 20 多个最先进的 AI 模型，AI在线附上题目如下：Oliver 在星期五采摘了 44 个猕猴桃、然后他在星期六采摘了 58 个猕猴桃，星期日采摘的数量是星期五的两倍，不过其中有…
应用
- 9
- 0
故渊11月2日
豆包大模型团队开源RLHF框架，训练吞吐量最高提升20倍
强化学习（RL）对大模型复杂推理能力提升有关键作用，但其复杂的计算流程对训练和部署也带来了巨大挑战。近日，字节跳动豆包大模型团队与香港大学联合提出 HybridFlow。这是一个灵活高效的 RL/RLHF 框架，可显著提升训练吞吐量，降低开发和维护复杂度。
应用
- 8
- 0
新闻助手11月1日
百川智能发布一站式解决方案，助力企业“多、快、好、省”落地大模型
今日，百川智能推出一站式大模型商业化解决方案，即1 3产品矩阵（全链路优质通用训练数据，Baichuan4-Turbo、Baichuan4-Air两款模型和全链路领域增强工具链），该方案“工具多、速度快、效果好、成本低”，能够帮助企业以最低成本实现效果最佳的私有化部署。并支持企业将专有数据与百川智能自用的全链路优质训练数据混合，对Baichuan4-Turbo、Baichuan4-Air两款模型…
应用
- 6
- 0
新闻助手10月31日
扎克伯格押注 AI：Meta 正推动美国政府使用其 Llama 模型
Meta 首席执行官马克・扎克伯格在第三季度财报电话会议上表示，Meta 正在“与公共部门合作，推动 Llama AI 模型在整个美国政府机构中得到应用”。这一消息引发了诸多疑问：哪些政府部门将使用 Meta 的 AI 模型？这些模型将用于何种用途？
应用
- 4
- 0
远洋10月31日
OpenAI 开源 SimpleQA 新基准，专治大模型“胡言乱语”
当地时间 30 日，OpenAI 宣布，为了衡量语言模型的准确性，将开源一个名为 SimpleQA 的新基准，可衡量语言模型回答简短的事实寻求（fact-seeking）问题的能力。 AI 领域中的一个开放性难题是如何训练模型生成事实正确的回答。当前的语言模型有时会产生错误输出或未经证实的答案，这一问题被称为“幻觉”。
应用
- 5
- 0
清源10月31日
神秘模型“小熊猫”一夜刷屏：排名超 Flux、Midjourney
一夜之间，名为“red_panda” （小熊猫）的神秘文生图模型狠狠火了！！登顶文生图竞技场，直接将 Flux、Midjourney 等一众顶尖模型踩在脚下 ——其 ELO 得分比 Flux 1.1 Pro 高出 100 多，胜率高达 79%，每 7 秒就能生成一张图像。
应用
- 11
- 0
汪淼10月29日
微软开源 OmniParser 纯视觉 GUI 智能体：让 GPT-4V 秒懂屏幕截图，可操控手机 / 电脑
科技媒体 marktechpost 于 10 月 24 日发布博文，报道称微软公司宣布开源 OmniParser，是一款解析和识别屏幕上可交互图标的 AI 工具。项目背景传统的自动化方法通常依赖于解析 HTML 或视图层次结构，从而限制了其在非网络环境中的适用性。而包括 GPT-4V 在内的现有的视觉语言模型（VLMs），并不擅长解读复杂 GUI 元素，导致动作定位不准确。
应用
- 8
- 0
故渊10月29日