大语言模型

如何借助Cortex运行本地LLM

译者 | 布加迪审校 | 重楼AI行业正在经历一场转变，转向更小巧更高效的大语言模型（LLM），从而使用户能够在本地机器上运行模型，无需功能强大的服务器。本教程将指导你借助Cortex运行本地LLM，着重介绍其独特的功能和易用性，使任何拥有标准硬件的人都可以享用AI。注意：Cortex目前正在积极开发中，这可能会导致bug或某些功能无法正常运行。

11/27/2024 8:14:43 AM

布加迪

Salesforce 首席执行官：大语言模型可能已接近技术上限，AI 的未来是智能体

他认为人工智能的未来在于自主代理（即俗称的“AI智能体”），而不是目前用于训练 ChatGPT 等聊天机器人的大型语言模型（LLM）。

11/25/2024 9:29:55 AM

清源

多样任务真实数据，大模型在线购物基准Shopping MMLU开源｜NeurIPS&KDD Cup 2024

谁是在线购物领域最强大模型？也有评测基准了。基于真实在线购物数据，电商巨头亚马逊终于“亮剑”——联合香港科技大学、圣母大学构建了一个大规模、多任务评测基准Shopping MMLU，用以评估大语言模型在在线购物领域的能力与潜力。

11/20/2024 12:17:59 PM

Nature:「人类亲吻难题」难倒 LLM，所有大模型全部失败

Nature 上的一项研究，全面驳斥了 LLM （大语言模型）具有类人推理能力的说法。研究者设定的「人类亲吻难题」把 7 个大模型彻底绕晕。最终研究者表示，与其说 LLM 是科学理论，不如说它们更接近工具，比如广义导数。

11/16/2024 6:21:58 PM

清源

谷歌Gemini咒骂学生凸显AI失控风险

随着AI技术的迅猛发展，大语言模型应用（例如谷歌的Gemini和OpenAI的ChatGPT）已逐渐融入日常生活，帮助人们完成作业、解答各种问题。然而，最近的一起事件再次引发了对AI模型潜在风险的广泛关注。 Gemini咒骂学生去死近日，一位Reddit学生用户分享了一段与Google聊天机器人Gemini的对话，令人不寒而栗。

11/15/2024 1:09:41 PM

佚名

SMoA: 基于稀疏混合架构的大语言模型协同优化框架

在大语言模型(LLM)快速发展的背景下，研究者们越来越关注如何通过多代理系统来增强模型性能。传统的多代理方法虽然避免了大规模再训练的需求，但仍面临着计算效率和思维多样性的挑战。本文提出的稀疏代理混合(Sparse Mixture-of-Agents, SMoA)框架，通过借鉴稀疏专家混合(Sparse Mixture-of-Experts, SMoE)的设计理念，有效解决了这些问题。

11/13/2024 2:37:30 PM

佚名

三款出色的无代码LLM应用程序构建神器

译者 | 布加迪审校 | 重楼通过轻松地挑选和丢弃组件并连接组件来构建LLM应用程序，比如矢量存储区、web搜索、存储内容和自定义提示等组件。许多商业人士和非技术人士向我询问如何在缺乏技术知识的情况下构建AI应用程序。我总是告诉他们，市面上有许多非代码解决方案，它们易于使用，可以帮助他们为公司中的任何人构建原型并部署解决方案。

11/8/2024 9:53:01 AM

布加迪

借助LLM实现模型选择和试验自动化

译者 | 布加迪审校 | 重楼大语言模型（LLM）已成为一种工具，从回答问题到生成任务列表，它们在许多方面简化了我们的工作。如今个人和企业已经使用LLM来帮助完成工作。代码生成和评估最近已经成为许多商业产品提供的重要功能，以帮助开发人员处理代码。

11/7/2024 8:03:10 AM

布加迪

AI Agent智能代理如何快速变现

AI Agent，即人工智能代理，是一种能够感知环境、进行自主理解、决策和执行动作的智能实体。它基于大语言模型，能够通过独立思考、调用工具来逐步完成给定目标的计算机程序。 AI Agent的核心在于其自主性和自适应性，在特定任务或领域中能够自主地进行学习和改进。

11/5/2024 4:47:27 PM

天涯咫尺TGH

近日，谷歌宣布其大语言模型（LLM）项目“Big Sleep”成功发现了一个SQLite数据库引擎中的内存安全漏洞，这是人工智能首次在真实软件中发现可利用的内存安全漏洞（且该漏洞无法通过传统的模糊测试检测到）。 AI首次发现内存安全漏洞谷歌的“Project Naptime”项目旨在评估LLM在进攻性安全研究方面的能力，后来该项目演变为“Big Sleep”，由谷歌Project Zero和DeepMind团队共同参与。 Big Sleep项目致力于探索AI在发现软件漏洞中的潜力，特别关注高危漏洞的检测与利用。

11/5/2024 2:48:57 PM

佚名

RAG新突破：块状注意力机制实现超低延迟检索增强

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：[email protected]；[email protected]

11/3/2024 1:31:00 PM

机器之心

北大对齐团队独家解读：OpenAI o1开启「后训练」时代强化学习新范式

9/15/2024 1:41:00 PM

机器之心

讲座预约 | AI4S 的前世今生：大语言模型与提示学习在科技研发中的应用与潜力丨GAIR Live

尽管人工智能驱动科学研究（AI4S）是最近几年才逐步火热的一个话题，但在某些科研领域如生物信息学，早在上个世纪90年代，随着人类基因组计划的实施，生物信息学迎来了一个“数据大爆炸”的时代，从那时起，生物信息学领域研究者就开始尝试使用人工智能技术来助力科研工作，直至今天。在过去几年中，大模型技术作为人工智能的一个重要分支，已经从理论研究的深奥殿堂走向了实践应用的广阔天地，从实验室的封闭空间走向了我们日常生活的各个角落。在生物信息学、材料科学、药物发现等领域，大模型技术正在发挥着越来越重要的作用。

9/12/2024 9:25:00 AM

岑大师

华为云发布医疗健康解决方案，盘古大模型赋能五大医药健康场景

8 月 10 日，华为云医药健康 AI 高峰论坛在海南博鳌拉开帷幕。华为云副总裁（战略与产业发展部总裁）黄瑾在会上表示，国家政策对生物医药持续加码，医药健康企业也纷纷增加科研创新投入，但与国际先进水平相比仍有差距，尤其是在创新药研发上。然而，国内人工智能的快速发展为医药健康提供了可以赶超的新契机。华为云副总裁（战略与产业发展部总裁）黄瑾“华为云拥有全栈自主的 AI 创新能力，我们希望和医药健康行业的客户一起努力，打造出中国自己的享誉国际的医药品牌，一起为人类健康谋福祉，推动中国医药健康产业发展。” 黄瑾表示。A

8/12/2024 3:37:00 PM

新闻助手

鸿蒙智行享界S9及全场景新品发布会，多款重磅新品齐发

不到 45 万的 D 级车，明天开始交付。

8/6/2024 7:34:00 PM

新闻助手

华为云用盘古大模型重塑服务，ModelArts Studio全面升级

6 月 21 日，华为开发者大会 2024 在东莞召开。在大会现场，华为发布了 HarmonyOS Next、盘古大模型 5.0 等方面的最新进展，也介绍了一系列 AI 先进技术的应用案例。在活动中，华为云 CTO 张宇昕表示：“华为云基于盘古大模型的能力，重塑一系列的云服务，打造 AI Native 的云，助力千行万业智能化。” 据介绍，华为云将盘古大模型和华为在产品研发、数据治理、安全防护、业务运维等各个领域积累的数据和经验相结合，“跳了自己的降落伞”，应用在了华为云 CodeArts、DataArts、Met

6/21/2024 7:57:00 PM

新闻助手

答案抽取正确率达96.88%，xFinder断了大模型「作弊」的小心思

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：[email protected]；[email protected]本文第一作者和通讯作者均来自上海算法创新研究院。其中，通讯作者李志宇博士毕业于中国人民大学计算机专业，并曾在阿里巴巴、小红书等互联网公司从事算法落地与研究工作，曾参与了包括千亿级商品知识图

6/17/2024 2:59:00 PM

机器之心

总结374篇相关工作，陶大程团队联合港大、UMD发布LLM知识蒸馏最新综述

大语言模型（Large Language Models, LLMs）在过去两年内迅速发展，涌现出一些现象级的模型和产品，如 GPT-4、Gemini、Claude 等，但大多数是闭源的。研究界目前能接触到的大部分开源 LLMs 与闭源 LLMs 存在较大差距，因此提升开源 LLMs 及其他小模型的能力以减小其与闭源大模型的差距成为了该领域的研究热点。LLM 的强大能力，特别是闭源 LLM，使得科研人员和工业界的从业者在训练自己的模型时都会利用到这些大模型的输出和知识。这一过程本质上是知识蒸馏（Knowledge,

3/18/2024 11:09:00 AM

机器之心

资讯热榜

上海AI实验室开源InternVL3系列多模态大型语言模型 Haisnap横空出世，小白用户也能轻松打造AI应用 OpenAI开源超Agent:Codex CLI,五小时内破 5000 颗星「交交」媲美GPT-4o！上海交大推出口语对话情感大模型，首个纯学术界自研！ kimi开源视觉语言模型 Kimi-VL 与 Kimi-VL-Thinking，多项基准超越 GPT-4o 本地部署DeepSeek+DiFy平台构建智能体应用 ChatGPT重磅更新：新增图像库功能，可查看自己用GPT生成的所有图片击败DeepSeek-R1！豆包新推理模型仅用前者参数量1/3！还将开源两个基准，瞄准通用推理能力！

标签云

人工智能 OpenAI AIGC AI ChatGPT DeepSeek AI绘画数据机器人谷歌模型大模型 Midjourney 智能用户学习开源 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达神经网络腾讯计算研究 Sora AI for Science 3D Anthropic AI设计机器学习 GPU 开发者场景华为预测伟达 Transformer 百度苹果深度学习 AI视频模态人形机器人 xAI 驾驶文本搜索字节跳动大语言模型 Claude Copilot 具身智能神器推荐 LLaMA 算力安全应用视频生成科技视觉亚马逊干货合集 2024 AGI 特斯拉训练 DeepMind

大语言模型

如何借助Cortex运行本地LLM

Salesforce 首席执行官：大语言模型可能已接近技术上限，AI 的未来是智能体

多样任务真实数据，大模型在线购物基准Shopping MMLU开源｜NeurIPS&KDD Cup 2024

Nature:「人类亲吻难题」难倒 LLM，所有大模型全部失败

谷歌Gemini咒骂学生凸显AI失控风险

SMoA: 基于稀疏混合架构的大语言模型协同优化框架

三款出色的无代码LLM应用程序构建神器

借助LLM实现模型选择和试验自动化

AI Agent智能代理如何快速变现

重大突破！AI首次发现内存安全漏洞

RAG新突破：块状注意力机制实现超低延迟检索增强

北大对齐团队独家解读：OpenAI o1开启「后训练」时代强化学习新范式

讲座预约 | AI4S 的前世今生：大语言模型与提示学习在科技研发中的应用与潜力丨GAIR Live

华为云发布医疗健康解决方案，盘古大模型赋能五大医药健康场景

鸿蒙智行享界S9及全场景新品发布会，多款重磅新品齐发

华为云用盘古大模型重塑服务，ModelArts Studio全面升级

答案抽取正确率达96.88%，xFinder断了大模型「作弊」的小心思

总结374篇相关工作，陶大程团队联合港大、UMD发布LLM知识蒸馏最新综述