资讯列表

Mixtral 8x7B论文终于来了:架构细节、参数量首次曝光

Mixtral 8x7B 在大多数基准测试中都优于 Llama 2 70B 和 GPT-3.5。前段时间,那个爆火整个开源社区的 Mixtral 8x7B MoE 模型论文放出了。此前,由于 OpenAI 团队一直对 GPT-4 的参数量和训练细节守口如瓶。Mistral 8x7B 的放出,无疑给广大开发者提供了一种「非常接近 GPT-4」的开源选项。要知道,很早之前就有人爆料,OpenAI 也是采用了「混合专家模型」(Mixture of Experts,MoE)的构架来搭建 GPT-4。随着论文的放出,一些研究

挥舞起代码语料的魔杖,大模型和智能体将召唤出更强大的能量

正如瑞斯福兹魔杖缔造了诸如邓布利多在内的历代非凡魔法师的传奇,具有巨大潜能的传统大型语言模型,在经过代码语料的预训练 / 精调后,掌握了更超出本源的执行力。具体来说,进阶版的大模型在编写代码、更强推理、自主援引执行接口、自主完善等方面都获得了提升,这将为它作为 AI 智能体、执行下游任务时方方面面带来增益。近日,伊利诺伊大学厄巴纳 - 香槟分校(UIUC)的研究团队发布了一项重要综述。论文链接: (Code)如何赋予大型语言模型(LLMs)及其基于此的智能体(Intelligent Agents)强大的能力。其中,

比A100性价比更高!FlightLLM让大模型推理不再为性能和成本同时发愁

大语言模型在端侧的规模化应用对计算性能、能效比需求的“提拽式”牵引,在算法与芯片之间,撕开了一道充分的推理竞争场。面对想象中的终端场景,基于 GPU 和 FPGA 的推理方案的应用潜力需要被重新审视。近日,无问芯穹、清华大学和上海交通大学联合提出了一种面向 FPGA 的大模型轻量化部署流程,首次在单块 Xilinx U280 FPGA 上实现了 LLaMA2-7B 的高效推理。第一作者为清华大学电子系博士及无问芯穹硬件负责人曾书霖,通讯作者为上海交通大学副教授、无问芯穹联合创始人兼首席科学家戴国浩,清华大学电子工程

利用可解释AI,发现可扩展钙钛矿太阳能电池制造的工艺动力学

编辑 | 萝卜皮钙钛矿半导体薄膜的大面积加工非常复杂,并且会引起无法解释的质量差异,成为钙钛矿光伏发电商业化的主要障碍。可扩展制造工艺的进步目前仅限于渐进和任意的试错过程。虽然光致发光视频的原位采集有可能揭示薄膜形成过程中的重要变化,但数据的高维性很快就超出了人类分析的极限。德国癌症研究中心(German Cancer Research Center)交互式机器学习小组(Interactive Machine Learning Group)、亥姆霍兹成像小组(Helmholtz Imaging)以及德国卡尔斯鲁厄理

地球科学新视角:上交大团队推出300亿参数的地学学术型大模型GeoGalactica

编辑 | Z2022年10月30日,ChatGPT的横空出世,仅用几天的时间就改变了包括学术界在内的各行各业的,在OpenAI的成果的光辉下,有一个独特的模型,来自Meta团队的Galactica在ChatGPT三天前上线就被迫下线,这一度成为了LeCun教授的意难平。顺着LeCun的意难平,来自上海交通大学的团队,将这一颇具潜力的模型引入到了地球科学领域。使用Galactica作为基座的地学模型首先让我们回顾一下Galactica。Galactica最初在⼤量的科学⽂献上进⾏预训练,包括超过 4800 万篇论⽂、

钉钉×小冰:共同推出一键定制数字人,将在AI助理等领域全面合作

在1月9日举行的钉钉7.5产品发布会上,钉钉总裁叶军宣布,钉钉与小冰公司达成合作,共同推出一键定制数字人服务。钉钉已接入小冰数字人,用户可通过钉钉发放的邀请码免费参与数字人内测,在钉钉生成专属的数字人视频并发布于钉钉视频号。作为技术示例,由小冰框架生成的钉钉总裁叶军数字分身首次亮相,向大家展示了强大的多语言能力。未来,双方将持续探索在钉钉视频号、直播、视频会议、AI助理等领域的全面合作,推进数字人应用在钉钉全场景落地。小冰将充分发挥人工智能完备框架优势,助力钉钉进一步完善AI助理平台生态。此举旨在推动AI进入生产力

MoonValley!零基础也能快速学会的AI视频生成神器

本文为大家介绍一款视频生成 AI 工具 Moonvalley,只需简短的提示词,即可产生 16:9 的电影质感片段。 接下来让我们来试一试吧。 更多AI视频生成神器:一、使用体验 目前,Moonvalley 处于 Beta 阶段,完全免费,需要在 Discord 中使用。 1. 加入频道 在 Discord 中搜索 Moonvalley,点击顶部「join」会跳到 discord 的授权页面,按照流程往下走就行。

英伟达展示生成式AI驱动NPC,40SUPER系列显卡上线

引领 AI PC 的革新体验。

大模型应用助力大学生备考提效 夸克App上线“AI学习助手”

期末备考进行时,智能工具成为大学生提效的新“搭子”。日前,夸克App基于自研大模型的强大参数和数据精调能力,推出一款大模型全新应用“AI学习助手”,在部分搜索学习内容的结果页中,通过智能化的解题思路和讲解方式,进一步提升大学生在自学场景中的效率和质量。AI时代,学习不再是枯燥的刷题和找答案,尤其在大学阶段,通过互联网产品培养自主学习能力是提升自身竞争力的新方向。随着大模型应用逐渐落地以及用户需求不断变化,夸克App不仅能解决学习时面临的实际困难,还是每个人都能拥有的智能助手。夸克数据显示,过去一个月中,与大学学习相

FATE 2.0版本重磅发布:实现异构联邦学习系统互联互通

打破“计算孤岛”、联通“技术孤岛”,推动异构平台之间的互联互通,是隐私计算技术下一阶段的重要发展方向。国家数据局印发的《“数据要素×”三年行动计划(2024—2026年)》提出:“打造安全可信流通环境,深化隐私计算、联邦学习等技术应用,增强数据利用可信、可控、可计量能力,促进数据合规高效流通使用。”[1]中国信通院评论文章曾指出:“隐私计算有望成为支撑数据流通产业的基础设施,解决不同产品之间的技术壁垒,实现隐私计算跨平台间的互联互通已成为产业内的迫切需求。” [2]

对标GPTs但没有创建门槛,应用层的AI Agent玩家终于来了

从此在钉钉上,你只需要给出指令,其他事情交给「AI 助理」来办就可以了。2024 开年伊始,大厂便开始卷 AI Agent 了。 过去一年,人工智能行业的风向标不断发生变化,最开始备受关注的是如雨后春笋般涌现的大语言模型及 AIGC 应用,接着又出现很多基于大语言模型打造的 AI 辅助应用(如微软 Copilot)。如今 AI Agent 成为激烈角逐点,是 AIGC 下一阶段的关键。 去年 11 月, OpenAI 发布 AI Agent 初级形态产品 GPTs,让人看到智能体的应用前景。谷歌、亚马逊在该领域也有

个人计算迎变革:联想集团10余款AI PC亮相CES 2024

1月9日,在2024年科技界的首场盛事国际消费电子展(CES)上,联想集团携40多款基于人工智能的全新设备与解决方案亮相,涵盖Yoga™、ThinkBook™、ThinkPad™、ThinkCentre™和Legion™等众多产品系列,为消费者和企业用户带来前所未有的个人计算体验。其中,10余款AI PC成为CES 2024的焦点,进一步推动联想集团“AI for All,让人工智能惠及每一个人”的愿景走向现实。AI PC爆发元年,产品规模化落地2023年以大模型为代表的生成式人工智能的爆发引起了全球关注,随着其进

OpenAI大呼冤枉,称《纽约时报》说法片面,吴恩达也为其发声

OpenAI:《纽约时报》的诉讼毫无根据。2023 年年底,《纽约时报》拿出了强有力的证据起诉微软与 OpenAI。根据多家科技公司的首席法律顾问 Cecilia Ziniti 的分析,《纽约时报》获胜的概率极大。机器学习领域著名学者吴恩达针对这件事连发两条推文说明了自己的观点。在他的第一条推文中,表达对 OpenAI 和微软的同情。他怀疑很多重复的文章实际是通过类似于 RAG(检索增强生成)的机制产生的,而非仅仅依赖模型训练的权重。来源:,吴恩达的推测被也遭到了反驳。纽约大学教授 Gary Marcus 表示在视

奋战一年,LangChain首个稳定版本终于发布,LangGraph把智能体构建为图

著名的大模型智能体工具,现在有大版本更新了。不知不觉,LangChain 已经问世一年了。作为一个开源框架,LangChain 提供了构建基于大模型的 AI 应用所需的模块和工具,大大降低了 AI 应用开发的门槛,使得任何人都可以基于 GPT-4 等大模型构建自己的创意应用。在过去的一年中,LangChain 自身也一直在进化。刚刚,LangChain 官方宣布,他们的首个稳定版本 ——LangChain v0.1.0 问世了。新版本有以下几个重要特点:   可观察性:构建复杂的 LLM 应用是困难的。为了更好地进

百川智能发布角色大模型 ,零代码复刻角色轻松满足游戏领域定制需求

2024年1月9日,百川智能发布角色大模型Baichuan-NPC,深度优化了“角色知识”和“对话能力”,使模型能够更好的理解上下文对话语义,更加符合人物性格地进行对话和行动,让角色栩栩如生。此外,对于游戏领域AI角色开发成本高、周期长、自由度差、API不稳定等诸多不足, 百川智能推出了“角色创建平台 搜索增强知识库”的定制化解决方案。通过这一方案,游戏厂商无需编写任何代码,只需通过简单的文字描述,便可以快速构建出自己需要的角色,实现低成本、高效率的角色定制。今日起,用户登录,即可开启全新的角色创建之旅。中文领域最

首个无师自通、泛化使用各种家具家电的具身三维图文大模型系统

这几天,家务活都被机器人抢着干了。前脚来自斯坦福的会用锅的机器人刚刚登场,后脚又来了个会用咖啡机的机器人 Figure-01 。只需给它观看示范视频,加上10个小时的训练,Figure-01 就能学会使用咖啡机,放咖啡胶囊到按下启动键,一气呵成。但是想要让机器人无师自通,第一次见到各式各样的家具家电,就能在没有示范视频的情况下熟练使用。这是个难以解决的问题,不仅需要机器人拥有强大的视觉感知、决策规划能力,更需要精确的操纵技能。现在,一个三维具身图文大模型系统为以上难题提供了新思路。该系统将基于三维视觉的精准几何感知

英特尔发布第14代酷睿桌面处理器:24核、5.8GHz,更适合游戏玩家

英特尔全新酷睿第 14 代 HX 系列移动处理器旨在为创作者和移动爱好者提供最佳体验。在 CES 2024 期间,英特尔推出了最新的第 14 代酷睿 HX 系列移动处理器,为移动发烧友带来了卓越的性能体验。该系列将为大部分旗舰游戏笔记本电脑和一些以创作为中心的笔记本电脑提供动力。第 14 代酷睿 HX 系列由 5 个新 SKU 组成,是之前第 13 代酷睿 HX 系列的更新版本,类似于酷睿 i9-14900K 到酷睿 i9-13900K 等桌面处理器。在全新的英特尔酷睿 HX 系列处理器中, i9-14900HX

NVIDIA 与 Deepcell 合作,加速生成式 AI 在单细胞研究中的应用

编辑 | X1 月 8 日,AI 驱动的单细胞分析领域的先驱 Deepcell,宣布与 NVIDIA 达成一项研究合作,加速生命科学领域先进计算机视觉解决方案的开发和采用。Deepcell 已经使用 NVIDIA A4000 和 NVIDIA AI 技术,将把 NVIDIA AI 融入其单细胞分析技术中,与 NVIDIA 合作共同开发细胞生物学中生成 AI 和多模式应用的新用途。此次联合合作旨在增进对细胞形态的理解,并最终加速 AI 驱动的细胞分析在细胞生物学和转化研究中的广泛应用,包括癌症、干细胞和细胞治疗。多模