大模型

百度关于大模型在研发领域落地的深度思考
一、智能研发工具的发展首先来看一下智能研发工具的发展历程和方向。智能化的发展背景与落地诉求早期的智能化工具，如 GitHub 的 Copilot 工具，大约在两年半前推出。最初，Copilot 的主要功能是在开发者编写代码时提供自动补全建议。
理论
- 973
- 0
张立理4小时前
AI大模型时代，人才的需求已经变了
什么是 AI 发展的第一驱动力？最近，全球科技大厂都在用行动告诉我们：人才。本月初，谷歌 NotebookLM 的核心团队共同宣布离职创业，他们新公司的网站已经进入了「建设中」的状态。
应用
- 974
- 0
机器之心16小时前
全球首个全模态理解开源端模型：长语音自动总结，图文音啥都会！300%推理速度领先，来自无问芯穹
全球首个端侧全模态理解开源模型来了！在菜单里帮忙选奶茶，不在话下：还能帮忙轻松提炼长语音，再也不用对着一串几十秒语音头皮发麻（doge）。就在刚刚，无问芯穹宣布开源目前世界上首个端侧全模态理解的开源模型Megrez-3B-Omni，不仅体积轻巧，速度飞快，更是一个多才多艺的全能选手，能够轻松处理图片、音频、文本三种模态数据。
理论
- 972
- 0
admin12月16日
细节表现超Sora，网友：真正的国产之光！MiniMax视频模型再上新
3 个月前，MiniMax 发布了首款 AI 高清视频生成模型 Abab-video-1。只用了 5 周时间，海螺 AI 的网页版访问量便增速超 800%，还登上了 AI 产品榜当月全球增速榜、国内增速榜双榜单 TOP 1。一时间，不少国内网友直呼其为“国产之光”。
应用
- 1000
- 0
郑佳美12月16日
王小川当场自曝：为什么百川不做Sora；生命科学是下一个互联网；大模型创业有两大误区；AGI5年后就会到来；如何从投资人拿到融资
编辑｜言征出品 | 51CTO技术栈（微信号：blog51cto）王小川不止搞大模型，这次真的要在医疗行业搞出大动静来了！ 12月14日上午，百川智能王小川在与极客公园创始人张鹏进行了一场圆桌对话。对话中，王小川公开透露了进入下半年来，有些低调的百川究竟在做什么事情，更是抖出了很多有关百川智能成立前后的趣事，比如百川的“百”是怎么得来的，以及如何跑步入场赢得投资人信任、拿到融资的，并详细阐述…
理论
- 973
- 0
言征12月16日
专治大模型“套壳”！上海AI实验室等给LLM做“指纹识别”，剪枝合并也无所遁形
大模型“套壳”事件防不胜防，有没有方法可以检测套壳行为呢？来自上海AI实验室、中科院、人大和上交大的学者们，提出了一种大模型的“指纹识别”方法——REEF（Representation Encoding Fingerprints）。在不改变模型性能的前提下，利用REEF就可以精准识别未经授权的后续开发行为。
理论
- 972
- 0
admin12月16日
腾讯微信正式发布多模态大模型 POINTS 1.5
据官方介绍，这一代 POINTS 模型，不仅兼顾了 POINTS1.0 中所坚持的效率优先的思想，同时极大了增强了模型的性能。
应用
- 975
- 0
问舟12月14日
阶跃星辰推出国内首个千亿参数端到端语音大模型“ Step-1o”
Step-1o 支持语音、文本等混合形式的输入和输出，可以快速反应并随时打断，它也能深度理解和模仿音色、韵律、方言、个性化的口语表达习惯等声音特征。
应用
- 972
- 0
浩渺12月14日
在大模型时代，智能化推荐怎么做呢？
自2022年11月30日OpenAI发布ChatGPT以来，大模型技术掀起了新一轮人工智能浪潮。 ChatGPT在各个领域（如人机对话、文本摘要、内容生成、问题解答、识图、数学计算、代码编写等）取得了比之前算法好得多的成绩，很多方面都超越了人类专家的水平，特别是人机对话具备了一定的共情能力，这让AI领域的工作者和普通大众都相信AGI（Artificial General Intelligence，…
理论
- 971
- 0
刘强12月13日
容联云举办数智金融应用论坛，探索AI能力落地金融“营销服”
12月12日，容联云举办“步进·新金融”2024数智金融应用论坛。大会聚焦运营、营销、服务等金融业务应用场景，共同探讨金融行业数智化转型的最佳实践和大模型应用创新成果。现场嘉宾通过真实的案例与数据呈现金融行业数智化转型带来的实际成效，与生态伙伴共同推动数智金融的高质量发展。
应用
- 973
- 0
新闻助手12月12日
GPT-4o再暴露「弱智」缺陷，大模型无一幸免！港中文等发布「视觉听觉」基准AV-Odyssey：26个任务直指死角问题
在人工智能领域，我们一直以为顶尖的多模态大模型已经无所不能，GPT-4o在ASR（音频转文字）任务上已经达到了97%的正确率，更是凸显了强大的音频理解能力。然而，最近一项来自香港中文大学、斯坦福大学、伯克利大学和耶鲁大学的研究成果却彻底颠覆了这一认知——GPT-4o、Gemini 1.5 Pro、Reka Core等最先进的多模态大模型居然无法正确分辨明显不同的声音大小！下面是一个例子：结果让…
理论
- 974
- 0
新智元12月11日
面壁智能获新一轮数亿元融资，高效端侧智能持续引领行业发展
近日，面壁智能完成新一轮数亿元融资，本轮融资由龙芯创投、鼎晖百孚、中关村科学城基金和赛富基金联合领投，北京市人工智能产业投资基金与清科创投跟投，万甲资本担任本轮独家财务顾问。本轮融资完成后，面壁智能将进一步提速以端侧AI为代表的高效大模型商业化布局，以同等参数、更高性能、更低能耗、更快速度的高效大模型深度服务行业，为用户创造具体可感知的价值。面壁智能是以「高效为第一性原理」的大模型公司。
应用
- 972
- 0
新闻助手12月11日
Scaling Law不是唯一视角！清华刘知远团队提出大模型“密度定律”：模型能力密度100天翻番
Scaling Law并非描述大模型能力的唯一视角！清华NLP实验室刘知远教授团队，最新提出大模型的密度定律（densing law），表达形式让人想到芯片领域的摩尔定律：模型能力密度随时间呈指数级增长，2023年以来能力密度约每3.3个月（约100天）翻一倍。根据密度定律，研究团队还得出以下重要推论——AI时代的三大核心引擎——电力、算力与智力，都同样遵循密度快速增长趋势。
理论
- 976
- 0
admin12月10日
大模型界「摩尔定律」Densing Law 来了！盲目Scaling将过时！清华刘知远团队发现：大模型能力密度约100天翻倍！
整理 | 伊风出品 | 51CTO技术栈（微信号：blog51cto）Scaling Law会失效吗？虽然 OpenAI CEO 奥特曼掷地有声地说“这里没有墙”。但是，OpenAI的最近的发布也没有那么炸了，尤其是 o1 Pro 比满血版在编程能力上仅高出一分，似乎更让人相信了“墙”的存在。
理论
- 977
- 0
伊风12月9日
浅析面向场景的大模型应用框架选择
从demo到产品之间存在着鸿沟，大模型应用也是如此。在工程实践的时候，产品/服务提供的功能与性能及成本之间存在着大量的权衡，面向场景来选择大模型的应用框架，则是一种具体的权衡方法。例如，什么时候使用Agent？
理论
- 974
- 0
曹洪伟12月9日
白话告诉你大模型到底是怎么工作的
图片本文转载自微信公众号「程序反思录」，作者程序反思录。转载本文请联系程序反思录公众号。前言2022年底“大模型”在国内突然遍地开花，不管你身处什么行业，都或多或少听说或使用过大模型相关的工具，也听说过大模型训练是一件超级烧钱的事情。
理论
- 974
- 0
程序反思录12月9日
o1被曝“心机深”：逃避监督还会撒谎，骗人能力一骑绝尘
o1满血版刚发布，就被曝：骗人技能也拉满了。具体行为包括但不限于，在回答中故意引入微小错误、试图关闭监督机制……甚至在人类追问其是否诚实时，还会继续撒谎说自己啥坏事也没干。这项最新研究，来自AI安全研究机构Apollo Research。
理论
- 974
- 0
admin12月9日
枫清科技高雪峰：从数据到知识，跨越生成式AI与决策智能间的鸿沟
12 月 5 日，“2024 中国生成式 AI 大会”在上海开幕，全球 AI 领域的顶尖专家、行业领袖与技术创新者汇聚一堂。会上，枫清科技（Fabarta）创始人兼 CEO 高雪峰深入探讨了人工智能在企业智能化转型中的关键作用。高雪峰指出，随着 AI 技术的不断进步，企业转型已经进入一个全新阶段。
应用
- 973
- 0
晓楠12月6日
游戏bug帮大模型学物理！准确率超GPT4o近四个百分点
融合物理知识的大型视频语言模型PhysVLM，开源了！它不仅在 PhysGame 基准上展现出最先进的性能，还在通用视频理解基准上（Video-MME, VCG）表现出领先的性能。在这项研究之前，想让AI像人类儿童一样，通过观察世界理解基本的物理常识，是一个主要挑战。
理论
- 978
- 0
admin12月6日
1-bit大模型还能再突破！新一代BitNet架构启用4位激活值
量化到1 bit的LLM还能再突破？这次，他们对激活值下手了！近日，BitNet系列的原班人马推出了新一代架构：BitNet a4.8，为1 bit大模型启用了4位激活值：图片论文地址：，激活值量化通常是比较难办的。
理论
- 972
- 0
新智元12月6日
最真实大模型编程评估！字节开源FullStack Bench，首次全覆盖超11类现实编程场景
代码大模型越来越卷，评估AI编程水平的“考卷”也被迫升级。 12月5日，字节豆包大模型团队开源最新代码大模型评估基准FullStack Bench，在业界首次囊括编程全栈技术中超11类真实场景，覆盖16种编程语言，包含3374个问题，相比此前基准，可以更有效地评估大模型在现实世界中的代码开发能力。代码评估基准是衡量大模型编程能力的标准工具，也是推动模型优化的关键驱动力。
应用
- 980
- 0
新闻助手12月5日
企业智能体：为AI投资带来丰厚回报
基于AI的智能体当下可谓风头正劲。最近几个月来，这个话题也已渗透到不少技术供应商的宣传和营销当中，包括Salesforce、Microsoft、ServiceNow、SAP、亚马逊云科技以及谷歌。从多方面来讲，人们对AI智能体的关注有其道理：智能体代表着生成式AI的下一个发展阶段，有望进一步提高AI的自主性水平。
理论
- 972
- 0
admin12月5日
英伟达提出全新 Star Attention：10 倍加速大语言模型推理，登顶 Hugging Face 论文榜
大模型如今已具有越来越长的上下文，而与之相伴的是推理成本的上升。英伟达最新提出的 Star Attention，能够在不损失精度的同时，显著减少推理计算量，从而助力边缘计算。
应用
- 982
- 0
清源12月5日
AWS宣布新应用市场Amazon Bedrock上线100多个AI模型
AWS正在通过Amazon Bedrock服务向AI应用开发人员提供更多的大型语言模型，同时增强该平台的优化推理工作负载和为他们提供所需数据的能力。 AWS在年度盛会AWS re:Invent上发布的最新公告中包括了推出新的Amazon Bedrock Marketplace，这个主要门户将让开发人员可以访问100多个最强大的大型语言模型，其中包括一些只能在那里找到的大型语言模型。 Amazon …
理论
- 973
- 0
admin12月5日