大模型

0 Token 间间隔 100% GPU 利用率，百度百舸 AIAK 大模型推理引擎极限优化 TPS

什么是大模型推理引擎大模型推理引擎是生成式语言模型运转的发动机，是接受客户输入 prompt 和生成返回 response 的枢纽，也是拉起异构硬件，将物理电能转换为人类知识的变形金刚。大模型推理引擎的基本工作模式可以概括为，接收包括输入 prompt 和采样参数的并发请求，分词并且组装成 batch 输入给引擎，调度 GPU 执行前向推理，处理计算结果并转为词元返回给用户。和人类大脑处理语言的机制类似，大模型首先会把输入的 prompt 进行统一理解，形成具有记忆能力的上下文。

1/8/2025 8:55:32 AM

跨年舞台歌手翻车惨烈，AI唱作俱佳，意外圈粉

AI好好用报道编辑：Sia刚刚过去的跨年舞台，依旧延续了群魔乱舞的台风。假唱早已见怪不怪。假唱。

1/6/2025 6:08:00 PM

AI好好用

全网都在扒的DeepSeek团队，是清北应届生撑起一片天

DeepSeek-v3大模型横空出世，以1/11算力训练出超过Llama 3的开源模型，震撼了整个AI圈。紧接着，“雷军开千万年薪挖DeepSeek研究员罗福莉”的传闻，也使得人们把目光聚焦向DeepSeek的人才。这下不只科技圈，全网都在好奇，连小红书上都有人发帖询问，这究竟是一只怎样的团队？

1/6/2025 7:45:00 AM

OpenAI发布新年目标，Agent智能体或将迎来百模大战

2025年1月1日，OpenAI CEO 奥特曼公布了公司的新年目标，涵盖AGI、智能体、4o升级、模型更好记忆、更长上下文等等。图片关于智能体，有网友爆料，OpenAI 可能在 1 月份发布一个名为 “operator” 的 Agent，这个 Agent 将具备直接控制电脑的能力。图片其实24年10月份的时候，Claude 就已经发布了基于 Claude 3.5 Sonnet 多模态大模型，可操作电脑的智能体。

1/3/2025 11:02:38 AM

渡码

阿里云与零一万物达成战略合作，成立“产业大模型联合实验室” ，加速落地应用

近期，阿里云和大模型头部企业零一万物达成模型平台业务的战略合作，双方将成立“产业大模型联合实验室”，联手加速大模型从技术到应用的落地，进一步扩大产业大模型的生态整合。据悉，双方深度战略合作的产业大模型联合实验室包含技术、业务、人才等板块，阿里和零一万物将结合两个团队全球顶尖的大模型研发实力，形成从下一代基座模型技术探索到产业落地大模型服务的组合拳，全面通过阿里云百炼大模型平台的模型服务层面向市场，针对 ToB 行业打造更强更全面的大模型解决方案，加速大模型穿透千行百业。在开展的合作中，阿里云拥有从技术到算力到服务层的平台级完整链条，通义系列大模型将作为具有强大通用能力的“教师模型”，零一万物拥有国际前沿的高性价比模型能力，能够敏捷批量训练垂直定向的产业智能模型，双方联手将加速大模型的产业落地，拓宽大模型生态前景。

1/3/2025 10:32:00 AM

新闻助手

金融风控领域的大模型落地实践

Akulaku 作为一个海外互联网金融平台，运用大模型优化金融风控、客服及电商推荐等场景，通过集成图像（如 KYC 人脸识别）、文本（如智能客服）与设备数据，增强风控系统效能与用户体验。大模型的引入旨在提升效率，通过优化小模型构建与工作流程自动化，减轻业务人员负担。智能体在金融领域的应用包括欺诈调查与数据分析助手，预示着通过大模型辅助构建类 AGI 系统的可能性，能够进一步提升金融风控的效率与效果，在金融领域拥有广泛的应用前景。

1/3/2025 8:26:17 AM

黄泓

智象未来多模态大模型3.0全球首发，创始人兼CEO梅涛演讲实录来了

2024年12月28日，智象未来科技有限公司在安徽省人工智能产业先导区启动仪式中，宣布智象多模态生成大模型3.0与智象多模态理解大模型1.0同时发布。上海电影集团、中国移动咪咕音乐、科大讯飞等企业参加。加拿大工程院外籍院士、智象未来创始人兼CEO梅涛进行现场演讲。

1/2/2025 4:20:00 PM

新闻助手

2025 年考研数学一得 126 分，智谱深度推理模型 GLM-Zero 预览版上线

GLM-Zero-Preview 是 GLM 家族中专注于增强 AI 推理能力的模型，擅长处理数理逻辑、代码和需要深度推理的复杂问题。

12/31/2024 5:53:12 PM

沛霖（实习）

AI能力权威认证！用友大易入选最佳大模型产品及应用TOP20

近日，「AI中国」AI在线2024年度榜单正式揭晓，基于YonGPT用友企业服务大模型的AI招聘系统成功上榜「最佳大模型产品及应用TOP20」。用友大易依托于YonGPT的强大功能，探索并实现AI技术在招聘方面的深度应用和商业价值，助力企业实现招聘的提效增质。凭借其突出的创新性和实用性荣获「最佳大模型产品及应用TOP20」奖项。

12/31/2024 11:32:00 AM

新闻助手

G行人工智能与大模型技术的应用与发展

一、人工智能与大模型技术在银行业的普遍应用1. 客户服务和智能客服客户服务是人工智能应用的核心领域之一。传统银行客户服务依赖专业的人工客服，虽然能提供较高的情感交互，但因响应时间较长、服务覆盖面有限以及成本较高，难以满足现代客户对高效、便捷服务的需求。

12/31/2024 8:46:28 AM

王涛刘丁

大模型 DeepSeek：未授权任何人员参与机构投资者交流会，网传交流信息不实

据财联社报道，近期，一份关于 DeepSeek 发布历程、优化方向的专家会议纪要文件在业内流传。对此，DeepSeek 回应称，公司未授权任何人员参与券商投资者交流会，所谓“DeepSeek 专家”非公司人员，所交流信息不实。

12/30/2024 5:03:59 PM

浩渺

沙利文发布权威报告：商汤科技GenAI技术栈市场综合能力位居国内第一

创新实力强、应用落地广，GenAI（生成式AI）技术栈领域，商汤科技位居国内榜首！近日，权威研究机构弗若斯特沙利文（Frost & Sullivan, 简称“沙利文”）联合头豹研究院发布《2024年中国GenAI技术栈市场报告》，商汤科技在11个GenAI厂商中超越阿里云、百度智能云和华为云，增长指数和创新指数均排名国内第一，在全球排名中仅次于亚马逊云科技。报告认为，商汤积极投入技术创新，致力于为用户提供行业领先的自研模型与高性能国产化的推理引擎，同时建立了包含机器与人工审核、安全评测与内容安全策略迭代升级等在内的完整性安全管理方案，是GenAI技术栈领域的领导者。

12/30/2024 4:09:00 PM

新闻助手

央视《对话》直击百度吴甜谈大模型产业落地

2024年，关于大模型的讨论从未停歇，国内大模型市场进入到新阶段，大模型落地情况到底如何？ AI 应用有哪些新场景、新变化？近日，百度集团副总裁、深度学习技术及应用国家工程研究中心副主任吴甜做客CCTV-2《对话》节目，从技术发展及产业实践角度分享了当前以大模型为代表的人工智能技术发展及产业应用的最新进展。

12/30/2024 11:57:33 AM

基于指标+标签的经营分析 Agent 创新实践

数势科技研发的数据资产和数据分析相关产品，主要面向零售和金融企业，帮助其进行业务语义层资产构建，为企业提供基于大模型增强的数据分析 AI Agent、智能指标平台、智能标签平台及智能营销平台，从而助力企业提升数字化决策能力，推动企业数字化升级。本文将分享如何基于大模型能力，叠加指标和标签平台能力，构建企业内智能数据分析产品。一、企业经营分析的难点和挑战企业内部的数据分析涉及到诸多方面，包括：加工制作报表；基于数据发现异常因素，开发人员需要通过 SQL 或算法去做多维异常检测；进一步挖掘异常背后的原因，又需要因果推断或者归因洞察等算法；分析之后还需要撰写数据分析报告。

12/30/2024 8:45:09 AM

李飞