大模型
0 Token 间间隔 100% GPU 利用率,百度百舸 AIAK 大模型推理引擎极限优化 TPS
什么是大模型推理引擎大模型推理引擎是生成式语言模型运转的发动机,是接受客户输入 prompt 和生成返回 response 的枢纽,也是拉起异构硬件,将物理电能转换为人类知识的变形金刚。 大模型推理引擎的基本工作模式可以概括为,接收包括输入 prompt 和采样参数的并发请求,分词并且组装成 batch 输入给引擎,调度 GPU 执行前向推理,处理计算结果并转为词元返回给用户。 和人类大脑处理语言的机制类似,大模型首先会把输入的 prompt 进行统一理解,形成具有记忆能力的上下文。
1/8/2025 8:55:32 AM
LW
全网都在扒的DeepSeek团队,是清北应届生撑起一片天
DeepSeek-v3大模型横空出世,以1/11算力训练出超过Llama 3的开源模型,震撼了整个AI圈。 紧接着,“雷军开千万年薪挖DeepSeek研究员罗福莉”的传闻,也使得人们把目光聚焦向DeepSeek的人才。 这下不只科技圈,全网都在好奇,连小红书上都有人发帖询问,这究竟是一只怎样的团队?
1/6/2025 7:45:00 AM
OpenAI发布新年目标,Agent智能体或将迎来百模大战
2025年1月1日,OpenAI CEO 奥特曼公布了公司的新年目标,涵盖AGI、智能体、4o升级、模型更好记忆、更长上下文等等。 图片关于智能体,有网友爆料,OpenAI 可能在 1 月份发布一个名为 “operator” 的 Agent,这个 Agent 将具备直接控制电脑的能力。 图片其实24年10月份的时候,Claude 就已经发布了基于 Claude 3.5 Sonnet 多模态大模型,可操作电脑的智能体。
1/3/2025 11:02:38 AM
渡码
阿里云与零一万物达成战略合作,成立“产业大模型联合实验室” ,加速落地应用
近期,阿里云和大模型头部企业零一万物达成模型平台业务的战略合作,双方将成立“产业大模型联合实验室”,联手加速大模型从技术到应用的落地,进一步扩大产业大模型的生态整合。 据悉,双方深度战略合作的产业大模型联合实验室包含技术、业务、人才等板块,阿里和零一万物将结合两个团队全球顶尖的大模型研发实力,形成从下一代基座模型技术探索到产业落地大模型服务的组合拳,全面通过阿里云百炼大模型平台的模型服务层面向市场,针对 ToB 行业打造更强更全面的大模型解决方案,加速大模型穿透千行百业。 在开展的合作中,阿里云拥有从技术到算力到服务层的平台级完整链条, 通义系列大模型将作为具有强大通用能力的“教师模型”,零一万物拥有国际前沿的高性价比模型能力,能够敏捷批量训练垂直定向的产业智能模型,双方联手将加速大模型的产业落地,拓宽大模型生态前景。
1/3/2025 10:32:00 AM
新闻助手
金融风控领域的大模型落地实践
Akulaku 作为一个海外互联网金融平台,运用大模型优化金融风控、客服及电商推荐等场景,通过集成图像(如 KYC 人脸识别)、文本(如智能客服)与设备数据,增强风控系统效能与用户体验。 大模型的引入旨在提升效率,通过优化小模型构建与工作流程自动化,减轻业务人员负担。 智能体在金融领域的应用包括欺诈调查与数据分析助手,预示着通过大模型辅助构建类 AGI 系统的可能性,能够进一步提升金融风控的效率与效果,在金融领域拥有广泛的应用前景。
1/3/2025 8:26:17 AM
黄泓
智象未来多模态大模型3.0全球首发,创始人兼CEO梅涛演讲实录来了
2024年12月28日,智象未来科技有限公司在安徽省人工智能产业先导区启动仪式中,宣布智象多模态生成大模型3.0与智象多模态理解大模型1.0同时发布。 上海电影集团、中国移动咪咕音乐、科大讯飞等企业参加。 加拿大工程院外籍院士、智象未来创始人兼CEO梅涛进行现场演讲。
1/2/2025 4:20:00 PM
新闻助手
2025 年考研数学一得 126 分,智谱深度推理模型 GLM-Zero 预览版上线
GLM-Zero-Preview 是 GLM 家族中专注于增强 AI 推理能力的模型,擅长处理数理逻辑、代码和需要深度推理的复杂问题。
12/31/2024 5:53:12 PM
沛霖(实习)
AI能力权威认证!用友大易入选最佳大模型产品及应用TOP20
近日,「AI中国」AI在线2024年度榜单正式揭晓,基于YonGPT用友企业服务大模型的AI招聘系统成功上榜「最佳大模型产品及应用TOP20」。 用友大易依托于YonGPT的强大功能,探索并实现AI技术在招聘方面的深度应用和商业价值,助力企业实现招聘的提效增质。 凭借其突出的创新性和实用性荣获「最佳大模型产品及应用TOP20」奖项。
12/31/2024 11:32:00 AM
新闻助手
G行人工智能与大模型技术的应用与发展
一、人工智能与大模型技术在银行业的普遍应用1. 客户服务和智能客服客户服务是人工智能应用的核心领域之一。 传统银行客户服务依赖专业的人工客服,虽然能提供较高的情感交互,但因响应时间较长、服务覆盖面有限以及成本较高,难以满足现代客户对高效、便捷服务的需求。
12/31/2024 8:46:28 AM
王涛 刘丁
大模型 DeepSeek:未授权任何人员参与机构投资者交流会,网传交流信息不实
据财联社报道,近期,一份关于 DeepSeek 发布历程、优化方向的专家会议纪要文件在业内流传。对此,DeepSeek 回应称,公司未授权任何人员参与券商投资者交流会,所谓“DeepSeek 专家”非公司人员,所交流信息不实。
12/30/2024 5:03:59 PM
浩渺
沙利文发布权威报告:商汤科技GenAI技术栈市场综合能力位居国内第一
创新实力强、应用落地广,GenAI(生成式AI)技术栈领域,商汤科技位居国内榜首! 近日,权威研究机构弗若斯特沙利文(Frost & Sullivan, 简称“沙利文”)联合头豹研究院发布《2024年中国GenAI技术栈市场报告》,商汤科技在11个GenAI厂商中超越阿里云、百度智能云和华为云,增长指数和创新指数均排名国内第一,在全球排名中仅次于亚马逊云科技。 报告认为,商汤积极投入技术创新,致力于为用户提供行业领先的自研模型与高性能国产化的推理引擎,同时建立了包含机器与人工审核、安全评测与内容安全策略迭代升级等在内的完整性安全管理方案,是GenAI技术栈领域的领导者。
12/30/2024 4:09:00 PM
新闻助手
央视《对话》直击百度吴甜谈大模型产业落地
2024年,关于大模型的讨论从未停歇,国内大模型市场进入到新阶段,大模型落地情况到底如何? AI 应用有哪些新场景、新变化? 近日,百度集团副总裁、深度学习技术及应用国家工程研究中心副主任吴甜做客CCTV-2《对话》节目,从技术发展及产业实践角度分享了当前以大模型为代表的人工智能技术发展及产业应用的最新进展。
12/30/2024 11:57:33 AM
基于指标+标签的经营分析 Agent 创新实践
数势科技研发的数据资产和数据分析相关产品,主要面向零售和金融企业,帮助其进行业务语义层资产构建,为企业提供基于大模型增强的数据分析 AI Agent、智能指标平台、智能标签平台及智能营销平台,从而助力企业提升数字化决策能力,推动企业数字化升级。 本文将分享如何基于大模型能力,叠加指标和标签平台能力,构建企业内智能数据分析产品。 一、企业经营分析的难点和挑战企业内部的数据分析涉及到诸多方面,包括:加工制作报表;基于数据发现异常因素,开发人员需要通过 SQL 或算法去做多维异常检测;进一步挖掘异常背后的原因,又需要因果推断或者归因洞察等算法;分析之后还需要撰写数据分析报告。
12/30/2024 8:45:09 AM
李飞
中科院海洋所发布高分辨率海洋大模型“琅琊”1.0 ,可提升全球海洋预报准确性
“琅琊”由中国科学院海洋研究所自主研发,是面向海洋状态变量预报研发的新一代人工智能大模型。
12/28/2024 3:38:40 PM
清源
火山引擎视觉大模型4K修复百部港片,面部肤质纹理等细节更清晰
12月26日-29日,“经典香港电影修复计划” 专题展在京举办。 该修复计划由中国电影资料馆、抖音、火山引擎发起,历经一年多时间,完成100部港片的4K修复工作。 其中10部是“人工 AI”精修,90部主要由AI修复,这些修复后的作品已上线抖音、抖音精选,搜索片名即可观看。
12/27/2024 9:27:00 PM
新闻助手
中国MoE一夜爆火!大模型新王暴打GPT-4o,训练成本仅600万美元
一夜之间,来自中国的大模型刷屏全网。 DeepSeek-V3,一个拥有671B参数的MoE模型,吞吐量每秒高达60 token,比上一代V2直接飙升3倍。 在多项基准测试中,V3性能直接与Claude 3.5 Sonnet、GPT-4o相匹敌。
12/27/2024 10:27:58 AM
新智元
集中接入:将大模型统一管理起来,你觉得怎么样?
为什么要集中接入? 集中接入,就是把大模型的接入统一到一个地方管理起来,下面这张图可以很好地帮我们理解集中接入:图片从这个图上,你已经看出来了,所谓的集中接入,其实就是构建了一个代理,我们后面就称它为大模型代理。 到这里,你可能产生这样的疑问:我直接用大模型不好吗?
12/27/2024 8:27:27 AM
greencoatman
资讯热榜
企业级模型推理部署工具vllm使用指南 - 部署最新deepseek-v3-0324模型
上海AI实验室开源InternVL3系列多模态大型语言模型
50组多风格提示词,全面测评Midjourney V7生图效果!
全日程揭晓!ICLR 2025论文分享会我们北京见
斯坦福2025 AI指数出炉!中美AI对决差距仅剩0.3%,DeepSeek领衔
5分钟直出46页论文!谷歌Deep Research完爆OpenAI,最强Gemini 2.5加持
击败DeepSeek-R1!豆包新推理模型仅用前者参数量1/3!还将开源两个基准,瞄准通用推理能力!
ChatGPT重大更新,能翻出所有历史对话,网友被AI聊破防了
标签云
人工智能
OpenAI
AIGC
AI
ChatGPT
DeepSeek
AI绘画
数据
机器人
谷歌
模型
大模型
Midjourney
智能
用户
学习
开源
GPT
微软
Meta
AI创作
图像
技术
论文
Stable Diffusion
马斯克
Gemini
算法
蛋白质
生成式
芯片
代码
英伟达
神经网络
腾讯
计算
研究
Sora
AI for Science
3D
AI设计
Anthropic
机器学习
GPU
开发者
场景
华为
预测
伟达
Transformer
百度
深度学习
苹果
模态
AI视频
驾驶
文本
xAI
搜索
人形机器人
大语言模型
Copilot
神器推荐
LLaMA
字节跳动
具身智能
Claude
算力
安全
应用
视频生成
科技
视觉
亚马逊
干货合集
2024
AGI
特斯拉
DeepMind
训练