资讯列表
央视《对话》直击百度吴甜谈大模型产业落地
2024年,关于大模型的讨论从未停歇,国内大模型市场进入到新阶段,大模型落地情况到底如何? AI 应用有哪些新场景、新变化? 近日,百度集团副总裁、深度学习技术及应用国家工程研究中心副主任吴甜做客CCTV-2《对话》节目,从技术发展及产业实践角度分享了当前以大模型为代表的人工智能技术发展及产业应用的最新进展。
迈向Z级计算:Cloud4Science范式加速科学发现进程
编辑 | X_X传统超级计算机作为科学计算的核心支柱,在推动技术进步方面发挥了不可替代的作用,但随着科学智能时代下需求的多样化和复杂化,其扩展性和能效的局限逐渐显现。 针对这一挑战,微软亚洲研究院的研究员提出了 Cloud4Science 的新范式,以云计算、人工智能和高性能计算技术的深度融合为核心,重新定义科学计算的架构,加速科学智能的研究进展。 在此框架下,研究员们已对关键科学计算算法如 Stencil、FFT、SpMV 等进行了优化,并成功开发了一系列创新算法,为科学家利用云计算及人工智能平台进行科学计算和研究开辟了新的途径。
支付宝“扫一扫”推出新一代 AI 视觉搜索产品“探一下”
支付宝今日推出新一代 AI 视觉搜索产品“探一下”,基于自研的多模态大模型技术,可“用 AI 之眼探索万物”,提供生成式搜索服务。
政务如何借助AI完成智能化升级?从架构到应用
政务大模型的背景源于数字化转型的深入推进和智能化治理的迫切需求。 随着大数据、人工智能等技术的快速发展,政府亟需通过技术手段提升治理效率和服务质量。 政务大模型作为AI技术在公共管理领域的创新应用,能够整合多源数据,优化决策流程,提供精准化、个性化的政务服务。
o1 pro深评博士医学论文,震惊顶尖免疫学家!2分破解神秘作家身份
圣诞马拉松的第一天,OpenAI对外发布了o1 pro。 近乎全网都震惊于o1 pro高达博士水平的数学、科学、编程能力。 最近,OpenAI总裁Greg Brockman在X上转发了世界顶尖免疫学专家Derya Unutmaz的帖子。
26 年前的古董 Windows 98 电脑成功运行大语言模型:搭载奔腾 II 处理器、128MB 内存
12 月 30 日消息,一个名为 EXO Labs . 的组织今日在社交媒体上发布了一段视频,展示了一台运行 Windows 98 系统的 26 年高龄的奔腾 II 电脑(128MB . 内存)成功运行大型语言模型(LLM)的情形。
低精度只适用于未充分训练的LLM?腾讯提出LLM量化的scaling laws
论文标题:Low-Bit Quantization Favors Undertrained LLMs: Scaling Laws for Quantized LLMs with 100T Training Tokens论文链接:(low-bit quantization)和低比特大语言模型(low-bit LLM)近期受到了广泛的关注,因为有一些研究发现,它们能够以更小的模型规模、更低的内存占用和更少的计算资源,取得与 fp16 或 bf16 精度相当的性能表现。 这一发现让低比特语言模型一度被认为是实现模型高效化的一个非常有前景的方向。 然而,这一观点受到了腾讯 AI Lab 的挑战。
机器人空间泛化也有Scaling Law!清华新国大新算法框架让机器人操作更加鲁棒
在机器人空间泛化领域,原来也有一套Scaling Law! 来自清华和新加坡国立大学的团队,发现了空间智能的泛化性规律。 在此基础上,他们提出了一套新颖的算法框架——ManiBox,让机器人能够在真实世界中应对多样化的物体位置和复杂的场景布置。
2024年优秀Web开发工具发展趋势总结
译者 | 陈峻审校 | 重楼在科技领域我们经常会看到,某一项技术的兴起和受到关注,往往会为其他相关领域的蓬勃发展创造广阔的空间和资源。 例如,在大量涌现的LLM(大语言模型)领域,入场的玩家和资本产生了蝴蝶效应,为其他技术稍逊、但小众必要的软件项目,提供了更多的发展可能性与应用空间。 它们虽然并不处在技术迭代的第一线,但是确实能让项目本身、以及用户从中受益。
一道题烧几千美元,OpenAI新模型o3:这34道题我真不会
前几天,OpenAI 已经完成了 12 连更的最后一更 —— 如外界所料,是新的推理系列模型 o3 和 o3-mini 。 从 o1 开始,OpenAI 所指出的推理 Scaling Law 似乎带来了全新的实现 AGI 的希望。 此次被用来验证 o3 推理能力的基准是 ARC-AGI,这项基准已经提出了 5 年时间,但一直未被攻克。
重大突破!美国西北大学利用现有互联网光缆实现量子隐形态传输:量子通信要变天
核心发现:通过识别低干扰波长并使用特殊滤波器,该团队成功地在一条30公里长的光缆上,与高速互联网信号同时传输了量子信息。 这项研究简化了量子网络基础设施,并为利用现有系统实现安全、长距离的量子连接奠定了基础。 西北大学的研究人员在光学领域世界顶尖期刊《Optica》上发表了一项研究,展示了量子通信可以在同一光缆中与传统的互联网信号共存。
谷歌会议音频流出!CEO劈柴:2025年事关重大,将迎来颠覆时刻!全力聚焦Gemini在C端增长!承认谷歌正面临全球范围审查
编辑 | 伊风出品 | 51CTO技术栈(微信号:blog51cto)谷歌刚刚举行的2025年战略会议,其音频流出! 明年对于谷歌意义非凡! 据CNBN表示,在12月18日的会议上,劈柴和其他谷歌高层身穿节日丑毛衣,热烈讨论即将到来的2025年,尤其是与AI相关的内容!
OpenAI研究员首次提出「AGI时间」进化论!o1数学已达「分钟级AGI」
随着AI不断刷新各项基准测试,关于AI的发展各方也态度不一。 早在本月5日,「泛化的未知未来」研讨会上,众多知名研究员就相关话题展开了一场针锋相对的辩论。 此次辩题是 「当今的LLM沿着既有路线持续发展是否就足以实现真正的AGI」。
DeepSeek V3“报错家门”:我是ChatGPT
要说这两天大模型圈的顶流话题,那绝对是非DeepSeek V3莫属了。 不过在网友们纷纷测试之际,有个bug也成了热议的焦点——只是少了一个问号,DeepSeek V3竟然称自己是ChatGPT。 甚至让它讲个笑话,生成的结果也是跟ChatGPT一样:加之DeepSeek V3这次爆火的一个亮点,就是训练只花了557.6万美元的成本。
AI掌控编码人类狂按Tab,软件工程自主时代来临!OpenAI董事长Taylor重磅长文
2024年额度几近用完。 这一年,你认为AI对软件工程师最大的影响是什么? 今年3月,世界首个AI程序员Devin一出世,全网惊呼一切完结了!
超越ControlNet++!腾讯优图提出动态条件选择新架构
超越ControlNet ,让文生图更可控的新框架来了! 腾讯优图、南洋理工、浙大等研究机构联合推出DynamicControl,直接将多模态大语言模型(MLLM)的推理能力集成到文本生成图像(T2I))任务中。 而且还提出了一种新颖、高效的多控制适配器,可以自适应地选择不同的条件,从而实现动态多控制对齐。
CMDB多模型探索,痛并快乐着!
基于对CMDB的使用,我们又有了新的理解,当然这都是伴随着收益和痛点而来的。 正所谓痛并快乐着,我们最终还是要量力而行。 图片多模型管理CMDB得益于其多模型管理能力,这使得它能够高效地处理各种技术资产。
基于指标+标签的经营分析 Agent 创新实践
数势科技研发的数据资产和数据分析相关产品,主要面向零售和金融企业,帮助其进行业务语义层资产构建,为企业提供基于大模型增强的数据分析 AI Agent、智能指标平台、智能标签平台及智能营销平台,从而助力企业提升数字化决策能力,推动企业数字化升级。 本文将分享如何基于大模型能力,叠加指标和标签平台能力,构建企业内智能数据分析产品。 一、企业经营分析的难点和挑战企业内部的数据分析涉及到诸多方面,包括:加工制作报表;基于数据发现异常因素,开发人员需要通过 SQL 或算法去做多维异常检测;进一步挖掘异常背后的原因,又需要因果推断或者归因洞察等算法;分析之后还需要撰写数据分析报告。