文心iRAG能力怎么样?王海峰详解背后技术
“文心一言的用户规模达到4.3亿。 ”11月12日,以“应用来了”为主题的百度世界2024在上海举办,百度首席技术官王海峰在会上宣布了这一数据。 除用户规模外,王海峰还解读了文心大模型最新技术及应用,如检索增强的文生图、无代码产品秒哒、文心快码等。- 968
- 0
智能科学时代的双引擎,火山引擎打造 AI 与 Science 协同创新的飞轮
2024 年,诺贝尔奖的物理学奖与化学奖双双授予了与人工智能技术紧密相关的研究,这无疑为 AI 在科研领域的推动作用提供了强有力的背书,进一步彰显了其不可或缺的重要性。 AI for Science 变得盛况空前。 科学家们积极探索人工智能在科研领域的广阔应用与发展前景,科学研究也从经验范式、理论范式、计算范式、数据驱动范式,迎来了第五范式——智能科学。- 968
- 0
李彦宏的野心:百度不造“超级应用” !百度亮出4款产品新形态:多智能体“秒哒”、多模态iRAG、AI眼镜,自由画布!奥运冠军站台
编辑 | 言征出品 | 51CTO技术栈(微信号:blog51cto)进入下半年,国内大模型厂商们都在忙什么? 11月12日上午9点35分,百度世界大会如约而至。 李彦宏身着白衬衫,信步走入在上海世博中心的主会场,用一个小时的时间为人们展示了大模型进入2024年之后,百度最新取得的一些产品技术进展。- 968
- 0
开源版SearchGPT来了,两张3090就可复现,超越Perplexity付费版
OpenAI推出SearchGPT没几天,开源版本也来了。 港中文MMLab、上海AI Lab、腾讯团队简易实现了Vision Search Assistant,模型设计简单,只要两张RTX3090就可复现。 Vision Search Assistant(VSA)以视觉语言模型(VLM)为基础,巧妙地将Web搜索能力融入其中,让VLM内部的知识得到实时更新,使其更加灵活和智能。- 969
- 0
为什么AI增强的威胁和法律不确定性成为风险主管最关心的问题
据Gartner称,2024年第三季度,企业面临的最大新兴风险是AI增强的恶意攻击。 关键的新兴风险这是连续第三个季度,这类攻击被列为首要新兴风险。 IT供应商的关键性以及动荡的监管和法律环境是新出现的首要企业新兴风险。- 968
- 0
最强开源CodeLLM模型深夜来袭!320亿参数,Qwen2.5-Coder新模型超越GPT-4o
一夜之间,AI编程模型的开源王座易主了! Qwen2.5-Coder-32B正式发布,霸气拿下多个主流基准测试SOTA,彻底登上全球最强开源编程模型宝座。 更重要的是,在代码能力的12个主流基准上,Qwen2.5-Coder-32B与GPT-4o对决,斩获9胜,一举掀翻闭源编程模型的绝对统治。- 968
- 0
Java真的能玩AI了?Spring AI轻松接入大模型,几行代码就搞定!
您还在为Java难以对接AI模型而发愁吗? 您是否羡慕Python开发者能轻松调用各种大模型? 您是否也想用熟悉的Java技术栈开发AI应用?- 970
- 0
深度揭秘CoT!普林斯顿耶鲁发布最新报告:大模型既有记忆推理、也有概率推理
「推理」是非常能展现「人类智能」的一项能力,需要结合现有证据和过去的经验,以逻辑和系统的方式思考某件事情,进而做出决策。 大型语言模型(LLMs)以其通用性,在多项任务上都取得了出色的性能,虽然思维链(CoT)提示已经证明了大模型具备多步推理能力,但这种能力到底来自于「抽象泛化」(abstract generalization)还是「浅层启发式」(shallow heuristics),仍然没有定…- 968
- 0
AlphaFold3重磅开源,诺奖级AI颠覆世界!GitHub斩获1.8k星,本地即可部署
AlphaFold3源码终于开放了! 六个月前,AlphaFold3横空出世震撼了整个学术界。 AlphaFold的开发人也凭借它在上个月赢得了诺贝尔化学奖。- 971
- 0
扩散模型失宠?端侧非自回归图像生成基础模型Meissonic登场,超越SDXL!
最近,YouTube和Reddit上出现了一个引起广泛讨论的图像生成模型,来自日本、韩国、美国、印度、中东和英国的网友们纷纷参与讨论。 图片Youtube热烈讨论那么,这到底是怎么回事呢? 让我们一起来看看吧。- 969
- 0
Ilya认错,Scaling Law崩了?自曝SSI秘密技术路线取代OpenAI
昨天,The Information爆料,传统的大模型Scaling Law已经撞墙,OpenAI下一代旗舰Orion遭遇瓶颈。 就在刚刚,路透社也发文表示,由于当前方法受到限制,OpenAI和其他公司正在寻求通向更智能AI的新途径。 有趣的是,昨天拱火的The Information,今天又急忙发出一篇文章来灭火。- 968
- 0
o1不是唯一路径!MIT新研究:在测试时训练,模型推理能力最高升至5.8倍
o1不是通向大模型推理的唯一路径! MIT的新研究发现,在测试时对大模型进行训练,可以让推理水平大幅提升。 在挑战超难的ARC任务时,准确率最高可提升至原来的5.83倍。- 968
- 0
李彦宏:不是要一个“超级应用”,是要打造数百万“超级有用”的应用
“过去24个月,AI行业的最大变化是什么? 是大模型基本消除了幻觉。 ”11月12日,百度创始人李彦宏在百度世界2024大会上,发表了主题为《应用来了》的演讲,发布两大赋能应用的AI技术:检索增强的文生图技术(iRAG)和无代码工具“秒哒”。- 968
- 0
即插即用ChatTracker:多模态大模型重塑目标跟踪
写在前面 & 笔者的个人理解视觉对象跟踪旨在基于初始边界框在视频序列中定位目标对象。 最近,视觉语言(VL)跟踪器已经提出利用额外的自然语言描述来增强各种应用中的通用性。 然而,VL跟踪器在跟踪性能方面仍然不如最先进的视觉跟踪器(SoTA)。- 969
- 0
通用场景拉满了!GenXD:生成任何3D&4D场景(新加坡国立&微软最新)
写在前面&笔者的个人理解近年来,利用扩散和自回归建模生成2D视觉内容已经取得了显著成功,并已在实际应用中进行广泛使用。 除了 2D 生成之外,3D 内容生成也至关重要,可应用于视频游戏、视觉效果和可穿戴混合现实设备。 然而,由于 3D 建模的复杂性和 3D 数据的局限性,3D 内容生成仍然远远不能令人满意,并且正在引起学术界和工业界越来越多的关注。- 968
- 0
如何简单理解视觉语言模型以及它们的架构、训练过程?
关于视觉语言模型(VLMs),以及它们的架构、训练过程和如何通过VLM改进图像搜索和文本处理的多模态神经网络。 可以参考这篇文章:(VLMs),它们是未来的复合AI系统。 文章详细描述了VLMs的基本原理、训练过程以及如何开发一个多模态神经网络,用于图像搜索。- 968
- 0
o1/Claude集体翻车!陶哲轩等60+顶尖数学家合力提出新数学基准,大模型正确率通通不足2%
让大模型集体吃瘪,数学题正确率通通不到2%! 获大神卡帕西力荐,大模型新数学基准来势汹汹——一出手,曾在国际数学奥赛中拿下83%解题率的o1模型就败下阵来,并且Claude 3.5 Sonnet、GPT-4o、Gemini 1.5 Pro等全都未攻破2%这一防线。 所以,新挑战者到底啥来头?- 968
- 0
克服机器学习转换器的局限性——从位置嵌入到RoPE和ALiBi方法
译者 | 朱先忠审校 | 重楼引言近年来开发出的机器学习模型的指数级进步与转换器架构的出现密切相关。 以前,人工智能科学家必须先为手头的每项任务选择架构,然后再进行超参数优化以获得最佳性能。 限制科学家们潜力的另一个挑战是难以处理数据的长期依赖性,难以解决梯度消失、长序列上下文丢失以及因局部约束而无法捕获全局上下文的问题。- 968
- 0
浙大开源“最懂Excel的GPT”!首次将结构化数据作为独立模态训练,刷榜提升40百分点
大模型理解复杂表格,能力再次飞升了! 不仅能在不规则表格中精准找到相关信息,还能直接进行计算。 比如提问:如果2022年出口总额的人民币计价比实际数值少了10%,请计算新的出口总额并与实际数据比较。- 968
- 0
大模型应用系列:从Ranking到Reranking
每个搜索引擎背后都隐藏着一个至关重要却往往被忽视的组成部分——Reranking(重新排名)。 那么,什么是Rerank呢? 简而言之,这一过程旨在优化并调整搜索结果的顺序,使之更加精准地匹配用户的查询需求。- 968
- 0
一文揭开 NVIDIA CUDA 神秘面纱
Hello folks,我是 Luga,今天我们继续来聊一下人工智能生态相关技术 - 用于加速构建 AI 核心算力的 GPU 编程框架 - CUDA 。 CUDA,作为现代图形处理器(GPU)的计算单元,在高性能计算领域扮演着日益重要的角色。 通过将复杂的计算任务分解为数千个线程并行执行,CUDA 显著提升了计算速度,为人工智能、科学计算、高性能计算等领域带来了革命性的变革。- 968
- 0
探讨营销技术的六个AI用例
随着营销越来越依赖数据,AI在营销技术(martech)行业中发挥着变革性作用。 从自动化日常任务到深入洞察客户行为,AI驱动的工具正在帮助营销人员在营销活动中实现更高的效率和精准度。 无论是优化广告支出、个性化客户体验还是增强预测分析,AI工具都在重塑企业与受众互动的方式。- 968
- 0
多模态大模型技术方向和应用场景
多模态大模型(Multimodal Large Language Models,MLLM)是一种结合了大型语言模型(LLM)和大型视觉模型(LVM)的深度学习模型,它们能够处理和理解多种类型的数据,如文本、图像和音频,从而在跨模态任务中展现出卓越的性能。 核心特点对于多模态输入-文本输出的典型 MLLM,其架构一般包括编码器、连接器以及 LLM。 如要支持更多模态的输出(如图片、音频、视频),一般…- 968
- 0
贝叶斯统计中常见先验分布选择方法总结
在贝叶斯统计中,选择合适的先验分布是一个关键步骤。 本文将详细介绍三种主要的先验分布选择方法:经验贝叶斯方法信息先验无信息/弱信息先验经验贝叶斯方法经验贝叶斯方法是一种最大似然估计(MLE)方法,通过最大化先验分布下数据的边际似然来估计先验分布的参数。 设X表示数据,θ表示参数,则经验贝叶斯估计可表示为:θ = argmax P(X|θ)信息先验信息先验是一种基于先前知识或以前研究结果,纳入了关于…- 968
- 0
理论
❯
个人中心
今日签到
搜索
扫码打开当前页
返回顶部
幸运之星正在降临...
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠劵
- ¥优惠劵使用时效:无法使用使用时效:
之前
使用时效:永久有效优惠劵ID:×
没有优惠劵可用!