资讯列表
用大模型云锦天章问世 彩云科技开创DCFormer架构全新篇章
2017年,谷歌发布《Attention Is All You Need》论文,首次提出Transformer架构,掀开了人工智能自然语言处理(NLP)领域发展的全新篇章。 Transformer架构作为神经网络学习中最重要的架构,成为后来席卷全球的一系列通用大模型如ChatGPT、Gemini的底层技术支撑。 而提升Transformer的运行效率也成为人工智能领域的研究热点,2024年4月,谷歌最近一次更新了Transformer架构,提出了Mixture-of-Depths(MoD)方法,使得训练后采样过程中提速50%,成为Transformer架构提速升级的又一重要事件。
11/14/2024 9:33:10 AM
Red Hat 收购 Neural Magic 并开源其技术:优化通用设备 AI 性能,可媲美专用芯片
Red Hat 于 11 月 12 日发布公告,宣布收购初创企业 Neural Magic,但并未披露本次交易细节。
11/14/2024 9:15:26 AM
故渊
关于战略人工智能的深度综述
译者 | 朱先忠审校 | 重楼本文将全面探索战略性人工智能的概念、发展及相关博弈论理论,并对战略人工智能的未来发展方向提出建议。 开场白1997年5月11日,纽约市。 这是纽约市一个美丽的春日,天空晴朗,气温攀升至20摄氏度。
11/14/2024 8:22:34 AM
朱先忠
如何使用Kubernetes合理调整GPU和CPU资源以训练和推理AI模型
译者 | 李睿审校 | 重楼如今,人工智能服务的迅速崛起创造了对计算资源的巨大需求,而如何有效管理这些资源成为一项关键挑战。 虽然使用Kubernetes运行人工智能工作负载已经取得了长足的进步,但基于动态需求优化调度仍然是一个亟待改进的领域。 在全球范围内,许多组织面临与GPU集群的成本和可用性相关的限制,并且通常依赖于这些计算集群来进行推理工作负载和持续的模型训练和微调。
11/14/2024 8:00:00 AM
李睿
AI 开始“卷”智能体:OpenAI 被曝明年将推 Operator,可控制电脑、独立执行任务
科技媒体 The Verge 今天(11 月 14 日)发布博文,报道称 OpenAI 公司计划于 2025 年 1 月,以研究预览和开发工具的形式,推出名为“Operator”的自动化 AI 智能体,可以独立控制计算机并执行各种任务。
11/14/2024 7:35:17 AM
故渊
人工智能的下一个前沿:多模态系统将重塑我们的世界
人工智能的世界正在以惊人的速度发展。 多模态人工智能处在这场革命的前沿,这项技术将重新定义我们人类与机器的交互方式。 多模态人工智能不仅仅是另一个热词,多模态人工智能是一个正在改变各个行业并有望重塑数字格局的范式转变。
11/14/2024 6:00:00 AM
至顶网
AI 配色新思路!用色卡直接控制 Midjourney 的图像生成色调
大家好我是花生~. 前段时间我高强度使用了不少 AI 绘画工具,包括 Midjourney、Ideogram、Recraft 等,发现在新出的 2 款工具中,都有 Color Palette 调色板功能,帮用户的准确控制图像色调。 其中 Ideogram 的颜色控制效果非常好,可以准确将调色板的颜色应用到图像中,生成氛围各异的多种图像;Recraft 调色板则在插画类图像上表现较好。
11/14/2024 1:00:21 AM
夏花生
终于把 Seq2Seq 算法搞懂了!!
Seq2Seq(Sequence-to-Sequence)模型是一种用于处理序列数据的神经网络架构,广泛应用于自然语言处理(NLP)任务,如机器翻译、文本生成、对话系统等。 它通过编码器-解码器架构将输入序列(如一个句子)映射到输出序列(另一个句子或序列)。 图片模型结构Seq2Seq 模型由两个主要部分组成。
11/14/2024 12:16:46 AM
程序员小寒
腾讯:大模型 App 元宝不会嵌入商业搜索结果,目前专注于尽可能增加对用户的吸引力
腾讯元宝是依托于腾讯混元大模型的 AI 产品,发布于今年 5 月,提供了 AI 搜索、AI 总结、AI 写作等功能。
11/13/2024 11:11:15 PM
沛霖(实习)
DeepL 推出首个语音翻译解决方案 DeepL Voice,号称消除虚拟会议中语言障碍
DeepL Voice 现已面向全球企业推出,推出时支持以下口语语言:英语、德语、日语、韩语、瑞典语、荷兰语、法语、土耳其语、波兰语、葡萄牙语、俄语、西班牙语和意大利语。
11/13/2024 10:28:58 PM
沛霖(实习)
消息称 OpenAI、谷歌等巨头 AI 模型遇瓶颈:训练数据难寻,成本高昂
据彭博社报道,包括 OpenAI、谷歌和 Anthropic 在内的人工智能巨头公司在开发更先进的 AI 模型方面遇到了瓶颈,面临着“收益递减”的困境。
11/13/2024 10:16:44 PM
远洋
对话|应用来了,百度云的企业级大模型应用如何在产业落地?
放眼全球,企业对大模型的需求日益增加,这不仅因为其强大的数据处理和分析能力,更因为其在实际应用中的出色表现。 大模型通过预训练大量数据,提升了模型对内容的理解力和生成力,面向行业,无论是在市场营销、办公提效,还是客户服务等方面,如何将更好的将大模型进行业务场景化落地,始终是企业关心的核心问题。 百度作为全球领先的技术公司,率先推出了文心大模型等系列大规模预训练模型,这些模型通过整合海量数据和知识,成为多个应用场景的技术基础。
11/13/2024 5:48:00 PM
成妍菁
业内首次,彩云科技发布基于DCFormer架构通用大模型云锦天章
2017年,谷歌发布《Attention Is All You Need》论文,首次提出Transformer架构,掀开了人工智能自然语言处理(NLP)领域发展的全新篇章。 Transformer架构作为神经网络学习中最重要的架构,成为后来席卷全球的一系列通用大模型如ChatGPT、Gemini的底层技术支撑。 而提升Transformer的运行效率也成为人工智能领域的研究热点,2024年4月,谷歌最近一次更新了Transformer架构,提出了Mixture-of-Depths(MoD)方法,使得训练后采样过程中提速50%,成为Transformer架构提速升级的又一重要事件。
11/13/2024 5:36:00 PM
新闻助手
百度沈抖:AI应用在B端率先爆发
11月12日,以“应用来了"为主题的百度世界2024在上海召开。 会上,百度集团执行副总裁、百度智能云事业群总裁沈抖分享了百度智能云在大模型产业落地方面的最新进展,并在企业级AI原生应用开发、大模型开发调优等方面发布一系列全新功能。 目前,百度智能云拥有中国最大的大模型产业落地规模。
11/13/2024 5:29:53 PM
全球首个:英伟达与软银试运行“AI+5G” 电信网络,号称投资 1 美元收入 5 美元
英伟达透露,软银正利用 NVIDIA AI Aerial 加速计算平台,成功试点了全球首个 AI 和 5G 相结合的电信网络,并表示“这是计算领域的一项突破,为电信运营商带来了潜在价值数十亿美元的 AI 收入流”。
11/13/2024 5:06:37 PM
汪淼
AI解锁500多年的圣殿,米开朗基罗杰作,你我触手可及
AI好好用报道编辑:Sia有了AI ,咱就更能理解什么是:条条大路通罗马。 活久见!就连世界六分之一人口的信仰中心、「文化瑰宝」——梵蒂冈也开始 AI 了 ! 要知道,教皇弗朗西斯一直呼吁警惕人工智能风险,本人也被 AI 恶搞过。
11/13/2024 4:06:00 PM
AI好好用
AI将重塑职场:中层管理崛起,初级职位缩减
据凯捷的一项调查显示,随着AI在职场中可能取代初级职位,中层管理人员将占据劳动力的更大比例,并承担更多专业化职能。 凯捷的一项新调查显示,随着GenAI在企业中的应用,谁做什么工作以及组织的结构将不可避免地发生变化,特别是在领导和管理层面,该调查有来自15个国家500家组织的1500名管理人员参与。 大多数(51%)受访者认为,由于GenAI的使用,决策职位将变得更加专业化,这意味着领导者也需要成为数据分析、AI战略、伦理评估和风险管理等领域的专家。
11/13/2024 3:42:00 PM
Karin Lindström
零一万物与华为启动合作,将基于昇腾硬件底座开发原生大模型应用
零一万物将基于昇腾硬件底座、昇腾异构计算架构(CANN)、昇思MindSpore AI框架以及MindIE 推理引擎,开展面向金融、政务、制造、能源、交通、运营商等行业的原生大模型应用开发。
11/13/2024 3:41:37 PM
清源