应用

谁将替代 Transformer?

Transformer 由于其处理局部和长程依赖关系的能力以及可并行化训练的特点,一经问世,逐步取代了过去的 RNN(循环神经网络)与 CNN(卷积神经网络),成为 NLP(自然语言处理)前沿研究的标准范式。 今天主流的 AI 模型和产品——OpenAI 的ChatGPT、谷歌的 Bard、Anthropic 的 Claude,Midjourney、Sora到国内智谱 AI 的 ChatGLM 大模型、百川智能的 Baichuan 大模型、Kimi chat 等等——都是基于Transformer 架构。 Transformer 已然代表了当今人工智能技术无可争议的黄金标准,其主导地位至今无人能撼动。

马斯克宣布 Grok 聊天机器人将在本周晚些时候向所有 X Premium 订阅用户开放

感谢埃隆・马斯克今日宣布,xAI 公司的 Grok 聊天机器人将在本周晚些时候向所有 X(原推特)Premium 订阅用户开放,而不仅限于 Premium 订阅用户使用。Grok 聊天机器人由 xAI 公司开发,去年 11 月起开始向 X Premium 订阅用户开放。IT之家此前报道,官方在本月早些时候宣布 3140 亿参数的 Grok-1 以 Apache 2.0 协议开源。随着 Grok 向全部 X Premium 用户开放,X Premium 用户将获得新的 Super Grok 模式。马斯克解释道,

利用固态硬盘降低 AI 微调训练显存需求,群联展示 aiDaptiv+ 平台

据外媒 Tom's Hardware 报道,群联在英伟达 GDC2024 上展示了同 Maingear 合作的 aiDaptiv 硬件平台,可降低中小型企业 AI 模型微调训练成本。群联表示中小型企业在模型微调训练方面面临各种困难:采用云服务不仅昂贵也存在数据隐私的不稳定性;而在本地运行又需要复杂的构建过程,电力需求也不能忽视。而群联 aiDaptiv 方案采用超耐用型 aiDAPTIVCache 固态硬盘,可扩展系统的可用内存容量,容纳更大模型,同时也方便易用。具体来说,aiDaptiv 包含的中间件软件库

AI 美女广告让人难辨真假,博主被迫录视频自证“真的是 AI”

难以置信!现在 AI 生成视频,已经进化到让人不相信这是 AI 生成的了。(这真的不是套娃)最近一段短视频广告在网上引起轰动。视频中的人极力推荐产品,说话语气以及手势十分富有感染力。结果博主一句无意感叹:「家人们,这是 AI 生成的,太疯狂了。」瞬间引起轩然大波,网友:wait. Is this AI????无奈之下,博主被迫录视频自证。逼真到难以置信各位看官来看看,你能相信这是 AI 生成的吗? 不管是口型、动作,同她所说的内容完美契合。有网友 cue 还 cue 到了抖音(doge)。网友的质疑主要集中在两个方

机构预估 OpenAI 部署文生视频模型 Sora 需要 72 万片英伟达 H100:价值 216 亿美元

市场调查机构 Factorial Funds 近日发布报告,认为 OpenAI 部署文本转视频模型 Sora,在峰值期需要 72 万片英伟达 H100 AI 加速卡。如果按照每片英伟达 H100 AI 加速卡 3 万美元成本计算,72 万片需要 216 亿美元(IT之家备注:当前约 1561.68 亿元人民币)。而这仅仅只是 H100 加速卡的成本,想要运行必然消耗大量的电力,每片 H100 功耗为 700W,72 万片就是 504000000W。Factorial Funds 预估训练 Sora 1 个月,需要使

手机大模型崛起:荣米 OV 的战场厮杀

作者丨郭思编辑丨陈彩娴数据显示,2023年全球智能手机出货量同比下滑3.2%,总数仅为11.7亿部。 手机市场的饱和,早已是行业共识。 尽管如此,智能手机作为主流的通讯和娱乐工具,业界人士表示,其地位在未来五年内不太可能被迅速替代。

抖音:已掌握部分黑产团伙不当使用 AI 生成虚拟人物用于犯罪的线索,将报警打击

去年,抖音发布《关于人工智能生成内容的平台规范暨行业倡议》,明确平台不鼓励利用 AI 生成虚拟人物进行低质创作,将严格处罚违规使用 AI 生成虚拟人物发布违背科学常识、弄虚作假、造谣传谣的内容。抖音安全中心今日发布公告,近期平台发现,站内仍有不当使用 AI 技术生成虚拟人物发布内容的账号,平台进行了严厉处置。其中典型行为包括:1、生成境外虚假人设,消费爱国心理、博取关注。用虚假外国人的形象,以想嫁给中国、想到中国生活、评价社会事件等言论博取眼球。2、生成俊男美女虚假形象,骗取互动,交友导流。直接称用户为“你”“娘”

来自科技进步一等奖的肯定:腾讯破解万亿参数大模型训练难题

中国电子学会 2023 科学技术奖授奖名单公布,这次,我们发现了一个熟悉的身影 —— 腾讯 Angel 机器学习平台。在大模型飞速发展的当下,科学技术奖授予机器学习平台类研究和应用项目,对于模型训练平台的价值和重要性给予了充分的肯定。科学技术奖授予机器学习平台类研究和应用项目,在大模型飞速发展的当下,对于模型训练平台的价值和重要性给予了充分的肯定。从深度学习的新一轮浪潮开始,各大公司都已经意识到机器学习平台对于打造人工智能技术的意义,谷歌、微软、英伟达都有自己的机器学习平台,为快速训练人工智能模型提供便捷支持。20

实名羡慕!这些人已经用上了Sora

Sora 第三方口碑出炉,或许带给艺术家们最大的好处是:让他们的想象力、创造力更少地受到技术层面的限制。自 OpenAI 推出 Sora 以来,一直是该团队的成员放出演示视频,何时向公众开放测试我们不得而知。Sora 的初体验到底如何?或许艺术家、创意家、导演等公众人物的试用点评值得大家参考。今早,OpenAI 首次展示了一些 Sora 生成的作品,这些作品是获得 Sora 访问权限的电影制作人、艺术家、广告公司和音乐家制作完成的。以下是艺术家作品的一些示例,以及他们对 Sora 如何融入其工作流程和业务的早期想法

再谈复现 Sora:被仰望与被遗忘的

2月16日,OpenAI 发布了视频生成领域的重磅模型 —— Sora。Sora 对 Scaling Law 的信仰及其突破性的技术创新,使它持续保持领先地位。同时,也再次证明了“大力出奇迹”依然适用于文生视频领域。Sora 披露的技术细节,远远不足以窥其全貌。同时 Sora 目前也未正式对外开放。源于此,针对 Sora 的思考和讨论从未停止过。                              OpenAI 发布的技术报告Sora 给整个 AI 领域带来的最大冲击,莫过于如何优化和校正现有的视频生成思路和

智能体DS-Agent基于案例推理,让GPT-4数据科学任务接近100%

基于案例的推理助力大模型智能体挑战自动化数据科学任务,吉大、上交和汪军团队发布专注于数据科学的智能体构建框架 DS-Agent。在大数据时代,数据科学覆盖了从数据中挖掘见解的全周期,包括数据收集、处理、建模、预测等关键环节。鉴于数据科学项目的复杂本质以及对人类专家知识的深度依赖,自动化在改变数据科学范式方面拥有极大的发展空间。随着生成式预训练语言模型的兴起,让大语言模型智能体处理复杂任务变得越来越重要。传统的数据处理和分析大多依赖专业的数据科学家,费时费力。如果能够让大语言模型智能体扮演数据科学家的角色,那么除了能

Stability AI开源3B代码生成模型:可补全,还能Debug

Stable Diffusion 3 还没全面开放,这家公司的代码生成模型先来了。本周一,Stability AI 开源了小体量预训练模型 Stable Code Instruct 3B。Stable Code Instruct 3B 是一个基于 Stable Code 3B 的指令调整编码语言模型(Code LM)。给出自然语言 prompt,该模型可以处理各种任务,例如代码生成、数学和其他软件工程相关的任务。Stability AI 宣称,该模型在 3B 规模上提供了 SOTA 性能,并且优于 CodeLlam

首发半固态电池:折叠屏旗舰vivo X Fold3系列发布

vivo X Fold 3的问世,或许标志着折叠屏的技术和体验完全走向成熟。

来自一线大咖的前沿观察与洞见,大模型技术 Workshop 第一期活动举行

为了更好地分享大模型技术最新进展,张江科投、张江孵化器、机器之心、WAIC Circle 联合发起举办了“大模型技术 Workshop”系列活动,邀请产学研一线大咖带来前沿观察与洞见。3月22日,大模型技术 Workshop 第一期成功举行。本次活动围绕“Claude 3热浪来袭,一起聊聊文本大模型的重点技术路径”展开,并得到了张江科学城商会的大力支持。张江孵化器总经理金红梅张江孵化器总经理金红梅介绍,作为张江集团向“卓越的创新策源和产业发展生态综合服务商”战略转型中聚焦创新策源的主要板块,张江科投坚持以产业促进为

Stable Code Instruct 3B AI 模型亮相:可精准翻译转换编程语言

Stability AI 公司近日面向程序员,推出 Stable Code Instruct 3B 大语言模型,其亮点在于可以从一种编程语言翻译转换成另一种编程语言。IT之家附上 Stable Code Instruct 3B 大语言模型的功能如下:该模型可以根据代码上下文情境自动生成代码。基于相关代码情境,自动插入、补全相关代码。Stable Code Instruct 3B 能够生成与数据库交互的代码。该模型可以将代码从一种编程语言翻译成另一种编程语言。该模型可以注释现有代码功能。根据用户指令,稳定代码指示器

第四波!2024年3月精选实用设计工具合集

大家好,这是 2024 年 3 月的第 4 波干货合集!这一期干货合集当中 AI 工具并不多,主要还是灵感素材和插件。除了两个优质的日本和韩国的灵感网站之外,还有一个推荐优质订阅服务的平台,以及倒计时弹出框的代码生成器,以及方便版本管理的 Figma 插件,此外,唯一涉及 AI 资源,是一个 AI 背景图的素材网站。 当然,在此之前记得看看往期干货中有没有你感兴趣的素材:下面我们具体看看这一期的干货: 1、高品质订阅服务推荐平台 ,现在很多 APP 和工具都是采用的订阅制,订阅制的 APP 和服务基本上都是按时间或

6000字干货!AI 时代如何让孩子更有竞争力?

最近人工智能火得不得了,特别是 ChatGPT、DALL-E、Sora 这些 AI 工具一出来,简直把大伙儿都惊呆了! 毫无疑问,AI 将为我们开启一个全新的时代。它能帮助我们快速获取信息、解决问题,激发我们的创造力和想象力。AI 还能代替我们处理许多繁琐、重复的任务,让我们能够专注于更具创造性和战略性的工作。这意味着,未来的职业形态和社会结构都将发生深刻的变革。 面对 AI 带来的机遇和挑战,家长们更关心孩子们的未来。在这个瞬息万变的时代,传统的应试教育显然已经不再适用。 我们必须重新思考,在 AI 时代,孩子应

AI 大模型升级:蓝心千询、vivo 办公套件开放下载,其他品牌手机同样可用

在今天的 vivo X Fold3 系列发布会上,vivo 官方宣布蓝心大模型迎来全新升级,整体数据量跨越式升级到「端侧 7B」 「云侧 70B」的超大组合,实现超 700 种手机相关功能。最重要的是,蓝心大模型应用现在全面开放下载,不是 vivo 手机也能用,包括蓝心千询 AI 助手、vivo 办公套件都可以自行下载使用。就目前已知的手机厂商推出的 AI 助手中,似乎只有蓝心千询支持独立下载,不限品牌开放。此外,vivo 还将与南开大学联合承办「中国高校计算机大赛-AIGC 创新赛」,蓝心大模型开源赋能全社会,推