理论
马斯克20万块GPU炼出Grok-3,暴击DeepSeek R1数学屠榜!疯狂复仇OpenAI
人类史上首个在20万块GPU上训出的模型终于问世! 刚刚,马斯克带队三位xAI成员在线开启直播,官宣Grok-3全家桶——Grok-3(Beta)、Grok-3 mini首个推理模型Grok-3 Reasoning(Beta)、Grok-3 mini Reasoning:击败o3-mini/DeepSeek-R1,解锁推理时计算首个AI智能体「DeepSearch」:联网深入搜索一股OpenAI发布会的味道扑面而来据介绍,三代Grok的训练计算量竟是Grok-2的10倍,那么实际表现又如何? 世界最大超算集群Colossus已有20万块GPU:10万块GPU同步训练(第一阶段用时122天搭建);20万GPU(第二阶段用时92天)在多项基准测试中,Grok-3在数学(AIME 2024)、科学问答(GPQA)、编码(LCB)上刷新SOTA,大幅超越DeepSeek-V3、Gemini-2 Pro、GPT-4o。
2/18/2025 2:59:16 PM
新智元
中国首个AI短剧模型开源,4090秒生好莱坞级大片!人人拍短剧时代来临
2月18日,昆仑万维开源中国首个面向AI短剧创作的视频生成模型SkyReels-V1、中国首个SOTA级别基于视频基座模型的表情动作可控算法SkyReels-A1。 开源地址(SkyReels-V1):(SkyReels-A1):::skyreels.ai针对当前全球AI视频生成模型和产品不开源、用不到、费用高、不好用等痛点,昆仑万维SkyReels一次性开源SkyReels-V1和SkyReels-A1两个SOTA级别的模型和算法,将面向AI短剧创作的技术成果回馈开源社区和AIGC用户。 而这只是在AI视频方向开源道路上的起点,未来将陆续开源更多面向AI短剧的优秀研究成果。
2/18/2025 1:52:02 PM
全球AI大佬如何看待DeepSeek?美日欧心态大不同,有人高兴有人愁
在全球人工智能的舞台上,DeepSeek的崛起如同一颗耀眼的新星,引发了美日欧等科技巨头和专家的高度关注。 这些来自不同地域的AI大佬们,对DeepSeek的技术实力和行业影响力做出了截然不同的评价,非常耐人寻味。 美国:从惊讶到警惕,再到“如坐针毡”美国方面,DeepSeek的出现打破了长期以来由OpenAI和谷歌主导的AI格局。
2/18/2025 1:44:53 PM
舒云
OpenAI突宣开源计划:端侧模型or小模型二选一!奥特曼在线征集投票全球最大开源视频模型,现在也Created in China了,阶跃出品
刚刚,阶跃星辰联合吉利汽车集团,开源了两款多模态大模型! 新模型共2款:全球范围内参数量最大的开源视频生成模型Step-Video-T2V行业内首款产品级开源语音交互大模型Step-Audio多模态卷王开始开源多模态模型,其中Step-Video-T2V采用的还是最为开放宽松的MIT开源协议,可任意编辑和商业应用。 (老规矩,GitHub、抱抱脸、魔搭直通车可见文末)在两款大模型的研发过程中,双方在算力算法、场景训练等领域优势互补,“显著增强了多模态大模型的性能表现”。
2/18/2025 1:30:00 PM
量子位
嚯!大语言扩散模型来了,何必只预测下一个token | 人大高瓴&蚂蚁
用扩散模型替代自回归,大模型的逆诅咒有解了!人大高瓴人工智能研究院、蚂蚁共同提出LLaDA(a Large Language Diffusion with mAsking)。 LLaDA-8B在上下文学习方面与LLaMA3-8B能力相当,而且在反转诗歌任务中超越GPT-4o。 在大语言模型领域,反转诗歌是一个特殊任务,它用来评估模型在处理语言模型的双向依赖关系和逻辑推理能力。
2/18/2025 1:00:00 PM
量子位
OpenAI突宣开源计划:端侧模型or小模型二选一!奥特曼在线征集投票
就在刚刚,奥特曼发了个推特,轻描淡写透露了个大消息:For our next open source project……读到第一句,咱就眼前一亮,OpenAI居然又要有开源项目了? ! 仔细读完整条推文,居然是真的。
2/18/2025 12:02:45 PM
2025年前,商业领袖必须规避GenAI的五大陷阱
在科技浪潮的推动下,一项新的研究揭示了一个震撼的事实:67%的商业领袖坚信,GenAI将在未来两年内为他们的企业带来翻天覆地的变革,然而,在这场技术革命的狂欢中,潜在的陷阱也如影随形,一旦失足,后果可能不堪设想——从名誉扫地到巨额罚款,乃至最致命的客户信任流失。 那么,如何在这场变革中稳健前行,避免踏入雷区?以下,我将为您剖析企业和商业领袖在接下来几年里可能遭遇的五大常见误区,并为您规划出一条避坑之路。 人工监督的缺失:GenAI是把双刃剑GenAI的强大与变革力无可置疑,但其不完美之处同样不容忽视。
2/18/2025 11:36:54 AM
Bernard Marr
DeepSeek时代:经验已死,提问为王
随着人工智能技术的飞速发展,DeepSeek 等先进 AI 系统的出现,正在彻底改变我们的工作方式和学习模式。 过去依赖的经验和做事思路,在 AI 时代可能已经不再适用。 面对这一变革,我们必须重新审视自己的能力体系,学会问正确的问题,并快速适应新的工作方式。
2/18/2025 11:15:12 AM
数据人创作者联盟
开源AI短剧神器来了,单卡即可部署!好莱坞效果人人可享,昆仑万维出品
开源AI短剧神器来了! 来自昆仑万维,一次性开源两大视频模型——国内首个面向AI短剧创作的视频生成模型SkyReels-V1;国内首个SOTA级别基于视频基座模型的表情动作可控算法SkyReels-A1。 当前全球AI视频生成模型和产品面临着不开源、用不到、费用高、不好用等痛点。
2/18/2025 11:09:27 AM
量子位
韩国下架DeepSeek的安全反思
据韩联社2月17日报道,韩国个人信息保护委员会(PIPC)于本周一宣布,即日起暂停中国人工智能初创企业深度求索(DeepSeek)旗下聊天机器人应用在韩国应用商店的新用户下载服务,以审查其是否符合韩国《个人信息保护法》。 已安装用户仍可正常使用,但被建议避免输入敏感个人信息。 DeepSeek承认“欠考虑”根据PIPC公告,此次限制措施自2月15日下午6时生效,主要针对苹果AppStore和谷歌Play商店的韩国本地版本。
2/18/2025 11:08:41 AM
佚名
从DeepSeek看昇腾AI:智能时代的科技探索与合作
从春节前夕R1版本发布至今,热度居高不下。 作为新兴的大型语言模型,DeepSeek正以其独特的技术优势引领着行业的变革,并且引领大模型从技术摸高走向“技术摸高 工程创新”并行 ,算力结构从“预训练” 走向 “预训练 后训练 推理”,算力需求持续增长。 而昇腾AI,自DeepSeek模型发布即原生支持昇腾,不仅为DeepSeek提供了坚实的算力底座,更在技术创新、生态构建等方面展现出强大的竞争力。
2/18/2025 11:02:49 AM
张诚
直接通过 Node 部署,把任意网站变为 API 接口?firecrawl有点牛了!
最近看到了一个爬虫类框架:firecrawl 号称 可以抓取任何网站并将其转换为干净的 markdown 或结构化数据。 并且可以直接通过 Node 进行部署。 看这样的描述有点厉害了,所以,咱们今天就来看看这个 firecrawl01:什么是 firecrawlFirecrawl 是一种 API 服务,它获取 URL、对其进行抓取并将其转换为干净的 markdown 或结构化数据。
2/18/2025 11:02:01 AM
程序员Sunda
13 款帮助你提高工作效率的 AI 工具
Promptmetheus — 别再浪费时间微调提示了如果你曾经玩过 ChatGPT,你就会知道写出好的提示词是一门艺术。 有时候它会给你一个惊人的答案,有时候就像在跟一个智障的机器人聊天。 我使用 Promptheus 是因为它可以帮助我像代码一样组织我的提示。
2/18/2025 10:56:18 AM
佚名
DeepSeek引发开源生态新思考,欧洲AI巨头Mistral力挺开源
在AI技术快速发展的当下,开源与闭源的争论一直是行业焦点。 近期,DeepSeek的崛起引发了新的讨论,而被称为“欧洲OpenAI”的Mistral公司CEO亚瑟·曼什(Arthur Mensch)则明确表示,DeepSeek的开源模型为整个行业带来了重要机遇。 Mistral自2023年在法国巴黎成立以来,一直致力于推动开源生态的发展。
2/18/2025 10:34:36 AM
小菲
大模型 Prompt 技巧全解析
作者 | mitin在数字化浪潮的推动下,AI大模型以其卓越的自然语言处理能力和智能交互特性,迅速在很多领域中占据了重要地位。 比如:与传统客服相比,AI大模型展现出了无可比拟的优势,通过精心设计的 prompt,能使我们在客服托管、智能客服等多个项目和业务场景中发挥显著作用,大幅提高工作效率,优化成果质量。 为了精进个人能力以及助力产研学习氛围的提升,本人在学习完吴恩达教授以及其他前辈们有关 prompt 的课程之后,整理了这份学习资料,以供大家学习交流。
2/18/2025 10:25:10 AM
腾讯技术工程
Ray 在微信 AI 计算中的大规模实践
一、背景微信现在已经成为人们日常生活中非常重要的组成部分,而随着人工智能的发展,微信内也为用户提供了多种涉及 AI 计算的服务体验。 例如,语音消息的文字转换、视频号的 AIGC 和推荐、扫一扫功能的图像识别等。 这些功能由于微信的用户规模巨大,所以 AI 计算的服务规模也非常大。
2/18/2025 9:48:58 AM
陈国敏、苏文豪
阿里提出文生卡通新方法Textoon:一分钟内生成丰富多彩、可交互的Live2D格式角色
阿里提出了一种基于文本描述生成多样化2D卡通角色的新方法Textoon, Textoon利用先进的语言和视觉模型,能够在短短一分钟内生成丰富多彩、可交互的Live2D格式角色。 这种方法不仅提高了生成效率,还降低了对计算资源的需求,使得2D卡通角色的创作更加便捷和高效。 Textoon:根据文本描述生成生动的 2D 卡通人物相关链接论文::: 卡通风格是数字角色创作中一种重要的艺术形式,尤其受到年轻观众的欢迎。
2/18/2025 9:40:00 AM
AIGC Studio
突发!台积电博通欲「瓜分」英特尔,昔日芯片霸主或将陨落?
据WSJ报道,英特尔目前正面临来自博通和台积电的「肢解」。 博通意在英特尔的芯片设计业务,台积电则对英特尔的工厂感兴趣。 英特尔分家,为股东负责据相关人士透露,全球最大的芯片设计公司博通一直在密切关注英特尔的芯片设计和营销业务。
2/18/2025 9:30:00 AM
新智元
资讯热榜
标签云
人工智能
OpenAI
AIGC
AI
ChatGPT
DeepSeek
AI绘画
数据
机器人
谷歌
模型
大模型
Midjourney
智能
用户
学习
开源
GPT
微软
Meta
AI创作
图像
技术
论文
Stable Diffusion
马斯克
Gemini
算法
蛋白质
生成式
芯片
代码
英伟达
腾讯
神经网络
计算
研究
Sora
AI for Science
3D
Anthropic
AI设计
机器学习
GPU
开发者
场景
华为
预测
伟达
Transformer
百度
人形机器人
苹果
深度学习
AI视频
模态
字节跳动
xAI
驾驶
文本
搜索
大语言模型
Claude
Copilot
具身智能
神器推荐
LLaMA
算力
安全
应用
视频生成
科技
视觉
亚马逊
干货合集
2024
AGI
特斯拉
大型语言模型
训练