AI
强化学习Scaling Law错了?无需蒸馏,数据量只要1/6,效果还更好
DeepSeek-R1带火了使用强化学习训练LLM。 在训练中,AI灵机一动,让作者耳目一新,甚至因此惊叹到:这就是强化学习的力与美! DeepSeek-R1-Zero惊艳了研究人员然而,对RL训练的理解存在空白:这些工作的训练数据的透明度有限,谁知道是方法好还是数据集质量好?
中国首个AI短剧模型开源,4090秒生好莱坞级大片!人人拍短剧时代来临
2月18日,昆仑万维开源中国首个面向AI短剧创作的视频生成模型SkyReels-V1、中国首个SOTA级别基于视频基座模型的表情动作可控算法SkyReels-A1。 开源地址(SkyReels-V1):(SkyReels-A1):::skyreels.ai针对当前全球AI视频生成模型和产品不开源、用不到、费用高、不好用等痛点,昆仑万维SkyReels一次性开源SkyReels-V1和SkyReels-A1两个SOTA级别的模型和算法,将面向AI短剧创作的技术成果回馈开源社区和AIGC用户。 而这只是在AI视频方向开源道路上的起点,未来将陆续开源更多面向AI短剧的优秀研究成果。
OpenAI突宣开源计划:端侧模型or小模型二选一!奥特曼在线征集投票全球最大开源视频模型,现在也Created in China了,阶跃出品
刚刚,阶跃星辰联合吉利汽车集团,开源了两款多模态大模型! 新模型共2款:全球范围内参数量最大的开源视频生成模型Step-Video-T2V行业内首款产品级开源语音交互大模型Step-Audio多模态卷王开始开源多模态模型,其中Step-Video-T2V采用的还是最为开放宽松的MIT开源协议,可任意编辑和商业应用。 (老规矩,GitHub、抱抱脸、魔搭直通车可见文末)在两款大模型的研发过程中,双方在算力算法、场景训练等领域优势互补,“显著增强了多模态大模型的性能表现”。
嚯!大语言扩散模型来了,何必只预测下一个token | 人大高瓴&蚂蚁
用扩散模型替代自回归,大模型的逆诅咒有解了!人大高瓴人工智能研究院、蚂蚁共同提出LLaDA(a Large Language Diffusion with mAsking)。 LLaDA-8B在上下文学习方面与LLaMA3-8B能力相当,而且在反转诗歌任务中超越GPT-4o。 在大语言模型领域,反转诗歌是一个特殊任务,它用来评估模型在处理语言模型的双向依赖关系和逻辑推理能力。
OpenAI 要开源新模型?CEO 奥尔特曼公开征求意见
OpenAI 首席执行官萨姆・奥尔特曼于当地时间 2 月 17 日在 X 社交平台上发文,就公司下一个开源项目的方向征询公众意见。他提出了两种可能的开源模型方向:一种是“相当小但仍需在 GPU 上运行的 o3-mini 级模型”,另一种则是“尽可能优化的手机大小模型”。这或许意味着 OpenAI 即将开源新的大模型,也将是 2019 年 OpenAI 开源 GPT-2 之后再次开源某个大模型。
OpenAI 联合创始人 Sutskever 的 AI 初创公司估值飙升至 300 亿美元,目标打造安全超级智能
据彭博社报道,知情人士透露,OpenAI 联合创始人伊利亚・苏斯科弗(Ilya Sutskever)正在以超过 300 亿美元(IT之家备注:当前约 2179.12 亿元人民币)的估值为其初创公司 Safe Superintelligence(以下简称 SSI)筹集超过 10 亿美元(当前约 72.64 亿元人民币)的资金,使 SSI 一举跻身全球最有价值的私人科技公司行列。
开源AI短剧神器来了,单卡即可部署!好莱坞效果人人可享,昆仑万维出品
开源AI短剧神器来了! 来自昆仑万维,一次性开源两大视频模型——国内首个面向AI短剧创作的视频生成模型SkyReels-V1;国内首个SOTA级别基于视频基座模型的表情动作可控算法SkyReels-A1。 当前全球AI视频生成模型和产品面临着不开源、用不到、费用高、不好用等痛点。
13 款帮助你提高工作效率的 AI 工具
Promptmetheus — 别再浪费时间微调提示了如果你曾经玩过 ChatGPT,你就会知道写出好的提示词是一门艺术。 有时候它会给你一个惊人的答案,有时候就像在跟一个智障的机器人聊天。 我使用 Promptheus 是因为它可以帮助我像代码一样组织我的提示。
DeepSeek引发开源生态新思考,欧洲AI巨头Mistral力挺开源
在AI技术快速发展的当下,开源与闭源的争论一直是行业焦点。 近期,DeepSeek的崛起引发了新的讨论,而被称为“欧洲OpenAI”的Mistral公司CEO亚瑟·曼什(Arthur Mensch)则明确表示,DeepSeek的开源模型为整个行业带来了重要机遇。 Mistral自2023年在法国巴黎成立以来,一直致力于推动开源生态的发展。
大模型 Prompt 技巧全解析
作者 | mitin在数字化浪潮的推动下,AI大模型以其卓越的自然语言处理能力和智能交互特性,迅速在很多领域中占据了重要地位。 比如:与传统客服相比,AI大模型展现出了无可比拟的优势,通过精心设计的 prompt,能使我们在客服托管、智能客服等多个项目和业务场景中发挥显著作用,大幅提高工作效率,优化成果质量。 为了精进个人能力以及助力产研学习氛围的提升,本人在学习完吴恩达教授以及其他前辈们有关 prompt 的课程之后,整理了这份学习资料,以供大家学习交流。
Ray 在微信 AI 计算中的大规模实践
一、背景微信现在已经成为人们日常生活中非常重要的组成部分,而随着人工智能的发展,微信内也为用户提供了多种涉及 AI 计算的服务体验。 例如,语音消息的文字转换、视频号的 AIGC 和推荐、扫一扫功能的图像识别等。 这些功能由于微信的用户规模巨大,所以 AI 计算的服务规模也非常大。
阿里提出文生卡通新方法Textoon:一分钟内生成丰富多彩、可交互的Live2D格式角色
阿里提出了一种基于文本描述生成多样化2D卡通角色的新方法Textoon, Textoon利用先进的语言和视觉模型,能够在短短一分钟内生成丰富多彩、可交互的Live2D格式角色。 这种方法不仅提高了生成效率,还降低了对计算资源的需求,使得2D卡通角色的创作更加便捷和高效。 Textoon:根据文本描述生成生动的 2D 卡通人物相关链接论文::: 卡通风格是数字角色创作中一种重要的艺术形式,尤其受到年轻观众的欢迎。
秘塔 AI 搜索上线“先想后搜”研究模式:采用“小模型 + 大模型”协同架构
秘塔科技宣布秘塔 AI 搜索上线新的研究模式 —— 先想后搜,可以让模型先提出思考框架与路径,再进一步进行资料的整合与分析。
刚刚,Ilya被曝正筹资超10亿美元、估值超300亿美元,知名创投Greenoaks牵头
一觉醒来,Ilya Sutskever 及其创业公司 Safe SuperIntelligence(SSI)又有了新消息! 而在几天前,这家公司刚被传出正以 200 亿美元估值洽谈融资。 据彭博社援引知情人士的消息,Ilya Sutskever 正在为其创业公司 SSI 筹集 超过 10 亿美元资金,估值将超过 300 亿美元。
老友记搬沙发难题终结,60年数学谜题破解!119页论文惊人证明:有最优解
臭名昭著的「搬沙发」难题,已经困扰了数学家们60年。 《老友记》经典的一幕,就是Ross找人帮忙搬新沙发时,无论如何也无法使沙发顺利通过拐角。 Ross大喊「Pivot!
AI教父Hinton怒批万斯,对AI无知恐葬送全人类!
在巴黎AI行动峰会上,美国副总统万斯高举「美国优先」的大旗,明确表示美国仍将维持在AI领域的主导地位,欧洲对AI的监管在扼杀创新! 会后,美国和英国拒绝签署关于确保AI「安全、可靠、可信」的峰会声明,拒绝相关国际承诺。 la Repubblica独家报道了诺奖得主、AI「教父」Hinton,对这种行为的猛烈抨击。
树莓派 Zero“硬核改造”:8 年老设备实现本地运行大语言模型
越南开发者 Binh Pham 最近尝试使用树莓派 Zero(Raspberry Pi Zero)进行了一项创新实验。他成功地将这款设备改造为一个小型 USB 驱动器,使其能够在本地运行 LLM,无需任何额外设备。
AI重构采购新生态:CIO如何驱动企业降本增效?
在数字化转型的浪潮中,采购不再是简单的“买买买”,而是企业战略版图中的关键一环。 当“时间就是金钱”已不足以形容采购流程的紧迫性,AI正以破局者的姿态,重塑采购行业的未来,它不仅让繁琐的常规任务自动化,更让决策变得智能高效,为企业创造长期价值的战略采购插上了翅膀。 对于身兼技术管理者与战略业务领导者双重角色的CIO而言,AI无疑是他们平衡长期战略与立即实施、突破采购痛点、引领企业迈向创新未来的最强盟友。