资讯列表

国产文生视频大模型 Vidu 将迎更新:支持生成 32 秒内容、音视频合成

感谢据“钛媒体 AGI”周四报道,生数科技、清华大学联合发布的国内首个长时长、高一致性、高动态性的视频大模型 Vidu 将于近期完成三大更新,实现“重大技术迭代”。主要更新内容如下:支持一键生成 32s 视频支持音视频合成,“视频有声音了”(Text-2-Audio)支持 4D 生成,可以从单一视频生成时空一致的 4D 内容IT之家附部分视频预览: 据介绍,Vidu 是自 Sora 发布之后,全球率先取得重大突破的视频大模型,并且仍在加速迭代提升中。据IT之家此前报道,Vidu 模型融合 Diffusion

Ilya参与,OpenAI给GPT-4搞可解释,提取了1600万个特征,还能看它怎么想

大模型也可解释了?大模型都在想什么?OpenAI 找到了一种办法,能给 GPT-4 做「扫描」,告诉你 AI 的思路,而且还把这种方法开源了。大语言模型(LLM)是当前 AI 领域最热门的探索方向,吸引了大量的关注和研究投入。它们强大的语言理解能力和生成能力在各种应用场景中都表现出巨大潜力。虽然我们见证了大模型迭代后性能上的显著提升,但我们目前对模型中的神经活动仍然只是一知半解。本周四,OpenAI 分享了一种查找大量「特征」的全新方法 —— 或许这会成为可解释的一种可用方向。OpenAI 表示,新方法比此前的一些

阿里Qwen2正式开源,性能全方位包围Llama-3

Qwen 系列会是众多大学实验室新的默认基础模型吗?斯坦福团队套壳清华大模型的事件不断发酵后,中国模型在世界上开始得到了更多关注。不少人发现,原来中国已经有不少成熟的大模型正在赶超国外。HuggingFace 平台和社区负责人 Omar Sanseviero 曾表示,AI 社区一直在「忽视」中国机器学习生态系统的工作,他们正在用有趣的大语言模型、视觉大模型、音频和扩散模型做一些令人惊奇的事情,如 Qwen、Yi、DeepSeek、Yuan、WizardLM、ChatGLM、CogVLM、Baichuan、Inter

ACL 2024 | 让纯LLM实现类人的符号逻辑推理能力,开源框架SymbCoT来了

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected][email protected]徐俊东,本文第一作者。本科毕业于伦敦大学学院(UCL),硕士就读于新加坡国立大学(NUS)计算机系。主要研究方向为大语言模型的推理能力。个人主页:(LLMs)实现严谨可信的推理,新国立提出

3年16亿营收!云天励飞迎来业绩增长

今日,云天励飞发布公告,公司与德元方惠签署《AI算力运营合作框架协议》。德元方恵将向云天励飞购买AI训练及推理异构算力服务,总算力规模约4000PFLOPS,该协议预计在未来三年服务期内为云天励飞贡献约16亿的营收。奠定未来的业绩基础作为国内领先的人工智能公司,云天励飞一直积极建设算力基座,并且对外提供算力运营服务。今年3月,云天励飞在发布会上公布了“1 3”业务布局,即基于1个算法芯片化平台,打造三大方向业务—AI方案、AI运营、AI产品。本次与德元方惠签署战略合作协议,是公司AI运营业务的一大突破,并在未来3年

10家国产大模型、GPT-4o共同挑战新鲜高考作文,还自我打分,谁是第一?

机器之能报道编辑:杨文10家国产明星大模型PK高考作文,谁是AI圈的笔杆子?高考这几天,AI 可真够忙的 ——考前忙着押题,考后忙着做题,甚至监考都得上阵。6 月 7 日上午,备受瞩目的 2024 年高考正式开始。第一场语文,毫无意外爆上热搜,全是跟作文有关。其中新课标 I 卷直接拿「人工智能」做文章。有网友认为,今年的高考作文题目真简单,还有网友觉得想写出彩要费点心思。那么,当 AI 遇上高考作文,能碰撞出怎样的火花?我们决定使用国产明星大模型,尝试写一写高考作文,与各位考生「一较高下」。参赛选手包括 ——百度家

高考语文作文首次遇上 AI:2024 新课标 I 卷谈“AI 时代问题是否会越来越少”

2024 高考语文科目刚刚已经落下帷幕,如往年一样,高考作文题目依旧是各路网友最为关心的话题之一。目前各地高考语文作文试题已经公布,其中,人工智能首次登上新课标 I 卷作文题,新课标 II 卷则是提到了“太空之旅”与“未知之境”的关系。IT之家现汇总各地高考作文试题如下:新课标 I 卷阅读下面的材料,根据要求写作。(60 分)随着互联网的普及、人工智能的应用,越来越多的问题能很快得到答案。那么,我们的问题是否会越来越少?以上材料引发了你怎样的联想和思考?请写一篇文章。要求:选准角度,确定立意,明确文体,自拟标题;不

谷歌 Play 商店宣布整顿生成式 AI 类 App:必须限制不当内容传播

感谢当地时间周四,谷歌针对 AI 类应用程序更新了指导方针,目标是减少“不适当的”和“被禁止的”内容。谷歌在新的政策中指出,提供生成式 AI 功能的应用必须防止生成受限制的内容,包括色情内容、暴力等,并要求应用对其 AI 模型进行“严格测试”。这些规则适用于多种应用程序,IT之家简要汇总如下:以文本、语音和图像提示输入的任何组合,经由生成式 AI 产生内容的 App。聊天机器人类、图像生成类(文生图、音生图、图生图)、语音及视频生成类 App。不适用于“仅仅承载”AI 内容的 App,或将 AI 用作生产力工具的

价格战之后,智谱来到商业化的下一站

这次价格战的两股势力分别是互联网大厂和大模型创业公司,以字节、阿里云、腾讯和智谱为主要参战代表。 面对这场突如其来的价格战,大家讨论最多的是,创业公司很难承受得住这样的比拼。 相比互联网大厂底子厚、钱多,大模型创业公司跟大厂打价格战,风险很大,一些人认为「价格战」是大模型玩家的淘汰加速赛。

支付宝推出 AI 毛发自测工具:上传照片可测脱发程度

支付宝周四宣布上线“AI 毛发自测”工具,用户上传数张头皮照片后,即可通过 AI 大模型能力识别脱发类型、级别,并接受来自 AI 的“健康建议”。据该项目负责人蔡科发介绍,研发该应用的初衷是希望更多人能够及时、科学地认识自己的脱发水平,避免听信土豆、生姜擦头一类的偏方,错过了最佳的养护时机。他还谈到了自己有关于“脱发”的经历:“我第一次意识到自己脱发,是看到女儿在幼儿园里画的爸爸,居然只有三根头发。”此次推出的“AI 毛发自测”由支付宝和杭州一家医院脱发专科门诊医生共同研发,基于蚂蚁百灵多模态大模型识别技术、人工智

阿里云通义千问系列 AI 开源模型升至 Qwen2:5 个尺寸、上下文长度最高支持 128K tokens

感谢通义千问(Qwen)今天宣布经过数月的努力,Qwen 系列模型从 Qwen1.5 到 Qwen2 的重大升级,并已在 Hugging Face 和 ModelScope 上同步开源。IT之家附上 Qwen 2.0 主要内容如下:5 个尺寸的预训练和指令微调模型,包括 Qwen2-0.5B、Qwen2-1.5B、Qwen2-7B、Qwen2-57B-A14B 以及 Qwen2-72B在中文英语的基础上,训练数据中增加了 27 种语言相关的高质量数据;多个评测基准上的领先表现;代码和数学能力显著提升;增大了上下文长

挑战英伟达 AMD,背靠高通和富士康的初创公司耐能发布笔记本 NPU 新品

人工智能芯片初创公司耐能(Kneron)周三在 2024 台北国际电脑展推出了其下一代 AI 产品 —— KNEO 330 服务器和搭载第三代 NPU 芯片 KL830 的 PC 设备。据悉该公司由 CEO 刘峻诚和张懋中创立于 2015 年,是一家提供边缘运算人工智能(edge AI)技术的公司,其投资者主要包括李嘉诚旗下的维港投资、高通、鸿海集团、阿里巴巴创业者基金、中华开发资本等知名集团。耐能 CEO 刘峻诚在发布会上表示,目前使用生成式 AI 功能和应用的公司,云业务依赖于微软和亚马逊等巨头,并从英伟达或是

史上首届「AI选美」十强,拿的全是大女主剧本

机器之能报道编辑:杨文入围的AI网红们都不是胸大无脑的傻白甜,而是走的大女主路线。首届 AI 选美入围名单,终于出炉了!5 月 31 日,第一届选美盛事「Miss AI」公布前十强入围名单,来自印度、摩洛哥、罗马尼亚、土耳其、法国等国的 10 位 AI 美女,共同角逐 AI 小姐的桂冠。除了第一届 AI 小姐的称号,选美冠军还将抱走高达 1.3 万美元的大奖。竞争到底多激烈?据悉,全球有超过 1500 个 AI 角色、1 万名 AI 团队成员参与。甚至入围名单一度难产,原定 5 月 10 日揭晓结果,后变更到 5

辅导作业这么费劲的事,还是交给这个大模型吧

“小思”是学而思学习机的人格化,代表整个学习机以拟人化的方式与孩子交互。辅导孩子作业已成为中国大部分家长的常态。 每一份令人啼笑皆非的作业的背后,都有一位濒临崩溃的父亲或者母亲。 明星,又如何? 学渣、学霸,一律平等。 这也是为什么家庭——这个课堂学习外的主要学习战场——从来都是兵家必争之地。 近期,一组数据也给人带来意想不到的震动。 2024 年一季度,中国学习平板线上市场大涨 80%,均价提升 573 元。教培企业阵营反超了科技型企业阵营,学而思在销量和销额两个维度上均位居第一。 其中,搭载了九章大模型( Ma

黎曼猜想突破作者首次公开讲解,陶哲轩送上总结

满满一黑板的「天书」,会是「猜想界皇冠」破解的开始吗?昨天,有关试证黎曼猜想的新研究又一次引爆了数学圈。MIT 数学教授 Larry Guth 和牛津大学数学研究所教授、2022 菲尔兹奖得主 James Maynard 撰写论文《New large value estimates for Dirichlet polynomials》,首次对数学家 Albert Ingham 在 1940 年左右关于黎曼 ζ 函数零点(以及更广泛地控制各种 Dirichlet 级数的大值)的经典界限做出了实质性改进。论文地址: G

微软推出首个基于 AI 的天气预报系统 Aurora,还能预测空气污染水平

微软在本周一发布了首个用于天气预测的大型大气基础模型 Aurora(极光),可实现天气和大气变化的高精度预报。据微软官方宣称,Aurora 是一个有着 13 亿参数的基础模型,同时还带有基于 3D 感知器的编码器和解码器。Aurora 经过超过一百万小时的不同天气和气候数据训练。Aurora 利用基础建模方法的优势,为各种大气预测问题(包括训练数据有限、异构变量和极端事件)提供业务预测。团队在预训练时分两个阶段对 Aurora 模型进行了优化,以最大限度地减少具有不同分辨率、变量和压力水平的多个异构数据集的损失,得

这个团队做了OpenAI没Open的技术,开源OpenRLHF让对齐大模型超简单

随着大型语言模型(LLM)规模不断增大,其性能也在不断提升。尽管如此,LLM 依然面临着一个关键难题:与人类的价值和意图对齐。在解决这一难题方面,一种强大的技术是根据人类反馈的强化学习(RLHF)。但是,随着模型越来越大,RLHF 通常需要维持多个模型以及越来越复杂的学习流程,这又会导致内存和计算资源需求增长。举个例子,近端策略优化(PPO,这是 RLHF 常用的一种算法)需要在训练过程中维持四个模型。由此,当语言模型的参数规模超过 700 亿时,为了训练和协调多个模型,所需的计算资源和调度复杂性会显著增长 ——

Stability AI开源47秒音频生成模型,虫鸣鸟叫、摇滚、鼓点都能生成

音频生成领域又有好消息:刚刚,Stability AI 宣布推出开放模型 Stable Audio Open,该模型能够生成高质量的音频数据。项目地址: Stability AI 的商业 Stable Audio 产品(可生成长达三分钟的更长、连贯的音乐曲目)不同,Stable Audio Open 可以通过简单的文本提示生成长达 47 秒的高质量音频数据。经过专业训练后,这个模型已经非常适合创建鼓点、乐器 riffs、环境音、拟声录音和其他用于音乐制作和声音设计的音频样本。虽然它可以生成简短的音乐片段,但它并未针