资讯列表

达摩院发布一站式AI视频创作平台"寻光",打造全新AI工作流

今年是 AI 视频生成爆发的元年,以 Sora 为代表的算法模型和产品应用不断涌现。短短几个月内,我们目睹了几十种视频生成工具的问世,基于 AI 的视频创作方式开始流行起来。但新技术也引发更多的挑战与质疑,除了大家熟知的 “开盲盒” 现象,AI 所生成的视频内容也因可控性差、处理工作流繁琐而频频被诟病。OpenAI 曾经邀请专业视频制作团队对 Sora 进行了测试,其中来自于多伦多的 Shy Kids 团队,利用 Sora 制作了一个气球人主题的短片,把创意和 AI 技术进行了完美的结合,让人印象深刻。整个短片其实

全尺寸通用人形机器人青龙亮相WAIC,加速迈入具身智能时代

7 月 4 日下午,由世界人工智能大会组委会办公室指导,世界人工智能大会组委会办公室主办,国家地方共建人形机器人创新中心、中国电子学会承办,AI在线、《机器人技术与应用》杂志协办的 2024 WAIC 世界人工智能大会人形机器人与具身智能发展论坛将于 7 月 4 日下午在上海世博展览馆举行。本次论坛邀请了 12 位国内外人形机器人与具身智能领域的学者、企业代表以及开发者代表进行了主旨报告、技术分享和圆桌讨论,并发布了人形机器人创新成果。论坛现场吸引了 200 多位人形机器人及具身智能领域的专业观众,同时通过多个直播

Soul创新多模态互动体验,携「异世界回响」亮相WAIC2024

7月4日,2024世界人工智能大会暨人工智能全球治理高级别会议(WAIC 2024)正式开幕。 今年主题为“以工商促共享 以善治促善智”,围绕核心技术、智能终端、应用赋能三大板块,集中展示一批“人工智能 ”创新应用最新成果。 作为当下“AI 社交”领域代表,社交平台Soul App受邀参展,并重点展出了“数字分身”“狼人魅影”和“异世界回响”等AI能力落地的新功能、新场景。

开源视频版GPT-4o?快速记忆,实时问答,拿下CVPR'24长视频问答竞赛冠军

AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected][email protected]张颢继:清华大学本科生,师从唐彦嵩老师,主要研究方向为视频理解。王逸钦:清华大学深圳国际研究生院硕士生,师从唐彦嵩老师,主要研究方向为多模态学习。唐彦嵩博士:清华大学深圳国际研究生院助理教

联手商汤AI大模型,“空间王者”L380亮相世界人工智能大会

7月4日,2024世界人工智能大会(WAIC)在上海世博展览馆拉开帷幕。大会战略合作伙伴商汤科技在7月5日主办的“大爱无疆·向新力”论坛上发布对标GPT-4o 的“SenseNova 5.5”大模型体系。而作为首个搭载商汤“SenseNova”AI大模型的汽车产品,LEVC旗下豪华纯电MPV——“空间王者”L380也亮相WAIC。除此之外,LEVC联席CTO于童也出席上述论坛并作主题演讲,详解L380如何开启轮上空间新纪元。于童表示,“基于行业第一的空间利用率和空间灵活性,L380已经成为能够激发AI大模型无限潜能

Anthropic 首席执行官:未来三年内,AI 大模型训练成本将上升至百亿甚至千亿美元

据 Tom's Hardware 今日报道,AI 初创公司 Anthropic 的首席执行官 Dario Amodei 近期接受播客节目采访时表示,目前像 GPT-4o 这样的模型训练成本约为 1 亿美元,而目前正在开发的 AI 大模型训练成本可能高达 10 亿美元(AI在线备注:当前约 72.94 亿元人民币)。当然,10 亿美元还不是“终点”。Dario Amodei 作出预测,未来三年内,AI 大模型的训练成本将上升至 100 亿美元甚至 1000 亿美元(当前约 7294.28 亿元人民币)。Dario A

WAIC上,高通这一波生成式AI创新,让我们看到了未来

做最有挑战的事:把生成式 AI 送到每个人手上。没想到,生成式 AI 爆发后,产业格局的变化居然这么快。一个月前,微软向全世界介绍了专为 AI 设计的「Copilot PC」,AI PC 这个新品类突然有了标准款。这是迄今为止速度最快、最智能化的 Windows 个人电脑。凭借搭载的新型芯片,它能够实现超过 40 TOPS(每秒万亿次操作)AI 算力、电池续航时间长达一整天,而且无缝接入了世界最先进的人工智能模型。其发布之时,只有骁龙 X 系列的 45TOPS 能够满足这样的 Windows 11 AI PC

更美图像生成、直出分钟级视频,国产自研DiT架构的越级之旅

一转眼,2024 年已经过半。我们不难发现,AI 尤其是 AIGC 领域出现一个越来越明显的趋势:文生图赛道进入到了稳步推进、加速商业落地的阶段,但同时仅生成静态图像已经无法满足人们对生成式 AI 能力的期待,对动态视频的创作需求前所未有的高涨。 因此,文生视频赛道持续高热,尤其是自年初 OpenAI 发布 Sora 以来,以 Diffusion Transformer(DiT)为底层架构的视频生成模型迎来了井喷期。在这一赛道,国内外视频生成模型厂商们正默默展开着一场技术竞速。在国内,一家成立于去年 3 月、专注于

Adam有了mini版:内存占用少一半,吞吐量提升50%

在训练大型语言模型(LLM)时,Adam(W) 基本上已经成为了人们默认使用的优化器。Adam 尽管性能优异,但使用成本很高。具体来说,Adam 需要内存来保存其优化器状态:一阶动量 m 和二阶动量 v^2。这总共需要模型大小至少 2 倍的内存。这样的内存消耗已经成为了 LLM 训练的一大主要负担。举个例子,要训练一个 7B 模型,只是 Adam 就需要每张卡有大约 56 GB 来保存 m 和 v;而如果再加上梯度,则总共需要 86 GB。即使使用最先进的 A100-80GB,成本也过高了。为了支持这样的高内存算法

中山大学联合字节智创数字人团队提出MMTryon虚拟试穿框架,效果优于现有SOTA

虚拟换装技术在特效以及电商的场景下有着广泛的应用,具有较高的商业潜质与价值。近期,中山大学联合字节跳动智能创作数字人团队提出了一种多模态多参考虚拟试穿 (VITON) 框架 MMTryon,可以通过输入多个服装图像及指定穿法的文本指令来生成高质量的组合试穿结果。对于单图换装,MMTryon有效的利用了大量的数据设计了一个表征能力强大的服装编码器, 使得该方案能处理复杂的换装场景及任意服装款式;对于组合换装,MMTryon消除了传统虚拟换装算法中对服装精细分割的依赖,可依靠一条文本指令从多张服装参考图像中选择需要试穿

红杉:重金购入GPU后,AI行业收入缺口达到5000亿美元

囤 GPU 真的像修铁路一样,是一项划算的投资吗?AI公司花了那么多钱从英伟达购买GPU,需要产生多少收入才能证明这笔钱花得合理?最近,红杉资本的一篇文章给出了一个答案:6000亿美元。而去年9月份,同一位作者算出的数字是2000亿美元。这些数字是怎么算出来的呢?在去年9月份的文章中,作者David Cahn(红杉资本的合伙人)表示:在 GPU 上每花费 1 美元,在数据中心运行 GPU 需要花费大约 1 美元的能源成本。GPU 的最终用户——例如星巴克、X、特斯拉、Github Copilot 或新的初创公司——

RAGFlow开源Star量破万,是时候思考下RAG的未来是什么了

AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected][email protected]本文作者为张颖峰,英飞流 InfiniFlow 创始人 CEO,连续创业者,先后负责 7 年搜索引擎研发,5 年数据库内核研发,10 年云计算基础架构和大数据架构研发,10 年人工智能核心

日本总务省报告:该国仅 9.1% 的个人使用生成式 AI,远低于中美英等国

据日经报道,日本总务省于 7 月 5 日发表了《信息通信白皮书》。数据显示,日本国内仅有 9.1% 的个人使用生成式 AI,与中国的 56.3%、美国的 46.3%、英国的 39.8% 和德国的 34.6% 存在较大差距。AI在线汇总详细数据如下:日本民众不使用生成式 AI 的理由方面,“不知道使用方法”超过 4 成,“生活中不需要”接近 4 成,占所有理由的前 2 名。使用生成式 AI 的具体用途方面,根据从“已在使用”的民众中的调查显示,用于“查询”的最多,占 8.3%,用于“提炼及翻译内容”其次,占比为 5.

专注为通用人工智能算力底座筑基,「燧原科技」连续五年参加世界人工智能大会

2024年7月4日,由外交部、国家发展和改革委员会、教育部、科学技术部、工业和信息化部、国家互联网信息办公室、中国科学院、中国科学技术协会和上海市人民政府共同主办的2024世界人工智能大会(WAIC 2024)正式开幕。致力于为通用人工智能打造算力底座的燧原科技以 “芯火燎原”为主题,连续第五年参会。大会期间,燧原科技不仅在展台现场(H2馆C109)展示了智算中心落地案例和里程碑系列产品,还为与会者带来了基于燧原算力的AIGC交互体验站,展示其最新商业落地成果及规模化应用。此外,燧原科技还将在大会期间举办“共迎智算

转发有奖|AFAC2024 金融智能创新大赛,持续火热招募中!

在上海市科学技术委员会指导、中国计算机学会(CCF)支持下,由北京大学、复旦大学、香港大学、蚂蚁集团等共同发起了AFAC2024金融智能创新大赛。 报名通道已正式上线,7月份进行成果初选,8月份进入决赛路演,9月份在上海“外滩大会”举行大赛成果总结和奖项颁发。 1.创新大赛解决行业真命题 AFAC2024与去年相比,本次AFAC2024金融智能创新大赛更加开放化、国际化,更注重人工智能和大模型技术在金融领域的落地应用,在赛制上做了全新升级,设置挑战组、初创组、企业组三个组别,分别面向高校企业的专业人士、创业团队以及中小型企业,从真实的业务场景经验和当前技术变革的趋势出发,设置了算法、创意开发及应用和落地方案三个赛题方向。

吉利翼真 L380 纯电 MPV 首搭商汤“日日新”AI 大模型,支持文生图、健康检测等

在 7 月 5 日举行的 2024 世界人工智能大会(WAIC)期间,商汤科技发布“日日新 SenseNova 5.5”大模型体系。吉利翼真 L380 MPV 作为首个搭载该大模型的汽车产品,也亮相 WAIC。据介绍,搭载商汤“日日新”AI 大模型的 L380,可以实现文生图和图生图功能,同时支持设置成自定义壁纸桌面及手机分享。而基于视觉检测算法、医疗垂域模型的 AI 健康检测,可通过无接触式检测方式,对用户心率、心率变异性、血氧饱和度和呼吸频率四项健康指标的动态检测。AI在线注意到,吉利旗下号称“陆地空客”的 M

AI 青年,执掌未来十年的钥匙,2024 WAIC·云帆奖得主揭晓

期待更多奋斗在 AI 第一线的青年先锋,积极思考如何将更通用的 AI 技术,更有效地应用到更广泛、更多元的实际生产生活场景中,使之成为真正推动社会和经济发展的引擎。7 月 5 日,在 2024 WAIC·云帆奖颁奖典礼暨人工智能青年先锋论坛上,举行了最新一届的「WAIC·云帆奖」颁奖典礼。2024 年 WAIC·云帆奖共收到来自全球的近 200 份有效报名和提名,最终遴选出 10 位璀璨明星和 15 位明日之星。他们中有来自海内外著名高校的青年教师及博士后研究员,AI 领先企业的技术负责人、也有参与创立了新一代 A

漆远获新融资,阿里云参投;芯原创始人直言百模大战就是“群模乱舞”,是在浪费电;英伟达今年在华将交付超100万颗芯片丨AI情报局

融资快报无限光年完成新一轮融资:无限光年的核心产品是可信大模型,这是漆远认为通往人工智能通用智能的道路。 可信大模型结合了大语言模型与符号推理,旨在解决大模型的幻觉问题和遗忘性灾难,提高模型的可信度和可解释性。 无限光年已完成多轮融资,并与金融和医疗行业的头部企业合作,打造了针对特定行业的精专大模型。