应用
单镜头16秒720p高清视频一键生成,开源版Sora又有新惊喜了
潞晨 Open-Sora 团队在 720p 高清文生视频质量和生成时长上实现了突破性进展,支持无缝产出任意风格的高质量短片,令人惊喜的是,他们选择再给开源社区带来亿点点震撼,继续全部开源。开源地址:,能够生成各种酷炫的短片,比如海浪和海螺的亲密接触,还有那些深不可测的森林秘境。人物肖像的渲染也相当逼真。还能精准渲染赛博朋克风,让短片瞬间充满强烈的未来感和科技感。 图片经过压缩。也能生成有趣生动的动画镜头,带来极具表现力的视觉体验。
杀疯了!谷歌卷视频到语音,逼真音效让AI视频告别无声!
AI圈这遍地开花的大好局面,让吃瓜群众们甚是惊喜。这几天,大洋彼岸杀疯了!Luma 的热乎劲儿还没过去,昨晚 Runway 就甩出一个王炸 ——Gen-3 Alpha。(查看详情请移步:Runway 版 Sora 发布:高保真、超强一致性,Gen-3 Alpha 震撼到网友了)更没想到的是,一觉醒来,Google DeepMind 也有了新消息,悄咪咪地发布了视频生成语音(V2A)技术的进展。虽然这一功能还未向公众开放,不过从官方放出的视频 Demo 来看,效果那是相当丝滑。同时,Google DeepMind 强
字节打造大模型TTS:不仅能高保真合成,而且支持调整编辑
通过高保真合成语音与真人语音无异。首先来听一段《凡人修仙传》:你猜的没错,这段有声书并非来自某个专业制作团队,而是一个 AI 模型 Seed-TTS,而这个模型则是来自字节跳动的 Seed Team。TTS 是指文本转语音,这是一种具备诸多妙用的技术,像是让个人智能助理说话、为视频或游戏配音、辅助视障人士、制作有声书等等。对于 TTS 技术研发者来说,流畅自然的表达一直以来都是值得追求的重要目标。字节跳动 Seed Team 发布的 Seed-TTS 不只是一个模型,而是一整个模型系列。论文标题:Seed-TTS:
Runway版Sora发布:高保真、超强一致性,Gen-3 Alpha震撼到网友了
虽然生成的视频只有10秒左右,但在清晰度、细节、角色一致性等方面看起来可以匹敌现有一切视频生成模型。刚刚,AI视频生成初创公司Runway推出了新的视频生成基础模型Gen-3 Alpha。该模型可以创建具有复杂场景变化、多种电影风格和详细艺术指导的高精细视频。Runway表示,Gen-3 Alpha是即将推出的一系列模型中的首个。系列模型是在为大规模多模态训练而构建的新基础设施上训练的。与Gen-2相比,Gen-3 Alpha在保真度、一致性和运动性方面有了重大改进,并朝着构建通用世界模型迈出了重要一步。在博客中,
AI 教父 Hinton:我支持超级 AI 取代人类
【新智元导读】「AI 教父」Geoffrey Hinton 在最近的采访中表达了自己对 AI 智能的理解 ——LLM 并不是简单的统计模型,已经具备了理解能力。与此同时,网友翻出了去年 12 月的「过期」视频,惊奇地发现 Hinton 早就「叛变」了,竟然对超级 AI 取代人类的未来表示支持。最近,半退休的「AI 教父」Geoffrey Hinton 频频出现在各种采访中,输出他关于 ASI 的各种言论和观点,甚至只是聊点生涯轶事都可以引起网友们的热烈讨论。不到一个月之前,他就揭发了爱徒 Ilya 在暑假受够了炸薯
Canalys 预计今年全球 AI 手机市场份额达 16%,2028 年将激增至 54% 首次过半
根据 Canalys 对具有生成式 AI 能力智能手机市场的调研预测,2024 年,AI 手机出货量预计占全球智能手机出货量的 16%,到 2028 年,这一比例将激增至 54%。从 2023 年到 2028 年,AI 手机市场年均复合增长率(CAGR)将达到 63%。▲ 图片源于 Canalys 官网,下同从一些关键数据来看,全球有 63% 的受访者对于手机上的 AI 应用及 AI 能力有兴趣,仅有 7% 的受访者对 AI 手机展现出极高度的兴趣倾向。印度和中国大陆消费者对 AI 手机的兴趣倾向远高于德国和美国消
让用户更省心驾驭 PDF 文档,Adobe Acrobat 升级 AI 技能:文生图、梳理信息等
Adobe 公司昨日(6 月 17 日)发布新闻稿,表示将于本周晚些时候开始,通过 Adobe 的 Firefly Image 3 模型,为旗下 Acrobat 应用程序添加图像生成功能。Adobe 公司表示 Acrobat 应用程序将引入全新的“Generate Image”功能,用户可以选择 PDF 文件中的某段内容,调用 AI 来生成图片,此外用户还可以调整生成图片的样式和大小,让其更契合整个 PDF 文档内容。Adobe 新版 Acrobat 应用程序还引入了“Edit Image”功能,通过 Firefl
Runway 发布第三代视频生成模型,90 秒生成 10 秒片段
专为电影和图像内容创作者打造生成式 AI 工具的公司 Runway 发布了 Gen-3 Alpha 视频生成模型。IT之家附 Gen-3 Alpha 官方网站: 表示,与其之前的旗舰视频模型 Gen-2 相比,该模型在生成速度和保真度方面有了“重大”改进,并且对生成视频的结构、风格和运动提供了细粒度的控制。Gen-3 将在未来几天内向 Runway 订阅用户提供,包括企业客户和 Runway 创意合作伙伴计划中的创作者。Runway 联合创始人 Anastasis Germanidis 表示,Gen-3 的视频生成
超强 AI 视频生成模型 Dream Machine 来啦!效果秒杀 Runway,可免费使用
大家好,这里是和你们一起探索 AI 的花生~
最近一款新的 AI 视频生成模型 Dream Machine 爆火出圈,它虽然只能生成 5s 的视频片段,但是在画面清晰度、动态的自然流畅程度、以及对提示词的理解上秒杀了 Runway、Pika 等一众工具,甚至能与 Sora 一较高下,因此得到了很多专业人士的肯定和称赞。今天就为大家详细介绍一下 Dream Machine 的用法和特点。
相关推荐:Dream Machine
官网直达:
Dream Machine 是 Luma AI 新推出的一款视频生成模型,这家
4500字深度思考!苹果如何用沉浸来重塑 AI 体验?
其实 6 月 11 日凌晨的 WWDC 24 特别活动,看得我特别煎熬。各个群里、社交媒体上都在等着苹果的 AI 王炸。压轴登场时,出乎意料,又在情理之中。周一晚上我精神涣散没来得及细想,第二天清醒之后,才咂摸出味来。
现场演示的功能,其实没有那么重要,但是它的存在形式和所指方向,又非常重要。
这篇稿子写了删,删了写,到现在才挤出来。是 Apple Intelligence,而非 AI
姑且把这次 WWDC 上苹果所「承诺」的,都视作为画饼。苹果一直都是谐音梗大户。Artificial Intelligence 是
严打虚拟主播?腾讯微信视频号新规拟限制数字人带货
感谢近日,腾讯对《视频号橱窗达人“发布低质量内容”实施细则》进行修订,修订内容于今年 6 月 7 日-6 月 13 日进行意见征集。最新方案显示,“使用插件、AI 等工具生成虚拟形象进行直播”“提供、售卖、教学或展示平台不提倡传播的内容:如讲解和售卖虚拟人代播软件”等涉及虚拟人 / 数字人直播,将被视频号明确列入低质量内容,并进行违规处理。据澎湃新闻今日报道,相关人士透露,使用数字人 / 虚拟人直播目前属于平台直播带货中的违规行为,如被平台发现,将依据相关规则进行处罚,包括不限于减少直播推荐、减少账号推荐、限制直播
加速生成式 AI 应用开发,亚马逊 AWS 宣布向全球创企提供 2.3 亿美元资助
亚马逊 AWS 云科技近日宣布将向全球 AI 初创企业提供价值 2.3 亿美元(IT之家备注:当前约 16.73 亿元人民币)的资助,以支持这些企业加速开发生成式 AI 应用。这部分资金将用于为初创(尤其是早期初创)企业提供指导、教育和免费的 AWS 云服务,促进这些企业进一步使用 AI 和 ML 技术。作为整体资助的一部分,亚马逊将启动第二批 AWS Generative AI Accelerator 计划,为 80 家使用生成式 AI 解决复杂挑战的顶级早期初创企业提供为期 10 周的系统性指导。这 80 家企
抖音联合博纳影业推出首部 AIGC 科幻短剧集《三星堆:未来启示录》
博纳影业出品制作、抖音联合出品的 AIGC 科幻短剧集《三星堆:未来启示录》今日亮相博纳 25 周年新闻发布会。该剧第一季共 12 集,由抖音联合出品,将在抖音短剧暑期档播出。即梦 AI 作为首席 AI 技术支持方,基于豆包大模型技术,为《三星堆:未来启示录》提供了 AI 剧本创作、概念及分镜设计、镜头画面生成、图像到视频转换、视频编辑和媒体内容增强等十种 AI 技术。据介绍,《三星堆:未来启示录》的故事设定在科技飞速发展的近未来。地球古文明遗迹的异变引起全球古文明研究组织的高度关注,泛大西洋人工智能组织 ACE
项目征集 | 全球创新项目路演:AI创新集结号,寻找下一个科技独角兽!
“全球创新项目路演”作为深度链接世界人工智能大会(WAIC)和全球开发者先锋大会(GDC)两大行业顶级盛会的投融资对接平台及全球合作平台的重要活动之一,旨在为创新和创业项目提供优秀的展示平台,推动其技术创新及落地转化;同时为企业与投资人做好精准对接,帮助企业在合适的时间内完成融资,推动企业高质量发展。 作为人工智能行业的顶级路演IP,自创办以来累计收到来自海内外近千家人工智能初创和成长型企业的踊跃报名,覆盖北美、欧洲、亚太等多个国家地区以及上海、北京、深圳等国内城市。 吸引近百家投资机构参与,包括政府产业基金、上市公司战投以及财务投资。
软银宣布与 Perplexity AI 搜索引擎达成战略合作:其用户可免费试用一年 Pro 订阅,价值 29500 日元
感谢日本软银今天宣布与 AI 初创公司 Perplexity 达成战略合作,将于 6 月 19 日向 Softbank、Y-Mobile 和 LINEMO 三大品牌的用户开放 Perplexity Pro 一年免费试用的申请。据介绍,Perplexity Pro 是 AI 搜索引擎 Perplexity 的付费订阅版本,提供更多专业搜索次数、自选 AI 模型、限量上传及分析文件等功能,一年订阅价值 29500 日元(IT之家备注:当前约 1362 元人民币)。Perplexity 今年 4 月获得来自软银和德国电信
全域机动的豪华电动越野座驾,猛士917蛟龙战甲开启预售
6月17日,中国第一款电影联名车,东风旗下猛士科技全域机动豪华电动越野座驾——猛士917蛟龙战甲正式开启预售,新车预售价格区间为76.8万元—86.8万元。猛士917蛟龙战甲还推出了具有吸引力的预定政策: 9月17日前下定的大定用户,可享终身整车质保、终身免费取送车、终身免费移动服务车、终身免费道路救援、连续5年20G每月座舱娱乐流量、一年影音会员等6大权益。除此之外,还将赠送家冲充桩、碳纤维内饰套件、原厂底盘装甲等3项限定大礼,总价值达到28000元。作为中国第一款电影联名车,猛士917蛟龙战甲出道大银幕,彰显了
利用 AI 合成“艳照”敲诈勒索,广东 / 山东警方破获两起“AI 换脸伪造不雅照”案
今天央视新闻 CCTV13《法治在线》介绍了两起“AI 换脸伪造不雅照”案,相关诈骗团伙主要利用被害者视频照片信息制作“艳照”进行敲诈。IT之家从报道中获悉,深圳市民吴先生近日收到一张包含自己与一名不认识女子的“艳照”彩信,犯罪嫌疑人同时在彩信中威胁当事人需在指定时间前将钱财转到指定账号“破财消灾”,此后吴先生报警求助。深圳坪山警方经调查锁定了一个流窜作案的犯罪团伙,该团伙以“已掌握你在外面找小姐”、“艳照将公诸于众”等方式进行威胁,在多地警方协作下,警方抓获了以王某为首的十多名犯罪嫌疑人,相关团伙分工明确,据称“
3D 版 SORA 来了!DreamTech 推出全球首个原生 3D-DiT 大模型 Direct3D
2024 年 5 月,DreamTech 官宣了其高质量 3D 生成大模型 Direct3D,并公开了相关学术论文 Direct3D: Scalable Image-to-3D Generation via 3D Latent Diffusion Transformer。链接: 3D 大模型,通过采用 3D Diffusion Transformer (3D-DiT),解决了长期以来困扰行业的高质量三维内容生成难题。坚持原生 3D 技术路线并取得突破此前,3D AIGC 通常采用的技术路线是 2D-to-3D li