阿里通义万相视觉生成大模型升级,支持文生视频、图生视频等
在今日的 2024 云栖大会上,阿里云发布了通义万相 Wanx 视觉生成大模型的新升级,能力全面进化。通义万相除了此前的文生图能力,现已支持文生视频、图生视频等,还有插画设计、涂鸦作画、局部重绘、短片创作、配乐生成等场景化能力。据阿里云官方透露,通义万相累计创作图片数已达 7500 万 ,累计用户数已达 93 万 。通义万相官网显示,全新发布自研 AI 视频生成大模型,具备“强大的画面视觉动态生成…- 23
- 0
YouTube 将推出 AI“一站式服务”:可生成创意、标题、完整视频
据 The Verge 报道,在当地时间周三(今天)举行的“Made on YouTube”特别活动上,谷歌宣布为 YouTube 带来一系列 AI 相关功能,有望改变视频制作的方式乃至视频本身。据悉,谷歌为 YouTube 创作者中心带来了新的“灵感”选项卡,其由 AI 驱动,主要功能就是“告诉”创作者应该制作的东西 —— 推荐视频的概念,提供标题和缩略图,甚至可以编写视频的大纲。YouTube…- 18
- 0
单图就能解锁全景视角,北大 / 港中文 / 腾讯等推出 ViewCrafter 开源项目
随便给张图就能从更多视角查看全景了?!话不多说,先看一波效果,单视角输入 be like:难度升级,接下来换成双视角,看起来衔接也非常丝滑。以上来自 ViewCrafter,由北大、港中文、腾讯等机构的研究人员提出,可以从单张或稀疏输入图像生成精确相机可控的新视角视频。还支持场景级文生 3D、图生 3D、以及稀疏视角重建等应用。目前论文和代码均已开源,并提供了在线 Huggingface demo…- 8
- 0
阿里通义将发布 AI 视频生成大模型,支持文生视频、图生视频
感谢阿里通义将在 2024 云栖大会(9 月 19 日至 9 月 21 日)期间发布视频生成大模型,目前通义 App 频道和通义万相 PC 端已上线“视频生成”入口,仅支持用户预约,但未开放使用。页面内容显示,全新发布的视频生成大模型是由通义实验室自主研发,包含“文生视频”和“图生视频”两种创作模式。AI在线测试,预约成功后,阿里通义会在用户获得使用资格时进行通知,并赠送给用户 66 灵感值(有效…- 24
- 0
OpenAI大秀肌肉,一口气放出10个新模型Demo,全球网友玩疯了
AI好好用报道编辑:杨文9.11和9.8哪个大还是答不对。9 月 13 日凌晨,OpenAI 又搞了个大新闻 ——推出 o1 系列模型,也就是江湖流传已久的「草莓」。这款模型到底厉害在哪,能让朋友圈刷了屏?这么说吧,它不需要专门训练,就能直接拿下数学奥赛金牌,甚至可以在博士级别的科学问答环节上超越人类专家。(查看详情,请移步:刚刚,OpenAI震撼发布o1大模型!强化学习突破LLM推理极限)不过,…- 3
- 0
Adobe 预告 Firefly 文生视频 AI 模型年内登场,可通过提示词 / 静帧生成动态片段
继去年 3 月推出 Firefly 文生图 AI 模型后,Adobe 计划在今年内推出 Firefly 文生视频模型,允许用户使用文字描述或图像静帧生成动态视频。▲ Adobe 去年 3 月推出的 Firefly 文生图 AI 模型▲ Adobe 预告的 Firefly 文生视频 AI 模型Adobe 表示,当前全球短视频市场需求不断增长,这意味着编辑、电影制作人或内容创作者需要在更短的时间内完成…- 30
- 0
AI 能「看懂」你的唇语,悄悄话不再安全
小心悄悄话被 AI 听见!(嘘)最近国外一款可以读唇语的 AI 软件火了!具体效果如下:红毯上布莱克・莱弗利小声说:“好紧张”,笑着说话时肉眼很难分辨唇语,但 AI 可以。乍一看只能看见一排白牙(bushi)的侃爷,唇语也能被轻松破解。看完后网友们开始纷纷评论,大开脑洞:求“联名”型网友:快把它和 Siri 结合一下吧!这样我就不用像小傻子一样对着电脑大喊了!测评型网友:我想用它试试“座机画质”的…- 6
- 0
Adobe Premiere Pro 将集成视频生成功能,年底前推出
Adobe 宣布,将于今年年底前推出由 Adobe Firefly Video 模型驱动的视频生成功能,届时用户可以在 Premiere Pro 测试版应用和独立网站上体验这一功能。Adobe 表示目前正在内部测试三种功能:生成续帧 (Generative Extend)、文本转视频 (Text to Video) 和图像转视频 (Image to Video),并将在近期开放公测。生成续帧功能允…- 22
- 0
快手启动“可灵 AI”电影共创计划:联合李少红、贾樟柯、薛晓路等导演出品 AIGC 电影短片
快手今日宣布启动“可灵 AI”电影共创计划。快手将联合李少红、贾樟柯、叶锦添、薛晓路、俞白眉、董润年、张吃鱼、王子川、王卯卯等 9 位导演,制作出品 9 部 AIGC 电影短片,9 部短片将全部由可灵 AI 进行视频生成。据AI在线此前报道,今年 6 月,快手视频生成大模型“可灵”上线。今年 8 月,快手宣布有超过 160 万人使用过可灵 AI,并累计生成超 1600 万视频、累计生成图片数量为 …- 28
- 0
腾讯发布混元大模型Turbo版本 用AI助力场景创新
大模型落地持续加速中。9月5日,腾讯宣布推出新一代大模型“混元Turbo”,相比前代模型,腾讯混元Turbo性能显著提升,训练效率提升108%,推理效率提升 100%,推理成本降低 50%,效果在多个基准测试上对标GPT-4o,且第三方测评居国内第一。目前,混元Turbo已经在腾讯云上线,输入和输出价格只有前代模型的一半。企业和开发者可以通过API、专属模型、精调模型等方式使用混元大模型相关能力。…- 22
- 0
商汤科技:目前投建的国产化 AI 算力集群已拥有 5.4 万张 GPU,最高算力达 2 万 P
据界面新闻报道,在今日举办的 2024 REAL 科技大会上,商汤数字文娱事业部总经理栾青介绍称,目前商汤投建的国产化人工智能算力集群已拥有 5.4 万张 GPU,最高算力达 2 万 P。栾青表示,商汤正在上海临港投建全国最大规模人工智能数据中心,全国算力节点遍及上海、广州、重庆、深圳、福州等地。据AI在线此前报道,商汤截至 2024 年 6 月 30 日的半年报数据显示,2024 年上半年,集团…- 14
- 0
智谱清言 App 视频通话功能面向所有用户限时免费开放:“有了眼睛”的 AI 产品
感谢智谱 AI 今日宣布,清言 App 视频通话功能面向所有用户全面放开,限时免费。智谱称其为“有了眼睛”的 AI 产品:不局限于打字和语音交互,不用担心机器播报模式,不会觉得它生硬、冷冰。AI在线附主要功能如下:速读文档、分析材料、高情商回复领导帮助用户解析题干导航看路、餐厅点餐随拍随学、即时翻译、语法教学时尚造型顾问据介绍,用户在清言 App 点击首页右下方的打 Call 按钮,跳转视频通话后…- 27
- 0
还在死磕镜头?聪明人已经用AI拍时尚广告大片了
机器之能报道编辑:杨文以大模型、AIGC为代表的人工智能浪潮已经在悄然改变着我们生活及工作方式,但绝大部分人依然不知道该如何使用。因此,我们推出了「AI在用」专栏,通过直观、有趣且简洁的人工智能使用案例,来具体介绍AI使用方法,并激发大家思考。我们也欢迎读者投稿亲自实践的创新型用例。投稿邮箱:[email protected]「两块钱,太便宜了,我帮你把价格打~上~去~!」去年,这句魔性…- 18
- 0
阿里云通义千问 Qwen2-VL 第二代视觉语言模型开源
阿里云通义千问今日宣布开源第二代视觉语言模型 Qwen2-VL,并推出 2B、7B 两个尺寸及其量化版本模型。同时,旗舰模型 Qwen2-VL-72B 的 API 已上线阿里云百炼平台,用户可直接调用。据阿里云官方介绍,相比上代模型,Qwen2-VL 的基础性能全面提升:读懂不同分辨率和不同长宽比的图片,在 DocVQA、RealWorldQA、MTVQA 等基准测试创下全球领先的表现;理解 20…- 28
- 0
韩国 N 号房卷土重来:这一次是 Deepfake,波及超 200 所学校
Deepfake(深度伪造),再度深陷舆论的风波。这一次,用这项 AI 技术犯罪的严重程度被网友直呼是“韩国 N 号房 2.0”,魔爪甚至伸向了众多未成年人!事件影响之大,直接冲上了各大热搜、热榜。早在今年 5 月,《韩联社》便通报过一则消息,内容是:首尔大学毕业生朴某和姜某,从 2021 年 7 月至 2024 年 4 月,涉嫌利用 Deepfake 换脸合成色情照片和视频,并在通信软件 Tel…- 22
- 0
智谱发布新一代基础模型,清言 App 国内率先面向 C 端开放视频通话服务
感谢智谱 AI 在 KDD 2024 大会上发布了新一代基础模型,自称在相应领域均达到了国际第一梯队的水准,并宣布在 MaaS 平台上免费开放 GLM-4-Flash API:语言模型 GLM-4-Plus:在语言理解、指令遵循、长文本处理等方面性能得到全面提升。文生图模型 CogView-3-Plus:具备与当前最上面的 MJ-V6 和 FLUX 等模型接近的性能。图像 / 视频理解模型 GLM…- 32
- 0
利用 AI 技术制造谣言,一男子被厦门警方依法采取刑事强制措施
据福建网警今日披露,一男子为了吸粉引流、非法牟利,利用 AI 技术制造谣言,误导公众认知,扰乱社会秩序,厦门海沧警方对其采取刑事强制措施。AI在线附案件详情:今年 6 月,厦门警方接到举报,某互联网平台上名为“小逸看世界”的账号,发布了图文视频:“广东省五华县华阳镇一 70 多岁老人被殴打致昏迷,其孙子为此跳河自杀,打人者一审被判九年十个月。”▲ 图源“福建网警”官方公众号该视频一经发出便迅速吸引…- 9
- 0
智谱 AI 开源 CogVideoX-5B 视频生成模型,RTX 3060 显卡可运行
智谱 AI 开源了 CogVideoX-5B 视频生成模型,相比此前开源的 CogVideoX-2B,官方称其视频生成质量更高,视觉效果更好。官方表示大幅度优化了模型的推理性能,推理门槛大幅降低,可以在 GTX 1080Ti 等早期显卡运行 CogVideoX-2B ,在 RTX 3060 等桌面端“甜品卡”运行 CogVideoX-5B 模型。CogVideoX 是一个大规模 DiT(diffu…- 15
- 0
AI在用 | 雷总,我把你的出道曲《Are You OK》搞成了动画MV
机器之能报道编辑:杨文以大模型、AIGC为代表的人工智能浪潮已经在悄然改变着我们生活及工作方式,但绝大部分人依然不知道该如何使用。因此,我们推出了「AI在用」专栏,通过直观、有趣且简洁的人工智能使用案例,来具体介绍AI使用方法,并激发大家思考。我们也欢迎读者投稿亲自实践的创新型用例。投稿邮箱:[email protected]还记得之前的 AI 让火柴人讲搞笑段子吗?(查看详情,请移步:…- 15
- 0
快手可灵 AI 推出会员订阅计划:支持 AI 图片 / 视频,首月 19 元起
感谢快手可灵 AI 推出会员订阅计划,其中连续包月首月最低价 19 元、次月 58 元,可生成约 66 个视频或 3300 张图片,还可享受高表现视频生成、视频延长、大师运镜等多项会员专属功能。与此同时,可灵 AI 针对 B 端同步开启 OpenAPI 企业用户招募,首批加入企业将拥有优先接入和专属技术支持。快手刚发布的 2024 年二季度财报显示,可灵 AI 已有超百万用户,累计生成了超千万视频…- 53
- 0
微软 Azure AI 语音服务推出虚拟人形象,支持文本转视频
微软 Azure AI 语音服务允许开发者构建多语言生成式 AI 语音应用,Azure AI 语音服务最新推出了文本到语音虚拟人功能,可以将简单的文本转换为人类自然说话视频。今天,微软宣布全面推出 Text to Speech Avatar 功能。这项新功能使开发者能够为其用户创建个性化虚拟人。该服务的输出视频分辨率为 1920 x 1080,每秒 25 帧。AI在线附示例如下:Text to S…- 48
- 0
因未经许可抓取 YouTube 内容训练模型,英伟达遭视频创作者起诉
感谢综合 Legal Dive 及 404 Media 16 日报道,当地时间周三,YouTube 创作者大卫・米勒特 (David Millette) 对英伟达公司提起集体诉讼,声称英伟达从他和其他人的视频中获取丰厚利润,违反了加州的《不正当竞争法》,并以牺牲他和其他创作者的利益为代价,使公司“不当得利”。这名 YouTube 创作者声称,英伟达未经他和其他创作者的许可,基于从 YouTube …- 7
- 0
AI 马斯克“现身”数千条虚假广告,美国八旬老人被骗近 70 万美元
据《纽约时报》14 日报道,马斯克的形象在经过 AI 进行“深度伪造”之后,出现在数以千计的虚假广告中,造成数十亿美元的欺诈。报道提到一位受害者 ——82 岁的退休老人 Steve Beauchamp。他只是想要养家糊口的钱,并认为马斯克能帮得上忙。去年年底他看到了一段视频,视频中的“AI 马斯克”为一个承诺“快速回报”的激进投资机会代言。Steve 便联系上了该广告背后的公司,并以 248 美元…- 6
- 0
由 AI 生成的假马斯克,成了最大的网络骗子
8 月 15 日消息,据美媒报道,近年来,人工智能深度伪造技术(Deepfake)在网络诈骗中广泛应用,尤其是利用伪造的埃隆・马斯克(Elon Musk)视频进行诈骗的案例尤为突出。这些视频通过模拟马斯克的声音和动作,误导投资者。这类深度伪造视频成本低廉、传播迅速,使得诈骗者能够轻易扩大其欺诈活动的影响范围,导致许多受害者因为虚假的投资机会而损失巨额资金。随着深度伪造技术的风险日益凸显,其每年可能…- 11
- 0
视频
❯
个人中心
今日签到
搜索
扫码打开当前页
返回顶部
幸运之星正在降临...
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠劵
- ¥优惠劵使用时效:无法使用使用时效:
之前
使用时效:永久有效优惠劵ID:×
没有优惠劵可用!