资讯列表
谷歌版 Her 大翻车:试了 3 次且换手机才成功… 网友:我手动只需 10 秒
翻车,大翻车。就在今天凌晨,谷歌版 Her——Gemini Live 正式发布。毕竟明显是对标 OpenAI 家的 GPT-4o,可以说是吸足了科技圈的眼球。在官网发布的 demo 中,拍照问答功能的效果是这样的:它大致实现的功能,是用手机拍摄演唱会的海报,并让 Gemini 查看用户的日历,看看行程是否适合参加。以及还可以基于此进行一系列后续的操作,包括定时间查票价等等。然而…… 当来到发布会现场演示环节的时候,画风却 180° 大变样。请看 VCR: 第一次:失败了。第二次:失败了。第三次:换手机,成功了。嗯…
AI 斗图神器:普通视频秒变 meme,手绘动画轻松融入
哎鸭,鸭鸭摔倒了!鸭鸭是真的,摔跤是真的,但端的咖啡和端咖啡的手,是 AI 给 p 上去的。△ 还好手里的咖啡只洒了亿点点来自一个开源项目,VideoDoodles,这两天在外网上的讨论度直线上升。这项目妙就妙在,能给视频加上手绘风格的涂鸦,可可爱爱的也行,奇奇怪怪的也行。就跟人工一帧一帧画上去的没差。这对目前市场上大多数的 2D 视频编辑软件来说,还是比较难的。想要达成同等效果,一般还是得创作者真・一帧一帧画上去。怪费力气的。但 VideoDoodles 能靠在视频中重建 3D 场景,然后在其中放置平面画布,来生
我用AI帮义乌老板重新设计全红婵“丑鱼”拖鞋
作者:马蕊蕾编辑:林杰鑫最近巴黎奥运会火得不止运动员,和他们相关的“奥运”同款,商品搜索量和销量一路暴涨。 全红婵的同款“丑鱼”拖鞋,这周在某宝的上升热度提升了113%,搜索关键词全红婵,第一个提示词就是“丑鱼”拖鞋。 你有想过为啥每次订单爆了,都能及时供上货?
谷歌介绍 Call Notes AI 功能:本地运行,摘录通话内容
谷歌公司在今天凌晨 1 点举办的 Made By Google 活动中,在发布 Pixel 9 系列手机之外,还介绍了全新的 Call Notes 功能,可摘录、总结通话内容。Call Notes 功能简介Call Notes 功能隶属于 Call Assist 工具集,可以调用 AI 来摘录用户的通话内容,如果用户在没有纸笔的情况下,想要梳理通话内容或者想要记录某个电话号码,该功能可以非常方便地处理重要信息。用户操作也非常简单,打开 Google Phone 应用程序,点击联系人,就能看到最近一次的通话摘要,而且
昆仑万维发布全球首个 AI 流媒体音乐平台 Melodio:持续、稳定生成特定风格歌曲
昆仑万维今日宣布,正式发布全球首个 AI 流媒体音乐平台 Melodio,并同步推出 AI 音乐商用创作平台 Mureka。据介绍,用户根据此刻的场景或心情在 Melodio 输入 Prompt(提示),Melodio 便会持续生成相应风格的定制化音乐。用户在 Melodio 音乐生成与播放过程中可以随时修改输入文案,改变音乐生成内容,还能够实时查询生成的歌词,并对于喜欢的片段进行保存、分享。▲ Melodio 使用页面官方还表示,Melodio 是业内首个能够持续、稳定生成特定风格歌曲(如:中国风、Rap、DJ
全球最强AI程序员:GPT-4o加持,需求到跑通只需84秒
大家都在排 waitlist。大模型正在「替代人类程序员」的道路上快速前进。今年 3 月,人工智能软件工程师 Devin 引爆了 AI 社区,该产品由 OpenAI 的 GPT-4 基础大型语言模型(LLM)提供支持,可以在收到自然语言文本指令后自主编写和编辑代码。但在生成式 AI 领域,快速发展是主旋律,现在技术又迭代了。本周,一家 Y Combinator 支持,名为 Cosine 的创业公司宣布推出自己的全新自主 AI 工程师 Genie。该公司表示,Genie 的表现轻松超越了 Devin,在第三方基准测试
Fireworks乔琳:AI产品上市时间从五年压缩到五天,我们的秘诀是什么?
在大模型革命的第一波浪潮中,许多初创公司和企业基于领先的闭源模型,如OpenAI的ChatGPT设计自己的商业模式。 然而,随着越来越多新的开源模型的出现,大模型从训练转向推理,基于大模型的商业模式也在悄然改变。 最近,在人工智能领域,一家名为Fireworks AI的公司迅速崭露头角。
浩瀚智驾2.0首发,2025款极氪001、极氪007全能上市
今日,极氪智能科技正式发布2025款极氪001与2025极氪007,官方起售价分别为25.90万元和20.99万元。即日起,用户可通过极氪App、极氪官网、极氪小程序、全国各大城市的极氪门店等官方渠道进行预定。8月14日,2025款极氪001、极氪007将正式开启全国交付。2025款极氪001购车权益:2024年8月13日到2024年9月30日24:00(含)支付定金5000元的用户可享限时购车权益:极氪新车首任车主,于2024年9月 30日24:00(含)前下定的首台2025款极氪001可享10000元尾款抵扣。
AMD 6.65 亿美元收购 Silo AI;Genie 击败 Devin、GPT-4,刚获 250 万美元融资丨AI情报局
今日融资快报AMD 收购欧洲第一私人AI实验室 Silo AI 交易价值约6.65亿美元AMD 宣布,已经正式完成了对Silo AI的收购,后者是欧洲规模最大的私人人工智能实验室之一。 此次交易的价值约为6.65亿美元,折合人民币约47.7亿元,AMD将全部以现金方式支付。 这笔交易是自 Google 在 2014 年以约 4 亿英镑收购英国 DeepMind 之后,欧洲最大规模的私人 AI 创新公司并购案。
集体诉讼已受理:艺术家指控 Stability AI、Midjourney 等公司非法利用其版权内容训练 AI
美国当地法院主审法官昨日(8 月 13 日)裁定,可以继续推进 AI 图片训练集体诉讼案件,不过驳回了部分诉求。AI在线从报道中获悉,原告由多名艺术家组成,被告为 Stability AI、Midjourney 和其它 AI 相关公司,原告指控其非法使用版权作品用于训练 AI。该集体诉讼原告表示,目前诸多主流 AI 文生图服务所使用的数据集中,包含了他们创造的版权作品。法官威廉・奥里克(William Orrick)批准了针对 Stability 公司的额外诱导性版权侵权索赔,并受理原告对 DeviantArt(该
快手推出“飞船”App:基于“快意”AI 模型,主打虚拟陪伴
快手在发布可灵图生视频模型之后,最新推出了“飞船”(Kraft)AI 对话助手,提供个性化的对话体验。官方介绍称,飞船(Kraft)智能助手 App 是一款基于先进 AI 技术的互动软件,旨在提升用户的生活质量和工作效率。用户可以通过文字或语音与 AI 助手进行交流,解答疑问、获得娱乐、进行创作和角色定制等。用户在飞船平台上扮演“船长”角色,名为快快的 AI 少女领航员引导用户体验,飞船基于快手自研大模型“快意”,更侧重于虚拟陪伴,拥有快速的回复速度和逼真的语音体验。用户可以在该应用中创建和定制专属 AI 虚拟角色
谷歌发布 Gemini Live:支持 AI 语音聊天,可模拟面试场景、推荐演讲技巧
谷歌在今天召开的 Pixel 9 系列手机发布会上,发布了 Gemini Live 服务,将于今天开始率先面向使用英语的 Gemini Advanced 订阅用户开放。 推动自然、流畅的对话交流谷歌表示 Gemini Live 提供了一种移动对话体验,让用户和 Gemini 展开自由流畅的对话。Gemini Live 可以说是对标 OpenAI ChatGPT 最新上线的 Advanced Voice 模式(限量 Alpha 测试),采用了增强型语音引擎,可以展开更连贯、更有情感表达力、更逼真的多轮对话。谷歌表示用
谷歌发布 Pixel Studio 本地 AI 文生图应用:基于 Imagen 3 模型,2 秒内生成
谷歌公司在今天召开的 Pixel 9 系列手机发布会上,推出名为 Pixel Studio 的全新图像生成应用,并表示将预装在每台 Pixel 9 系列手机上。用户可以在 Pixel Studio 应用中输入提示词,要求其生成图片。谷歌 Pixel Studio 应用采用本地运行生成,基于谷歌自己的 Imagen 3 模型,主要生成艺术风格的图片,而写实风格的图片效果比较差。以生成下面这张小猫为例,生成时间不超过 2 秒。谷歌 Pixel Studio 应用依赖谷歌 Tensor G4 SoC 芯片来生成图片,如果
神器大盘点!B站700万人气的AI整活视频都是如何完成的?
大家好,这里是和你们一起探索 AI 的花生~
巴黎奥运会已经结束了,这段时间除了观看激动人心的竞赛,我的另一大乐趣就是在 B 站看各种奥运会的吐槽/整活视频。而在这个过程中,我也发现不少视频都用上了 AI 技术,给人带来了新的观看体验。那么今天就和大家聊聊其中比较新奇有趣的效果以及相关实现方法,说不定哪天你也用得上~
相关推荐:一、视频角色替换
首先是一个调侃在奥运 会开幕式上出场的 “蓝精灵” 的视频。由于 “蓝精灵” 的装扮造型和 86 版《西游记》里的青狮怪非常相似,于是一个 B 站 up 主借用了电影《美人
3Cap 王康曼:我为什么投资 Cerebras Systems?
访谈 | 陈彩娴撰文丨朱可轩、赖文昕编辑丨陈彩娴本月初,美国知名 AI 芯片创业公司 Cerebras Systems 官宣,其已经向美国证券交易委员会 (“SEC”) 提交了一份有关其普通股首次公开发行的表格 S-1 登记声明草案——这一声明,进一步证实了外界对其今年计划上市的猜想。 Cerebras Systems 成立于 2015 年,创始人是 Andrew Feldman,是一家以打破英伟达垄断为目标的美国 AI 芯片创业公司。 它们为业内熟知的标签有二:一是研发了世界上最大的芯片,从最初的 WSE-1到今年新发布的 WSE-3 均体量庞大;二是曾在 2018 年 D 轮获得 OpenAI CEO Sam Altman 的注资。
AI在用 | 微软总裁疯狂安利的AI小游戏,虐我千千万万遍
机器之能报道编辑:杨文以大模型、AIGC为代表的人工智能浪潮已经在悄然改变着我们生活及工作方式,但绝大部分人依然不知道该如何使用。因此,我们推出了「AI在用」专栏,通过直观、有趣且简洁的人工智能使用案例,来具体介绍AI使用方法,并激发大家思考。 我们也欢迎读者投稿亲自实践的创新型用例。天啊噜,AI 真的成精了。最近,AI 生图真假难辨这事儿,闹得那叫一个沸沸扬扬。(查看详情,请移步:AI在用 | 三步速成AI美女,又被AI一秒打回原形)除了火爆全网的 AI 谷歌小姐姐,社交平台上又冒出了形形色色的 FLUX 生
非Transformer架构站起来了!首个纯无注意力大模型,超越开源巨头Llama 3.1
Mamba 架构的大模型又一次向 Transformer 发起了挑战。Mamba 架构模型这次终于要「站」起来了?自 2023 年 12 月首次推出以来,Mamba 便成为了 Transformer 的强有力竞争对手。此后,采用 Mamba 架构的模型不断出现,比如 Mistral 发布的首个基于 Mamba 架构的开源大模型 Codestral 7B。今天,阿布扎比技术创新研究所(TII)发布了一个新的开源 Mamba 模型 ——Falcon Mamba 7B。先来总结一波 Falcon Mamba 7B 的亮点
论文荣登计算机体系结构顶会ISCA,芯片架构成为边缘AI最佳并行计算选择
AI 大模型的爆发带动了 GPU 的强劲需求,从云端到边缘渗透的 AI 应用也将带动边缘 AI 服务器及加速处理器的需求。通过对比 GPGPU、FPGA、NPU 和 ASIC,可重构计算架构 CGRA 成为最适合边缘 AI 的并行计算架构。由芯动力提出的可重构并行处理器(RPP)是比传统 CGRA 更适合大规模并行处理的计算架构,这不但通过试验评测得到证实,而且也通过 ISCA 会议得到国际学术权威的认可。基于 RPP 架构的 R8 芯片及后续更高性能的迭代芯片将是边缘 AI 服务器和 AI PC 的理想 AI 加