应用
Meta 发布 AI Studio:让用户零编程创建、分享和定制 AI 角色
Meta 公司昨日(7 月 29 日)发布 AI Studio,目标让用户创建、分享和定制 AI 角色。Meta AI Studio 基于 Llama 3.1 模型,在不需要任何技术或者技能情况下,可以让任何人都来创建定制 AI 角色。创建者可以将所创建的 AI 角色作为其延伸,回答私信或者回复网友,从而接触到更多受众。Meta 公司在新闻稿中写到:“我们的目标是构建所有人都能利用 AI 创意能力的世界,而 AI Studio 让我们迈出了第一步,这仅仅是开始”。AI在线注:Meta AI Studio 目前提供了
QuestMobile2024中国移动互联网半年报:超级APP集体发力内嵌式AI
7月30日,知名数据监测机构QuestMobile发布了《2024年中国移动互联网半年报告》。报告显示,各种技术形态的AIGC应用正在迎来大爆发。2024年6月,AIGC类APP的月活跃用户规模达6170万,同比增长653%。与此同时,淘宝、支付宝、抖音等国内流量规模前20的超级APP,集体发力内嵌式AI应用,成为另一股主力军。 《报告》显示,全网排名前20头部APP的内嵌 AI,主要分为智能助理、智能搜索、智能导购等方向,和各家业务场景强结合,突出对消费者的实用性。智能助理部分以支付宝的AI生活助理和 AI金融助
Getty 携手英伟达升级 AI 文生图服务:6 秒生成 4 张照片、提示词最多 250 个单词
Getty Images 和英伟达公司昨日(7 月 29 日)发布声明,联合推出安全的商业文生图 AI 模型,能够在 6 秒时间内生成 4 张照片,比以前的模型性能提高了一倍,速度处于行业领先水平。图源:英伟达Getty Images 表示全新文生图 AI 模型部分基于英伟达 Edify 模型架构,该架构隶属于英伟达 Picasso,主要为视觉设计搭建和部署生成式 AI 模型。英伟达 Edify 模型架构不仅能够带来更快的生成速度、更高的质量、更符合用户输入的提示词,而且该改进了 4K 采样和微调模型的能力。相比较
汇智智能CarrotAI大模型通过大模型服务备案
近日,由江苏汇智智能数字科技有限公司(以下简称汇智智能)自主研发的CarrotAI大模型通过国家大模型服务备案(上线备案号:Jiangsu-CarrotAI-202407030002)。作为南京第4家,江苏省第7家通过大模型服务备案的科创企业,此次备案的通过意味着汇智智能将面向大模型行业上下游伙伴、客户提供更有力的软硬件联合优化服务,从而推动生成式人工智能行业的可持续发展。而就在不久前,汇智智能自主研发的文本生成算法通过《第六批深度合成服务算法》备案,双备案的通过更是对汇智智能在人工智能领域的深厚积累和创新实力的认
刚刚,Meta开源「分割一切」2.0模型,视频也能分割了
还记得 Meta 的「分割一切模型」吗?这个模型在去年 4 月发布,被很多人认为是颠覆传统 CV 任务的研究。时隔一年多,刚刚,Meta 在 SIGGRAPH 上重磅宣布 Segment Anything Model 2 (SAM 2) 来了。在其前身的基础上,SAM 2 的诞生代表了领域内的一次重大进步 —— 为静态图像和动态视频内容提供实时、可提示的对象分割,将图像和视频分割功能统一到一个强大的系统中。SAM 2 可以分割任何视频或图像中的任何对象 —— 甚至是它以前没有见过的对象和视觉域,从而支持各种不同的用
又一「国产版Sora」全球上线!清华朱军创业团队,视频生成仅需30秒
AI 视频圈正「互扯头花」。国外的 Luma、Runway,国内的快手可灵、字节即梦、智谱清影…… 你方唱罢我登场。无一例外,它们对标的都是那个传说中的 Sora。其实,说起 Sora 全球挑战者,生数科技的 Vidu 少不了。早在三个月前,国内外视频生成领域还一片「沉寂」之时,生数科技突然曝出自家最新视频大模型 Vidu 的宣传视频,凭借其生动逼真、不输 Sora 的效果,惊艳了一众网友。就在今天,Vidu 正式上线。无需申请,只要有个邮箱,就能上手体验。(Vidu官网链接:www.vidu.studio)例如,
Runway深夜炸场,Gen-3 Alpha图生视频上线,11秒让你脑洞乱飞
网友不吝赞叹:AI 视觉生成又迈出了一大步。今天凌晨,Runway Gen 3 Alpha 模型的图生视频功能正式上线!用户可以使用任何图片作为视频生成的首帧。上传的图片既可以单独使用,也可以使用文本提示进行额外指导。目前,Gen 3 Alpha 支持生成的视频最长为 11 秒。作为一项重大更新,Runway 表示,图生视频功能将极大提高了生成视频的艺术控制和一致性。至于效果如何,大家可以先来欣赏以下官方给到的图生视频示例。Runway 联合创始人兼 CEO Cristóbal Valenzuela 发推表示,是时
只要一张图就能「还原」绘画过程,这篇论文比爆火的Paints-UNDO实现得更早
AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected];[email protected]作者介绍:宋亦仁:新加坡国立大学 ShowLab 博士研究生, 主要研究方向包括图像和视频生成, AI 安全性。 黄施捷:新加坡国立大学硕士二年级学生,目前在 Tiamat AI 任算法工
AI 图像生成平台 LiblibAI 融资总额达数亿元;Meta 曝训练 Llama 3 每 3 小时「罢工」一次丨AI情报局
今日融资快报AI 图像生成平台 Liblib AI 融资总额达数亿元 AI图像生成平台 LiblibAI哩布哩布AI一年内,已经完成了三轮融资,总金额达数亿元人民币,天使轮投资方为源码资本、高榕创投和金沙江创投;第二轮由战略投资方领投;第三轮由明势资本领投;老股东持续多轮加持。 其中,远识资本为多轮融资的独家财务顾问。 (智能涌现)宠物共情 AI 公司 Traini 获千万天使轮融资AI应用Traini不仅能让用户听懂狗狗的叫声,还能看懂狗狗的面部表情、身体行为等语言,来了解狗狗的心理状况。
Meta SAM 2 登场:首个能在图片和视频中实时分割对象的统一开源 AI 模型
感谢Meta 公司发布 Meta Segment Anything Model 2(SAM2),SAM 2 能分割任何目标,能在一个视频中实时追踪所有镜头 —— 解锁新的视频编辑能力并在混合现实中提供新的体验。Meta 公司今天发布新闻稿,介绍了全新的 Meta Segment Anything Model 2(SAM 2)模型,先支持分割视频和图像中的对象。开源Meta 公司宣布将以 Apache 2.0 许可发布 SAM 2,因此任何人都可以使用它来构建自己的体验。Meta 还将以 CC BY 4.0 许可共享
黄仁勋、扎克伯格支持 AI 大模型开源,两人互换外套
感谢当地时间 7 月 29 日,在美国丹佛举行的第 51 届 SIGGRAPH 图形大会上,英伟达创始人 CEO 黄仁勋和 Meta 创始人 CEO 马克・扎克伯格举行炉边谈话,讨论人工智能和仿真模拟的未来。这场对话一开始还算正常,黄仁勋热情洋溢地介绍了英伟达 GPU 的强大功能,扎克伯格则畅谈了他对 AI 聊天机器人的未来愿景。黄仁勋还称赞了 Meta 的开源大模型,他与扎克伯格都同意应坚持大模型的开源路线。但随后画风突变,在对谈接近尾声时,两人竟然互换了外套。扎克伯格表示,他为黄仁勋准备了一件黑色皮革和羊毛皮外
15000字干货!AI搜索产品如何做好用户体验设计?
最近在使用 360AI 搜索的时候遇到一个比较严重的产品设计问题,非常影响体验。
在 360AI 搜索首页,和普通搜索产品类似,有信息流和今日热搜两个模块。昨天偶然看到一条热搜是「工资四千月工作 300h」,这个标题确实很吸引人,所以作者打开了这条热搜想看看详细信息,结果打开的页面内容是这样的:标题和内容完全对不上!
原因也简单,360AI 搜索使用了大模型能力对输入的信息进行了处理,而不是点击这条热搜新闻直接打开一个链接。
按照传统的搜索引擎的做法一般是把关键词“月薪 4000 工作 300 小时”匹配到各个新闻
苹果:曾使用谷歌硬件来训练 Apple Intelligence 模型
苹果公司周一在一篇技术论文中表示,支撑其人工智能系统 Apple Intelligence 的两个人工智能模型是在谷歌设计的云端芯片上进行预训练的。这篇名为《Apple Intelligence 基础语言模型(Apple Intelligence Foundation Language Models)》的论文详细介绍了该模型的构建过程和数据来源。论文中的一段描述暗示,苹果可能在初期阶段使用了谷歌的硬件。论文提到,苹果的基础模型(AFM)及其背后的服务器技术最初是在“v4 和 v5p 云端 TPU 集群”上构建的,使
数据安全看得见:苹果 Apple Intelligence 提供详细隐私报告
苹果公司在 iOS 18.1 和 macOS Sequoia 15.1 的首个测试版中推出了名为“Apple Intelligence”的新 AI 功能的预览。该公司不仅详细介绍了这些功能的工作原理和背后的隐私机制,还允许用户查看一份详细的隐私报告,了解 Apple Intelligence 如何处理他们的请求。Apple Intelligence 是苹果对新 AI 功能的统称。例如,用户现在可以要求系统改写文本,或总结消息或电子邮件。这些功能既可以使用设备上的语言模型,也可以使用在线语言模型。为了确保用户隐私,苹
别认为对话式交互是进步!详解对话式交互的6大缺点
最近两年很多 AI 产品出现之后都采用了对话式(Chat)的形式。导致很多人认为对话形式(Chat)交互相对于常见的图形化界面是一种进步。事实并非如此。
这种错误认知可能因为把 AI 技术与对话式交互画上了等号,在看到 AI 技术迅猛发展的时候。就同样认为对话式更优秀。
但这种交互形式被众多 AI 产品使用的原因只是因为这一波 AI 浪潮最大的技术进步是大语言模型。而大语言模型的核心功能之一就是生成内容。加上 OpenAI 最早使用了这种形式被后来者效仿。
在 2017 年前后上一波 AI 浪潮中,主要的技术发展方
因用户数据自动被用于训练 xAI, X(推特)面临欧洲监管机构质询
感谢据《金融时报》当地时间周六报道,欧洲数据保护监管机构正在“寻求澄清”埃隆・马斯克的 X(推特)决定允许用户数据自动输入其人工智能初创公司 xAI 的举动,此举对该平台提出了新的监管审查。AI在线附事件背景:当地时间上周五,X 用户发现他们已“自动选择”将其帖子以及与 xAI 旗下 Grok 聊天机器人的互动用于“训练和微调”xAI 系统,此举是在未事先获得用户明确同意的情况下进行的数据共享。但是,用户只能通过 X 的桌面版本中进行设置,目前无法通过移动端 App 选择拒绝。负责执行欧盟隐私法的爱尔兰数据保护委员
Llama3.1 训练平均 3 小时故障一次,H100 万卡集群好脆弱,气温波动都会影响吞吐量
每 3 个小时 1 次、平均 1 天 8 次,Llama 3.1 405B 预训练老出故障,H100 是罪魁祸首?最近有人从 Meta 发布的 92 页超长 Llama 3.1 论文中发现了华点:Llama 3.1 在为期 54 天的预训练期间,经历了共 466 次任务中断。其中只有 47 次是计划内的,419 次纯属意外,意外中 78% 已确认或怀疑是硬件问题导致。而且 GPU 问题最严重,占了 58.7%。Llama 3.1 405 模型是在一个含 16384 块 Nvidia H100 80GB GPU 集群
GPT-4o mini 凭什么登顶竞技场?OpenAI 刷分秘诀被扒,原来奥特曼早有暗示
为啥 GPT-4o mini 能登顶大模型竞技场??原来是 OpenAI 会刷分呀。这两天,lmsys 竞技场公布了一份充满争议的榜单。其中才面世不久的 GPT-4o mini 和满血版并列第一,把 Claude 3.5 Sonnet 甩在身后。结果网友炸锅了,大家凭体感觉得这不可能。哪怕后面 lmsys 做过一次声明,表示大家别只看总榜,还要更关注细分领域的情况。也没能让大家满意,不少人觉得 lmsys 就是从 OpenAI 那收钱了。终于,官方晒出了一份完整数据,展示了 GPT-4o mini 参与的 1000