应用

18个月326项能力,这家大厂猛猛上新生成式AI,如今纯靠Prompt就搞定企业级应用了

构建生成式 AI 应用,现在只需要几分钟。「生成式 AI 的半衰期只有六个月,」亚马逊云科技全球 AI 产品副总裁 Matt Wood 说道。2024 开启下半年,人们发现,生成式技术和落地之间的距离,已经不能用「远」或「近」完全概括。狂热的百模大战之后,即使生成式 AI 技术展现出了前所未有的能力,为何一部分企业还没有投身到新技术的变革之中?技术门槛和高昂的研发投入、应用成本是它们保持谨慎态度的主要影响因素。今天凌晨,亚马逊云科技给全世界带来了解决方案。一系列生成式 AI 技术的重磅发布,将全球最先进的大模型技术

GitHub 8k Star,一作实习生,字节这个大模型成果被苹果选中了

字节跳动大模型团队成果 Depth Anything V2 现已被苹果官方收入 Core ML 模型库。本文介绍了 Depth Anything 系列成果的研发历程、技术挑战与解决方法,分享了团队对于 Scaling Laws 在单一视觉任务方面的思考。值得一提的是,Depth Anything V1 与 V2 两个版本论文一作是团队实习生。近日,字节跳动大模型团队开发的成果 Depth Anything V2 ,入选苹果公司 Core ML 模型库,目前已呈现在开发者相关页面中。Depth Anything 是一

AI 根据声音内容帮照片“对口型”,蚂蚁集团开源 EchoMimic 项目

蚂蚁集团 10 日开源了名为 EchoMimic 的新项目,其能够通过人像面部特征和音频来帮人物“对口型”,结合面部标志点和音频内容生成较为稳定、自然的视频。该项目具备较高的稳定性和自然度,通过融合音频和面部标志点(面部关键特征和结构,通常位于眼、鼻、嘴等位置)的特征,可生成更符合真实面部运动和表情变化的视频。其支持单独使用音频或面部标志点生成肖像视频,也支持将音频和人像照片相结合做出“对口型”一般的效果。据悉,其支持多语言(包含中文普通话、英语)及多风格,也可应对唱歌等场景。 AI在线附相关链接:项目地址: G

这些VLM竟都是盲人?GPT-4o、Sonnet-3.5相继败于「视力」测试

四大 VLM,竟都在盲人摸象?让现在最火的 SOTA 模型们(GPT-4o,Gemini-1.5,Sonnet-3,Sonnet-3.5)数一数两条线有几个交点,他们表现会比人类好吗?答案很可能是否定的。自 GPT-4V 推出以来,视觉语言模型 (VLMs) 让大模型的智能程度朝着我们想象中的人工智能水平跃升了一大步。VLMs 既能看懂画面,又能用语言来描述看到的东西,并基于这些理解来执行复杂的任务。比如,给 VLM 模型发去一张餐桌的图片,再发一张菜单的图片,它就能从两张图中分别提取啤酒瓶的数量和菜单上的单价,算

视频生成新公司!马尔奖、清华特奖得主曹越创业,「风投女王」押注

继月之暗面之后,眼光毒辣的「风投女王」徐新又投了一家 AIGC 创业公司。近期,有关今日资本裁撤一级市场团队的传言在业内引发关注。7 月 10 日晚,今日资本集团总裁徐新亲自在微信朋友圈辟谣,并透露了一则投资消息:2024 年 5 月,今日资本领投了 SandAI 的早期融资轮。据 IT 桔子数据,北京 SandAI 成立于 2023 年,是一家志在「做世界有影响力的事情」的 AI 创业公司。目前,SandAI 主要聚焦于类似 OpenAI Sora 的视频生成技术,为用户提供高效、便捷的视频生成服务。公司创始人兼

首届AI奥数竞赛方案公布:4支获奖队伍,竟都选择国产模型DeepSeekMath

获胜的 AI 数学奥林匹克模型出炉!几天前,随着榜单的公布,大家对全球首届 AI 数学奥林匹克竞赛(AIMO)进步奖的讨论量居高不下。这次比赛共有 5 个团队胜出,获得第一名的是 Numina 的团队,CMU_MATH 位列第二,after exams 暂居第三,codeinter、Conor #2 团队分别拿到第四、第五的成绩。                             图源:,曾让陶哲轩感到惊讶。当时官方只公布了获奖名单,并未透漏背后模型的更多信息。大家都在好奇,获得冠军的队伍到底是用了哪种模型?

三星确认今年将推出 AI 升级版 Bixby,由自研大语言模型提供支持

三星确认 Bixby 将很快获得人工智能升级。在 Galaxy Z Flip 6 和 Galaxy Z Fold 6 发布后,三星移动部门 CEO TM Roh 在接受 CNBC 采访时表示,公司将在今年晚些时候发布升级版 Bixby,并由三星自家的大语言模型(LLM)提供支持。Roh 表示:“我们将通过应用生成式人工智能技术来提升 Bixby 的能力。”几个月前,三星推出过名为“Samsung Gauss”的自研 LLM。此前曾有报道称三星正在研发升级版 Bixby,但这是三星首次确认相关消息,并透露了大致发布时

帮你把草图变成完整画作,三星 One UI 6.1.1 引入“手稿到图像”等 AI 功能

三星在昨晚的 Galaxy Unpacked 发布会上带来了 Galaxy Z Fold6 / Flip6 等手机新品,两款新机都将内置基于 Android 14 的 One UI 6.1.1。据悉,在此次更新中,三星还带来了一系列基于 Galaxy AI 的新功能,预计后期会登陆其他支持的 Galaxy 系列设备。据介绍,三星此次引入了名为“手稿到图像(Sketch To Image)”的新功能。用户可预先在手机上使用 S-Pen 或徒手绘制草图,Galaxy AI 就会通过 AI 和机器学习创建图形元素,使草图

“云计算一哥”亚马逊深夜放大招:几分钟纯靠 Prompt 打造一个 App

现在开发一个 App 需要多久?“云计算一哥”亚马逊云科技,深夜给出了一个新标准 —— 只需三步,几分钟,纯靠自然语言和鼠标“点点点”即可。话不多说,直接展示!第一步:说出你的想法我们首先可以直接用自然语言描述一下想要打造 App 的需求,例如:为我的团队创建一个应用程序,可以通过一个表单提交项目审批。这个表单将接受详细信息,并允许用户上传相关文件。静候几秒之后,这个 AI 便会根据你的需求,分析总结 App 的用例、流程和关键特征等信息。在确认没问题之后,我们就可以点击右下角的“生成 APP”按钮。第二步:编辑

夸克升级“超级搜索框”  推出AI搜索为中心的一站式AI服务

大模型时代,生成式AI如何革新搜索产品?阿里智能信息事业群旗下夸克“举手答题”。7月10日,夸克升级“超级搜索框”,推出以AI搜索为中心的一站式AI服务,为用户提供从检索、创作、总结,到编辑、存储、分享的一体化信息服务价值。“能回答、能创作、能总结的超级搜索框,是夸克对AI搜索的新定义。”阿里智能信息事业群总裁吴嘉表示,大模型、数据、场景等优势,推动夸克加速革新搜索产品,创造更大用户价值。“跨过大模型应用全新体验的临界点,夸克全面进入AI时代,一站式AI服务的创新涌现将滔滔不绝。”全新AI搜索,一框实现回答、创作、

Anthropic 基于 Claude 3.5 Sonnet 扩充 AI 开发工具:细化提示词、增强评估和测试

Anthropic 公司昨日(7 月 10 日)发布新闻稿,宣布推出了多项新工具,基于 Claude 3.5 Sonnet 大语言模型自动化、细化提示词(prompt)。AI在线附上完整演示视频如下: 增强开发环境,可生成提示Anthropic 控制面板新增“评估”(Evaluate)单元,借助 Claude 3.5 Sonnet 大语言模型,帮助开发者高效地生成、微调和测试提示(Prompt)。这些增强功能旨在改进语言模型对各种任务的响应,为使用 Claude 开发人工智能产品的企业提供宝贵的资源。开发者只需描述

第二波!2024年7月精选实用设计工具合集

大家好,这是 2024 年 7 月的第 2 波干货合集!这一期干货合集有专门生成 SVG 矢量素材的 AI 平台,免费生成 PNG 透明背景的 AI 平台,基于 AI 进行前期产品灵感探索的平台,以及在线生成可编辑 Banner 的 AI 平台,此外还有免费生成渐变背景的工具,以及次世代 3D 可视化设计的平台,都是精选的好东西。 当然,在此之前记得看看往期干货中有没有你感兴趣的素材:下面我们具体看看这一期的干货: 1、AI 生成的免费 SVG 矢量素材合集网站 SVGStud.io 的网站,是一个基于 AI 来

保姆级教程!小学生看了都会的AI视频短片制作教程

前言 我相信这是一篇针对大朋友、小朋友都通俗易懂的视频剧本构思到视频落地的全流程拆解教程。基于大语言模型和绘图模型的前提,有了一次和小伙伴们探索文生图到图生视频的创作实践。 废话不多说,直接上保姆级干货教程!保证你能够轻松学会!学之前,快来看看我们制作的视频短片吧~当视频在手机上无法加载,可前往PC查看。一、前期准备 1. 确定主题 针对于现有的 AI 生成能力,央视推出了多组 AI 视频短片,为此我们也决定生成一个符合时代主旋律的 AI 小视频。经过脑暴阶段,有了一带一路背景下丝绸之路这个角度的创作故事。创作方向

AMD 豪掷 6.65 亿美元收购芬兰 AI 初创公司 Silo AI,欲与英伟达争锋

芯片巨头 AMD 周三宣布,将斥资约 6.65 亿美元(AI在线备注:当前约 48.43 亿元人民币)现金收购芬兰人工智能初创公司 Silo AI。此举旨在增强其人工智能芯片能力,与行业领导者英伟达竞争。大型语言模型的构建和训练即使对于科技巨头来说也是一项挑战。AMD 表示,收购 Silo AI 将帮助其改进 AMD 驱动的人工智能模型的开发和部署,并帮助潜在客户使用 AMD 的芯片构建复杂的人工智能模型。同时,Silo AI 还将加强 AMD 的软件开发能力。“这笔交易不会影响 AMD 的财务业绩,但它将为未来业

HANDS@ECCV24 手部研讨会和挑战赛,诚邀投稿和参与竞赛

简介第八届HANDS将在ECCV24(9月30日下午,米兰)举办,包含研讨会和挑战赛。HANDS将为相关手部研究人员和从业者提供一个分享工作和讨论潜在合作的平台。过去7届HANDS也取得了极大的成功。本文档属于翻译,信息以官网为准。HANDS@ECCV24 主页::研讨会专注于手部相关方向,将邀请手部相关领域的专家做前沿报告。特别的,我们诚邀相关长文投稿。手部挑战赛:挑战赛基于最新的手部大数据集AssemblyHands、ARCTIC、OakInk2和UmeTrack,组织多个赛道,希望推动相关算法的发展。论文投稿

软银支持的基因检测公司 Tempus AI 受华尔街青睐:摩根大通等 7 家券商给出买入或增持评级

据路透社今日报道,当地时间周二开始,华尔街开始纷纷看好软银公司支持的基因检测公司 Tempus AI,该公司拥有 AI 驱动的临床和分子数据库,被认为可带来更强大的诊断和测试工具。AI在线注:Tempus AI 总部位于美国芝加哥,其向临床医师和医院系统销售基因组诊断测试产品,涵盖肿瘤学、精神病学、放射学和心脏病学等领域。包括摩根大通、摩根士丹利、美国银行全球研究部和 Stifel 在内的七家券商首次给予该公司“买入”或“增持”评级,TD Cowen 给出了最高的目标价 50 美元。摩根大通预测,Tempus 的收

《幻兽帕鲁》开发过程中使用生成式 AI?PocketPair 社长:并没有

今年上半年一度爆红的现象级游戏《幻兽帕鲁》曾被质疑在开发过程中使用生成式 AI,引发各界争议。今天上午,该作开发商 PocketPair 社长沟部拓郎亲自下场,发推对此前相关质疑进行回应。沟部拓郎表示,“《幻兽帕鲁》经常被指责(在开发中)使用了生成式 AI,但实际上我们并没有使用它们,上千幅草图都是由艺术家绘制而成的!”而在今年 1 月,就已经有网友发现沟部拓郎是激进的 AI 支持者,他不仅在公司推广 AI 流程,甚至还用 Stable Diffusion 专门做过一款以 AI 绘画为主题的游戏。综合AI在线此前报

京西集团2026中国量产EMB,2035全面线控化

7月10日,京西集团宣布“2035全线控”全球技术战略:未来十年,京西集团将以线控制动、线控悬架和智能系统及架构为全球客户提供更多智能出行解决方案。预计2035年,95%的京西底盘产品将为全线控产品。作为落实该战略的最新进展之一,电子机械制动系统(EMB)已获凯翼汽车和悠跑科技战略合作,将于2026年客户量产。2024年7月10日,京西集团全球CEO郑洁亮宣布全球技术战略京西集团全球CEO郑洁亮宣布的全球技术战略明确了面向未来十年的战略目标——2035年实现智能底盘产品全线控化。该战略以线控制动、线控悬架、系统及架