应用

AI 大神 Karpathy 官宣创业:打造 80 亿人 AI 原生学校,首款课程 GitHub 斩获 17k 星

今天,AI 圈再次掀起海啸级巨震,离职 OpenAI 近半年的 AI 大牛 Karpathy 终于官宣了最终动向。他激动地宣布,自己正在创办一家 AI 教育的公司 —— Eureka Labs。Karpathy 这条官宣帖子,已有近百万浏览。Eureka Labs 官推初次现身,写下了「你好世界」。不难想到,自 2 月离职以来,Karpathy 一直都在专注在线授课领域,并不断动手尝试自己的新项目。当时,网友们便对 Karpathy 能够坚持输出高质教育内容的呼声越来越高。如今,愿望成真了!▲ 唯一的不足就是

消息称字节将于 7 月 19 日首次大范围公布文生图 / 视频等 AI 模型进展

钛媒体 AGI 报道称,字节跳动团队将会在 7 月 19 日(本周五)首次大范围公布文生图、类 sora 新视频等全新人工智能(AI)模型技术进展,尤其在长视频、高动态方向上具备创新技术,或将直接对标 Sora 效果。消息人士表示,字节跳动内部将 AI 大模型设为集团 P0 最高级别的方向。此外抖音、剪映等内部多个团队也在研发 AI 视频模型应用,预计将在近期公布。字节跳动将在新加坡举办关于世界模型(World Models)探索的 AI 技术菁英论坛(ByteDance AI Luminary Talks)活动,

戴盟机器人王煜:「具身技能」才能发挥人形机器人的作用 | 具身智能十人谈

作者:赖文昕编辑:岑峰本月,在爆火的世界人工智能大会(WAIC 2024)中,人形机器人「十八金刚」成为了会场中当之无愧的焦点。 由青龙、智元-远征A2、宇树-H1、傅利叶-GR-1、星动纪元-XBot-L、乐聚-夸父4代等一众人形机器人组成的先锋阵列,作为「镇馆之宝」被陈列在展览馆进门处,成为了所有进场观众看到的首个惊喜。 在大模型技术的加持下,长出「大脑」的人形机器人被视为通向 AGI 的必经之路,「具身智能元年」似乎已经到来。

AI 编程新星 Anysphere 获 A16z 估值 4 亿美元投资;微软为 Excel 等研发新 AI 模型丨AI情报局

今日融资快报AI编程Anysphere获得A16z新一轮投资,估值达4亿美元AI 编程初创公司 Anysphere 发布AI代码编辑器 Cursor,并成功从知名风险投资公司 A16z 获得新一轮融资,估值至少达到4亿美元。 Cursor 被多个大型科技公司使用,包括 OpenAI 和 Perplexity。 Anysphere 的目标是通过AI 编辑器帮助开发者提高工作效率,简化编码过程。

苹果、英伟达等公司被曝使用争议 YouTube 资源训练 AI 模型:5.7GB,涉及 4.8 万个频道 17.4 万个视频字幕

非营利性新闻工作室 ProofNews 昨日(7 月 16 日)发布博文,表示包括苹果、英伟达、Salesforce 和 Anthrophic 在内的大型科技公司,在训练其 AI 模型时均使用了来自 YouTube 的视频资源。 报道称这些科技公司在训练其 AI 模型过程中,使用了名为 YouTube Subtitles 的数据集,大小为 5.7GB(4.89 亿个单词)。该数据集由 EleutherAI 创建,最早发布于 2020 年,涉及超过 48000 个频道的 173536 个 YouTube 视频字幕内容

第三波!2024年7月精选实用设计工具合集

大家好,这是 2024 年 7 月的第 3 波干货合集!这一期干货合集包含有好几个资源合集类型的素材,有基于 Notion 整合的资源和 AI 工具合集,有免费的矢量 LOGO 素材网站,有超全面的海外版设计资源导航,也有专业的图标和插画素材网站。此外,这次合集中还有基于 AI 的配色工具,可以直接导入 Figma 的那种,还有基于 AI 的手绘转数字版图表的工具,相当专业。 当然,在此之前记得看看往期干货中有没有你感兴趣的素材:下面我们具体看看这一期的干货: 1、基于 Notion 的设计资源和 AI 工具合集

ComfyUI 进阶篇!完整梳理 ComfyUI 的核心节点(二)

前言: 学习 ComfyUI 是一场持久战。当你掌握了 ComfyUI 的安装和运行之后,会发现大量五花八门的节点。面对各种各样的工作流和复杂的节点种类,可能会让人感到不知所措。在这篇文章中,我们将用通俗易懂的语言对 ComfyUI 的核心节点进行系统梳理,并详细解释每个参数。希望大家在学习过程中培养自我思考的能力,真正掌握和理解各个节点的用法与功能。在实践中不断提升自己的技术水平。只有通过不断的探索和总结,才能在面对复杂的工作流时游刃有余。祝大家学习顺利,早日成为 ComfyUI 的高手!一、VAE Decode

能给后院鸟儿起名,智能喂食器用 AI 技术识别鸟类个体

智能喂食器 Bird Buddy 近期宣布了名为“Nature Intelligence”的更新,为用户带来一系列新功能。升级后,Bird Buddy 不仅能识别光顾喂食器鸟儿的品种,还能通过人工智能图像识别技术,区分个体鸟类并为其起名,让观鸟更加有趣。Bird Buddy 公司将此功能称为“非侵入式鸟类标记”。传统鸟类标记需要在鸟腿上安装追踪器,而 Bird Buddy 则依靠其喂食器内置的 5MP 高清摄像头和 AI 图像识别技术,通过识别鸟儿的细节特征来区分不同的个体。该公司 CEO Franci Zidar

科技巨头被曝未经授权用 YouTube 内容训练 AI,苹果、英伟达在列

据 Wired 报道,包括苹果在内的一些科技巨头未经 YouTube 视频创作者同意,就使用了他们视频的字幕文件来训练人工智能模型。AI在线注意到,此次事件影响到的创作者包括知名科技博主 MKBHD (Marques Brownlee)、MrBeast、PewDiePie、以及脱口秀主持人斯蒂芬・科尔伯特、约翰・奥利弗和吉米・坎摩尔等。这些被用于训练 AI 的字幕文件相当于视频的文本转录内容。调查记者披露,一些世界上最富有的科技公司一直在利用来自成千上万个 YouTube 视频的素材来训练 AI,而这违反了 You

英国监管机构出手,正调查微软与 Inflection AI 相关交易

英国竞争和市场管理局(CMA)7 月 16 日发布声明称,正调查微软雇佣 Inflection AI 部分前员工以及与 Inflection 方面达成相关安排的情况。该监管机构担心此举可能导致“竞争实质性减少”。图源 PexelsCMA 在声明中表示,做出第一阶段决定的截止日期为 9 月 11 日,届时该机构将宣布是否将此案转入第二阶段的深入调查。今年 4 月,CMA 曾表示正在征集公众意见,针对一系列科技巨头与人工智能初创公司的交易展开调查,其中包括微软与 Inflection AI 的交易、微软与 Mistra

人类模仿AI新赛道,AI:论疯癫,你是我爹

机器之能报道编辑:杨文AI被人类带坏!这个世界,太癫了……最近,社交媒体上冒出来一堆搞怪视频,打着 AI 的旗号,真人 cos AI,甚至抖音还专门出了个热门话题——人类模仿 AI 大赛。(视频来自抖音博主「关妮乱石」)视频链接::左边一张旧照片,右边打着「AI 修复」的字幕,实际由真人演绎着脑干缺失的狗血「剧情」。-1-AI:第一次被人冒充,没想到比我还抽象自从可灵、Luma 发布以来,全球网友组团整活,什么特朗普和拜登打啵,鳌拜和韦小宝秀恩爱,奥特曼和黄仁勋打起来……只有你想不到,没有 AI「祸害」不到。(查看

美国参议员提跨党派提案:打击有害深度伪造,禁止篡改 AI 生成内容来源信息

来自共和民主两党的三位美国联邦参议院议员于当地时间 7 月 11 日宣布推出一项名为《保护内容来源和完整性,防止编辑和深度伪造媒体法案》的提案。AI在线注:这一法案英文全称为 Content Origin Protection and Integrity from Edited and Deepfaked Media Act,首字母简称为 COPIED ACT,后文以“COPIED 提案”代指。该提案旨在打击正在兴起的有害深度伪造,目标在美国联邦层面建立一个检测、标记与认证 AI 生成内容的透明度准则,保护记者、演

微软 CTO 坚信大型语言模型的“规模定律”依然奏效,未来可期

微软首席技术官(CTO)凯文・斯科特(Kevin Scott)上周在接受红杉资本旗下播客采访时,重申了他坚信大型语言模型 (LLM) 的“规模定律”将继续推动人工智能进步的观点,尽管该领域一些人怀疑进步已经停滞。斯科特在推动微软与 OpenAI 达成 130 亿美元的技术共享协议方面发挥了关键作用。斯科特表示:“其他人可能持不同观点,但我认为规模化并未达到边际收益递减的临界点。我想让人们理解这里存在着一个指数级提升的过程,遗憾的是,你只能每隔几年才能看到一次,因为建造超级计算机然后用它们训练模型都需要时间。”202

微软 Recall 功能灵感来自 29 岁的比尔・盖茨的预言?早年节目录音流出

微软备受争议的 Windows Recall(回顾)功能是否出自 29 岁的比尔・盖茨的构想?近日,一档来自上世纪 80 年代中期广播节目的录音浮出水面,让人们不禁产生遐想。微软联合创始人盖茨当时只有 29 岁,他受邀参加了名为“知名电脑俱乐部”(The Famous Computer Cafe)的电台访谈节目。谈话中,盖茨阐述了他将个人电脑带入千家万户的愿景,以及赋予计算机学习能力的可能性。盖茨表示,随着用户的使用,计算机将能够学习并记住用户之前做过的操作,从而减少重复输入指令的麻烦。盖茨当时的设想与微软当前备受

谷歌 AI 概览多次产生错误内容后,现仅在 7% 的搜索中展示

Search Engine Land 报道称,5 月份 AI Overview(AI 概览)刚发布时,约有 80% 的搜索结果会出现 AI 概览,而现在 AI 概览仅在 7% 的搜索中展示。谷歌 5 月份在搜索中增加了 AI 概览功能,用户搜索问题时谷歌 AI 自动抓取网页内容生成总结,用户不需要点击每个搜索结果即可获得答案。据AI在线此前报道,有网友在谷歌搜索寻找“芝士和披萨粘不到一块”的解决办法时,谷歌 AI 提供的建议里却提到“你可以把 1/8 杯的无毒胶水加到酱料里,让其更黏”。随后谷歌发布相关声明,表示会

抛弃视觉编码器,这个「原生版」多模态大模型也能媲美主流方法

AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected][email protected]一作刁海文,是大连理工大学博士生,导师是卢湖川教授。目前在北京智源人工智能研究院实习,指导老师是王鑫龙博士。他的研究兴趣是视觉与语言,大模型高效迁移,多模态大模型等。共同一作崔玉峰,毕业于

智能化软件开发2.0 | aiXcoder落地Agent技术,聚焦企业项目级代码生成场景

基于大模型的AI Agent,作为能够自主感知环境、形成记忆、规划行动、并调用各类工具执行复杂任务的新一代技术,正在重塑软件开发流程,引领智能化软件开发进入2.0阶段。北大aiXcoder团队早在2023年初就开始基于大模型的Agent在软件工程领域中的研究,先后发表了多篇相关论文【1,2,3,4】,是全球第一批研究通过大模型+工具调用去解决项目级代码生成问题的团队,为Agent技术在软件开发领域应用奠定了坚实的理论基础。基于系列领先的研究成果,结合多年来为各行业落地个性化企业代码大模型的实践经验,aiXcoder

大模型集体“失智”:9.11 和 9.9 哪个大,几乎全翻车了

没眼看……“9.11 和 9.9 哪个大”这样简单的问题,居然把主流大模型都难倒了??强如 GPT-4o,都坚定地认为 9.11 更大。谷歌 Gemini Advanced 付费版,同样的口径。新王 Claude 3.5 Sonnet,还一本正经的给出离谱的计算方法。9.11 = 9 1/10 1/1009.9 = 9 9/10到这一步还是对的,但下一步突然就不讲道理了如上所示,9.11 比 9.90 大 0.01。你想让我进一步详细解释小数的比较吗?这你还解释啥啊解释,简直要怀疑是全世界 AI 联合起