应用

AI“攻克”CAPTCHA 网站验证系统

互联网时代，网站如何判断访问者是人类用户还是机器人？其中一个被广泛部署的解决方案，就是 CAPTCHA 验证系统。不过在迈入 AI 时代后，CAPTCHA 验证系统的识别和防御能力被大打折扣。用户在访问某些网站时，可能就会遇到 CAPTCHA 验证系统，要求用户从 9 张图片中，筛选汽车、自行车、桥梁或红绿灯等，来证明是人类访问者。根据苏黎世联邦理工学院（ETH Zurich）的最新研究，AI 现在可以成功击败这些谜题。这款人工智能解谜软件建立在一个被广泛使用的人工智能图片处理模型之上，该模型被称为“You Onl

9/24/2024 10:21:12 AM

故渊

新“作弊神器”？德州仪器 TI-84 PLUS 计算器被改造接入 ChatGPT AI

YouTube 频道 ChromaLock 于 9 天前发布视频，介绍了名为 TI-32 的改造电路板，加装在德州仪器 TI-84 Plus 图形计算器上，可以接入 ChatGPT。AI在线查询公开资料，在 PSAT、SAT 和 ACT 大学入学考试、IB 和 AP 考试中，标准化组织已经批准考生使用 TI-84 Plus 图形计算器。ChromaLock 探索了该计算器的连接端口，设计了名为 TI-32 的改造电路板，其中一个支持 Wi-Fi 的微型微控制器 Seed Studio ESP32-C3（价格约为 5

9/24/2024 8:38:49 AM

故渊

OpenAI 阿尔特曼预测“智能时代”即将到来：能独立完成科学发现，影响就业但有助于解决气候变化等重大挑战

OpenAI 首席执行官山姆・阿尔特曼（Sam Altman）昨日（9 月 23 日）在其个人博客上发表博文，预测“智能时代”（Intelligence Age）即将到来，人工智能将在“未来几十年”带来巨大的经济收益。展望 AI 未来阿尔特曼在博文中写道，人类正在进入一个由人工智能驱动的新时代。他预测 AI 系统将很快成为个人助理，提供定制教育，甚至帮助医疗保健，最终 AI 系统甚至可能独立完成科学发现。阿尔特曼在博文中认为“超级智能 AI”（superintelligent AI）可能需要更长的发展周期，但预估会

9/24/2024 7:27:29 AM

故渊

飞天奖居然也用AI整活了！网友锐评：你敢再土一点吗？

大家好，我是花生~ 刚结束的第 34 届 “飞天奖” 颁奖典礼想必很多人都有关注，最后是雷佳音获得优秀男演员奖，赵丽颖获得优秀女演员奖，《三体》、《狂飙》和《繁花》等 16 部作品获得优秀电视剧奖，这些都是大家非常喜爱的演员和作品，能获奖属于实至名归。而在获奖结果之外，我还注意到了这次的颁奖典礼上一个很特别的环节，即在最后的歌曲大合唱中，有一部分内容是由不同电视剧的主要角色 “演唱” 的 —— 之所以加引号，是因为歌并不是真人在唱，而是通过 AI 驱动合成的，看完下面的视频大家就明白是怎么回事了。很显然主办方是想

9/24/2024 7:21:12 AM

夏花生

以前一天才能完成的运营图设计，如何用AI一个小时搞定？

前言大家好，我是金玉珏~ 今天这篇文章将向大家展示如何利用 AIGC 技术助力运营图片中的背景和容器设计。首先，请大家来看以下几张图片，它们主要由企业 LOGO、活动文案、活动元素、元素容器、画面背景构成。在日常工作中，这类设计任务十分常见，其中背景和容器部分完全可以借助 AI 来辅助完成。接下来，我们通过具体实例来展示如何利用 AI 技术提升这类设计的效率和质量。满满的设计思路全部奉上，评论区虚位以待，诚邀您分享独到观点~ 假设需求（比例 16:9）：标题：夏日福利暑于你副标题：借记卡支付享 5 重惊喜

9/24/2024 6:21:08 AM

金玉珏

OpenAI 发布“学院”计划：为开发者提供 100 万美元 API 信用额度及技术指导

OpenAI 今天宣布推出“OpenAI 学院”，旨在帮助开发者和组织利用 AI 解决难题，并推动社区经济增长。该平台将确保生成式 AI 的强大功能在全球范围内广泛普及，包括中低收入国家。OpenAI 表示，许多国家的科技行业发展迅速，拥有才华横溢的开发者和创新型组织，但仍然缺乏高级培训和技术资源的支持。通过投资于本地 AI 人才的发展，可以促进包括医疗、农业、教育和金融等行业的经济增长与创新。该项目将提供如下方面的支持：培训与技术指导：OpenAI 专家将为利用 AI 的开发者和使命驱动型组织提供支持。API 使

9/23/2024 11:38:16 PM

清源

11.28万起，比亚迪第二代宋Pro DM-i、海狮05DM-i重磅上市

9 月 23 日，搭载比亚迪第五代 DM 技术的海狮 05DM-i 及第二代宋 Pro DM-i 正式上市。在今天下午天津举行的发布会上，比亚迪海洋网总经理张卓、王朝网总经理路天与德云社演员阎鹤祥、孟鹤堂同台互动，讲述国民 SUV 的四门功课。两款新车各推出 4 个版本，官方指导价 11.28-14.28 万元，超 16 项全系标配，刷新了国民 SUV 的体验，充分展现了比亚迪持续以科技创新推动技术普惠，引领新能源汽车行业变革的决心。引领 A 级 SUV 新趋势比亚迪表示，此次发布的海狮 05DM-i 与第二代宋

9/23/2024 9:46:00 PM

李泽南

RDK X5重磅发布、RDK S100惊喜亮相，地瓜机器人开发者套件全家桶全新登场

9月20日，以“加速智能生长”为主题的“2024地瓜机器人开发者日”活动在深圳成功举办。作为业界领先的机器人软硬件通用底座提供商，地瓜机器人重磅推出面向“机器人 ”时代的软硬件产品全家桶，包括专为新一代通用机器人而生的旭日5智能计算芯片、极致易用全能开发首选RDK X5机器人开发者套件、具身智能全场景算力核心RDK S100，以及赋能全链条全生命周期的机器人云端开发环境，软硬结合、端云一体，让开发更简单、让机器更智能。伴随大模型和具身智能技术的突破，机器人有望在2030年成为下一轮产业升级的重要引擎。统一的软硬件通

9/23/2024 9:17:00 PM

新闻助手

谷歌宣布为全球 AI 教育设立 1.2 亿美元基金

谷歌 CEO 桑达尔・皮查伊（Sundar Pichai）于当地时间 9 月 21 日在联合国未来峰会上发表讲话，将 AI 描述为“迄今为止最具变革性的技术”。皮查伊表示，谷歌正在研究迄今为止最具变革性的技术 —— 人工智能，谷歌还看到了四个最大机遇，其中许多机遇与可持续发展目标相一致：一是帮助人们用自己的语言获取世界信息和知识。仅去年一年，谷歌就利用人工智能在 Google 翻译中添加了 110 种新语言，全球 10 亿人使用这些语言。这使得谷歌的语言总数达到 246 种，并且谷歌正在努力扩展到 1,000 种世

9/23/2024 5:48:12 PM

汪淼

华为云+腾讯音乐天琴实验室达成深度合作，基于昇腾AI

9 月 19-21 日，以「共赢行业智能化」为主题的第九届华为全联接大会（HUAWEI CONNECT 2024）在上海举办。活动期间，腾讯音乐娱乐集团（TME）天琴实验室 AI 大模型负责人吴斌博士在华为云峰会发表主题演讲。天琴实验室自研创新的 MUSELight 大模型推理加速解决方案与华为云昇腾 AI 云服务深度合作共建，并首次对外发布 Stable Diffusion 系列视觉大模型推理加速方案 lyraSD 的昇腾适配方案。吴斌博士表示，双方共同努力实现了 AI 算力的自主创新和领先突破，讲为用户提供更美

9/23/2024 5:37:00 PM

新闻助手

美图：“奇想大模型”视频生成能力已完成全面升级，可生成 1 分钟视频

美图公司今天宣布，旗下的“奇想大模型”视频生成能力完成全面升级，在实现生成能力、生成效率以及模型性能的三重进阶基础上，结合美图在计算机视觉领域的多项自研技术，实现了视频生成时长、画质、流畅性、真实性及可信度等方面的提升。据悉，美图奇想大模型的单次文生视频时长、单次图生视频时长均达 5 秒，支持生成 1 分钟、24FPS、1080P 的超长视频，升级后的视频生成功能将逐步覆盖美图秀秀、美颜相机、Wink、开拍、美图设计室、WHEE、MOKI 等产品。据AI在线此前报道，今年 1 月 2 日，美图公司自研 AI 视觉大

9/23/2024 5:12:35 PM

清源

商汤绝影全舱人脸感知技术，助力乐道L60上市，为每位用户打造专属关怀

在乐道L60的发布会上，「小乐识人」的场景演示视频获得了现场与线上观众的一致好评，主动为二大爷播放他喜欢的京剧、给爷爷按腰去除疲劳，都是专属于每位用户的贴心关怀。这背后离不开商汤绝影提供的OMS功能，尤其是全舱人脸感知技术，它助力了乐道L60识别并记住车内每位乘客，最多可记忆20个账号，三世同堂的家庭、七大姑八大姨都能记住，小乐通通叫上姓名。基于这个能力，乐道汽车可以同步每个乘客的个性化数据，如：座椅位置、音乐账号等，实现个性化体验，让用户感觉更加亲切、自然，有温度。结合商汤绝影多模感知、乐道账号的综合能力，乐道汽

9/23/2024 4:47:00 PM

新闻助手

美图奇想大模型全新升级：生成能力、生成效率、模型性能实现三重进阶

9月23日，美图公司宣布美图奇想大模型（MiracleVision）视频生成能力完成全面升级，在实现生成能力、生成效率以及模型性能的三重进阶基础上，结合美图在计算机视觉领域的多项自研技术优势，视频生成时长与画质、流畅性、真实性及可信度等方面提升显著。目前，美图奇想大模型（MiracleVision）的单次文生视频时长、单次图生视频时长均达5秒，已支持1分钟、帧率24FPS、分辨率1080P的超长视频生成，可以任意视频尺寸输出。基于美图公司在影像领域的长期深厚积累，全新升级的美图奇想大模型（MiracleVision

9/23/2024 4:44:00 PM

新闻助手

谷歌 CEO 皮查伊：AI 不会取代程序员，反而会让更多人成为程序员

近年来，人工智能（AI）的飞速发展引发了广泛讨论，人们担心 AI 是否会取代人类的工作。艺术家和程序员尤其担心，因为 AI 似乎能够胜任这两项工作。然而，谷歌及其母公司 Alphabet 的 CEO 桑达尔・皮查伊（Sundar Pichai）认为，AI 不会取代程序员，相反，其将帮助更多人成为程序员。图源 Pixabay皮查伊在卡内基梅隆大学的演讲中谈到了 AI 对编程工作的影响，他表示，AI 最有可能帮助人们，而不是取代他们。它可以帮助现有程序员专注于更高级的任务，而不是重复解决同样的问题。此外，皮查伊认为 A

9/23/2024 4:31:28 PM

远洋

李飞飞创业之后首个专访：视觉空间智能与语言一样根本

不久之前，李飞飞教授的空间智能创业公司 World Labs 以及全明星的创业阵容正式亮相。随后，李飞飞与另一位联合创始人 Justin Johnson 接受了 a16z 的专访。在这次访谈播客中，李飞飞重点分享了 AI 领域新的研究前沿：空间智能。她说：「视觉空间智能非常根本，与语言一样根本」。节目中，她首先介绍了自己的早期贡献 ImageNet 对计算机视觉发展的影响。之后介绍了计算和数据在 AI 发展中的作用。然后，她定义了 AI 的终极目标以及空间智能在这其中所扮演的重要角色。最后，她介绍了自己的 Worl

9/23/2024 2:49:00 PM

机器之心

仅用4块GPU、不到3天训练出「开源版GPT-4o」，这是国内团队最新研究

LLaMA-Omni能够接收语音指令，同步生成文本和语音响应，响应延迟低至 226ms，低于 GPT-4o 的平均音频响应延迟 320ms。以 ChatGPT 为代表的大型语言模型（LLM）已成为强大的通用任务解决器，但大多数 LLM 仅支持基于文本的交互，这限制了它们在不适合文本输入输出的场景中的应用。GPT-4o 的出现使得通过语音与 LLM 进行交互成为可能。然而，开源社区对于构建此类基于 LLM 的语音交互模型仍然缺乏探索。实现与 LLM 进行语音交互最简单的方法是采用基于自动语音识别（ASR）和语音合成（

9/23/2024 2:40:00 PM

机器之心

钉钉推出 365 会员产品：提供个性化 AI 助理等，连续包月 15 元

钉钉今天下午宣布面向个人用户推出“365 会员”，包含 AI 搜索、个人 AI 助理、AI 自动回复、自动速读等权益，非会员仍可使用钉钉 AI 助理、快速阅读等现有的 AI 功能。AI在线注意到，钉钉 365 会员的定价为单月 39 元，连续包月 39 元，全年 339 元。近期推出“有 AI 价”，单月 19 元，连续包月 15 元，全年 169 元。用户可在钉钉 v7.6.15 或以上版本开通会员。官方介绍显示，钉钉 365 会员中的 AI 搜索功能可以帮助用户整合工作和协同信息，个人 AI 助理可以设定描述、

9/23/2024 2:35:14 PM

浩渺

开源！上海AI Lab视频生成大模型书生·筑梦 2.0来了

AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年，AI在线AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：[email protected]；[email protected]近日，上海人工智能实验室推出新一代视频生成大模型 “书生・筑梦 2.0”(Vchitect 2.0)。根据官方介绍，书生・筑梦 2.0 是集文生视频、图生视频、插帧超分、训练系统一体化的视

9/23/2024 2:35:00 PM

机器之心

资讯热榜

纳米AI发布MCP万能工具箱，简化AI工具集成与调用即梦3.0海外版发布，电影级视觉与精准英文排版引领AI创作新高度 Mac也能跑Qwen3，一文看懂本地部署qwen 3配置要求 AI视频资讯早读！7个产品更新+8个案例精选 Manus开源平替！Kortix-AI正式发布开源通用AI智能体平台Suna Ollama 支持全线的 Qwen 3 模型 Qwen3正式发布，优化编码与代理能力，强化MCP支持引领AI新潮流 DeepWiki：AI驱动的GitHub代码库百科全书正式亮相

标签云

人工智能 OpenAI AIGC AI ChatGPT AI绘画 DeepSeek 数据机器人模型谷歌大模型 Midjourney 智能开源用户学习 GPT 微软 Meta 图像 AI创作技术论文 Stable Diffusion Gemini 马斯克算法蛋白质芯片生成式代码英伟达腾讯神经网络研究计算 Anthropic Sora 3D AI for Science AI设计机器学习 GPU 开发者 AI视频场景华为预测人形机器人百度苹果伟达 Transformer 深度学习 xAI 模态字节跳动 Claude 大语言模型搜索具身智能驾驶神器推荐文本 Copilot LLaMA 算力安全视觉视频生成干货合集应用训练大型语言模型科技亚马逊特斯拉 2024 AGI

应用

AI“攻克”CAPTCHA 网站验证系统

新“作弊神器”？德州仪器 TI-84 PLUS 计算器被改造接入 ChatGPT AI

OpenAI 阿尔特曼预测“智能时代”即将到来：能独立完成科学发现，影响就业但有助于解决气候变化等重大挑战

飞天奖居然也用AI整活了！网友锐评：你敢再土一点吗？

以前一天才能完成的运营图设计，如何用AI一个小时搞定？

OpenAI 发布“学院”计划：为开发者提供 100 万美元 API 信用额度及技术指导

11.28万起，比亚迪第二代宋Pro DM-i、海狮05DM-i重磅上市

RDK X5重磅发布、RDK S100惊喜亮相， 地瓜机器人开发者套件全家桶全新登场

谷歌宣布为全球 AI 教育设立 1.2 亿美元基金

华为云+腾讯音乐天琴实验室达成深度合作，基于昇腾AI

美图：“奇想大模型”视频生成能力已完成全面升级，可生成 1 分钟视频

商汤绝影全舱人脸感知技术，助力乐道L60上市，为每位用户打造专属关怀

美图奇想大模型全新升级：生成能力、生成效率、模型性能实现三重进阶

谷歌 CEO 皮查伊：AI 不会取代程序员，反而会让更多人成为程序员

李飞飞创业之后首个专访：视觉空间智能与语言一样根本

仅用4块GPU、不到3天训练出「开源版GPT-4o」，这是国内团队最新研究

钉钉推出 365 会员产品：提供个性化 AI 助理等，连续包月 15 元

开源！上海AI Lab视频生成大模型书生·筑梦 2.0来了

RDK X5重磅发布、RDK S100惊喜亮相，地瓜机器人开发者套件全家桶全新登场