应用

CNCC 落幕：国产大模型已经进化到能在横店给我们点咖啡

今年到 CNCC 现场参会的朋友，想必都对 CNCC 2024 举办所在地——超过 6200 亩的横店圆明新园印象深刻！虽然园内建筑身临其境，并且薅了主办方一把羊毛，免门票游览了圆明新园与横店多个著名旅游景点，但园子实在是太大了。参会人数超过 1 万 2，园内车辆、美食供不应求，小编表示腿已经走断。

10/28/2024 10:29:00 AM

朱可轩

轻舟智航完成数亿元C+轮融资，加速从L2++到L4级自动驾驶的渐进式进化

10月28日，轻舟智航（QCraft）宣布完成数亿元人民币C 轮新融资。本次融资由逐鹿聚航基金投资，资金将用于加大全栈自动驾驶技术的研发投入，扎实推进中高阶NOA方案的大规模量产交付，以持续、高效的量产数据积累驱动技术迭代，稳步实现从L2 到L4级自动驾驶技术的渐进式进化，推动L4级自动驾驶时代的全面到来。轻舟智航联合创始人、CEO于骞表示：“感谢逐鹿聚航基金对轻舟智航的坚定支持与信任！

10/28/2024 10:17:00 AM

新闻助手

OpenAI 语音转写工具 Whisper 被曝存在重大缺陷：会凭空生成大段虚假内容

当地时间 27 日，据美联社报道，超过十位软件工程师、开发人员和学术研究人员称，OpenAI 的语音转写工具 Whisper 存在一个重大缺陷：有时会凭空生成大段甚至整句虚假内容。这些专家指出，这些生成的文本（AI在线注：业内通常称为“AI 幻觉”）可能涉及种族言论、暴力措辞，甚至杜撰的医疗建议。专家们认为，这一问题尤其令人担忧，因为 Whisper 已被广泛应用于全球多个行业，包括用于翻译和转录访谈内容、生成常见消费科技文本及制作视频字幕。

10/28/2024 8:47:58 AM

清源

因使用生成式 AI 制作恶意软件，日本一 25 岁男子首次被判有罪

据《读卖新闻》25 日报道，日本一名 25 岁林（Hayashi）姓男子因滥用生成式 AI 制造电脑病毒，被东京地方法院判处有期徒刑三年，缓期执行四年，标志着日本首次有因滥用生成式 AI 作出刑事定罪的案例。据判决书等资料显示，去年 3 月 31 日，该男子左右在川崎市的住所中利用电脑和智能手机，通过生成式 AI 获取的恶意程序设计图（源代码）制作了类似勒索软件的电脑病毒。此外，他还冒充他人骗取了手机通信卡等物品。

10/28/2024 7:50:42 AM

清源

AIGC喂饭教程！6步快速搞定万圣节创意海报！

大家好，这里是和你一起探索 AIGC 美学边界的戏呱皮 DC。大家可以叫我呱呱。前几天呱呱用 FLUX 模型出了一套 COS 动漫人物的万圣节创意海报，获得很多人的喜爱。

10/28/2024 1:17:18 AM

戏呱皮DC

抖音：严厉打击利用 AI 骗取老年人互动，下架违规视频、处置违规账号

抖音官方于 10 月 25 日发布《抖音严厉打击利用 AI 骗取老年人互动的治理公告》。抖音官方表示，鼓励创作优质内容，包括采用 AI 技术进行辅助创作，但所创作内容必须遵循平台规范。平台对利用生成式人工智能技术创作和发布违背科学常识、弄虚作假、造谣传谣的内容进行持续打击。

10/27/2024 7:36:17 PM

沛霖（实习）

OpenAI 公布新型 AI 文生图方案“sCM”，号称效率是传统扩散模型 50 倍

OpenAI 本周公布了一款名为 sCM（Continuous-Time Consistency Model）的新型 AI 文生图方案。与传统的扩散模型相比，sCM 仅需两个步骤即可生成高质量样本，号称能够将文生图效率提升约 50 倍，且生成的样本质量能与“业界较强的扩散模型”相比较，为 AI 文生图提供了新的方案。目前业界通常使用扩散模型生成图片及音视频，但传统扩散模型的取样过程通常缓慢，通常需要数十到数百个逐步降噪的过程才能生成高质量样本（例如小伙伴们使用 SD“炼丹”绘图就需要等待特别长的降噪时间），这使得相应模型效率低下，不适合商业化应用。

10/27/2024 3:18:03 PM

漾仔

丹麦首台 AI 超级计算机 Gefion 推出，由 1528 个英伟达 H100 GPU 驱动

丹麦推出了该国首台 AI 超级计算机，以丹麦神话中的女神 Gefion 命名，旨在推动量子计算、清洁能源、生物技术等领域取得突破，英伟达首席执行官黄仁勋与丹麦国王一同出席了揭幕仪式。 ▲ 图源英伟达Gefion 是一台由 1528 个英伟达 H100 Tensor Core GPU 驱动的英伟达 DGX SuperPOD 超级计算机，使用英伟达 Quantum-2 InfiniBand 网络进行互连。 AI在线获悉，Gefion AI 超级计算机位于哥本哈根，为产业界、初创企业和学术界服务。

10/27/2024 3:05:15 PM

沛霖（实习）

谷歌 DeepMind 开源 SynthID Text 工具，可辨别 AI 生成的文字

谷歌 DeepMind 于 10 月 23 日宣布正式开源旗下 SynthID Text 文本水印工具，供开发者和企业免费使用。谷歌在 2023 年 8 月推出了 SynthID 工具，该工具具备创建 AI 内容水印（声明该作品由 AI 打造）和识别 AI 生成内容的能力。它可以在不损害原始内容的前提下，将数字水印直接嵌入由 AI 生成的图像、声音、文本和视频中，同时也能扫描这些内容已有的数字水印，以辨识它们是否由 AI 生成，不过本次谷歌开源的仅为针对文本生成的 SynthID Text。

10/27/2024 3:00:06 PM

漾仔

Meta 推出 Llama 3.2 1B / 3B 模型量化版：功耗更低、可适用更多轻量移动设备

继今年 9 月开源 Llama 3.2 的 1B 与 3B 模型之后，Meta 于 10 月 24 日发布了这两个模型的量化版本，量化后的模型大小平均减少了 56%，RAM 使用量平均减少了 41%，模型速度提高了 2 至 4 倍，同时降低了功耗，使这些模型能够部署到更多移动设备上。 AI在线注：模型量化（Model Quantization）就是通过各种训练方式将浮点模型转为定点模型，可以压缩模型参数，降低模型的复杂性，以便于在更轻量的平台运行。 Meta 表示，他们采用了量化感知训练（Quantization-Aware Training，QAT）和后训练量化（SpinQuant）两种方法对模型进行量化，其中“量化感知训练”更重视模型的准确性，而“后训练量化”更强调模型的可移植性。

10/27/2024 1:53:56 PM

漾仔

深圳一家公司造出世界上最酷机器人，卖2-3万美元

网友：终于不是太奶步伐了。国内惊现「无头」机器人！造出这个机器人的，是一家名叫众擎机器人（EngineAI）的深圳公司。

10/27/2024 1:52:00 PM

机器之心

谷歌这款新概念键盘，治好了我多年的老病

谷歌终于把人机交互给玩明白了？很多整天对着电脑的同学们难免腰酸背疼，有时会发出这样的感叹：我对这键盘受够了！那么问题来了：应该换个机械键盘还是分体式键盘呢？

10/27/2024 1:50:00 PM

机器之心

Anthropic 为 Claude 推出 JavaScript 沙盒工具：可 AI 写代码、可上传自有代码运行

Anthropic 现已为 Claude AI 推出了一款 JavaScript 沙盒工具，允许用户利用 Claude 编写 JavaScript 代码、在沙盒环境中上传自己的代码并自动生成运行结果，相应功能目前已作为预览版本向所有用户开放。此外，Anthropic 还提到 Claude AI 新增的这套沙盒工具允许用户加载本地文件，帮助企业快速处理 / 分析客户数据，快速将相关内容进行可视化处理。 ▲ 图源 Claude AIAnthropic 表示，目前他们已进一步提升了 Claude 的代码编写能力，这意味着 Claude 不仅能提供逻辑严谨且经过推敲的答案，还能帮助程序员 / 商务人员调试代码或进行精确高效的运算。

10/27/2024 10:33:44 AM

漾仔

可令 AI 助理同时进行快 / 慢速思考，谷歌 DeepMind 公布具备两种思维模式的 Talker-Reasoner 框架

谷歌 DeepMind 上周公布了一个号称“具备两种思维模式”的 Talker-Reasoner 框架，旨在让 AI 助理能够同时进行快速和慢速思考，目前相关论文已发布于 ArXiv 上（点此访问）。据介绍，这款框架采用“双系统”设计，能够在与用户进行对话的同时并行多步骤推理任务（一边快速回答用户问题，一边高速思考），其中系统 1 Talker LLM 主要负责快速、直觉和合成的语言回应，用于与用户交谈。而系统 2 Reasoner LLM 则负责解决复杂问题，涉及从外界获取信息以增强知识，例如调用工具或从外部数据库检索信息，从而提升系统 1 回应内容的准确度及逻辑性。

10/27/2024 10:20:36 AM

漾仔

北京发布首份教育领域人工智能应用指南

《北京市教育领域人工智能应用指南》于 10 月 26 日发布，明确人工智能在 6 大重点教育领域 29 个典型场景的应用规范，指导学校和师生稳妥有序开展应用实践。两项教育领域人工智能重点任务启动建设，让新技术更“懂”教育。该指南也是由北京市教育行政主管部门委托研制并发布的首份教育领域人工智能应用指南。

10/27/2024 9:11:42 AM

远洋

消息称谷歌将推出“Project Jarvis”：可实现网页任务自动化

据 The Information 报道，谷歌计划在 12 月预览其大型动作模型“Project Jarvis”。知情人士透露，该项目将帮助用户执行诸如“收集研究、购买产品或预订航班”等任务。图源 Pexels报道称，“Jarvis”将由未来版本的谷歌 Gemini 驱动，专门针对 Chrome 浏览器进行优化。

10/27/2024 6:47:17 AM

远洋

AI这么厉害，能帮我直接出海报吗？

太肝了！这可能是全网首篇Ideogram系统教程一、智言川语这款 AI 绘画软件 Ideogram，我认为是设计师、运营、自媒体从业人员需要重视起来的，如果你不会或者是不了解它，那么这一篇文章你一定要认真研读一下。阅读文章 .

10/27/2024 12:13:56 AM

58UXD 团队

腾讯研发全球首个大熊猫模型：实时识别、统计、分析大熊猫行为并生成报告

腾讯 10 月 25 日宣布，为了帮助饲养员全方位观察大熊猫，腾讯、中国大熊猫保护研究中心、广东工业大学，联合打造了全球首个大熊猫行为智能识别模型及智慧系统。 AI在线获悉，该模型可以识别大熊猫进食、喝水、睡觉等日常行为，并自动生成日报、周报、月报等可视化数据报表。项目组通过优化 SlowFast 算法，大幅提升了系统在遮挡环境下的行为识别能力，目前室内遮挡场景下的大熊猫行为识别准确率提升到了 80% 以上。

10/26/2024 9:37:06 PM

浩渺

资讯热榜

AI视频资讯早读！7个产品更新+8个案例精选 Manus开源平替！Kortix-AI正式发布开源通用AI智能体平台Suna 纳米AI发布MCP万能工具箱，简化AI工具集成与调用即梦3.0海外版发布，电影级视觉与精准英文排版引领AI创作新高度腾讯混元3D AI引擎2.5即将揭晓，3D生成技术再升级 OpenAI发布gpt-image-1 API，4o图像生成能力正式开放 DeepWiki：AI驱动的GitHub代码库百科全书正式亮相基于MiniO存储的RAGFlow+Dify图片处理方案

标签云

人工智能 OpenAI AIGC AI ChatGPT AI绘画 DeepSeek 数据机器人模型谷歌大模型 Midjourney 智能开源用户学习 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion Gemini 马斯克算法蛋白质生成式芯片代码英伟达神经网络腾讯计算研究 Anthropic Sora 3D AI for Science AI设计机器学习 GPU AI视频开发者场景华为预测人形机器人百度伟达苹果 Transformer 深度学习 xAI 模态字节跳动大语言模型 Claude 搜索驾驶文本具身智能神器推荐 Copilot LLaMA 算力安全视觉视频生成干货合集应用大型语言模型科技亚马逊训练特斯拉 AGI DeepMind