AI资讯列表 - AI在线

Perplexity AI 搜索引擎每周处理 1 亿次查询，消息称微软 / X / OpenAI 有意收购

综合 TechCrunch、The Information 报道，AI 搜索引擎 Perplexity 的首席执行官 Aravind Srinivas 透露，其产品目前每周的查询量已达到 1 亿次，推算下来每月约为 4 亿次，与 7 月的 2.5 亿次相比增长显著。当地时间 25 日，该公司披露称，随着公司快速扩展，Perplexity 正在逐步推出电商功能，计划让“Perplexity Pro”服务的订阅用户享受一键下单的便捷功能。同时，公司也在开发新的广告模式。

CNCC 落幕：国产大模型已经进化到能在横店给我们点咖啡

今年到 CNCC 现场参会的朋友，想必都对 CNCC 2024 举办所在地——超过 6200 亩的横店圆明新园印象深刻！虽然园内建筑身临其境，并且薅了主办方一把羊毛，免门票游览了圆明新园与横店多个著名旅游景点，但园子实在是太大了。参会人数超过 1 万 2，园内车辆、美食供不应求，小编表示腿已经走断。

轻舟智航完成数亿元C+轮融资，加速从L2++到L4级自动驾驶的渐进式进化

10月28日，轻舟智航（QCraft）宣布完成数亿元人民币C 轮新融资。本次融资由逐鹿聚航基金投资，资金将用于加大全栈自动驾驶技术的研发投入，扎实推进中高阶NOA方案的大规模量产交付，以持续、高效的量产数据积累驱动技术迭代，稳步实现从L2 到L4级自动驾驶技术的渐进式进化，推动L4级自动驾驶时代的全面到来。轻舟智航联合创始人、CEO于骞表示：“感谢逐鹿聚航基金对轻舟智航的坚定支持与信任！

OpenAI 语音转写工具 Whisper 被曝存在重大缺陷：会凭空生成大段虚假内容

当地时间 27 日，据美联社报道，超过十位软件工程师、开发人员和学术研究人员称，OpenAI 的语音转写工具 Whisper 存在一个重大缺陷：有时会凭空生成大段甚至整句虚假内容。这些专家指出，这些生成的文本（AI在线注：业内通常称为“AI 幻觉”）可能涉及种族言论、暴力措辞，甚至杜撰的医疗建议。专家们认为，这一问题尤其令人担忧，因为 Whisper 已被广泛应用于全球多个行业，包括用于翻译和转录访谈内容、生成常见消费科技文本及制作视频字幕。

因使用生成式 AI 制作恶意软件，日本一 25 岁男子首次被判有罪

据《读卖新闻》25 日报道，日本一名 25 岁林（Hayashi）姓男子因滥用生成式 AI 制造电脑病毒，被东京地方法院判处有期徒刑三年，缓期执行四年，标志着日本首次有因滥用生成式 AI 作出刑事定罪的案例。据判决书等资料显示，去年 3 月 31 日，该男子左右在川崎市的住所中利用电脑和智能手机，通过生成式 AI 获取的恶意程序设计图（源代码）制作了类似勒索软件的电脑病毒。此外，他还冒充他人骗取了手机通信卡等物品。

抖音：严厉打击利用 AI 骗取老年人互动，下架违规视频、处置违规账号

抖音官方于 10 月 25 日发布《抖音严厉打击利用 AI 骗取老年人互动的治理公告》。抖音官方表示，鼓励创作优质内容，包括采用 AI 技术进行辅助创作，但所创作内容必须遵循平台规范。平台对利用生成式人工智能技术创作和发布违背科学常识、弄虚作假、造谣传谣的内容进行持续打击。

OpenAI 公布新型 AI 文生图方案“sCM”，号称效率是传统扩散模型 50 倍

OpenAI 本周公布了一款名为 sCM（Continuous-Time Consistency Model）的新型 AI 文生图方案。与传统的扩散模型相比，sCM 仅需两个步骤即可生成高质量样本，号称能够将文生图效率提升约 50 倍，且生成的样本质量能与“业界较强的扩散模型”相比较，为 AI 文生图提供了新的方案。目前业界通常使用扩散模型生成图片及音视频，但传统扩散模型的取样过程通常缓慢，通常需要数十到数百个逐步降噪的过程才能生成高质量样本（例如小伙伴们使用 SD“炼丹”绘图就需要等待特别长的降噪时间），这使得相应模型效率低下，不适合商业化应用。

丹麦首台 AI 超级计算机 Gefion 推出，由 1528 个英伟达 H100 GPU 驱动

丹麦推出了该国首台 AI 超级计算机，以丹麦神话中的女神 Gefion 命名，旨在推动量子计算、清洁能源、生物技术等领域取得突破，英伟达首席执行官黄仁勋与丹麦国王一同出席了揭幕仪式。 ▲ 图源英伟达Gefion 是一台由 1528 个英伟达 H100 Tensor Core GPU 驱动的英伟达 DGX SuperPOD 超级计算机，使用英伟达 Quantum-2 InfiniBand 网络进行互连。 AI在线获悉，Gefion AI 超级计算机位于哥本哈根，为产业界、初创企业和学术界服务。

谷歌 DeepMind 开源 SynthID Text 工具，可辨别 AI 生成的文字

谷歌 DeepMind 于 10 月 23 日宣布正式开源旗下 SynthID Text 文本水印工具，供开发者和企业免费使用。谷歌在 2023 年 8 月推出了 SynthID 工具，该工具具备创建 AI 内容水印（声明该作品由 AI 打造）和识别 AI 生成内容的能力。它可以在不损害原始内容的前提下，将数字水印直接嵌入由 AI 生成的图像、声音、文本和视频中，同时也能扫描这些内容已有的数字水印，以辨识它们是否由 AI 生成，不过本次谷歌开源的仅为针对文本生成的 SynthID Text。

斯坦福开源学术研究神器STORM再进化，AI智能体像人一样进行圆桌讨论

不仅有主持人，还能得到不同AI专家的解答。今年 4 月，斯坦福大学推出了一款利用大语言模型（LLM）辅助编写类维基百科文章的神器。它就是开源的 STORM，可以在三分钟左右将你输入的主题转换为长篇文章或者研究论文，并能够以 PDF 格式直接下载。

Meta 推出 Llama 3.2 1B / 3B 模型量化版：功耗更低、可适用更多轻量移动设备

继今年 9 月开源 Llama 3.2 的 1B 与 3B 模型之后，Meta 于 10 月 24 日发布了这两个模型的量化版本，量化后的模型大小平均减少了 56%，RAM 使用量平均减少了 41%，模型速度提高了 2 至 4 倍，同时降低了功耗，使这些模型能够部署到更多移动设备上。 AI在线注：模型量化（Model Quantization）就是通过各种训练方式将浮点模型转为定点模型，可以压缩模型参数，降低模型的复杂性，以便于在更轻量的平台运行。 Meta 表示，他们采用了量化感知训练（Quantization-Aware Training，QAT）和后训练量化（SpinQuant）两种方法对模型进行量化，其中“量化感知训练”更重视模型的准确性，而“后训练量化”更强调模型的可移植性。

深圳一家公司造出世界上最酷机器人，卖2-3万美元

网友：终于不是太奶步伐了。国内惊现「无头」机器人！造出这个机器人的，是一家名叫众擎机器人（EngineAI）的深圳公司。

谷歌这款新概念键盘，治好了我多年的老病

谷歌终于把人机交互给玩明白了？很多整天对着电脑的同学们难免腰酸背疼，有时会发出这样的感叹：我对这键盘受够了！那么问题来了：应该换个机械键盘还是分体式键盘呢？

NeurIPS 2024 | 如何防御对抗性提示攻击？AdvUnlearn让图片生成风险骤降

AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年，AI在线AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。

Anthropic 为 Claude 推出 JavaScript 沙盒工具：可 AI 写代码、可上传自有代码运行

Anthropic 现已为 Claude AI 推出了一款 JavaScript 沙盒工具，允许用户利用 Claude 编写 JavaScript 代码、在沙盒环境中上传自己的代码并自动生成运行结果，相应功能目前已作为预览版本向所有用户开放。此外，Anthropic 还提到 Claude AI 新增的这套沙盒工具允许用户加载本地文件，帮助企业快速处理 / 分析客户数据，快速将相关内容进行可视化处理。 ▲ 图源 Claude AIAnthropic 表示，目前他们已进一步提升了 Claude 的代码编写能力，这意味着 Claude 不仅能提供逻辑严谨且经过推敲的答案，还能帮助程序员 / 商务人员调试代码或进行精确高效的运算。

可令 AI 助理同时进行快 / 慢速思考，谷歌 DeepMind 公布具备两种思维模式的 Talker-Reasoner 框架

谷歌 DeepMind 上周公布了一个号称“具备两种思维模式”的 Talker-Reasoner 框架，旨在让 AI 助理能够同时进行快速和慢速思考，目前相关论文已发布于 ArXiv 上（点此访问）。据介绍，这款框架采用“双系统”设计，能够在与用户进行对话的同时并行多步骤推理任务（一边快速回答用户问题，一边高速思考），其中系统 1 Talker LLM 主要负责快速、直觉和合成的语言回应，用于与用户交谈。而系统 2 Reasoner LLM 则负责解决复杂问题，涉及从外界获取信息以增强知识，例如调用工具或从外部数据库检索信息，从而提升系统 1 回应内容的准确度及逻辑性。

北京发布首份教育领域人工智能应用指南

《北京市教育领域人工智能应用指南》于 10 月 26 日发布，明确人工智能在 6 大重点教育领域 29 个典型场景的应用规范，指导学校和师生稳妥有序开展应用实践。两项教育领域人工智能重点任务启动建设，让新技术更“懂”教育。该指南也是由北京市教育行政主管部门委托研制并发布的首份教育领域人工智能应用指南。

消息称谷歌将推出“Project Jarvis”：可实现网页任务自动化

据 The Information 报道，谷歌计划在 12 月预览其大型动作模型“Project Jarvis”。知情人士透露，该项目将帮助用户执行诸如“收集研究、购买产品或预订航班”等任务。图源 Pexels报道称，“Jarvis”将由未来版本的谷歌 Gemini 驱动，专门针对 Chrome 浏览器进行优化。