资讯列表

分类

标签

一周发明GAN！时间检验奖得主分享背后故事：每件发明都不是最后的发明

引用超85000次的经典论文GAN获NeurIPS2024时间检验奖后，它的起源和背后故事也被抛了出来。要从Yoshua Bengio实验室的一次头脑风暴说起。 Bengio召集实验室成员，提出了一个富有挑战性的设想：训练一个确定性的生成网络g，该网络仅在输入z中包含随机噪声。

12/11/2024 2:10:00 PM

量子位

全球AI顶会 NeurIPS 2024温哥华开幕，中国校企上百篇论文被收录

当地时间 12 月 10 日- 15 日，全球 AI 顶级会议 NeurIPS （神经信息处理系统大会）在加拿大温哥华举办，这一顶会涵盖了机器学习、深度学习、神经网络等多个研究方向。官方数据显示， NeurIPS 2024 共收到 15671 篇有效论文投稿。投稿量创下新高，论文录取率为 25.8%，相比去年略有下降，来自中国的被收录的论文则很可观。

12/11/2024 2:04:00 PM

Nemo

微软成立全新消费者健康业务部门，目标提供更具针对性 AI 健康解决方案

穆斯塔法・苏莱曼此次挖来了前 DeepMind 健康部门负责人、曾在英国接受外科培训的 Dominic King，任命其为微软伦敦健康团队的副总裁。

12/11/2024 1:59:16 PM

清源

DeepMind悄悄发布PaliGemma二代，最易微调「视觉语言全能王」来了，多项任务登顶SOTA

OpenAI的发布会仿佛连续剧，让人眼花缭乱，谷歌也悄悄发布了PaliGemma 2模型，迈向可调视觉语言模型的下一代。今年5月，谷歌发布PaliGemma，也是Gemma家族中的第一个视觉语言模型，致力于模型民主化，降低视觉模型的使用难度。 PaliGemma 2模型以更高性能的Gemma 2为基座，增加了视觉能力，微调起来更容易，性能也更好。

12/11/2024 1:50:00 PM

新智元

GPT-4o再暴露「弱智」缺陷，大模型无一幸免！港中文等发布「视觉听觉」基准AV-Odyssey：26个任务直指死角问题

在人工智能领域，我们一直以为顶尖的多模态大模型已经无所不能，GPT-4o在ASR（音频转文字）任务上已经达到了97%的正确率，更是凸显了强大的音频理解能力。然而，最近一项来自香港中文大学、斯坦福大学、伯克利大学和耶鲁大学的研究成果却彻底颠覆了这一认知——GPT-4o、Gemini 1.5 Pro、Reka Core等最先进的多模态大模型居然无法正确分辨明显不同的声音大小！下面是一个例子：结果让人难以置信：这些顶尖的AI模型都未能准确判断出音量的差异！

12/11/2024 1:30:00 PM

新智元

CIO分享：什么时候数据太干净而无法用于企业AI？

数据质量对于AI项目的成功至关重要，但你需要保留原始数据的丰富性、多样性和完整性，以免破坏结果。数据管理曾经是数据仓库团队的职责，如今已经越来越多地成了高管层的优先事项，数据质量被视为客户体验和业务绩效的关键。但除了数据孤岛和合规性问题外，数据质量差也阻碍了企业AI项目的发展。

12/11/2024 1:23:46 PM

未来工厂，AI 领航 | 年终盛会，中信泰富特钢、施耐德、博世、工业富联等大咖共探 AI 赋能工厂新范式

2017 年，国务院发布《新一代人工智能发展规划》，制定了面向 2030 年的宏伟蓝图。将战略重心定位于人工智能与实体经济的深度融合，既彰显了我国在人工智能发展道路上的战略眼光和创新思维，更为科技创新指明方向，为实体经济转型升级注入新动能。其中，推动人工智能与制造业深度融合成为关键突破口。

12/11/2024 1:14:00 PM

机器之心

统信 UOS AI 2.0 发布，deepin（深度）系统社区用户超 760 万

统信软件发布 UOS AI 2.0，带来 3 大系统级交互感知、AI 效率办公全家桶，以及 AIOS 生态的全面升级。对比第一代，UOS AI 2.0 带来了很多原生 AI 的功能和场景，比如 AI 搜索、AI 随航、AI 任务栏。

12/11/2024 11:59:02 AM

汪淼

DeepSeek V2 系列 AI 模型收官，联网搜索上线

DeepSeek 官方公众号昨日（12 月 10 日）发布博文，宣布 DeepSeek V2 系列收官，推出 DeepSeek V2.5 的最终版微调模型 DeepSeek-V2.5-1210，主要支持联网搜索功能，全面提升各项能力。

12/11/2024 11:53:59 AM

故渊

聊天机器人平台 Character.AI 在美再遭起诉：对青少年及家庭构成威胁，恶化心理问题

据Popular Science今日报道，提供个性化聊天机器人服务的平台Character.AI，最近再次面临诉讼，因其对青少年用户的行为涉嫌造成“严重且无法弥补的伤害”。

12/11/2024 11:53:56 AM

清源

YouTube 自动配音功能推广至更多知识类频道，借助 AI 生成视频多语言配音

YouTube当地时间周二宣布，其自动配音功能已开始推广至更多的频道，创作者可为其视频生成多种语言的翻译音频。此前，这项功能仅限于少数创作者进行测试。

12/11/2024 11:21:50 AM

清源

久等了！希望这篇万字长文能帮助入门的朋友彻底搞懂车道线检测（中科院最新综述）

写在前面大家好，很荣幸能受到自动驾驶之心的邀请来为大家分享我们的一篇关于单目车道线检测的综述。与papaer里展现的顺序和内容可能有所不同，在这里笔者想更多地讲一讲本文的成文过程以及各类方法的发展史，因此对于各方法的详细介绍读者可以参考本文原文，这里不会花费过多笔墨来重述。关于本文原文中提到的方法，以及更多未提到的方法的论文和代码均可在笔者构建的GitHub仓库里找到，笔者后续也会不断更新，欢迎大家关注，也欢迎业内同仁指正，共同探讨。

12/11/2024 10:55:05 AM

自动驾驶之心

OpenAI员工意外泄露下一代ChatGPT！网友：故意的还是不小心的？

OpenAI员工发推介绍今天发布的新功能，结果意外泄露了未发布的模型？在Reddit上，被列文虎克附体的网友发现，OpenAI研究员Karina Nguyen展示的新功能界面中出现了一个陌生的名字——ChatGPT ε（第五个希腊字母，读作Epsilon）。这名网友猜测，这极可能就是之前被传出的下一代模型“猎户座”。

12/11/2024 10:11:02 AM

硅谷公司在旧金山街头投放争议性广告：“停止雇佣人类”

近日，一家名为 Artisan 的 AI 初创公司在硅谷中心地带旧金山投放了大量广告，其广告语简单粗暴 ——“停止雇佣人类”，引发广泛争议。

12/11/2024 10:04:44 AM

远洋

江山控股旗下 AI 公司突然宣布解散：资金无以为继，全体员工解聘

多位鹰眼智慧中医员工向新浪科技表示，在 12 月 9 日半夜 23:31 分，公司战略管理部总经理兼总裁办公室主任吕继有突然在企业微信全员群里发布了解散通知。

12/11/2024 9:54:40 AM

新浪科技

豆包电脑版上线视频生成功能，部分用户可体验

记者获悉，近日，字节跳动视频生成模型 PixelDance已在豆包电脑版正式开启内测，部分用户已开通体验入口。内测页面显示，用户每日可免费生成十支视频。 PixelDance视频生成模型于9月底首次发布，最早通过即梦AI、火山引擎面向创作者和企业客户小范围邀测，外部对其多镜头组合、运镜切换及人物运动能力评价较好。

12/11/2024 9:28:00 AM

新闻助手

面壁智能获新一轮数亿元融资，高效端侧智能持续引领行业发展

近日，面壁智能完成新一轮数亿元融资，本轮融资由龙芯创投、鼎晖百孚、中关村科学城基金和赛富基金联合领投，北京市人工智能产业投资基金与清科创投跟投，万甲资本担任本轮独家财务顾问。本轮融资完成后，面壁智能将进一步提速以端侧AI为代表的高效大模型商业化布局，以同等参数、更高性能、更低能耗、更快速度的高效大模型深度服务行业，为用户创造具体可感知的价值。面壁智能是以「高效为第一性原理」的大模型公司。

12/11/2024 9:17:00 AM

新闻助手

微软为 Win11 推出“原生”Copilot 应用，但本质仍是一个网页

微软正在 Windows 11 上测试 Copilot 应用的新更新，据微软称，该更新将其从由 Edge 驱动的网络应用转变为“原生”的 Windows 11 应用。然而据 WindowsCentral 报道，除了外观上的变化，Copilot 的实际功能体验仍然依赖于网页，与之前的版本并无本质区别。

12/11/2024 9:13:58 AM

远洋

资讯热榜

纳米AI发布MCP万能工具箱，简化AI工具集成与调用即梦3.0海外版发布，电影级视觉与精准英文排版引领AI创作新高度 AI视频资讯早读！7个产品更新+8个案例精选 Manus开源平替！Kortix-AI正式发布开源通用AI智能体平台Suna Qwen3正式发布，优化编码与代理能力，强化MCP支持引领AI新潮流 Ollama 支持全线的 Qwen 3 模型 DeepWiki：AI驱动的GitHub代码库百科全书正式亮相 OpenAI发布gpt-image-1 API，4o图像生成能力正式开放

标签云

人工智能 OpenAI AIGC AI ChatGPT AI绘画 DeepSeek 数据机器人模型谷歌大模型 Midjourney 智能开源用户学习 GPT 微软 Meta 图像 AI创作技术论文 Stable Diffusion Gemini 马斯克算法蛋白质芯片生成式代码英伟达神经网络腾讯研究计算 Anthropic Sora 3D AI for Science AI设计机器学习 GPU 开发者 AI视频场景华为预测人形机器人百度苹果伟达 Transformer 深度学习 xAI 模态字节跳动 Claude 大语言模型搜索具身智能驾驶神器推荐文本 Copilot LLaMA 算力安全视觉视频生成干货合集应用训练大型语言模型科技亚马逊特斯拉 2024 AGI