资讯列表

分类

标签

2024 科大讯飞全球 1024 开发者节：AI 文娱论坛“重构内容与表达”完满落幕

10 月 24 日，2024 科大讯飞全球 1024 开发者节 AI 文娱论坛在合肥圆满举办。论坛以“重构内容与表达”为主题，旨在探讨 AI 时代下文娱产业的最新趋势，见证讯飞 AI 文娱业务的重大发布，与合作伙伴共同推动文娱行业的繁荣发展。科大讯飞副总裁 & 研究院院长刘聪、科大讯飞消费者事业群副总裁严亚路出席大会，讯飞输入法业务部总经理程坤、数字娱乐业务部总经理 & 讯飞音乐主理人郭嘉、数字娱乐业务部副总经理 & 讯飞音乐首席科学家江源分别作主题演讲。

10/28/2024 9:01:42 PM

汐元

一张显卡“看懂”一部电影：智源联合高校开源 Video-XL，打破长视频理解极限

长视频理解是多模态大模型的核心能力之一，也是迈向通用人工智能（AGI）的关键一步。然而，现有的多模态大模型在处理 10 分钟以上的超长视频时，仍然面临性能差和效率低的双重挑战。对此，智源研究院联合上海交通大学、中国人民大学、北京大学和北京邮电大学等多所高校，推出了小时级的超长视频理解大模型 Video-XL。

10/28/2024 4:29:25 PM

汪淼

科学实验室走向全自动化，机器人融合AI，加速科学发现，Science子刊观点

编辑 | KX「机器人有可望将我们日常的科学实验室变成加速科学发现的自动化工厂。」实验室即将迎来一场全面而彻底的变革。自动化机器人和 AI 技术可以使科学实验更快、更安全、更准确、可重复性更高，从而使科学家能够在更短的时间内开发新分子、材料和化学系统。

10/28/2024 2:17:00 PM

ScienceAI

先让不懂代码的来测？通义这个新产品，代码刚写完，预览就出来了

这才是未来 AI 该有的样子？奇怪了。一款 AI 代码工具刚发布，限量测试却要求「不懂代码」的人优先。

10/28/2024 1:18:00 PM

机器之心

谷歌AI播客刚火，Meta就开源了平替，效果一言难尽

随着谷歌和 Meta 相继推出基于大语言模型的 AI 播客功能，将极大地丰富人类用户与 AI 智能体互动的体验。上个月，谷歌宣布对旗下 AI 笔记应用 NotebookLM 进行一系列更新，允许用户生成 YouTube 视频和音频文件的摘要，甚至可以创建可共享的 AI 生成音频讨论。加上此前支持的谷歌文档、PDF、文本文件、谷歌幻灯片和网页，NotebookLM 的用例和覆盖范围进一步扩大。

10/28/2024 1:14:00 PM

机器之心

世界模型新突破！极佳科技提出DriveDreamer4D，首次利用世界模型增强4D驾驶场景重建效果

近日，极佳科技联合中国科学院自动化研究所、理想汽车、北京大学、慕尼黑工业大学等单位提出DriveDreamer4D，是首个利用世界模型增强 4D 驾驶场景重建效果的工作。 DriveDreamer4D 可以大幅提升多种自动驾驶 4D 重建算法的效果，在 user study 实验中获得了超过 80% 的偏好投票，为走向空间智能和 4D 世界模型迈出了坚实的一步。论文链接：：：。

10/28/2024 1:11:00 PM

机器之心

整合长期记忆，AI实现自我进化，探索大模型这一可能性

地球上最早的生命证据至少可以追溯到 35 亿年前，而直到大约 25 万到 40 万年前，智人才出现地球上。在这漫长的岁月中，生物不断地兴盛又覆灭，但整体趋势总是越来越复杂，其中最复杂的生物组件莫过于我们智人的大脑。这样的复杂性是我们的意识和智慧的来源。

10/28/2024 1:05:00 PM

机器之心

NeurIPS 2024 | 消除多对多问题，清华提出大规模细粒度视频片段标注新范式VERIFIED

AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年，AI在线AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。

10/28/2024 1:01:00 PM

机器之心

Perplexity AI 搜索引擎每周处理 1 亿次查询，消息称微软 / X / OpenAI 有意收购

综合 TechCrunch、The Information 报道，AI 搜索引擎 Perplexity 的首席执行官 Aravind Srinivas 透露，其产品目前每周的查询量已达到 1 亿次，推算下来每月约为 4 亿次，与 7 月的 2.5 亿次相比增长显著。当地时间 25 日，该公司披露称，随着公司快速扩展，Perplexity 正在逐步推出电商功能，计划让“Perplexity Pro”服务的订阅用户享受一键下单的便捷功能。同时，公司也在开发新的广告模式。

10/28/2024 11:17:16 AM

清源

CNCC 落幕：国产大模型已经进化到能在横店给我们点咖啡

今年到 CNCC 现场参会的朋友，想必都对 CNCC 2024 举办所在地——超过 6200 亩的横店圆明新园印象深刻！虽然园内建筑身临其境，并且薅了主办方一把羊毛，免门票游览了圆明新园与横店多个著名旅游景点，但园子实在是太大了。参会人数超过 1 万 2，园内车辆、美食供不应求，小编表示腿已经走断。

10/28/2024 10:29:00 AM

朱可轩

轻舟智航完成数亿元C+轮融资，加速从L2++到L4级自动驾驶的渐进式进化

10月28日，轻舟智航（QCraft）宣布完成数亿元人民币C 轮新融资。本次融资由逐鹿聚航基金投资，资金将用于加大全栈自动驾驶技术的研发投入，扎实推进中高阶NOA方案的大规模量产交付，以持续、高效的量产数据积累驱动技术迭代，稳步实现从L2 到L4级自动驾驶技术的渐进式进化，推动L4级自动驾驶时代的全面到来。轻舟智航联合创始人、CEO于骞表示：“感谢逐鹿聚航基金对轻舟智航的坚定支持与信任！

10/28/2024 10:17:00 AM

新闻助手

OpenAI 语音转写工具 Whisper 被曝存在重大缺陷：会凭空生成大段虚假内容

当地时间 27 日，据美联社报道，超过十位软件工程师、开发人员和学术研究人员称，OpenAI 的语音转写工具 Whisper 存在一个重大缺陷：有时会凭空生成大段甚至整句虚假内容。这些专家指出，这些生成的文本（AI在线注：业内通常称为“AI 幻觉”）可能涉及种族言论、暴力措辞，甚至杜撰的医疗建议。专家们认为，这一问题尤其令人担忧，因为 Whisper 已被广泛应用于全球多个行业，包括用于翻译和转录访谈内容、生成常见消费科技文本及制作视频字幕。

10/28/2024 8:47:58 AM

清源

因使用生成式 AI 制作恶意软件，日本一 25 岁男子首次被判有罪

据《读卖新闻》25 日报道，日本一名 25 岁林（Hayashi）姓男子因滥用生成式 AI 制造电脑病毒，被东京地方法院判处有期徒刑三年，缓期执行四年，标志着日本首次有因滥用生成式 AI 作出刑事定罪的案例。据判决书等资料显示，去年 3 月 31 日，该男子左右在川崎市的住所中利用电脑和智能手机，通过生成式 AI 获取的恶意程序设计图（源代码）制作了类似勒索软件的电脑病毒。此外，他还冒充他人骗取了手机通信卡等物品。

10/28/2024 7:50:42 AM

清源

AIGC喂饭教程！6步快速搞定万圣节创意海报！

大家好，这里是和你一起探索 AIGC 美学边界的戏呱皮 DC。大家可以叫我呱呱。前几天呱呱用 FLUX 模型出了一套 COS 动漫人物的万圣节创意海报，获得很多人的喜爱。

10/28/2024 1:17:18 AM

戏呱皮DC

抖音：严厉打击利用 AI 骗取老年人互动，下架违规视频、处置违规账号

抖音官方于 10 月 25 日发布《抖音严厉打击利用 AI 骗取老年人互动的治理公告》。抖音官方表示，鼓励创作优质内容，包括采用 AI 技术进行辅助创作，但所创作内容必须遵循平台规范。平台对利用生成式人工智能技术创作和发布违背科学常识、弄虚作假、造谣传谣的内容进行持续打击。

10/27/2024 7:36:17 PM

沛霖（实习）

OpenAI 公布新型 AI 文生图方案“sCM”，号称效率是传统扩散模型 50 倍

OpenAI 本周公布了一款名为 sCM（Continuous-Time Consistency Model）的新型 AI 文生图方案。与传统的扩散模型相比，sCM 仅需两个步骤即可生成高质量样本，号称能够将文生图效率提升约 50 倍，且生成的样本质量能与“业界较强的扩散模型”相比较，为 AI 文生图提供了新的方案。目前业界通常使用扩散模型生成图片及音视频，但传统扩散模型的取样过程通常缓慢，通常需要数十到数百个逐步降噪的过程才能生成高质量样本（例如小伙伴们使用 SD“炼丹”绘图就需要等待特别长的降噪时间），这使得相应模型效率低下，不适合商业化应用。

10/27/2024 3:18:03 PM

漾仔

丹麦首台 AI 超级计算机 Gefion 推出，由 1528 个英伟达 H100 GPU 驱动

丹麦推出了该国首台 AI 超级计算机，以丹麦神话中的女神 Gefion 命名，旨在推动量子计算、清洁能源、生物技术等领域取得突破，英伟达首席执行官黄仁勋与丹麦国王一同出席了揭幕仪式。 ▲ 图源英伟达Gefion 是一台由 1528 个英伟达 H100 Tensor Core GPU 驱动的英伟达 DGX SuperPOD 超级计算机，使用英伟达 Quantum-2 InfiniBand 网络进行互连。 AI在线获悉，Gefion AI 超级计算机位于哥本哈根，为产业界、初创企业和学术界服务。

10/27/2024 3:05:15 PM

沛霖（实习）

谷歌 DeepMind 开源 SynthID Text 工具，可辨别 AI 生成的文字

谷歌 DeepMind 于 10 月 23 日宣布正式开源旗下 SynthID Text 文本水印工具，供开发者和企业免费使用。谷歌在 2023 年 8 月推出了 SynthID 工具，该工具具备创建 AI 内容水印（声明该作品由 AI 打造）和识别 AI 生成内容的能力。它可以在不损害原始内容的前提下，将数字水印直接嵌入由 AI 生成的图像、声音、文本和视频中，同时也能扫描这些内容已有的数字水印，以辨识它们是否由 AI 生成，不过本次谷歌开源的仅为针对文本生成的 SynthID Text。

10/27/2024 3:00:06 PM

漾仔

资讯热榜

这样在本地搭建DeepSeek可以直接封神：本地部署+避坑指南（升级版）基于 Spring AI + MCP + DeepSeek-R1-7B 构建企业级智能 Agent 工具调用系统 Manus开源平替！Kortix-AI正式发布开源通用AI智能体平台Suna Trae v1.3.0重磅更新，新增MCP与.rules支持引领AI开发新体验纳米AI发布MCP万能工具箱，简化AI工具集成与调用 Figma 推 AI 革命：开发智能应用制作器与网站创建工具即梦3.0海外版发布，电影级视觉与精准英文排版引领AI创作新高度 Persona Engine开源发布，AI虚拟助手与Live2D融合打造交互新体验

标签云

人工智能 OpenAI AIGC AI ChatGPT AI绘画 DeepSeek 数据机器人模型谷歌大模型 Midjourney 智能开源用户学习 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达腾讯神经网络计算研究 Anthropic Sora 3D AI for Science AI设计机器学习 GPU AI视频开发者场景华为预测百度人形机器人伟达苹果 Transformer 深度学习模态 xAI 字节跳动 Claude 大语言模型搜索驾驶文本具身智能神器推荐 Copilot LLaMA 算力视频生成安全干货合集视觉应用大型语言模型科技亚马逊特斯拉 AGI 训练 2024