1.0 - AI在线

全球首个开源 AI 标准发布，微软、谷歌、亚马逊、Meta、英特尔、三星等巨头制定

在本月底的 2024 年 ALL THINGS OPEN 大会上，开源组织 Open Source Initiative（OSI）正式发布开源人工智能定义（OSAID）1.0 版本，标志着全球首个开源 AI 标准的诞生。 OSI 成立于 1998 年，是一个全球性的非营利组织，旨在定义和“管理”所有开源事物。 OSAID 标准由超过 25 个组织共同设计，包括微软、谷歌、亚马逊、Meta、英特尔、三星、Mozilla 基金会、Linux 基金会、Apache 软件基金会等，该标准可以帮助验证一个 AI 系统是否可以被视为开源 AI。

商汤 CEO 徐立内部信曝光，确定“三位一体”新 AI 战略

10 月 22 日上午消息，新浪科技独家获悉，商汤科技十周年之际，商汤科技董事长兼首席执行官徐立于近日发内部信，首次提及公司最新确立的“大装置-大模型-应用”的三位一体战略，同时宣布将围绕战略和核心资源，将构建更加集中和高效的组织架构，加快组织和管理的轻盈化进程。新浪科技了解到，在内部信中，徐立还阐述了自己对于传统 AI 1.0 和生成式大模型 AI 2.0 的理解。他指出，“AI 1.0 被看作是专用智能，专注于单任务和信息处理；而 AI 2.0 被视为通用智能，强调多任务和内容生成。

英伟达 NVLM 1.0 引领多模态 AI 变革：媲美 GPT-4o，不牺牲性能平衡文本和图像处理难题

科技媒体 marktechpost 昨日（9 月 20 日）发布博文，报道了英伟达（Nvidia）最新发布的论文，介绍了多模态大语言模型系列 NVLM 1.0。多模态大型语言模型（MLLM）多模态大型语言模型（MLLM）所创建的 AI 系统，能够无缝解读文本和视觉数据等，弥合自然语言理解和视觉理解之间的差距，让机器能够连贯地处理从文本文档到图像等各种形式的输入。多模态大型语言模型在图像识别、自然语言处理和计算机视觉等领域拥有广阔应用前景，改进人工智能整合和处理不同数据源的方式，帮助 AI 朝着更复杂的应用方向发展。

文生视频平台 Pika 喜提功能升级：视频有声音了，可生成各种背景音效

文生视频平台 Pika 今日凌晨通过 X 平台官宣新功能：视频可以集成 AI 生成的音效了。用户现可在 Pika 生成的视频中无缝生成、整合声音，可以通过提示词来描述想要的声音，或者直接让 Pika 根据视频内容自动生成声音。“如果您觉得它很酷，那是因为它的确很酷。抱歉，我们之前静音了！”与此同时，官方放出了一段预告片和几个 DEMO，预告片中的车辆鸣笛声、刀剑呼啸声均与视频内容匹配，而在 DEMO 演示中，烤肉的滋滋声和海底的水声也可以说与画面主题非常吻合。据介绍，该功能目前仅面向“超级合作者”和专业用