1.0

全球首个开源 AI 标准发布,微软、谷歌、亚马逊、Meta、英特尔、三星等巨头制定

在本月底的 2024 年 ALL THINGS OPEN 大会上,开源组织 Open Source Initiative(OSI)正式发布开源人工智能定义(OSAID)1.0 版本,标志着全球首个开源 AI 标准的诞生。 OSI 成立于 1998 年,是一个全球性的非营利组织,旨在定义和“管理”所有开源事物。 OSAID 标准由超过 25 个组织共同设计,包括微软、谷歌、亚马逊、Meta、英特尔、三星、Mozilla 基金会、Linux 基金会、Apache 软件基金会等,该标准可以帮助验证一个 AI 系统是否可以被视为开源 AI。

商汤 CEO 徐立内部信曝光,确定“三位一体”新 AI 战略

10 月 22 日上午消息,新浪科技独家获悉,商汤科技十周年之际,商汤科技董事长兼首席执行官徐立于近日发内部信,首次提及公司最新确立的“大装置-大模型-应用”的三位一体战略,同时宣布将围绕战略和核心资源,将构建更加集中和高效的组织架构,加快组织和管理的轻盈化进程。新浪科技了解到,在内部信中,徐立还阐述了自己对于传统 AI 1.0 和生成式大模型 AI 2.0 的理解。他指出,“AI 1.0 被看作是专用智能,专注于单任务和信息处理;而 AI 2.0 被视为通用智能,强调多任务和内容生成。

英伟达 NVLM 1.0 引领多模态 AI 变革:媲美 GPT-4o,不牺牲性能平衡文本和图像处理难题

科技媒体 marktechpost 昨日(9 月 20 日)发布博文,报道了英伟达(Nvidia)最新发布的论文,介绍了多模态大语言模型系列 NVLM 1.0。多模态大型语言模型(MLLM)多模态大型语言模型(MLLM)所创建的 AI 系统,能够无缝解读文本和视觉数据等,弥合自然语言理解和视觉理解之间的差距,让机器能够连贯地处理从文本文档到图像等各种形式的输入。多模态大型语言模型在图像识别、自然语言处理和计算机视觉等领域拥有广阔应用前景,改进人工智能整合和处理不同数据源的方式,帮助 AI 朝着更复杂的应用方向发展。

文生视频平台 Pika 喜提功能升级:视频有声音了,可生成各种背景音效

文生视频平台 Pika 今日凌晨通过 X 平台官宣新功能:视频可以集成 AI 生成的音效了。用户现可在 Pika 生成的视频中无缝生成、整合声音,可以通过提示词来描述想要的声音,或者直接让 Pika 根据视频内容自动生成声音。“如果您觉得它很酷,那是因为它的确很酷。抱歉,我们之前静音了!”与此同时,官方放出了一段预告片和几个 DEMO,预告片中的车辆鸣笛声、刀剑呼啸声均与视频内容匹配,而在 DEMO 演示中,烤肉的滋滋声和海底的水声也可以说与画面主题非常吻合。 据介绍,该功能目前仅面向“超级合作者”和专业用
  • 1