开源
首个开源 AI 候选版定义稿发布:四大要求,训练数据上有妥协
如何定义开源人工智能(AI)?开源倡议组织(OSI)经过 2 年的努力,于昨日(10 月 9 日)发布了首个开源 AI 定义候选版本。首个候选版本主要澄清开源 AI 领域的各种争议,规定一个 AI 系统 / 模型需要具备以下 4 种基础自由要求,才能视为开源,AI在线附上相关要求如下:在未获许可的情况下,他人可出于任何目的使用该系统。可以深入研究系统的运行原理出于任何目的修改系统。与他人共享,无论是否修改。OSI 在训练数据方面选择妥协,要求提供“关于用于训练系统的数据的足够详细信息”,而非完整数据集。此举旨在平衡
Lumigator 评估框架登场:Mozilla 赋能开发者 AI 旅程,助其选择最佳模型
Mozilla 昨日(10 月 3 日)发布博文,推出了 Lumigator 新框架,主要帮助开发者为其项目挑选合适的 AI 大语言模型(LLM)。Mozilla 想要解决的问题Mozilla 公司在博文中表示,相比较 AI 大语言模型的繁荣,相关的评估工具尚未跟上发展的步伐,由于没有清晰的统一方法来比较模型,让开发者和企业难以做出明智的选择。Mozilla Lumigator 框架Mozilla 在博文中表示 Lumigator 主要有以下特点:透明和高效的模型选择:Lumigator 的目标是使模型选择过程变得
重磅!TeleAI 完成首个全国产化万卡万参大模型训练
近日,中国电信人工智能研究院(TeleAI)成功完成国内首个基于全国产化万卡集群训练的万亿参数大模型(万卡万参),并正式对外开源首个基于全国产化万卡集群和国产深度学习框架训练的千亿参数大模型——星辰语义大模型 TeleChat2-115B。这是由中国电信集团 CTO、首席科学家、中国电信人工智能研究院(TeleAI)院长李学龙教授带领团队完成的又一项里程碑式的重要科研成果,标志着国产大模型训练真正实现全国产化替代,正式进入全国产自主创新、安全可控的新阶段。TeleChat2-115B 基于中国电信自研的天翼云“息壤
最受欢迎开源大模型,为什么是通义?
开源与闭源之争早已非新奇的话题,但毋庸置疑的是,开源极大地促进了大模型技术发展和生态繁荣。 大模型被认为是最烧钱的技术,训练一个大模型往往需要大量的数据、计算资源,导致训练成本巨大,众所周知GPT-3的训练费用据说超过 4600万美元,在大模型开源之前,大模型一直是那些有大量资金加持的大厂和明星创业公司才有资格碰的事情。 随着如 llama、Mistral、Falcon 这些开源先锋搅动了整个大模型竞争浪潮,那些没有AI积累的企业、大量中小公司团队,今天个人开发者,都能基于开源底座模型,用很低的成本训练、部署自己的专属模型,llama 这样的开源先锋也因此拥有一众拥趸。
陈睿:B站已上线自研大模型 index 并应用于 AI 字幕,具备近 10 种语言实时翻译能力
感谢据澎湃新闻报道,在今天的 2024 年中国国际智能传播论坛上,哔哩哔哩董事长兼 CEO 陈睿表示,B站上线了自研大语言模型 index,并将其应用于 AI 字幕。目前,B站具备中、英、韩、日、泰语等近 10 种语言的实时翻译能力,准确度接近 90%。陈睿表示,B站更看重拥抱开源的生态,自研大模型就是建立在开源的基础上,相信开源将会成为 AI 中的主流。同时,AI 是年轻人在B站上最关注的内容,也是增长最快的科技内容。作为一种普惠技术,AI 最终会让所有人都从中受益。B站第二季度的日均活跃用户(日活用户)达 1.
“稚晖君”创业项目,智元自主研发的机器人中间件 AimRT 开源
智元自主研发的机器人中间件 AimRT 开源上线。▲ AimRT 架构图官方表示,AimRT 是一个更现代、轻量易用,且高效稳定的通信开发框架,具备机器人开发流程所必备的许多实用特性,并解决了主流开源中间件的一些痛点:在软件开发效率方面,AimRT 基于现代 C 新标准开发,轻量易部署,将现代化设计模式应用在资源管控、异步编程、部署配置等方面,使得机器人应用的开发更加快捷和高效。在工具链与调测效率方面,AimRT 提供了完善的调试、性能分析工具,以及良好的可观测性支持,有助于快速发现并解决系统中的问题,相比较传
摩尔线程开源 OpenCV-MUSA:支持绝大部分 cv::cuda 命名空间下数据结构及 API
感谢摩尔线程宣布其自研统一系统架构 MUSA 已完成与开源计算机视觉库 OpenCV 的适配,并正式发布 OpenCV-MUSA 开源项目。OpenCV 作为计算机视觉领域最重要的开源库之一,为图像和视频处理的开发者和研究人员提供了强大且灵活的工具。OpenCV 在自动驾驶、医疗影像、安防监控、机器人视觉、增强现实和图像识别等多个领域得到广泛应用。在现有 OpenCV 代码的基础上,摩尔线程新增了 MUSA 设备后端,并为多个算法模块提供了 MUSA 加速支持,同时对编译脚本也进行了适配。目前 OpenCV-MUS
零一万物开源 Yi-Coder 系列编程助手模型,支持 52 种编程语言
零一万物今日宣布开源 Yi-Coder 系列模型,该模型是 Yi 系列模型家族中的编程助手。Yi-Coder 系列模型专为编码任务而生,提供 1.5B 和 9B 两种参数。其中,Yi-Coder-9B 的表现号称“优于其他 10B 参数以下的模型”,如 CodeQwen1.5 7B 和 CodeGeex4 9B,甚至能够“与 DeepSeek-Coder 33B 相媲美”。据介绍,Yi-Coder 能够处理最长 128K tokens 的上下文内容,适用于复杂项目级代码的理解和生成。Yi-Coder 还支持 52
摩尔线程开源音频理解大模型 MooER:基于国产全功能 GPU 训练和推理
摩尔线程开源了音频理解大模型 —MooER(摩耳),是业界首个基于国产全功能 GPU 进行训练和推理的大型开源语音模型。基于摩尔线程夸娥(KUAE)智算平台,MooER 大模型用 38 小时完成了 5000 小时音频数据和伪标签的训练。MooER 不仅支持中文和英文的语音识别,还具备中译英的语音翻译能力。在 Covost2 中译英测试集中,MooER-5K 取得了 25.2 的 BLEU 分数,接近工业级效果。摩尔线程 AI 团队在该工作中开源了推理代码和 5000 小时数据训练的模型,并计划进一步开源训练代码和基
北京将建设具身智能机器人创新中心,全力打造全球机器人产业高地
2024 年世界机器人大会今天在北京亦庄开幕。据财联社,北京市副市长靳伟在大会上表示,北京将坚持产品创新和场景示范的双轮驱动,产业协同和生态优化的共同联动,全力打造全球的机器人产业高地。据介绍,北京将建设具身智能机器人创新中心,用好“天工”和“开悟”两个开源平台和具身智能数据体,组建机器人共享加工中心,推动精密零部件加工中心、概念验证和中试测试平台,尽快投入运营,支撑初创企业技术和产品的快速迭代。此外,北京将不断加大应用场景的开放力度,全面实施百项机器人新品工程和百种应用场景示范工程,率先探索医疗、养老、园林、农业
智谱 AI 开源 CogVideoX 视频生成模型:“清影”同源,单张 4090 显卡可推理
感谢智谱 AI 今日宣布,将与“清影”同源的视频生成模型 ——CogVideoX 开源。据介绍,CogVideoX 开源模型包含多个不同尺寸大小的模型,目前将开源 CogVideoX-2B,它在 FP-16 精度下的推理需 18GB 显存,微调则需要 40GB 显存,这意味着单张 4090 显卡即可进行推理,而单张 A6000 显卡即可完成微调。CogVideoX-2B 的提示词上限为 226 个 token,视频长度为 6 秒,帧率为 8 帧 / 秒,视频分辨率为 720*480。官方表示,性能更强参数量更大的模
Llama 对决 GPT:AI 开源拐点已至?|智者访谈
人工智能的卓越发展
源于对技术与产业本质的洞察
机器之心全新视频栏目「智者访谈」
邀请领域专家,洞悉 AI 核心技术与行业趋势
为从业者量身打造
深化行业认知,激发创新思考
与智者同行,共创 AI 未来
马斯克与扎克伯格终于对上眼了:AI 大模型 Llama 3.1 开源值得赞扬
周二,Meta 发布了最新的 AI 模型 Llama 3.1。Meta 声称,该模型优于 OpenAI 的 GPT-4o,并且是开源的,已向公众免费提供。随后,马斯克罕见地向扎克伯格致敬。马斯克在回应特斯拉前 AI 总监 Andrej Karpathy 关于该模型的帖子时表示:“这令人印象深刻,扎克(伯格)的开源决定确实值得赞扬。”对此,Meta 代表尚未发表评论。对于主导 AI 的野心,扎克伯格和马斯克一直都直言不讳。早在一月份,扎克伯格在接受媒体采访时曾表示,Meta 一直在从英伟达储备 AI 芯片。扎克伯格说
开源是未来 AI 之路,扎克伯格:Meta 要将 Llama 打造成为“AI 界的 Linux”
Meta 创始人兼首席执行官马克・扎克伯格(Mark Zuckerberg)昨日(7 月 23 日)发布博文,表达了他对开源 AI 生态系统的愿景,认为 Llama 有潜力成为“AI 界的 Linux”。扎克伯格表示 Linux 凭借着开源特性,近乎成为通过其开源特性已成为云计算和移动操作系统的行业标准,而 Meta 公司希望将 Llama 打造成 AI 领域的 Linux。扎克伯格阐述了开源人工智能为何有利于开发者和行业的理由,AI在线简要梳理如下:训练、微调和蒸馏自己的 AI 模型每个组织都有不同的需求,而满足
英特尔发布 AI Playground 开源软件:支持在锐炫 Arc 显卡本地运行 AI 图像生成与聊天机器人
在 6 月预告之后,英特尔今天正式推出 AI Playground 开源软件的 Beta 测试版。AI Playground 目前支持在配备 8GB 或更多显存的锐炫 Arc 显卡的 Windows 电脑上运行,未来还将支持英特尔酷睿 Ultra-H 处理器。据介绍,AI Playground 是一款免费开源的 AI PC 入门应用程序,支持在本地运行 AI 图像生成与增强、AI 聊天机器人功能。▲ AI 图像生成与增强▲ AI 聊天机器人AI在线注意到,这款软件的设计注重易用性,但同时也支持高级用户安装自己喜欢的
构筑 AI 安全防线,谷歌、微软、英伟达等 14 家公司组建安全 AI 联盟
感谢昨日举办的阿斯彭安全论坛(Aspen Security Forum)会议中,谷歌、微软、OpenAI、亚马逊、英伟达、英特尔等 14 家 AI 领域的大公司宣布联合组建安全人工智能联盟(Coalition for Secure AI,CoSAI)。CoSAI 由 OASIS 全球标准机构主办,是一项开源计划,旨在为所有 AI 从业人员和开发人员提供创建设计安全人工智能系统所需的指导和工具。CoSAI 将建立一个合作生态系统,共享开源方法、标准化框架和工具等等。CoSAI 的创始赞助商包括谷歌、IBM、英特尔、微
通义千问、GPT-4o 等七款 AI 大模型“高考成绩”公布 :前三名文科过一本,理科过二本
感谢上海人工智能实验室 17 日公布了针对 7 个 AI 大模型的高考全科目测试结果,据大模型开源开放评测体系“司南”相关负责人介绍,“当前大模型仍存在很大的局限性。组织 AI 大模型‘参加高考’,目的是评测当前大模型的真实水平,找准问题,持续推进技术进步。”测试结果显示,书生・浦语 2.0 系列文曲星大模型(浦语文曲星)、阿里通义千问大模型 Qwen2-72B 以及 GPT-4o 再次包揽文、理科前三甲;前三名 AI“考生”的文、理科成绩分别超过了“一本”“二本”线(以今年高考人数最多的河南省的分数线为参考)。从
PyTorch 团队首发技术路线图,近百页文档披露 2024 下半年发展方向
最近,PyTorch 团队首次公布了开发路线图,由内部技术文档直接修改而来,披露了这个经典开源库下一步的发展方向。如果你在 AI 领域用 Python 开发,想必 PyTorch 一定是你的老朋友之一。2017 年,Meta AI 发布了这个机器学习和深度学习领域的开源库,如今已经走到了第 7 个年头。根据 Assembly AI 2021 年的统计数据,HuggingFace 上最受欢迎的 top 30 模型都能在 PyTorch 上运行,有 92% 的模型是 PyTorch 专有的,这个占比让包括 Tensor