开源模型
谷歌前科学家出品!Reka开源Reka Flash 3,能力超Gemma 3 27B
Reka AI是由十几个谷歌DeepMind前科学家们创办的公司,近日他们掷出了其首个开源模型—— Reka Flash3。 这款拥有 210亿参数 的推理模型,一经亮相便引发业内外的广泛关注。 别看 Reka Flash3只有210亿参数,据官方介绍,这款模型是 从零开始训练 的通用推理模型。
32B参数的“逆袭”!OLMo 2 32B横空出世,叫板GPT-3.5 Turbo
近日,艾伦人工智能研究所(AI2)重磅发布了其最新的大型语言模型——OLMo232B。 这款模型一经亮相便自带光环,因为它不仅是OLMo2系列的最新力作,更以“完全开放”的姿态,向那些高墙深垒的专有模型发起了强有力的挑战。 OLMo232B最引人注目的特点莫过于其彻彻底底的开源属性。
开源图片超分模型Thera:可以提升图片清晰度,让模糊从此“下岗”
各位追求高清无码的视觉动物们,请注意!图像处理界又添一枚猛将——Thera,一款开源的任意尺度超分辨率模型,带着满满的黑科技和友好的开源姿态,闪亮登场啦! 这位新晋“美图秀秀Plus”不仅能让你的模糊照片重见天日,还能以你意想不到的灵活方式进行放大,简直是细节控们的福音,模糊党的克星!想放多大就多大?还在为固定倍数的图片放大而烦恼吗?Thera 告诉你,那都是过去式了!这款由苏黎世联邦理工学院和苏黎世大学的大佬们联手打造的神器,最引人注目的特点就是其任意尺度超分辨率能力。 你可以随心所欲地指定放大倍数,无论是3.14倍这种略显“调皮”的数字,还是其他任何你想要的比例,Thera 都能轻松应对,真正实现了“我的清晰度我做主”!
潞晨科技推全新开源视频模型Open-Sora 2.0 训练流程全开源
还在为动辄百万美金的视频生成模型望而却步?还在感叹AI视频创作只是巨头的游戏?今天,开源社区用实力告诉你: “No!” 一款名为 Open-Sora2.0的全新开源模型横空出世,彻底颠覆了视频生成的“氪金”规则。 难以置信的是,这款性能直逼商业级水准的110亿参数大模型,竟然只花费了区区20万美元(224张GPU)就训练成功! 要知道,那些动辄耗资数百万美元的闭源模型,在 Open-Sora2.0面前,性价比简直弱爆了!Open-Sora2.0的发布,无疑是视频生成领域的一场“平民革命”。
智谱开源文生图模型CogView4,支持中英双语提示词输入
智谱AI最新开源文生图模型CogView4正式亮相,CogView4不仅在参数数量上达到了6亿,还全面支持中文输入和中文文本到图像的生成,被称其为“首个能在画面中生成汉字的开源模型”。 CogView4以支持中英双语提示词输入为核心亮点,尤其擅长理解和遵循复杂的中文指令,成为中文内容创作者的福音。 作为首个能在图像中生成汉字的开源文生图模型,它填补了开源领域的一大空白。
阿里万相视频生成大模型宣布开源:8.2GB 显存就能跑,测试超越 Sora
此次开源采用最宽松的 Apache2.0 协议,14B 和 1.3B 两个参数规格的全部推理代码和权重全部开源,同时支持文生视频和图生视频任务,全球开发者可在 Github、HuggingFace 和魔搭社区下载体验。
腾讯混元视频模型(Hunyuan Video)测试招募中,开源在望
近日,腾讯混元视频模型(Hunyuan Video)在 X 平台上正式公开招募测试伙伴,标志着这一前沿 AI 视频生成技术迈入关键测试阶段。 根据官方透露,测试结束后,该模型有很大概率会开源,为全球 AI 社区贡献其技术成果。 混元视频模型是腾讯在 AI 视频生成领域的重要创新,拥有超过13B 的参数量,是目前开源模型中规模最大的视频生成模型之一。
DeepSeek-R1 成 Hugging Face 最受欢迎大模型,力压近 150 万个“对手”
Clement Delangue今日凌晨发文宣布:DeepSeek-R1在Hugging Face上获得了超过10000个赞,成为该平台近150万个模型之中最受欢迎的大模型,“太令人震惊了!”
再加一把火、造福全人类,Hugging Face 号召打造完全开源版 DeepSeek R1 大模型
Hugging Face 称这项工作非常重要,因为 DeepSeek R1 非常高效,可以作为创新的基础模型。它也可以被研究人员、科学家和企业用作促进创新和突破的负担得起的模型。
阿里云 Qwen2.5-1M 开源发布:100万上下文长度模型登场
继 DeepSeek R1之后,阿里云通义千问团队刚刚宣布推出其最新的开源模型 Qwen2.5-1M,再次引发业界关注。 此次发布的 Qwen2.5-1M 系列包含两个开源模型:Qwen2.5-7B-Instruct-1M 和 Qwen2.5-14B-Instruct-1M。 这是通义千问首次推出能够原生支持百万Token上下文长度的模型,并在推理速度上实现了显著提升。
DeepSeek R1 Preview 模型亮相,代码能力与 OpenAI o1 相当且确认开源
还未正式发布,已在代码基准测试 LiveCodeBench 霸榜前三,表现与 OpenAI o1 的中档推理设置相当。
解决“佛跳墙、老婆饼”问题,联通开源首个完全在国产昇腾 AI 平台训练和推理的中文原生文生图模型“元景”
同时通过引入海量中文图文对数据进行预训练,模型对中文专属名词,如鼠标-老鼠、仙鹤-吊车等英文模型易混淆的对象,以及中文菜谱等英文模型无法理解的名词,都能够准确理解并生成对应的图片。
全球首个全模态理解开源端模型:长语音自动总结,图文音啥都会!300%推理速度领先,来自无问芯穹
全球首个端侧全模态理解开源模型来了! 在菜单里帮忙选奶茶,不在话下:还能帮忙轻松提炼长语音,再也不用对着一串几十秒语音头皮发麻(doge)。 就在刚刚,无问芯穹宣布开源目前世界上首个端侧全模态理解的开源模型Megrez-3B-Omni,不仅体积轻巧,速度飞快,更是一个多才多艺的全能选手,能够轻松处理图片、音频、文本三种模态数据。
北交开源 o1 代码版:强化学习 + 蒙特卡洛树搜索,放出源代码、精选数据集以及衍生模型
团队认为编码是一个需要 System-2 思维方式的典型任务,涉及谨慎、逻辑、一步步的问题解决过程。而他们的策略是将强化学习(RL)与蒙特卡洛树搜索(MCTS)相结合,让模型能够不断生成推理数据,提升其 System-2 能力。
DeepMind 开源大模型 GenCast 登 Nature:8 分钟预测 15 日天气
DeepMind 大模型再登上 Nature —— 气象预测大模型 GenCast,8 分钟内完成 15 天的预测,而且不管常规还是极端天气都能分析。
2024年AI趋势看这张图,LeCun:开源大模型要超越闭源
能感受到其中的趋势吗?2023 年即将过去。一年以来,各式各样的大模型争相发布。当 OpenAI 和谷歌等科技巨头正在角逐时,另一方「势力」悄然崛起 —— 开源。开源模型受到的质疑一向不少。它们是否能像专有模型一样优秀?是否能够媲美专有模型的性能?迄今为止,我们一直还只能说是某些方面接近。即便如此,开源模型总会给我们带来经验的表现,让我们刮目相看。开源模型的兴起正在改变游戏规则。如 Meta 的 LLaMA 系列以其快速迭代、可定制性和隐私性正受到追捧。这些模型被社区迅速发展,给专有模型带来了强有力的挑战,能够改变
- 1