模型

端侧最强开源 AI 模型 Llama 3.2 登场：可在手机运行，从 1B 纯文本到 90B 多模态，挑战 OpenAI 4o mini
Meta 公司昨日（9 月 25 日）发布博文，正式推出了 Llama 3.2 AI 模型，其特点是开放和可定制，开发者可以根据其需求定制实现边缘人工智能和视觉革命。Llama 3.2 提供了多模态视觉和轻量级模型，代表了 Meta 在大型语言模型（LLMs）方面的最新进展，在各种使用案例中提供了更强大的功能和更广泛的适用性。其中包括适合边缘和移动设备的中小型视觉 LLMs （11B 和 90B）…
应用
- 13
- 0
故渊9月26日
英伟达发布 Llama-3.1-Nemotron-51B AI 模型：创新神经架构搜索等技术让单 H100 GPU 运行 4 倍以上负载
英伟达 9 月 23 日发布博文，宣布推出 Llama-3.1-Nemotron-51B AI 模型，源自 Meta 公司的 Llama-3.1-70B，不过创新使用神经架构搜索（NAS）方法，建立了一个高度准确和高效的模型。Llama-3.1-Nemotron-51B 简介Llama-3.1-Nemotron-51B AI 模型基于 Meta 公司 2024 年 7 月发布的 Llama-3.1…
应用
- 8
- 0
故渊9月25日
OpenAI o1 AI 模型 PlanBench 规划能力实测：准确率 97.8%，远超 LLaMA 3.1 405B 创造的 62.6% 纪录
来自亚利桑那州立大学的科研团队利用 PlanBench 基准，测试了 OpenAI o1 模型的规划能力。研究结果表明 o1 模型取得了长足的进步，但仍然存在很大的局限性。PlanBench 基准简介PlanBench 开发于 2022 年，用于评估人工智能系统的规划能力，包括 600 个来自 Blocksworld 领域的任务，其中积木必须按照特定顺序堆叠。OpenAI o1 模型成绩在 Blo…
应用
- 19
- 0
故渊9月25日
谷歌 Gemini 1.5 AI 模型再进化：成本更低、性能更强、响应更快
科技媒体 The Decoder 昨日（9 月 24 日）发布博文，报道谷歌升级旗下 Gemini 1.5 AI 模型，推出了 Gemini-1.5-Pro-002 和 Gemini-1.5-Flash-002，相比较此前版本成本更低、性能更强、响应更快。成本更低谷歌下调了 token 输入和输出费用，Gemini-1.5-Pro-002 和 Gemini-1.5-Flash-002 最高降幅 5…
应用
- 5
- 0
故渊9月25日
OpenAI 发布 MMMLU 数据集：更广、更深评估 AI 模型，支持简体中文
科技媒体 marktechpost 昨日（9 月 23 日）发布博文，报道称 OpenAI 在 Hugging Face 上发布了多语言大规模多任务语言理解（MMMLU）数据集。背景随着语言模型日益强大，评估其在不同语言、认知和文化背景下的能力已成为当务之急。OpenAI 决定推出 MMMLU 数据集，通过提供强大的多语言和多任务数据集，来评估大型语言模型（LLMs）在各种任务中的性能，从而应对这…
应用
- 6
- 0
故渊9月24日
美图：“奇想大模型”视频生成能力已完成全面升级，可生成 1 分钟视频
美图公司今天宣布，旗下的“奇想大模型”视频生成能力完成全面升级，在实现生成能力、生成效率以及模型性能的三重进阶基础上，结合美图在计算机视觉领域的多项自研技术，实现了视频生成时长、画质、流畅性、真实性及可信度等方面的提升。据悉，美图奇想大模型的单次文生视频时长、单次图生视频时长均达 5 秒，支持生成 1 分钟、24FPS、1080P 的超长视频，升级后的视频生成功能将逐步覆盖美图秀秀、美颜相机、Wi…
应用
- 25
- 0
清源9月23日
美图奇想大模型全新升级：生成能力、生成效率、模型性能实现三重进阶
9月23日，美图公司宣布美图奇想大模型（MiracleVision）视频生成能力完成全面升级，在实现生成能力、生成效率以及模型性能的三重进阶基础上，结合美图在计算机视觉领域的多项自研技术优势，视频生成时长与画质、流畅性、真实性及可信度等方面提升显著。目前，美图奇想大模型（MiracleVision）的单次文生视频时长、单次图生视频时长均达5秒，已支持1分钟、帧率24FPS、分辨率1080P的超长视…
应用
- 33
- 0
新闻助手9月23日
准确率87.6%，南农、国防科大、苏大等发布显微图像分类AI新方法
编辑 | 萝卜皮在医学显微图像分类（MIC）领域，基于 CNN 和 Transformer 的模型得到了广泛的研究。然而，CNN 在建模长距离依赖关系方面存在短板，限制了其充分利用图像中语义信息的能力。相反，Transformer 受到二次计算复杂性的制约。为了解决这些挑战，南京农业大学、国防科技大学、湘潭大学、南京邮电大学、苏州大学组成的联合研究团队提出了一个基于 Mamba 架构的模型：Mic…
理论
- 22
- 0
ScienceAI9月23日
大语言模型的规模化联邦全参数调优
光明实验室基础智能研究团队携手新加坡国立大学最新突破——大语言模型的规模化联邦全参数调优，为大语言模型(LLMs)的联邦学习开辟了全新篇章！其中共一第一作者是光明实验室基础智能研究团队负责人，共一第二作者是新加坡国立大学博士生，均师从新加坡国立大学的Bryan Low教授。论文链接：, ：（LLMs）已在众多实际应用中变得不可或缺。然而，在规模化环境下对这些模型进行微调，尤其是在数据隐私和通信效率…
基础
- 7
- 0
新闻助手9月23日
OpenAI 首款具备“推理”能力模型 o1 现已向企业 / 教育用户开放，每周最多使用 50 次
OpenAI 公司旗下首款具备“推理”能力的模型 o1 和 o1-mini 现已向企业版（Enterprise）和教育版（Edu）用户开放访问权限，用户每周最多可输入 50 条消息。据介绍，OpenAI o1 系列模型具有更高的理解能力，与传统模型不同，o1 系列模型在回答问题之前会进行深度思考，生成内在的思维链后再给出答案，因此系列模型能够处理比之前模型更复杂的任务，特别擅长解决科学、编程和数学…
应用
- 12
- 0
漾仔9月22日
华知大模型 5.0 发布：同方知网与华为云打造，7B~135B 尺寸
以“数智共生、行业共赢”为主题的华知大模型行业应用研讨会于 9 月 21 日在上海举行，会议由同方知网与华为云联合主办。会上，华知大模型 5.0 发布，并全新上线智能 PPT、AI 科技查新、华知 App、3D 全息交互数字人等应用。据同方知网介绍，此次发布的华知大模型 5.0 实现了：“全系列、多模态、强知识、高可信”的能力跃升，针对多样化大模型建设需求，训练了 7B、13B、38B、135B …
应用
- 18
- 0
汪淼9月22日
o1 核心作者 MIT 演讲：激励 AI 自我学习，比试图教会 AI 每一项任务更重要
“o1 发布后，一个新的范式产生了”。其中关键，OpenAI 研究科学家、o1 核心贡献者 Hyung Won Chung，刚刚就此分享了他在 MIT 的一次演讲。演讲主题为“Don’t teach. Incentivize（不要教，要激励），核心观点是：激励 AI 自我学习比试图教会 AI 每一项具体任务更重要思维链作者 Jason Wei 迅速赶来打 call：Hyung Won 识别新范式并…
应用
- 8
- 0
清源9月21日
英伟达 NVLM 1.0 引领多模态 AI 变革：媲美 GPT-4o，不牺牲性能平衡文本和图像处理难题
科技媒体 marktechpost 昨日（9 月 20 日）发布博文，报道了英伟达（Nvidia）最新发布的论文，介绍了多模态大语言模型系列 NVLM 1.0。多模态大型语言模型（MLLM）多模态大型语言模型（MLLM）所创建的 AI 系统，能够无缝解读文本和视觉数据等，弥合自然语言理解和视觉理解之间的差距，让机器能够连贯地处理从文本文档到图像等各种形式的输入。多模态大型语言模型在图像识别、自然语…
应用
- 20
- 0
故渊9月21日
古农文垂直领域大语言模型“齐民”发布，基于我国大量农业古籍文本训练
综合新华社、中国网消息，由农业农村部农业大数据重点实验室、中国农业科学院农业信息研究所联合湖北省图书馆、华中农业大学图书馆、郑州师范学院传播学院、中华书局古联（北京）数字传媒科技有限公司等单位开发的古农文垂直领域大语言模型“齐民”今天在北京发布。AI在线从报道中获悉，中国具备历史悠久的农业文明和耕读文化，孕育了众多的农学家、产生了大量的古农书，古农书是中国传统农业精髓的重要载体，也是我国文化遗产的…
应用
- 6
- 0
清源9月20日
OpenAI o1 全方位 SOTA 登顶 lmsys 排行榜：数学能力碾压 Claude 和谷歌 Gemini 模型，o1-mini 并列第一
o1 模型发布 1 周，lmsys 的 6k 投票就将 o1-preview 送上了排行榜榜首。同时，为了满足大家对模型「IOI 金牌水平」的好奇心，OpenAI 放出了 o1 测评时提交的所有代码。万众瞩目的最新模型 OpenAI o1，终于迎来了 lmsys 竞技场的测评结果。不出意外，o1-preview 在各种领域绝对登顶，超过了最新版的 GPT-4o，在数学、困难提示和编码领域表现出色；…
应用
- 23
- 0
问舟9月20日
OpenAI 再成“榜一大哥”：o1-preview AI 模型更轻松驾驭数学、编程等任务
科技媒体 The Decoder 昨日（9 月 19 日）发布博文，报道称在聊天机器人竞技场（Chatbot Arena）上，OpenAI 的新人工智能模型 o1-preview 和 o1-mini 问鼎榜首。聊天机器人竞技场简介聊天机器人竞技场是一个比较人工智能模型的平台，它利用 6000 多个社区评分对新的 OpenAI 系统进行了评估。结果结果显示，o1-preview 和 o1-mini …
应用
- 17
- 0
故渊9月20日
CoT能让模型推理能力无上限？田渊栋、LeCun下场反对：两层MLP还能模拟全世界呢
「这相当于在理论上，两层神经网络在理论上可以拟合任何数据，我们就盲目相信并应用在所有场景中。」大模型新范式 OpenAI o1 一经发布，如何「复刻」出 o1 便成为了 AI 圈最热的话题。由于 OpenAI 对技术细节守口如瓶，想从 AI 那里「套话」，让它复述完整的内部推理过程，多问几句，OpenAI 直接发邮件警告要撤销你的使用资格。想从技术报告中想找出点蛛丝马迹，也同样困难。于是，大家将目…
应用
- 2
- 0
机器之心9月19日
阿尔特曼称 o1 仅仅是“推理模型的 GPT-2”，黄仁勋表示“给你加速 50 倍”
AI 界最有影响力的两个人，同时出现在一场活动：OpenAI CEO 阿尔特曼，暗示了 o1 满血版将在接下来几个月发布。英伟达创始人黄仁勋，则表示新一代 Blackwell 架构 GPU 能给 o1 推理提速 50 倍。阿尔特曼把 o1 在推理模型里的地位比作语言模型中的 GPT-2 阶段。几年后人们将看到“推理模型的 GPT-4”，不过最近几个月就会有重大改进，新范式的进步曲线非常陡峭。L2“…
应用
- 16
- 0
清源9月19日
阿里通义千问开源 Qwen2.5 大模型，号称性能超越 Llama
感谢在今天的 2024 云栖大会上，阿里云 CTO 周靖人发布通义千问新一代开源模型 Qwen2.5，其中，旗舰模型 Qwen2.5-72B 号称性能超越 Llama 405B。Qwen2.5 涵盖多个尺寸的大语言模型、多模态模型、数学模型和代码模型，每个尺寸都有基础版本、指令跟随版本、量化版本，总计上架 100 多个模型。Qwen2.5 语言模型：0.5B、1.5B、3B、7B、14B、32B …
应用
- 7
- 0
汪淼9月19日
阿里国际发布最新开源多模态模型Ovis，多模态能力再升级
看一眼菜品图就知道怎么做、能给植物看病、能把手写英文准确翻译成中文、还能精准分析财报数据……多模态能力再次升级！今天，阿里国际AI团队发布了一款多模态大模型Ovis，在图像理解任务上不断突破极限，多种具体的子类任务中均达到了SOTA（最新技术）水平。多模态大模型能够处理和理解多种不同类型的数据输入，例如文本、图像。与大型语言模型（LLMs）相比，大语言模型在处理和生成文本数据方面有专长，而多模态大…
应用
- 8
- 0
新闻助手9月19日
OpenAI ChatGPT 新增自动模式，基于提示词复杂度灵活选择合适 AI 模型
科技媒体 testingcatalog 昨日（9 月 18 日）报道，OpenAI 面向所有用户在多种设备上，为 ChatGPT 推出了“Auto”自动模式。AI在线注：用户切换选择 Auto 之后，会自动根据用户输入的提示词复杂程度，自动选择最合适的 AI 模型。对于复杂的提示，它会选用最先进的模型，而对于较简单的提示，则采用更快的模型以节省时间。许多用户反馈表示，在大多数情况下，他们更倾向于与…
应用
- 5
- 0
故渊9月19日
AI 成功进军好莱坞，视频生成平台 Runway 与狮门影业达成合作
AI 视频生成平台 Runway 今天宣布与狮门影业达成合作，该公司将使用狮门影业的影片目录训练一个定制视频模型。狮门影业副董事长迈克尔・伯恩斯表示，公司的电影制片人、导演和其他创意人才将获得该模型，以增强工作效率。“狮门影业拥有一支出色的创意团队，对 AI 如何帮助他们的工作有着清晰的愿景，我们很高兴能帮助他们将想法变为现实。”Runway 公司表示，公司在考虑如何将模型作为模板授权给个人创作者…
应用
- 10
- 0
清源9月18日
上海 AI 气象大模型提前 6 天预测“贝碧嘉”台风登陆浦东，已实现多次精准预测
今天下午，据澎湃新闻报道，上海科学智能研究院院长、复旦大学浩清教授漆远在接受采访时介绍，从 9 月 10 日晚间“贝碧嘉”台风在西北太平洋洋面上生成起，伏羲气象大模型就一直在跟踪预测它的路径，每 6 小时一次持续预报“贝碧嘉”的移动路径。9 月 10 日 23 时，伏羲气象大模型预测的路径显示“贝碧嘉”将在上海浦东新区登陆。9 月 15 日一早，预测结果进一步调整并正式确认，“贝碧嘉”将极大概率在…
应用
- 3
- 0
清源9月18日
字节跳动豆包大模型 9 月 24 日发布视频生成模型
字节跳动今日宣布，豆包大模型将于 9 月 24 日发布视频生成模型，并带来更多模型家族的能力升级。9 月 24 日 14:30，2024 火山引擎 AI 创新巡展・深圳站将于深圳举行，字节跳动将在大会上公布火山引擎整体介绍及豆包大模型进展，还有火山引擎 AI 产品最新进展和多个行业企业 AI 落地实践分享。目前快手、智谱等国内厂商已推出视频生成模型，阿里通义也将在 2024 云栖大会（9 月 19…
应用
- 23
- 0
汪淼9月18日