大模型

DeepSeek称遭到大规模恶意攻击，注册或受影响

DeepSeek发布公告称其线上服务近期遭受了大规模恶意攻击，导致注册过程可能变得繁忙。 DeepSeek提醒用户，如果遇到注册困难，可以稍等后重试。已注册用户可以正常登录，不受影响。

1/28/2025 10:37:00 AM

AI在线

“DeepSeek或彻底改变游戏规则”！中国大模型“搅动”硅谷

“DeepSeek或彻底改变游戏规则”！中国大模型“搅动”硅谷，巨头进入恐慌模式，外媒刷屏，大佬发声：中国AI已追上美国

1/27/2025 8:29:32 AM

deep

百川智能上线开源全模态模型 Omni-1.5，号称多项能力超越 GPT-4o mini

官方宣称，其在视觉、语音及多模态流式处理等方面，Baichuan-Omni-1.5 的表现均优于 GPT-4omini；在多模态医疗应用领域，其具备更突出的领先优势。

1/26/2025 3:32:39 PM

清源

太惨，一个月仅23个下载！盘点2024“理想丰满现实骨感”的大模型们！

整理 | 言征出品 | 51CTO技术栈（微信号：blog51cto）大型语言模型的竞争似乎正在结束，只有少数几个明显的赢家。其中，DeepSeek V3 已成为 2024 年的焦点，引领中国开源模型的发展。据 Hugging Face 称，DeepSeek V3 与 GPT-4 和 Claude 3.5 等闭源巨头正面交锋，上个月的下载量为 45,499 次，与Meta 的 Llama 3.1（491,629 次下载）和谷歌的 Gemma 2（377,651 次下载）并驾齐驱。

1/26/2025 11:38:54 AM

言征

Meta杨立昆引燃全民大讨论：美政府有些人被洗脑了，监管让开源变得像非法一样！Meta也犯过错！大模型不如猫，保质期就3年！

编辑 | 言征出品 | 51CTO技术栈（微信号：blog51cto）1月23日，在冬季达沃斯论坛的“辩论技术”环节，Meta公司副总裁兼首席人工智能科学家Yann Lecun、麻省理工学院媒体实验室主任 Dava Newman、Axios首席技术记者Ina Turpen Fried（主持人）就未来十年前沿科技进行了时长47分钟的“全民”大讨论，话题涵盖了LLM、智能体、消费机器人、脑机接口、跨物种、太空探索，也讨论了非常让Meta敏感的“技术作恶”、审查监管、开闭源之争。观众们更是抓住机会让两位嘉宾抖出了很多猛料。 Lecun表示，现在的大模型并没有达到预期效果，在很多方面都存在不足：“我认为当前 LLM范式的保质期相当短，可能只有3到5年。

1/26/2025 11:35:05 AM

言征

TeleAI “复杂推理大模型” 达竞赛级数学表现，评分超 o1-preview

近日，中国电信人工智能研究院（TeleAI）“复杂推理大模型” TeleAI-t1-preview 正式发布，即将上线天翼 AI 开放平台。 TeleAI-t1-preview 使用了强化学习训练方法，通过引入探索、反思等思考范式，大幅提升模型在数学推导、逻辑推理等复杂问题的准确性。早在 1500 多年前，数学家祖冲之就曾在《辩戴法兴难新历》中指出，复杂事物的运行规律并非超自然现象，而是可以通过实际观测、数据推理而严谨求得。

1/26/2025 9:41:00 AM

新闻助手

中国电信发布“复杂推理大模型”TeleAI-t1-preview：能解《九章算术》题目

据介绍，TeleAI-t1-preview 使用了强化学习训练方法，通过引入探索、反思等思考范式，大幅提升模型在逻辑推理、数学推导等复杂问题的准确性。

1/25/2025 5:57:55 PM

清源

字节启动AGI长期研究计划，代号Seed Edge

1月23日，据媒体报道，字节豆包大模型团队已在内部组建AGI长期研究团队，代号“Seed Edge”，鼓励项目成员探索更长周期、具有不确定性和大胆的AGI研究课题。接近字节的知情人士透露，Seed Edge的目标是探索AGI的新方法，代号名中Seed是豆包大模型团队名称，Edge代表最前沿的AGI探索。 Seed Edge鼓励跨模态、跨团队合作，为项目成员提供宽松的研究环境，实行采用更长周期的考核方式，以保障挑战真正颠覆性的AGI课题。

1/23/2025 9:29:00 AM

新闻助手

有道子曰推理模型“子曰-o1”发布即开源，14B小参数复现OpenAI o1强推理效果

2025开年，AI行业掀起大模型“推理潮”，自OpenAI发布o1后，各式推理模型不断涌现，模型的高阶推理能力迎来爆发增强，其应用价值也愈发获得业界的广泛关注。 1月22日，网易有道正式推出国内首个输出分步式讲解的推理模型“子曰-o1”。作为14B轻量级单模型，子曰-o1支持在消费级显卡上进行部署，采用思维链技术，能够提供细致解题过程，以强逻辑和推理能力，实现更高的解题准确性，并提供中文逻辑推理。

1/22/2025 11:32:00 AM

新闻助手

几个开发大模型应用常用的 Python 库

一、应用层开发1. FastAPIFastAPI是构建API的优选。顾名思义，它快速、简单，并能与Pydantic完美集成，实现无缝数据验证。

1/22/2025 10:33:44 AM

zone7

豆包推出实时语音大模型：号称中文对话断崖式领先、情商智商均在线

据介绍，豆包实时语音大模型实现了语音理解和生成一体化，实现了端到端语音对话。相比传统级联模式，在语音表现力、控制力、情绪承接方面表现惊艳，并具备低时延、对话中可随时打断等特性。

1/20/2025 4:29:51 PM

清源

小红书翻译紧急上线，见证历史：大模型翻译首次上线C端应用！AI竟自称是GPT-4?网友变身“测试狂魔”，疯狂套话，效果拉满了！

编辑 | 伊风出品 | 51CTO技术栈（微信号：blog51cto）程序员键盘敲冒烟，小红书翻译功能这不是就来了吗！之前大家各种吐槽美国人用的翻译机器不准确，导致大家交流起来“人机感很重”，一些美网友还需要额外用ChatGPT才能实现无缝交流。这翻译功能一出来，语言障碍什么的都不存在了。

1/20/2025 1:52:45 PM

伊风

全球首个亿级参数量地震波大模型今年对外开放

全球首个亿级参数量地震波大模型“谛听”在国家超级计算机成都中心发布第三阶段测试版本，该大模型 2025 年将开放微调、推理框架和配套的数据处理流程，用户可在超算平台直接使用“谛听”用于业务分析和科学研究。

1/19/2025 1:46:30 PM

归泷（实习）

看听读全都会的六边形战士MiniCPM，来啦

MiniCPM-o 2.6开源啦，该模型视觉、语音和多模态流式能力达到了 GPT-4o-202405 级别。图片简介MiniCPM-o 2.6是一个端侧多模态大模型，具有8B参数量。它基于SigLip-400M、Whisper-medium-300M、ChatTTS-200M和Qwen2.5-7B构建，通过端到端的方式训练和推理。

1/17/2025 11:38:10 AM

哎呀AIYA

大模型时代，人机交互体验将被怎样重塑？

在科技持续演进、创新浪潮迭起的当下，人类与计算机的关系日益紧密，成为推动社会发展的关键力量。自从世界上第一台计算机ENIAC被发明以来，人机交互就成为计算机科学非常重要的一个分支学科。人机交互(Human-Computer Interaction，HCI)指的是人类和计算机之间的信息交换和互动的过程，目标是使这种交互尽可能直观、高效、满足需求。

1/17/2025 11:37:46 AM

突发，美国开始拉黑国产大模型公司！智谱官方回应：手握全链路大模型核心技术，无实质影响！一天内25家中企被列入实体名单！

编辑 | 伊风月初，腾讯被美国国防部列进了“中国军工企业清单”（1260H 清单）已经够离谱了！没想到刚过去10天，更离谱的事情出现了：大模型公司也登上了美国黑名单！昨晚深夜，美国商务部工业和安全局（BIS）修订了实体清单，其中大模型六小虎之一的智谱公司赫然在列。

1/16/2025 1:24:32 PM

伊风

文档解析技术指南：从传统Pipeline到端到端大模型

众多文档，如技术手册、历史档案、学术论文和法律文件，往往以扫描件或图片形式存在。这对检索增强生成（Retrieval-Augmented Generation, RAG）、内容提取以及文档解读等后续处理工作构成了极大的挑战。文档解析技术应运而生，它能够识别并提取文档中的多种元素，如文字、公式、表格和图片，同时保持它们之间的结构联系。

1/16/2025 10:11:58 AM

追求卓越的

ChatGPT全年更新大总结！重看「大模型风向标」进化之路

2024年，大模型已经深入融入了我们的日常生活。而作为领跑者，ChatGPT也一直是大模型届的指南针，无论是去年发布的大模型o1-pro，Sora Turbo，还是各种小功能，比如视频模式、打断说话等，甚至是每月200美元的高额定价，OpenAI的每一场发布会都能给广大AI爱好者带来一些新震撼、新思路。下面共同回顾一下OpenAI在2024年发布的关键更新，一起见证大模型的进化之路！

1/16/2025 9:30:00 AM

新智元

资讯热榜

企业级模型推理部署工具vllm使用指南 - 部署最新deepseek-v3-0324模型全能且实用！实战测评谷歌最新模型Gemini 2.5 Pro 大模型部署工具 Ollama 使用指南：技巧与问题解决全攻略基于 DeepSeek GRPO 的 1.5B Rust 代码生成模型训练实战 DeepSeek R1 vs OpenAI O3 vs Gemini 2 Pro—谁最适合做客服主管的AI 模态编码器|CLIP详细解读 50组多风格提示词，全面测评Midjourney V7生图效果！斯坦福2025 AI指数出炉！中美AI对决差距仅剩0.3%，DeepSeek领衔

标签云

人工智能 OpenAI AIGC AI ChatGPT DeepSeek AI绘画数据机器人谷歌模型大模型 Midjourney 智能用户学习 GPT 开源微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达神经网络腾讯计算研究 Sora AI for Science 3D AI设计 Anthropic 机器学习 GPU 开发者场景华为预测伟达 Transformer 百度深度学习模态苹果 AI视频驾驶文本搜索 xAI 人形机器人 Copilot 神器推荐 LLaMA 大语言模型具身智能字节跳动 Claude 算力安全应用视频生成科技视觉干货合集亚马逊 2024 AGI 特斯拉 DeepMind 架构