AI在线 AI在线

大模型

DeepSeek称遭到大规模恶意攻击,注册或受影响

DeepSeek发布公告称其线上服务近期遭受了大规模恶意攻击,导致注册过程可能变得繁忙。 DeepSeek提醒用户,如果遇到注册困难,可以稍等后重试。 已注册用户可以正常登录,不受影响。
1/28/2025 10:37:00 AM
AI在线

“DeepSeek或彻底改变游戏规则”!中国大模型“搅动”硅谷

“DeepSeek或彻底改变游戏规则”!中国大模型“搅动”硅谷,巨头进入恐慌模式,外媒刷屏,大佬发声:中国AI已追上美国
1/27/2025 8:29:32 AM
deep

百川智能上线开源全模态模型 Omni-1.5,号称多项能力超越 GPT-4o mini

官方宣称,其在视觉、语音及多模态流式处理等方面,Baichuan-Omni-1.5 的表现均优于 GPT-4omini;在多模态医疗应用领域,其具备更突出的领先优势。
1/26/2025 3:32:39 PM
清源

太惨,一个月仅23个下载!盘点2024“理想丰满现实骨感”的大模型们!

整理 | 言征出品 | 51CTO技术栈(微信号:blog51cto)大型语言模型的竞争似乎正在结束,只有少数几个明显的赢家。 其中,DeepSeek V3 已成为 2024 年的焦点,引领中国开源模型的发展。 据 Hugging Face 称,DeepSeek V3 与 GPT-4 和 Claude 3.5 等闭源巨头正面交锋,上个月的下载量为 45,499 次,与Meta 的 Llama 3.1(491,629 次下载)和谷歌的 Gemma 2(377,651 次下载)并驾齐驱。
1/26/2025 11:38:54 AM
言征

Meta杨立昆引燃全民大讨论:美政府有些人被洗脑了,监管让开源变得像非法一样!Meta也犯过错!大模型不如猫,保质期就3年!

编辑 | 言征出品 | 51CTO技术栈(微信号:blog51cto)1月23日,在冬季达沃斯论坛的“辩论技术”环节,Meta公司副总裁兼首席人工智能科学家Yann Lecun、麻省理工学院媒体实验室主任 Dava Newman、Axios首席技术记者Ina Turpen Fried(主持人)就未来十年前沿科技进行了时长47分钟的“全民”大讨论,话题涵盖了LLM、智能体、消费机器人、脑机接口、跨物种、太空探索,也讨论了非常让Meta敏感的“技术作恶”、审查监管、开闭源之争。 观众们更是抓住机会让两位嘉宾抖出了很多猛料。 Lecun表示,现在的大模型并没有达到预期效果,在很多方面都存在不足:“我认为当前 LLM范式的保质期相当短,可能只有3到5年。
1/26/2025 11:35:05 AM
言征

TeleAI “复杂推理大模型” 达竞赛级数学表现,评分超 o1-preview

近日,中国电信人工智能研究院(TeleAI)“复杂推理大模型” TeleAI-t1-preview 正式发布,即将上线天翼 AI 开放平台。 TeleAI-t1-preview 使用了强化学习训练方法,通过引入探索、反思等思考范式,大幅提升模型在数学推导、逻辑推理等复杂问题的准确性。 早在 1500 多年前,数学家祖冲之就曾在《辩戴法兴难新历》中指出,复杂事物的运行规律并非超自然现象,而是可以通过实际观测、数据推理而严谨求得。
1/26/2025 9:41:00 AM
新闻助手

中国电信发布“复杂推理大模型”TeleAI-t1-preview:能解《九章算术》题目

据介绍,TeleAI-t1-preview 使用了强化学习训练方法,通过引入探索、反思等思考范式,大幅提升模型在逻辑推理、数学推导等复杂问题的准确性。
1/25/2025 5:57:55 PM
清源

字节启动AGI长期研究计划,代号Seed Edge

1月23日,据媒体报道,字节豆包大模型团队已在内部组建AGI长期研究团队,代号“Seed Edge”,鼓励项目成员探索更长周期、具有不确定性和大胆的AGI研究课题。 接近字节的知情人士透露,Seed Edge的目标是探索AGI的新方法,代号名中Seed是豆包大模型团队名称,Edge代表最前沿的AGI探索。 Seed Edge鼓励跨模态、跨团队合作,为项目成员提供宽松的研究环境,实行采用更长周期的考核方式,以保障挑战真正颠覆性的AGI课题。
1/23/2025 9:29:00 AM
新闻助手

有道子曰推理模型“子曰-o1”发布即开源,14B小参数复现OpenAI o1强推理效果

2025开年,AI行业掀起大模型“推理潮”,自OpenAI发布o1后,各式推理模型不断涌现,模型的高阶推理能力迎来爆发增强,其应用价值也愈发获得业界的广泛关注。 1月22日,网易有道正式推出国内首个输出分步式讲解的推理模型“子曰-o1”。 作为14B轻量级单模型,子曰-o1支持在消费级显卡上进行部署,采用思维链技术,能够提供细致解题过程,以强逻辑和推理能力,实现更高的解题准确性,并提供中文逻辑推理。
1/22/2025 11:32:00 AM
新闻助手

几个开发大模型应用常用的 Python 库

一、应用层开发1. FastAPIFastAPI是构建API的优选。 顾名思义,它快速、简单,并能与Pydantic完美集成,实现无缝数据验证。
1/22/2025 10:33:44 AM
zone7

豆包推出实时语音大模型:号称中文对话断崖式领先、情商智商均在线

据介绍,豆包实时语音大模型实现了语音理解和生成一体化,实现了端到端语音对话。相比传统级联模式,在语音表现力、控制力、情绪承接方面表现惊艳,并具备低时延、对话中可随时打断等特性。
1/20/2025 4:29:51 PM
清源

小红书翻译紧急上线,见证历史:大模型翻译首次上线C端应用!AI竟自称是GPT-4?网友变身“测试狂魔”,疯狂套话,效果拉满了!

编辑 | 伊风出品 | 51CTO技术栈(微信号:blog51cto)程序员键盘敲冒烟,小红书翻译功能这不是就来了吗! 之前大家各种吐槽美国人用的翻译机器不准确,导致大家交流起来“人机感很重”,一些美网友还需要额外用ChatGPT才能实现无缝交流。 这翻译功能一出来,语言障碍什么的都不存在了。
1/20/2025 1:52:45 PM
伊风

全球首个亿级参数量地震波大模型今年对外开放

全球首个亿级参数量地震波大模型“谛听”在国家超级计算机成都中心发布第三阶段测试版本,该大模型 2025 年将开放微调、推理框架和配套的数据处理流程,用户可在超算平台直接使用“谛听”用于业务分析和科学研究。
1/19/2025 1:46:30 PM
归泷(实习)

看听读全都会的六边形战士MiniCPM,来啦

MiniCPM-o 2.6开源啦,该模型视觉、语音和多模态流式能力达到了 GPT-4o-202405 级别。 图片简介MiniCPM-o 2.6是一个端侧多模态大模型,具有8B参数量。 它基于SigLip-400M、Whisper-medium-300M、ChatTTS-200M和Qwen2.5-7B构建,通过端到端的方式训练和推理。
1/17/2025 11:38:10 AM
哎呀AIYA

大模型时代,人机交互体验将被怎样重塑?

在科技持续演进、创新浪潮迭起的当下,人类与计算机的关系日益紧密,成为推动社会发展的关键力量。 自从世界上第一台计算机ENIAC被发明以来,人机交互就成为计算机科学非常重要的一个分支学科。 人机交互(Human-Computer Interaction,HCI)指的是人类和计算机之间的信息交换和互动的过程,目标是使这种交互尽可能直观、高效、满足需求。
1/17/2025 11:37:46 AM
Yu

突发,美国开始拉黑国产大模型公司!智谱官方回应:手握全链路大模型核心技术,无实质影响!一天内25家中企被列入实体名单!

编辑 | 伊风月初,腾讯被美国国防部列进了“中国军工企业清单”(1260H 清单)已经够离谱了! 没想到刚过去10天,更离谱的事情出现了:大模型公司也登上了美国黑名单! 昨晚深夜,美国商务部工业和安全局(BIS)修订了实体清单,其中大模型六小虎之一的智谱公司赫然在列。
1/16/2025 1:24:32 PM
伊风

文档解析技术指南:从传统Pipeline到端到端大模型

众多文档,如技术手册、历史档案、学术论文和法律文件,往往以扫描件或图片形式存在。 这对检索增强生成(Retrieval-Augmented Generation, RAG)、内容提取以及文档解读等后续处理工作构成了极大的挑战。 文档解析技术应运而生,它能够识别并提取文档中的多种元素,如文字、公式、表格和图片,同时保持它们之间的结构联系。
1/16/2025 10:11:58 AM
追求卓越的

ChatGPT全年更新大总结!重看「大模型风向标」进化之路

2024年,大模型已经深入融入了我们的日常生活。 而作为领跑者,ChatGPT也一直是大模型届的指南针,无论是去年发布的大模型o1-pro,Sora Turbo,还是各种小功能,比如视频模式、打断说话等,甚至是每月200美元的高额定价,OpenAI的每一场发布会都能给广大AI爱好者带来一些新震撼、新思路。 下面共同回顾一下OpenAI在2024年发布的关键更新,一起见证大模型的进化之路!
1/16/2025 9:30:00 AM
新智元