资讯列表
星辰与代码:DeepSeek的发展历程
技术突破阶段2024 年,DeepSeek 强势开启生态扩张与技术爆发的新纪元,成为全球 AI 领域瞩目的焦点。 年初 1 月,DeepSeek 便以 DeepSeek-MoE 震撼登场,创新性架构设计以仅 60% 的计算量损耗,成功超越 Llama 2-7B 性能,为后续技术突破奠定坚实基础,在模型效率优化上迈出关键一步。 紧接着 2 月,DeepSeekMath 在 MATH 基准测试中表现惊艳,成绩飙升至 51.7%,无限逼近 GPT-4 水平,数学推理能力实现质的飞跃,极大提升了模型在复杂数学问题求解上的可靠性与精准度。
3/27/2025 3:50:00 AM
小牛呼噜噜
LLM中的分块技术:原理、应用与展望
在大语言模型(LLM)飞速发展的当下,分块技术(Chunking)(RAG 中的分块策略:从基础到前沿的全面剖析)作为提升模型性能的关键手段,受到了广泛关注。 它在优化信息处理、提高检索效率、增强模型理解能力等方面发挥着不可或缺的作用。 深入探究 LLMs 中的分块技术,对于推动自然语言处理(NLP)领域的发展具有重要意义。
3/27/2025 2:50:00 AM
大模型之路
一文详尽大型语言模型的四种量化技术
大型语言模型(比如ChatGPT背后的技术)确实非常"庞大"——这不仅指它们的能力,更直接体现在它们的体积上。 一个中等规模的模型就可能占用几十GB的内存,相当于几百部高清电影的大小。 对于普通开发者、个人研究者或初创公司来说,这样的资源需求无疑是一道难以跨越的门槛。
3/27/2025 2:44:00 AM
云朵君
重磅发布!ChatGPT ImageGen “Shiba” 震撼来袭:你从未见过的强大AI图像生成模型!
引言期待已久的ChatGPT ImageGen终于迎来重大更新! 代号为“Shiba”的全新模型正式发布,而我可以毫不犹豫地说,这绝对是我目前为止使用过的最强大的AI图像生成工具! 无论是在Prompt理解、生成质量,还是在文字排版、编辑能力和角色一致性等方面,“Shiba”都展现出了前所未有的卓越性能,可以说是全面碾压!
3/27/2025 12:04:33 AM
深海幽光
Anthropic 取得 AI 版权官司初步胜利,出版商被指要求过于宽泛
Anthropic在与音乐出版商的版权纠纷中取得初步胜利,美国法官裁定出版商请求过于宽泛,未能证明Anthropic使用歌词对其造成不可弥补的损害。此案涉及AI训练中版权材料的合理使用问题,Anthropic对此裁决表示欢迎。#AI版权# #Anthropic#
3/26/2025 11:22:23 PM
远洋
消息称 OpenAI 考虑建立首个数据中心,助力公司成全球最大存储客户之一
知情人士透露,该数据中心可能用于存储 OpenAI 计划采购、价值数十亿美元的硬件和软件数据。《The Information》指出,如果这一计划落地,OpenAI 将成为“全球最大的存储客户”之一。
3/26/2025 9:57:58 PM
清源
被指导致青少年自杀后,聊天机器人平台 Character.AI 将允许家长查看子女使用记录
报告内容包括用户在网页端和移动端的日均使用时长、最常互动的角色及其聊天时长,旨在回应外界对未成年人沉迷聊天机器人以及接触不当内容的担忧。
3/26/2025 9:28:04 PM
清源
商汤集团 2024 年财报出炉:生成式 AI 业务收入大幅增长 103%
商汤集团发布了其年度财务报告,展示了公司在过去一年中的经营成果。 整体上,商汤集团在 2024 年度实现了 37.7 亿元人民币的收入,同比增加了 10.8%。 在这份财报中,生成式 AI 业务的表现尤为亮眼,其收入达到了 24 亿元,年增长率高达 103.1%。
3/26/2025 9:00:40 PM
AI在线
以一敌五、屠榜登顶的谷歌Gemini 2.5,居然栽在小学数学题上
编辑 | 杨文今天凌晨,大洋彼岸可真够热闹的。 OpenAI 推出了 GPT-4o 动嘴生图、P 图的功能,而谷歌则直接祭出了号称「最智能的模型」Gemini 2.5。 据谷歌首席科学家 Jeff Dean 介绍,首个版本 Gemini 2.5 Pro Experimental 已集成「思考能力」,是迄今为止性能最强大的 Gemini 模型,尤其擅长高级推理和编码,并在 @lmarena_ai 排行榜上拿下第一。
3/26/2025 8:54:00 PM
AI好好用
成都:力争2025年人工智能产业规模达到1300亿元
成都市经济和信息化局近日召开了一场媒体吹风会,发布了《2025年成都市人工智能产业链发展工作要点》。 根据计划,成都将积极推进人工智能及机器人产业的发展,力争到2025年实现核心产业规模达到1300亿元,年增速超过30%。 这项计划旨在加快成都成为全国人工智能与机器人产业发展的高地。
3/26/2025 8:43:00 PM
AI在线
蚂蚁集团发布 EnergyTS 大模型 提升新能源预测能力
蚂蚁集团旗下的蚂蚁数科正式推出了一款名为 EnergyTS 的能源电力时序大模型。 这款模型的发布被业界视为蚂蚁在人工智能领域的重要布局,尤其是在新能源行业的应用。 EnergyTS 能够通过精准的预测功能,帮助企业更好地把握发电量和供需情况,从而优化经营策略,提升运营效率。
3/26/2025 8:41:00 PM
AI在线
成都:力争今年 AI 核心产业规模 1300 亿元,培育 10 个大模型通过国家备案
成都将围绕生产、生活、城市治理,聚焦警务、养老、赛事、文旅、商务、展会、农业、教育、城管、应急、交通、工业等重点领域,打造典型应用场景不少于70个。
3/26/2025 8:00:25 PM
清源
诺奖得主罗杰・彭罗斯:人工智能不会有意识,因此不应被视为“智能”
“人类意识远远超越 AI 依赖的算法,而 AI 只能遵循预设规则,始终无法突破局限。事实上,我们误用了‘人工智能’一词,因为它并不具备真正的智能,缺乏意识的 AI 不能称之为智能。”
3/26/2025 7:49:51 PM
清源
因在学术写作中不当使用 AI,立陶宛维尔纽斯大学去年开除 10 名学生
维尔纽斯大学主管学术事务的副校长瓦尔达斯·亚斯库纳斯表示,过去一年,约10名学生因在学术写作中不当使用AI被开除,包括在毕业论文中未披露 AI 参与。
3/26/2025 6:07:05 PM
清源
知乎首次实现单季度盈利:AI将进一步融入多元化社区场景
近日,知乎正式公布了其2024年第四季度及全年业绩报告。 数据显示,知乎全年营收达到36亿元,与去年相比下降了14.3%。 然而,在第四季度,知乎实现了显著的业绩突破,营收达到8.6亿元,经调整后的净利润为9710万元,经营利润为2310万元,成功实现了全面盈利。
3/26/2025 6:00:40 PM
AI在线
雷鸟AR眼镜与通义深度定制大模型联手,交互体验提升显著
在增强现实(AR)眼镜领域,雷鸟创新正在引领一场革命。 随着 AI 技术的飞速发展,AR 眼镜正逐渐被认为是未来消费电子的重要载体。 而雷鸟创新与阿里云的深度合作,致力于将 AI 与 AR 进行无缝融合,为用户带来更流畅的交互体验。
3/26/2025 5:59:00 PM
AI在线
蚂蚁数科推出新型能源电力预测模型 EnergyTS,助力新能源行业优化运营
在新能源行业的快速发展中,准确的发电量预测和供需管理显得尤为重要。 3月26日,蚂蚁数科发布了全新的能源电力时序大模型 ——EnergyTS。 这一模型的推出,旨在通过高精度的数据分析,帮助企业优化经营策略,提升运营效率。
3/26/2025 5:51:00 PM
AI在线
全球首个音乐推理大模型 Mureka O1 震撼上线,AI 音乐创作迈入新纪元
国内科技公司昆仑万维正式推出了全球首个音乐推理大模型 Mureka O1,这款模型的推出标志着 AI 音乐创作技术的一次重大突破。 Mureka O1不仅引入了链式思维(CoT)能力,还显著提高了音乐生成的质量与效率,给全球音乐界带来了强烈震撼。 Mureka O1是在昆仑万维新升级的音乐生成基础模型 Mureka V6的基础上开发而成,它支持多达10种语言的歌词创作、纯音乐生成和音色克隆等多项功能。
3/26/2025 5:12:00 PM
AI在线