大模型帮你写小说,阶跃星辰推出 Step-2“高性价比版”及“文学大师版”

阶跃星辰昨日上线了 Step-2 系列语言模型的两款新品 —— 参数量小、性价比更高的 Step-2 mini,以及专门针对内容创作领域推出的模型 Step 文学大师版。
感谢阶跃星辰昨日上线了 Step-2 系列语言模型的两款新品 —— 参数量小、性价比更高的 Step-2 mini,以及专门针对内容创作领域推出的模型 Step 文学大师版。

大模型帮你写小说,阶跃星辰推出 Step-2“高性价比版”及“文学大师版”

AI在线从官方介绍获悉,Step-2 mini 和万亿参数大模型 Step-2 相比,以 3% 左右的参数量保有了其 80% 以上的模型性能。

与此同时,Step-2 mini 拥有更快的生成速度和极高的性价比。在输入 4000 tokens 的情况下,Step-2 mini 的平均首字时延仅 0.17 秒。目前,大家已经可以在阶跃星辰开放平台调用 Step-2 mini 的 API 接口。输入 1 元 / 百万 token;输出 2 元 / 百万 token。

大模型帮你写小说,阶跃星辰推出 Step-2“高性价比版”及“文学大师版”

▲ 网页截图

Step-2 mini 采用了阶跃星辰自主研发的新型注意力机制架构 ——MFA(Multi-matrix Factorization Attention,多矩阵分解注意力)及其变体 MFA-Key-Reuse,相比于常用的 MHA(Multi-Head Attention,多头注意力)架构,节省了近 94% 的 KV 缓存开销,拥有更快的推理速度并大幅降低了推理成本。

据官方介绍,Step-2 文学大师版是一款专为文字内容创作研发的模型,沿袭了 Step-2 的知识储备、对文字强大的细节把控能力,特色在于具有更加强大的内容创作能力。Step-2 文学大师版力求解决市面上语言模型过度对齐导致的内容“假大空”,缺乏新意和真情实感的问题。

相关资讯

阶跃星辰再拿多模态榜首,全方位升级发布六款模型

作者|朱可轩编辑|陈彩娴春节将近,各家厂商似乎都在争取休假前的最后一博,此时步入 2025 年也才半月有余,大模型玩家们已然卷上了新高度。 先是 OpenAI 打响了开年第一“枪”,ChatGPT 上线了新功能“Tasks”,主打提升了任务执行能力,之后国内一众厂商也先后发布了自家成果——月之暗面发布了全新的多模态图片理解模型 moonshot-v1-vision-preview;MiniMax 开源了基础语言模型 MiniMax-Text-01 和视觉多模态模型 MiniMax-VL-01;生数科技上新了视频大模型 Vidu 2.0;接着,智谱 AI 推出了端到端多模态大模型 GLM-Realtime;面壁智能带来了端侧多模态模型 MiniCPM-o 2.6;DeepSeek 开源了 DeepSeek-R1 推理模型......刚开年,模型更新便多到让人眼花缭乱,当中也不难发现,多模态、推理和端侧依旧是今年各家寻求突破的重点方向。 不得不提的是,在这一各厂商密集上新的“黄金节点”,AI 科技评论关注到,阶跃星辰一周内竟一口气批量更新了 6 款模型,全方位涵盖语言、语音、推理、图片理解、视频生成等多类别。

告别微软,姜大昕带领这支精英团队攀登Scaling Law,万亿参数模型已有预览版

攀登 Scaling Law,打造万亿参数大模型,前微软 NLP 大牛姜大昕披露创业路线图。前段时间,OpenAI 科学家 Jason Wei 的一份作息时间表引发了广泛关注。表中有很多让人看了会心一笑的梗,比如「9 点 45:背诵 OpenAI 章程,向最优化的神祷告,学习《苦涩的教训》」「10 点用 Google Meet 开会,讨论怎么在更多数据上训练更大的模型」「11 点写代码,用来在更多数据上训练更大的模型」「1 点:实操,在更多数据上训练更大的模型」「4 点:对用更多数据训练的更大的模型进行提示工程」…

揭秘:阶跃星辰万亿MoE+多模态大模型矩阵亮相

在 2024 年世界人工智能大会的现场,很多人在一个展台前排队,只为让 AI 大模型给自己在天庭「安排」一个差事。具体流程是这样的:首先, AI 会管你要一张个人照片,并参考《大闹天宫》画风生成你在仙界的形象照。接下来,它会引导你进入一个交互式的剧情选择和交谈环节(其实是 AI 大模型自己编的剧情),然后根据你的选择和回答评估出你的 MBTI 人格类型,并根据这个类型为你在天庭「安排」一个差事。 当然,除了现场排队,你还可以在线体验(扫描下方二维码即可)。这是大模型创业公司阶跃星辰与上影合作的 AI 互动体验《AI