AI在线 AI在线

齐心集团于斌平:在大模型时代,软件应用开发开发范式从“代码驱动”转向“模型能力优先”

作者: 云昭
2025-04-17 10:17
作者 | 于斌平编辑 | 云昭在大模型时代,软件应用开发范式正在发生深刻变革。 传统的开发模式以代码为核心,注重如何用代码实现功能及用户的交互体验;而大模型时代的开发则以模型能力为核心,强调智能交互设计和业务场景创新。 本文将从新范式的关键特征、软件工程模式和开发理念的变革、建议与实践三个方面展开讨论,旨在为企业在大模型落地过程中提供全面的技术和方法指引。

作者 | 于斌平

编辑 | 云昭

在大模型时代,软件应用开发范式正在发生深刻变革。传统的开发模式以代码为核心,注重如何用代码实现功能及用户的交互体验;而大模型时代的开发则以模型能力为核心,强调智能交互设计和业务场景创新。本文将从新范式的关键特征、软件工程模式和开发理念的变革、建议与实践三个方面展开讨论,旨在为企业在大模型落地过程中提供全面的技术和方法指引。

1.新范式的关键特征

1.1 人机交互模式发生改变应变

传统开发围绕功能实现和用户界面(UI)设计展开,注重功能的代码实现和用户操作体验,交互设计以研究点击和键盘输入组合顺序为重点。而在大模型为基础的应用开发中,人机交互模式发生了根本性的改变,更关注用户与系统的对话交互(包括显式对话和隐性对话),包括对话内容、意图识别、上下文管理和异常处理等。例如,齐心集团员工报销AI助手系统,员工可以直接与系统对话:“报销打车费98元。”系统自动通过AI大模型确定用户的意图和需求,解析报销人、成本中心、费用科目、摘要等具体信息,结果跟用户以对话方式确认后,调用模型自动生成报销单,自动走审批流完成报销。

1.2 对话流即代码

传统开发,几乎所有的功能都通过写代码来实现,而大模型时代应用开发的一个重要范式特征是“对话流即代码”。它将开发者的关注点转向自然语言对话的设计和实现。与传统代码开发不同,这种方法将对话视为代码和核心逻辑,通过自然语言处理技术将用户交互转化为可执行的操作。开发者需要设计不仅仅是功能逻辑,而是如何通过对话流完成功能的实现。例如,齐心集团智能客服系统需设计对话流程(如用户提问 → 模型解析 → 知识库/业务库查询 → 生成回复→用户反馈→重新查询获取答案→用户反馈),而非传统的菜单导航。在这个过程中,开发者需要关注如何处理用户意图、管理对话上下文,以及处理对话中的异常情况。这需要开发人员具备设计合适对话流以及构建和优化自然语言理解模型的能力。通过将对话流视为代码的一部分,开发者可以更好地适应大模型时代的发展需要,创造更智能的应用体验。

1.3 基于模型能力优先

在大模型应用开发中,开发能力从“围绕代码的软件工程设计实现”转变为“基于模型能力”。传统开发通常专注于构建代码框架、类/方法、算法、业务/系统/数据逻辑,而在大模型时代,开发者需要充分挖掘和利用模型的潜在能力。通过提示词 prompt 工程、RAG、多模型调用、多模态集成、模型精调、预训练等方式,最大化模型的产出能力。以齐心集团HR员工助手“问心心”系统为例,通过企业知识库为员工自动生成企业流程制度、业务知识等问题的回复。开发者无需逐一实现固定的问答规则,而是通过设计精准的提示(Prompt),引导大模型结合上下文理解和知识库查询,生成个性化且准确的回答,从而大幅提升开发效率和用户体验。

图片图片

1.4数据驱动优化模型输出效果

模型输出需要结合动态数据(如用户实时行为、业务数据库),并通过反馈循环优化结果。例如,齐心集团云采商城推荐系统调用大模型生成推荐内容,同时根据用户点击率/加购率和使用场景变化动态调整推荐策略;智能客服根据模型回复的问题准确率,及时调整优化Prompt工程和知识库查询策略。

1.5 多模态融合

整合文本、语音、图像、视频等多种模态的模型能力,构建复合型应用。例如,齐心集团交互数字人员工“心心”,能够处理用户提出的各种问题诸如报销流程、商品详情咨询、售后服务问题、数据分析等。能够通过不同的交互方式如语音、图片、文字、甚至一段小视频等,与用户实时互动。系统根据输入内容,自动调用文本、语音和图像处理能力,高效地解决用户各种形态的问题,提升企业协同办公能力和员工满意度。

图1:齐心集团数字员工“心心”系统实现逻辑

1.6 跨模型协同

调用不同模型的专长(如DeepSeek处理推理类需求、GPT处理文本分析、通义千问处理图片分析等),处理综合类复杂类业务场景问题。例如,齐心集团交互数字人系统,调用DeepSeek R1模型解析用户需求,调用千帆模型生成文字答案,调用通义千问模型分析图片,调用图像模型生成可视化结果。

2.软件工程模式和开发理念的变革

2.1 开发者的能力重心发生变化:从“流程设计”到“模型驱动”

传统的软件工程,不论是“敏捷开发”还是“瀑布式开发”模式,软件开发的工作重心是业务流程(如订单流程)和数据逻辑的设计及实现,开发者需手动编写各种逻辑及数据时序,关注功能的代码实现及优化。

大模型时代,业务功能由大模型推理生成,开发者更关注数据质量、模型微调训练、Prompt工程等。开发者从编写代码逻辑转向设计模型交互链路,通过低代码工具和模型能力快速实现功能。例如,齐心集团云采商城智能推荐系统,开发人员不再编写推荐算法和数据训练逻辑,而是训练模型理解用户下单场景和喜好用途,调用大模型生成推荐商品(如DeepSeek + 商品知识库)。

2.2 工程角色转变:从“单一职责者协作”到“多角色协作或多面手工程”

一般应用软件开发,通常是单一职责者协作或主导。角色构成主要由软件工程师(Full Stack Developer、Backend Developer等)负责开发,产品经理负责分析用户需求,设计流程和业务功能实现策略,软件工程师根据需求文档编写代码,测试团队进行功能测试,上线后依赖人工运维和运营。

大模型时代的软件工程技术人员,其角色和工作模式在潜移默化中逐渐发生改变。角色构成包括AI工程师、数据工程师、产品经理、安全与合规专家、软件工程师、测试工程师。通常开发流程为:

1)需求分析:产品经理分析用户需求,明确主要功能点,以模型为基础设计人机交互方式,并与AI工程师讨论对模型的需求。

2)模型开发:AI工程师进行大模型微调,设计RAG模式,设计提示词Prompt工程,优化对话生成能力;数据工程师清洗历史数据,并根据关键意图标注数据。

3)业务功能开发:软件工程师编写业务代码,调用模型能力,实现业务需求功能。

4)系统集成:AI工程师将训练好的模型部署为API服务,软件工程师调用模型API到应用系统中。

5)安全与合规审查:安全专家审查模型输出是否符合数据隐私保护和业务合规要求。

6)测试与上线:软件工程师、AI工程师、测试团队验证模型在多种场景下的表现,用模型编写测试用例进行功能测试;系统上线后,持续监控用户反馈,动态优化模型和对话流程,并使用模型能力进行系统自动化监控和运维。

实际上,一般企业配备这么多角色显然是比较困难的。所以对以往的技术人员提出了比较高的转型要求,即之前的单一职责的软件开发工程师或者产品经理,需要同时具备AI工程师、数据工程师、系统集成工程师,甚至安全专家等多个职能。

例如,齐心集团智能客服系统的开发工程中,软件工程师负责基础工程代码的编写,同时负责训练和微调大模型,使其能够理解用户的多样化提问,还需要部署模型API到云原生平台,实现用户与模型的实时交互。软件工程师也要审查模型输出是否包含敏感信息、模型是否有安全漏洞等。产品经理负责清洗历史客服对话数据,标注关键意图和实体,同时分析用户行为数据,优化对话流程。

图2:齐心集团智能客服系统架构图

2.3 软件架构的变化:从“分布式微服务”到“模型服务化”

互联网时代,“服务化/微服务化”是应用软件架构的标配(实际上被“滥用”,很多业务场景的软件架构并不适合“微服务化”,另议),这种架构通常会以单一功能逻辑服务提供为标准,拆分功能模块(如订单服务、库存服务、支付服务、注册服务),通过RPC或HTTP API进行服务间通信,重点在于业务流程的编排和事务管理。例如,电商系统中,订单服务负责处理下单逻辑,支付服务负责调用第三方支付接口完成支付功能。

大模型时代,大部分功能逻辑服务,都可以通过大模型以API形式提供服务,形成模型服务网格(如文本生成服务、推理分析服务、图像识别服务),服务间通信更注重模型推理结果的调用和整合,重点在于动态资源调度(如不同模型调用分配)和模型服务的高可用性。例如,齐心集团智能客服系统调用“文本生成模型服务”生成回复,调用“情感分析模型服务”判断用户情绪,通过ReAct机制,调用大模型能力实现对不同工具集的调用(如商品、订单、结算等)。

2.4 模型训练与推理:从“传统机器学习”到“大模型专用工具链”

使用传统机器学习框架(如Scikit-learn、XGBoost)训练模型时,特征工程是核心环节,依赖算法工程师人工设计特征(例如用户点击率预测中需构造行为序列统计特征、时间窗口聚合特征)。模型部署通常采用本地服务化或轻量级REST API。此类方法对AI工程能力要求较高,需掌握特征交叉策略(如多项式特征生成)和超参数优化(如网格搜索)等专业技能。

大模型时代,AI开发呈现"普世工程化"和"半自动化"趋势,在“大模型专用工具链”的加持下,模型训练的门槛逐步降低。典型表现在以下几个方面:

1)自动化特征工程。云平台(如阿里云PAI)集成智能特征处理工具,支持自动数据清洗(缺失值填充)、特征编码(类别变量Embedding)与特征选择(基于特征重要性排序)。

2)预训练+微调范式。基于预训练模型(如CV领域的ViT,NLP领域的BERT)通过精调接口(如华为云ModelArts、OpenAI platform、千帆ModelBuilder)快速适配业务场景,大幅降低数据需求。

3)分布式训练简化。主流云平台框架原生支持分布式训练,配合云平台资源调度(如华为云ModelArts的弹性GPU集群)实现一键扩展。

4)流程标准化。端到端流水线,从数据标注(集成Label Studio等工具)、模型训练(AutoML自动超参搜索)到服务部署(KServe推理框架)全链路标准化。

5)低代码开发:通过可视化界面配置训练任务,支持自动生成数据增强策略(如随机裁剪/旋转)。

以齐心集团云采商城训练图片审核模型为例。数据准备阶段,使用数据标注服务完成图片检测标准精细化标注,自动提取EXIF元数据(如设备、分辨率)作为辅助特征。模型训练阶段,选择预训练视觉模型(如ResNet-101),配置分布式训练节点,系统自动优化学习率调度策略。推理部署阶段,使用部署服务部署模型,结合DeepSeek R1实现计算优化目的。

2.5 数据基础设施:从“传统数据库”到“向量数据库”

一般应用系统,数据存储以关系型数据库(如MySQL、PostgreSQL)为主,以NoSQL数据库如Redis、MongoDB、ArangoDB等为辅,数据处理以结构化数据为核心,注重事务一致性和数据完整性。

随着AI大模型的普及推广,以私有/专属知识查询为主RAG模式逐步成为标配,RAG模式的数据存储以向量数据库(如Milvus、Pinecone)为主,支持非结构化数据的向量化存储和检索,数据处理以语义理解和相似度检索为核心,注重高效检索和实时反馈。例如,齐心集团推荐系统存储用户兴趣及喜好、场景及对应商品的向量,通过向量数据库快速检索相似内容。

2.6 自动化与低代码:从“手动编码”到“AI辅助开发”

传统开发者手动编写代码,依赖IDE(如VS Code、IntelliJ)和版本控制系统(如Git),业务逻辑以代码形式实现,需手动调试和优化。

大模型时代开启全新AI开发模式,AI范式以语义级代码生成(如完整模块生成)、上下文感知补全(基于代码环境推荐装饰器)为核心,开发效率提升数倍。例如,开发者向模型描述需求“实现用户登录的功能,Python语言”,模型自动生成相关代码和前端UI。

AI辅助开发通过大语言模型将自然语言需求直接映射为可执行代码,结合低代码工具实现“需求-代码”的端到端压缩。开发者从编码者转型为AI训练师,聚焦逻辑校验与业务对齐,开发模式从“人写机器跑”升级为“人机协同设计”。使用AI辅助开发工具(如GitHub Copilot、Cursor)生成主要代码,开发者只需根据特定业务逻辑进行二次修改、微调即可。正如 Cursor 创始人所言:“我们不是在教 AI 写代码,而是让它成为人类创造力的延伸。”在这种新范式下,清晰的表达将会成为一种重要的生产力。

特别一提的是,在大模型时代,传统的UI设计师和前端工程师岗位,正快速地被AI取代,可以预见在不久的将来(不是5-10年,可能就是18个月左右),一些普通的后端工程师岗位,也会被AI取代。AI 辅助编程已经是一个不可逆的潮流趋势,不能高效使用 AI 工具为己所用的程序员将很快被时代抛在后面。

2.7 算力与资源管理:从“本地/专属计算”到“AI云原生与分布式计算”

过去,AI算力基本依赖本地服务器或购买云平台专属算力服务器,成本很高但资源利用率有限,模型训练和推理需手动配置硬件资源(如CPU、GPU)。例如,在本地/专属服务器上运行机器学习模型,依赖手动调整硬件配置。

随着各大云平台纷纷入场大模型领域,AI算力天然丝滑地依赖云原生基础设施(如华为云、阿里云),模型训练和推理通过云服务动态分配资源。方式上,既可调用云平台的Maas服务,也可以动态购买GPU算力(如按需扩展GPU集群)和RPM/TPM。国内外主流云平台,如华为云ModelArts、阿里云PAI、千帆ModelBuilder,都支持这些模式。齐心集团的大模型研发,也受益于这些模式。

2.8 数据安全与隐私:从“传统加密与访问控制”到“智能与隐私增强技术”

在传统开发范式中,数据安全与隐私主要依赖于访问控制、静态数据加密和传输加密等机制。例如:数据存储采用AES等对称加密,保障数据在存储中的安全性;通过权限分级和认证(如OAuth、RBAC)限制数据访问;在数据传输中使用TLS协议防止窃听和篡改;等等。这种方式适用于关系型数据库中存储的结构化数据,如金融机构保护用户的交易数据,电商系统中的订单和用户信息等,主要解决未经授权访问和数据泄露问题。

大模型时代,数据类型和获取方式逐渐多样化,隐私和安全需求更为复杂,比如大家熟知的,通过提示词的巧妙设计,向大模型“套取”敏感数据等。传统安全机制已难以满足非结构化数据和大规模数据场景的需求,在以上数据安全策略的基础上,出现新的技术范式,包括:

1)联邦学习:在本地训练模型,敏感数据不直接共享。

2)差分隐私:在数据处理和模型推理时加入噪声,保护个体隐私。

3)同态加密:在加密状态下进行计算,无需解密即可处理数据。

4)零知识证明:验证数据真实性的同时不暴露具体数据内容。

5)隐私增强技术与模型安全性优化:对生成内容的隐私保护提出新要求,如通过内容过滤和模型输出的隐私屏蔽,防止生成内容中泄露敏感信息。

例如,齐心云采商城专属化推荐系统,用户场景、下单记录及行为数据存储为向量表示,并采用联邦学习和差分隐私技术,在隐私数据安全可控的前提下进行语义分析,确保系统既能提供优质服务,又保护用户隐私。

3.建议与实践

3.1 提高Prompt工程能力和质量,提高模型可使用性和可透明性

1) 迭代式Prompt设计:采用A/B测试和反馈闭环,不断优化Prompt工程能力,提高在各场景下输出的准确性。常见方法有:格式化Markdown、FewShot、COT、L2M、BOT、ReAct等,大模型使用效果提升的其他通用做法还有使用RAG、SFT等。

2) 模型解释模块引入:在推理大模型出来之前,利用SHAP、LIME等工具,为模型决策过程增加可解释性,帮助业务人员理解系统输出。在DeepSeek R1等推理大模型问世后,可输出推理“thinking”过程,让使用人员理解输出结果是如何产生的。

3) 示例:在齐心集团主数据智能治理系统中,技术团队通过不断迭代优化Prompt工程,对常见问题形成实例性标准结果,结合用户反馈优化Prompt,并使用RAG模式进行向量库语义检索,输出结果准确率最高提升了28%;在员工助手数字人“心心”系统中,直接使用DeepSeek R1推理模型,输出了推理过程,提升问题解答的透明度。

3.2 完善MLOps全流程

MLOps指的是在机器学习项目的整个生命周期中,涵盖从数据准备到模型部署、监控以及持续迭代优化的各个环节。它通过自动化和协同工作,将开发、测试、部署、运维等过程无缝连接起来,从而确保模型能够稳定、高效地在生产环境中运行。

1)自动化训练与版本管理:构建从数据采集、清洗、特征工程到模型训练、评估和版本发布的闭环流水线。

2)持续集成/持续部署(CI/CD):通过自动化测试、在线验证、日志监控及异常预警,确保新模型发布后能够平滑回滚。

3)在线/离线监控:实时监控模型推理性能和用户反馈,形成持续优化闭环。

4)示例案例:在齐心集团主数据智能治理系统中,引入MLOps理念方法,实现了数据标注、模型微调到API部署的全流程建设和管控。系统收集用户使用反馈,评估输出结果并不断验证模型表现,针对badcase进行分析和数据再标注、模型微调;当某个版本出现异常时,系统能自动回滚至稳定版本,保障服务连续性。

3.3 建立混合云架构

1)对实时性响应不高的需求场景:直接调用云平台大模型服务API。

2)对实时性要求较高,并且需要私有知识库或对输入数据有保密性要求的场景:可独立部署企业专有模型。

3)仅对实时性有很高要求的单一需求场景:可将部分模型推理任务下沉至边缘节点,降低响应延迟。

4)混合云协同:构建中心云服务与边缘节点之间的数据同步和任务调度机制,实现高效资源利用。

5)示例案例:齐心集团研发和使用AI大模型的各项目中,根据不同场景需求构建了混合云架构。主数据治理系统在本地边缘设备上部署了轻量级模型,实时响应处理数据问题;复杂的商品推荐及客户询价系统由中心云端专属大模型处理,其他相关系统直接调用云端MaaS模型服务API处理。系统间通过任务调度实现无缝衔接,既满足实时响应需求,又确保计算资源高效利用,并能有效节省成本。

3.4 组织与团队转型

1)组织与团队能力转型:任何事情的本质都是人和组织,大模型引起的变革也不例外。所以首先是组织和团队的能力向AI大模型时代需要的能力和结构转变。可以组建涵盖AI工程师、数据工程师、产品经理、安全专家和软件工程师的多角色协作团队,共同完成系统设计与落地。注意,这里是多角色而不是多个岗位,最好的模式是一个岗位承担多个角色。可以考虑培养多面手工程师和产品经理,使传统的软件工程师和产品经理向具有大模型能力的新型技术人员转变。

2)内部培训与知识共享:建立学习和技术分享机制,提升团队对AI新技术、大模型新范式、Prompt工程、向量模型、模型微调、MLOps工具及安全合规知识的整体掌握。

3)明确战略目标,凝聚团队共识:大模型作为新一轮生产力变革的核心驱动力,需以战略机遇视角锚定方向,同步推动组织能力重构与个人认知升级,实现技术革命背景下的系统性跃迁。

4)案例:齐心集团定期举办AI技术沙龙和案例分享,向行业AI专家学习,团队间互相学习,营造隆重AI学习氛围,并通过一些直接或间接的大模型任务/项目模式,树立成功项目典范,逐渐以点带面使整个组织逐步拥有大模型开发能力,掌握大模型开发新范式。并通过敏捷开发流程实现从需求收集、模型微调到系统部署的高效协作,显著提升了大模型工程的开发效率与上线成功率。

4.总结

大模型时代重塑了企业应用软件开发的核心逻辑,推动开发范式从“代码驱动”向“模型能力优先”转型。本文系统阐述了新范式的六大关键特征:对话交互重构、模型服务化架构、多模态融合、跨模型协同、数据基础设施升级及AI辅助开发普及,并结合齐心集团实践案例验证了技术落地的可行性。实践证明,开发者需聚焦Prompt工程、MLOps全流程优化及混合云架构设计,同时推动组织能力向多角色协作/多面手能力转型。通过战略目标锚定与团队认知升级,企业可系统性实现生产力跃迁,在智能化竞争中占据先机。

5.后记

未来,大模型技术将持续深化与垂直行业的融合创新,催生更具变革性的应用场景。然而,当前仍面临模型可解释性不足、数据隐私保护机制不完善、算力成本居高不下、应用场景创新乏力以及系统升级成本高昂等关键瓶颈。建议模型厂商重点突破轻量化部署技术与伦理治理框架,产业界应着力打造开放协同的工具链生态以降低应用门槛,企业用户则需立足业务痛点精准匹配场景化解决方案。唯有通过技术创新与组织变革的双轮驱动,才能充分释放大模型的产业价值,引领数字化发展的智能新时代。

相关标签:

相关资讯

OpenAI员工疯狂暗示,内部已成功开发ASI?被曝训出GPT-5但雪藏

种种迹象表明,最近OpenAI似乎发生了什么大事。 AI研究员Gwern Branwen发布了一篇关于OpenAI o3、o4、o5的文章。 根据他的说法,OpenAI已经跨越了临界点,达到了「递归自我改进」的门槛——o4或o5能自动化AI研发,完成剩下的工作!
1/20/2025 7:30:00 AM
新智元

5090跑《黑神话》飙到200+帧,英伟达DLSS也用上Transformer了

现在,打个游戏都用上Transformer了? 老黄的DLSS进行了一波大升级,换上了基于Transformer的新大脑。 用上新模型之后,光线重建和超分辨率,效果都变得更细腻了。
1/20/2025 7:00:00 AM
量子位

DeepSeek新模型霸榜,代码能力与OpenAI o1相当且确认开源,网友:今年编程只剩Tab键

DeepSeek版o1,有消息了。 还未正式发布,已在代码基准测试LiveCodeBench霸榜前三,表现与OpenAI o1的中档推理设置相当。 注意了,这不是在DeepSeek官方App已经能试玩的DeepSeek-R1-Lite-Preview(轻量预览版)。
1/20/2025 8:46:00 AM
量子位