感谢统信软件今日宣布,中国首款操作系统级端侧模型 UOS LM 正式发布。目前,UOS LM 端侧模型面向所有统信 UOS 社区版(deepin V23)用户发起定向邀约内测,添加 deepin 小助手申请内测资格。
为保证流畅体验,统信推荐以下硬件性能:
1.5B 模型:内存 2G,GPU 显存 4G,10TOPS
7B 模型:内存 8G,GPU 显存 10G,20TOPS
对于个人用户,UOS LM V1.0 版本实现本地文档构建知识库,并通过向量数据库支持基于语义的相似性搜索和向量分析操作,帮助用户通过 UOS AI 桌面智能助手实现问答、翻译、创作等功能。
对于组织用户,UOS LM V1.0 版本针对组织用户的原始文档,知识库系统的处理总共分为五个部分,分别是文档预处理、文本智能分块、向量化计算、向量索引构建、元数据索引文件的保存和调用。
AI在线汇总如下:
文档预处理阶段,知识库系统可提取各类格式文档的文本内容,如 txt、docx、xlsx、ppt、pdf 等文本格式,并对文本进行清洗、过滤,准备进行文本分块;
文本智能分块阶段,对文本四种切分方式,如固定长度切分、段切分、句切分、语义切分,尽量平衡分块个数和语义信息的完整性;
向量化计算阶段,顾名思义,就是将文本转化为向量的过程。主要作用是进行语义表征,向量检索就是使用查询文本的向量和向量数据库中的向量进相似性计算;
向量索引构建阶段,分为全量索引、倒排索引、乘积量化索引、乘积量化加倒排索引四种方式,主要目的是将文本向量化计算出来的结果通过不同的索引方式组合,得到一个最优的检索性能和存储空间兼顾的向量索引库;
元数据索引文件的保存和调用阶段,将向量化索引数据作为结构体数据来存储到电脑中,并通过向量化检索和大模型处理检索结果后,输出用户检索的内容。
对于开发者,UOS LM 提供了丰富的功能和灵活的扩展性,并提供了强大的文档支持,助力开发者简化 AI 应用开发流程,加速行业应用、业务系统的开发,拓展 AI 应用场景。
AI SDK 提供三个层面的接口能力:
AI 业务插件(AI-Plugin):灵活的 AI 业务插件能力,具备系统级和应用级调用配置,三方应用可注册自己功能接口进入 AI 推理逻辑。
AI 接口能力(DTK AI):面向编程的 DTK AI 接口能力,提供文件搜索、问答、总结、润色、语音等业务能力,减少应用开发工作。
AI 模型管理(Modelhub):原生模型接口能力,融合模型原生输入输出接口能力,方便用户调试自定义提示词或内容解析。