自然语言处理

用有限的预算构建AI应用程序
译者 | 布加迪审校 | 重楼人工智能（AI）已经成为现代软件应用程序不可或缺的一部分，因为它可以为传统应用程序添加更强大的功能。本教程将指导你使用一种简单的方法来构建AI应用程序。人工智能（AI）已经成为现代软件应用程序不可或缺的一部分，因为它可以为传统应用程序添加前所未有的更强大功能，比如语音识别、图像检测/分类以及自然语言处理（NLP）等等。
理论
- 973
- 0
布加迪12月10日
25 个值得关注的检索增强生成 (RAG) 模型和框架
大型语言模型 (LLM) 如 GPT-4 彻底革新了自然语言处理 (NLP) 领域，在生成类人文本、回答问题和执行各种语言相关任务方面展现出卓越的能力。然而，这些模型也存在一些固有的局限性：知识截止：LLM 的训练数据通常截止于特定时间点，使其无法获取训练后发生的事件或信息。静态知识库：LLM 嵌入的知识在训练后固定不变，限制了其动态整合新信息的能力。
理论
- 970
- 0
Isuru Lakshan Ekanay11月19日
提高深度学习模型效率的三种模型压缩方法
译者 | 李睿审校 | 重楼近年来，深度学习模型在自然语言处理（NLP）和计算机视觉基准测试中的性能稳步提高。虽然这些收益的一部分来自架构和学习算法的改进，但数据集大小和模型参数的增长是重要的驱动因素。下图显示了top-1 ImageNet分类精度作为GFLOPS的函数，GFLOPS可以用作模型复杂性的指标。
理论
- 972
- 0
李睿11月18日
基于PyTorch的大语言模型微调指南：Torchtune完整教程与代码示例
近年来,大型语言模型(Large Language Models, LLMs)在自然语言处理(Natural Language Processing, NLP)领域取得了显著进展。这些模型通过在大规模文本数据上进行预训练,能够习得语言的基本特征和语义,从而在各种NLP任务上取得了突破性的表现。为了将预训练的LLM应用于特定领域或任务,通常需要在领域特定的数据集上对模型进行微调(Fine-tun…
理论
- 969
- 0
佚名11月4日
百川智能发布超千亿大模型Baichuan 3，华文评测水平超GPT-4
1 月 29 日，百川智能正式发布千亿参数的大语言模型 Baichuan 3。在多个权威通用本领评测如 CMMLU、GAOKAO 和 AGI-Eval 中，Baichuan 3 都展现了出色的本领，尤其在华文义务上更是逾越了 GPT-4。而在数学和代码专项评测如 MATH、HumanEval 和 MBPP 中同样表现出色，证明了 Baichuan 3 在自然语言处理和代码生成范围的强大实力。不仅如…
工程
- 6
- 0
新闻助手1月29日