几个开发大模型应用常用的 Python 库

2025-01-22 10:33

一、应用层开发1. FastAPIFastAPI是构建API的优选。顾名思义，它快速、简单，并能与Pydantic完美集成，实现无缝数据验证。

一、应用层开发

1. FastAPI

FastAPI是构建API的优选。顾名思义，它快速、简单，并能与Pydantic完美集成，实现无缝数据验证。

复制

from fastapi import FastAPI
from pydantic import BaseModel

app = FastAPI()

class Item(BaseModel):
    name: str
    price: float

@app.post("/items/")
async def create_item(item: Item):
    return {"name": item.name, "price": item.price}

2. Jinja

Jinja是一个模板引擎，用于创建动态提示，它简单而强大，在管理复杂的提示逻辑方面起着关键作用。

复制

from jinja2 import Template


template = Template("Hello {{ name }}!")
print(template.render(name="Raj"))

二、任务调度

有时候系统需要处理繁重的工作，Celery库可以帮助跨多个线程或机器分配任务。即使在要求苛刻的操作中，也能保持应用程序的响应速度。

复制

from celery import Celery

app = Celery('tasks', broker='redis://localhost:6379/0')

@app.task
def add(x, y):
    return x + y

三、数据管理

数据是AI的基础，目前比较常用的两种数据库：PostgreSQL和MongoDB，分别对应着结构化和非结构化数据。

1. 连接

一般使用psycopg2管理Postgre SQL，使用PyMongo管理MongoDB。

复制

import psycopg2

conn = psycopg2.connect(
    dbname="example", user="user", password="password", host="localhost")
cursor = conn.cursor()
cursor.execute("SELECT * FROM table")
rows = cursor.fetchall()
print(rows)

2. 简化数据操作

SQLAlchemy可以实现Python API管理数据库操作，相比SQL，这更干净，更高效。

复制

from sqlalchemy import create_engine, Column, Integer, String
from sqlalchemy.ext.declarative import declarative_base
from sqlalchemy.orm import sessionmaker

Base = declarative_base()

class User(Base):
    __tablename__ = 'users'
    id = Column(Integer, primary_key=True)
    name = Column(String)

engine = create_engine('sqlite:///example.db')
Base.metadata.create_all(engine)

四、API集成

将AI大模型集成到应用程序是最重要的步骤，实际上我们的应用就像是LLM的客户端，OpenAI、Anthropic和Google API 这些库都是AI应用集成常用的。

复制

import openai

openai.api_key = "your-api-key"
response = openai.Completion.create(
    engine="text-davinci-003",
    prompt="Write a Python function to add two numbers.",
    max_tokens=100
)
print(response.choices[0].text.strip())

五、数据处理

1. 结构化

如果应用想从LLM中得到可靠的结构化输出，那么Instructor库是一个很好的选择。它可与各种模型配合使用，并且提供了高级数据验证功能。

复制

from instructor import Instructor

instructor = Instructor(api_key="your-api-key")
response = instructor.get_response(prompt="What is the capital of France?", model="text-davinci-003")
print(response)

2. LangChain和LlamaIndex：

这些框架简化了使用大型语言模型的工作。在一些场景下它们可以容简化提示管理和嵌入之类的复杂任务，使其易于入门。

复制

from langchain.chains import LLMChain
from langchain.llms import OpenAI

llm = OpenAI(temperature=0.7)
chain = LLMChain(llm=llm)
response = chain.run("What is 2 + 2?")
print(response)

3. 向量数据库

许多AI应用程序，例如RAG，依赖于存储上下文，以便于后续进行检索。

往往会使用到向量数据库存储向量以及执行相似性搜索，例如：Pinecone、Weaviate和PGVector。

复制

import pinecone

pinecone.init(api_key="your-api-key", environment="us-west1-gcp")
index = pinecone.Index("example-index")
index.upsert([("id1", [0.1, 0.2, 0.3])])
result = index.query([0.1, 0.2, 0.3], top_k=1)
print(result)

4. DSPy

DSPy有助于自动优化提示，在微调AI响应时节省大量时间以及猜测。

复制

from dsp import PromptOptimizer

optimizer = PromptOptimizer()
optimized_prompt = optimizer.optimize("Write a poem about space.")
print(optimized_prompt)

5. PyMuPDF和PyPDF2

如果AI应用需要从PDF或文档中提取数据，这些库是靠谱的选择。

复制

import fitz

doc = fitz.open("example.pdf")
for page in doc:
    print(page.get_text())

6. Pydantic

人工智能项目经常需要处理混乱、不可预测的数据，Pydantic优雅地可以清理、组织数据。

复制

from pydantic import BaseModel

class User(BaseModel):
    name: str
    age: int
    email: str

user = User(name="rose", age=30, email="[email protected]")
print(user.dict())

六、跟踪观察

大模型应用的开发不是一触而就，开发只是第一步，在开发完之后还需要持续监控它的执行状况并对其优化。

Langsmith和Langsmith，这两个平台适合用于跟踪LLM调用情况，包括延迟、成本和输出等关键数据。

复制

from langfuse import LangFuse

langfuse = LangFuse(api_key="your-api-key")
langfuse.log_interaction(prompt="What is 5 + 5?", response="10", latency=0.3)

以上这些Python库可以用于构建可靠、可扩展和高效的AI应用程序。

DeepSeek 总崩溃？如何快速使用满血版DeepSeek！！

DeepSeek 太火了，我们在使用的过程中，是不是经常遇到服务器繁忙的情况。后台很多同学都在询问有没有快速、免费使用满血版 DeepSeek 的平台。今天就给大家推荐一款免费使用满血版 DeepSeek-R1 671B 的平台，彻底解决服务器卡顿的情况，主打一个快、稳定，而且免费它支持多端使用，包括 iOS/安卓/PC/web废话不多说，让我们直接上手，看看如何使用这里以web为例进行演示，网址为，点击左侧的满血版 DeepSeek，默认开启深度思考和联网搜索。

2/27/2025 9:17:41 AM

程序员小寒

ChatGPT再进化：o1支持调用Python分析数据，网友：已经成为Copilot了

今天一大早，ChatGPT突然更新——基于Python的数据分析功能，在o1和o3-mini当中也可以使用了。 OpenAI介绍，现在可以通过两款模型调用Python，完成数据分析、可视化、基于场景的模拟等任务。量子位实测发现，虽然界面并无明显变化，但是Python的确已经在o1当中悄悄“上岗”了。

3/14/2025 12:14:24 PM

量子位

AI 工程师必备：Python 八大人工智能库介绍

Python已经成为人工智能 (AI) 领域的主流编程语言，这得益于其简洁的语法、丰富的社区支持以及大量专门为 AI 设计的库。这些库提供了各种工具和框架，涵盖了机器学习、深度学习、自然语言处理、计算机视觉等多个方面，极大地简化了 AI 应用的开发过程。本文将介绍8个常用且功能强大的人工智能库。

3/20/2025 9:48:25 AM

Python数智工坊

资讯热榜

企业级模型推理部署工具vllm使用指南 - 部署最新deepseek-v3-0324模型上海AI实验室开源InternVL3系列多模态大型语言模型 50组多风格提示词，全面测评Midjourney V7生图效果！全日程揭晓！ICLR 2025论文分享会我们北京见斯坦福2025 AI指数出炉！中美AI对决差距仅剩0.3%，DeepSeek领衔 5分钟直出46页论文！谷歌Deep Research完爆OpenAI，最强Gemini 2.5加持击败DeepSeek-R1！豆包新推理模型仅用前者参数量1/3！还将开源两个基准，瞄准通用推理能力！ ChatGPT重大更新，能翻出所有历史对话，网友被AI聊破防了

标签云

人工智能 OpenAI AIGC AI ChatGPT DeepSeek AI绘画数据机器人谷歌模型大模型 Midjourney 智能用户学习开源 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达神经网络腾讯计算研究 Sora AI for Science 3D AI设计 Anthropic 机器学习 GPU 开发者场景华为预测伟达 Transformer 百度深度学习苹果模态 AI视频驾驶文本 xAI 搜索人形机器人大语言模型 Copilot 神器推荐 LLaMA 字节跳动具身智能 Claude 算力安全应用视频生成科技视觉亚马逊干货合集 2024 AGI 特斯拉 DeepMind 训练

顶部

几个开发大模型应用常用的 Python 库

一、应用层开发

1. FastAPI

2. Jinja

二、任务调度

三、数据管理

1. 连接

2. 简化数据操作

四、API集成

五、数据处理

1. 结构化

2. LangChain和LlamaIndex：

3. 向量数据库

4. DSPy

5. PyMuPDF和PyPDF2

6. Pydantic

六、跟踪观察

相关资讯

DeepSeek 总崩溃？如何快速使用满血版DeepSeek！！

ChatGPT再进化：o1支持调用Python分析数据，网友：已经成为Copilot了

AI 工程师必备：Python 八大人工智能库介绍