生成式人工智能如何改变软件开发

译者 | 李睿审校 | 重楼软件开发专家Igboanugo David Ugochukwu表示，当他带领的软件开发团队在去年开始使用人工智能编码助手时，他对其能力持怀疑态度。基于其长达15年的编程经验，他不相信大型语言模型能够对实际的开发工作提供有意义的帮助。在六个月后，他的看法发生了根本性转变，其开发团队的工作效率提高了大约40%，同时代码质量指标也有所提高。

生成式人工智能如何改变软件开发

译者 | 李睿

审校 | 重楼

软件开发专家Igboanugo David Ugochukwu表示，当他带领的软件开发团队在去年开始使用人工智能编码助手时，他对其能力持怀疑态度。基于其长达15年的编程经验，他不相信大型语言模型能够对实际的开发工作提供有意义的帮助。在六个月后，他的看法发生了根本性转变，其开发团队的工作效率提高了大约40%，同时代码质量指标也有所提高。

但关键在于，这并不像“人工智能让编码变得更容易”那么简单。实际应用中的情况远比市场宣传所描绘的更微妙、更有趣，并且从实用角度来看，也更具价值。

实际应用情况

Ugochukwu分享了近日发生的一件事。他正在调试Node.js后端一个严重的内存泄漏。这在以往意味着要花费数小时梳理代码，添加控制台日志，可能还需要花费更多的时间。然而，他将相关代码和内存配置文件输入到人工智能助手中，并要求它分析模式。

在几分钟之内，人工智能助手就发现了一些他未曾留意的一处细节——在一个闭包中意外地保持了WebSocket连接。这是一个微不足道却难以察觉的错误。尽管人工智能并没有神奇地修复它，但它比传统的调试方法更快地指明了正确的方向。

真正有效的方法

根据其团队在过去一年使用人工智能助手的经验：

1.代码评审

复制

Python 
1 def process_user_data(data):
2    if data['status'] == 'active':
3        user = User.objects.get(id=data['user_id'])
4        if user.subscription:
5            if user.subscription.status == 'valid':
6                return handle_active_user(user)
7            else:
8                return handle_inactive_subscription(user)
9    return handle_inactive_user()

人工智能助手发现了这一点，并提出了以下建议：

重构版本：

复制

Python 
1 def process_user_data(data):
2    if data['status'] != 'active':
3        return handle_inactive_user()
4      
5    user = User.objects.get(id=data['user_id'])
6    if not user.subscription:
7        return handle_inactive_user()
8      
9    return (handle_active_user(user) 
10            if user.subscription.status == 'valid'
11            else handle_inactive_subscription(user))

虽然它并不是革命性突破，但始终比人类审阅者更快地发现这些可读性问题。

2.测试生成

这是另一个意外的发现。以下是一个真实示例：

最初的功能：

复制

Python 
1 def calculate_order_total(items, discount_code=None):
2    subtotal = sum(item.price * item.quantity for item in items)
3    if discount_code:
4        discount = get_discount_amount(discount_code, subtotal)
5        return subtotal - discount
6    return subtotal

人工智能生成了这些测试用例：

复制

Python 
1 def test_calculate_order_total():
2    items = [
3        Item(price=10.0, quantity=2),
4        Item(price=15.0, quantity=1)
5    ]
6    assert calculate_order_total(items) == 35.0
7
8  def test_calculate_order_total_with_discount():
9    items = [Item(price=100.0, quantity=1)]
10    assert calculate_order_total(items, 'SAVE20') == 80.0
11
12 def test_calculate_order_total_empty():
13    assert calculate_order_total([]) == 0
14
15 def test_calculate_order_total_invalid_discount():
16    items = [Item(price=10.0, quantity=1)]
17    assert calculate_order_total(items, 'INVALID') == 10.0

它捕捉到了开发人员一开始可能会忽略的边界案例。

不适用人工智能助手的情况

1.复杂的架构决策

Ugochukwu带领的开发团队最近需要重新设计身份验证系统，以处理多租户单点登录（SSO）。人工智能助手提供的建议从技术上来说是正确的，但忽略了关于不同客户端类型之间会话管理的关键现实因素。

2.场景复杂型调试

当一个bug涉及多个服务、复杂状态或竞争条件时，人工智能工具仍然会遇到困难。它们可以帮助分析单个组件，但往往忽略了整体情况。

对开发工作流程的实际影响

以下是开发工作流程的实际变化：

在人工智能整合之前

复制

Plain Text 
1 1. Write code (2 hours)
2 2. Write tests (1 hour)
3 3. Debug issues (2 hours)
4 4. Code review (1 hour)
5
6 Total: ~6 hours per feature

在人工智能整合之后

复制

Plain Text 
1 1. Write code with AI assistance (1 hour)
2 2. AI generates test cases, developer adjusts (30 mins)
3 3. Debug with AI analysis (1 hour)
4 4. AI-assisted code review (30 mins)
5
6 Total: ~3 hours per feature

但问题是，这之所以能奏效，是因为开发团队学会了如何有效地使用人工智能工具。虽然他们在第一个月的工作效率较低，但正在摸索正确的工作流程。

学到的最佳实践

1.面向开发人员的提示工程

而不是：

复制

Plain Text 
1 "Write a function to process user data"

该开发团队采取的做法是：

复制

Plain Text 
1 "Write a Python function that:
2
3 - Takes a user_id and data dictionary
4 - Validates required fields: name, email, age
5 - Handles missing fields with default values
6 - Raises ValidationError for invalid data
7 - Returns a processed user object
8
9 Use type hints and include error handling."

输出内容质量上的差异十分显著。

2.代码审查策略

现在采取的做法是：

第一轮：利用人工智能进行风格、潜在漏洞和明显问题的审查。
第二轮：人工审查业务逻辑和架构方面的问题。
最后一轮：再次利用人工智能检查安全漏洞。

3.文档生成

这改变了游戏规则。示例如下：

复制

Python 
1 # Original function with minimal docs
2
3 def process_payment(amount, user_id, method):
4
5    # ... implementation ...

人工智能将其扩展为：

复制

Python 
1 def process_payment(
2    amount: Decimal,
3    user_id: str,
4    method: PaymentMethod
5 ) -> PaymentResult:
6    """Process a payment transaction for a user.
7
8    Args:
9        amount: Transaction amount in user's local currency.
10        user_id: Unique identifier for the user.
11        method: Payment method object containing card/bank details.
12
13    Returns:
14        PaymentResult object containing transaction ID and status.
15
16    Raises:
17        InsufficientFundsError: If payment method has insufficient funds.
18        InvalidPaymentMethodError: If payment method is expired/invalid.
19        PaymentProcessingError: If payment gateway encounters an error.
20
21    Example:
22        >>> result = process_payment(
23        ...     amount=Decimal('99.99'),
24        ...     user_id='usr_123',
25        ...     method=PaymentMethod(type='credit_card', token='tok_xyz')
26        ... )
27        >>> print(result.transaction_id)
28        'tx_abc123'
29    """

安全注意事项

在安全方面，必须极其谨慎。以下是吸取的一些教训：

1.永远不要让人工智能生成安全关键代码

不要做的示例：

复制

Python 
1 # DON'T: Let AI generate authentication logic
2 def verify_password(plain_text, hashed):
3    return hashlib.md5(plain_text.encode()).hexdigest() == hashed

2.始终检查生成的SQL

已经看到人工智能建议易受攻击的查询：

复制

SQL 
1 -- DON'T: Raw string formatting
2 f"SELECT * FROM users WHERE id = '{user_id}'"
3
4 -- DO: Parameterized queries
5 "SELECT * FROM users WHERE id = %s", (user_id,)

展望未来

根据目前的趋势和开发人员的经验，以下是一些实际的变化趋势：

1.集成开发环境（IDE）整合正变得日益重要

最新的人工智能驱动的集成开发环境（IDE）不仅提供代码建议，还能理解整个代码库。例如，开发团队的IDE异步函数在不同服务中的调用方式，标记了异步函数中潜在的竞争条件。

2.专业模型正在涌现

现在有一些人工智能模型专门针对某些框架或语言进行训练。目前，获得的针对TypeScript的特定建议明显优于通用的代码生成。

3.测试正在转变

人工智能在生成人类可能错过的边缘案例和压力测试方面做得越来越好，自从采用人工智能工具以来，测试覆盖率有所提高。

结论

人工智能在短期内并不会取代开发人员。与其相反，人工智能可以提高软件开发效率，帮助他们更早地发现漏洞，并处理编程中繁琐且重复性的任务。关键在于理解其局限性，并将其作为高效的工具使用，而不是替代人类的判断。

在这个数字时代中茁壮成长的开发人员并不是那些能编写大量代码的人，而是那些擅长与人工智能工具协作，同时对自己所构建的内容及其背后的逻辑与目的有着深刻认识的人。

Ugochukwu在撰写本文的过程中，就巧妙地借助了人工智能的力量来辅助部分内容的创作。这正是关键所在。人工智能是一种工具，开发人员需要理解并且有效地利用它。

原文标题：Beyond ChatGPT: How Generative AI Is Transforming Software Development，作者：Igboanugo David Ugochukwu

{{userData.name}}已认证

生成式人工智能如何改变软件开发

实际应用情况

真正有效的方法

1.代码评审

2.测试生成

不适用人工智能助手的情况

1.复杂的架构决策

2.场景复杂型调试

对开发工作流程的实际影响

在人工智能整合之前

在人工智能整合之后

学到的最佳实践

1.面向开发人员的提示工程

2.代码审查策略

3.文档生成

安全注意事项

1.永远不要让人工智能生成安全关键代码

2.始终检查生成的SQL

展望未来

1.集成开发环境（IDE）整合正变得日益重要

2.专业模型正在涌现

3.测试正在转变

结论

人工智能的过去、现在和未来

百度关于大模型在研发领域落地的深度思考

细节表现超Sora，网友：真正的国产之光！MiniMax视频模型再上新

关于LLM-as-a-judge范式，终于有综述讲明白了

快手预告“可灵 AI”导演共创计划作品 12 月 6 日上线：联合李少红、贾樟柯、叶锦添、薛晓路等

李飞飞「世界实验室」重磅推出 AI“造物主”：一张图片生成 3D 世界“任意门”

字节跳动豆包 AI 文生图“喜提新技能”：App 可生成带有指定文字的图片

ChatGPT遇到这些人名开始自闭，OpenAI回应了

平安人寿ChatBI：大模型智能化报表的深度实践

李飞飞空间智能首秀：AI靠单图生成3D世界，可探索，遵循基本物理几何规则