AI在线 AI在线

大规模语言模型(LLM)

AWS 发布 SWE-PolyBench:评估 AI 编程助手的新开源基准

近日,AWS AI Labs 推出了 SWE-PolyBench,这是一个多语言的开源基准,旨在为 AI 编程助手的评估提供一个更全面的框架。 随着大规模语言模型(LLM)的进步,AI 编程助手的开发已经取得了显著的进展,这些助手能够生成、修改和理解软件代码。 然而,目前的评估方法仍然存在诸多局限,许多基准测试往往仅集中在 Python 等单一语言,无法全面反映真实代码库的结构和语义多样性。
4/24/2025 10:01:16 AM
AI在线

谷歌 AI 发布 TxGemma:全新大规模语言模型助力药物开发

药物开发是一个复杂且成本高昂的过程,伴随着高失败率和漫长的开发周期。 传统的药物发现过程需要从靶点识别到临床试验的各个阶段进行大量的实验验证,这往往消耗大量的时间和资源。 然而,随着计算方法,特别是机器学习和预测建模的兴起,这一过程有望得到优化。
3/28/2025 2:32:00 PM
AI在线
  • 1