大型语言模型(LLM)

英伟达发布Llama3.1 Nemotron Ultra 253B，性能超越Llama 4 Behemoth

推理性能再飞跃!DeepSeek推创新技术SPCT，让大模型更懂人心

OpenAI推出AI Agent评测基准PaperBench

英伟达AI研究人员推出FFN融合技术:加速大型语言模型推理

人工智能芯片巨头英伟达的研究人员近日发布了一项名为“FFN融合”（FFN Fusion）的创新架构优化技术。该技术旨在通过解决Transformer架构中固有的串行计算瓶颈，显著提升大型语言模型（LLMs）的推理效率，为更广泛地部署高性能AI应用铺平道路.近年来，大型语言模型在自然语言处理、科学研究和对话代理等领域展现出强大的能力。然而，随着模型规模和复杂性的不断增加，其推理过程所需的计算资源也大幅增长，导致了效率瓶颈。

告别AI“一本正经”!Midjourney联手NYU解锁创意文本新维度，多样性飙升23%!

Midjourney 和纽约大学的研究人员近日联手开发出一种创新方法，旨在显著提升语言模型生成创意文本的多样性，同时将质量损失控制在最低限度。这项发表在最新研究论文中的技术，核心在于将“偏差指标”引入人工智能的训练过程。其运作原理是通过量化每个生成的文本与针对同一提示创建的其他文本之间的差异。

小模型助力法律行业，LexisNexis 推出 AI 助手 Protégé

法律研究公司 LexisNexis 最近推出了一款名为 Protégé 的 AI 助手，旨在为、助理和法律专员提供支持。 Protégé 的主要功能是帮助用户撰写和校对法律文件，并确保引用的内容在诉状和简中是准确的。 LexisNexis 希望打造一款不仅仅是通用的法律 AI 助手，而是能够学习各个法律事务所的工作流程并提供定制化服务的智能助手。

报道称阿里云全新 “T 项目” 启动，推进下一代 AI 技术研发

据《科创板日报》，阿里云启动了名为 “T 项目” 的新计划，旨在加速下一代 AI 技术的研发。该项目将专注于多个前沿领域，包括 AI 引擎、大型语言模型（LLM）和多模态技术等，期望通过这些技术的突破，满足日益增长的市场需求。 “T 项目” 的启动意味着阿里云在 AI 领域布局的进一步加深。

谷歌Gemini 2.0 Flash放出原生图像生成功能：支持多轮对话式实时编辑编辑

继Gemma3之后，谷歌又给我们带来了一位“闪电侠”——Gemini2.0Flash，而且人家这次是带着独门绝技来的:原生图像生成! 要知道，以前的AI图像生成，很多时候都是大型语言模型（LLM）先理解你的文字，然后再把意思“翻译”给专门生成图像的扩散模型。这中间难免会有些“失真”，就像隔着好几个人传话，最后意思都变味儿了。

LLMs.txt生成器 v2发布:网站文本转换速度提升10倍

近日，LLMs.txt生成器迎来重大升级，正式推出v2版本。这一工具能够将任何网站内容快速转化为可供人工智能代理或大型语言模型（LLM）使用的文本文件，为AI应用的开发者和使用者带来了极大便利。新版本由@firecrawl_dev团队开发，并得到其官方llmstxt端点的全力支持，相较于上一代，处理速度提升了惊人的10倍。

仅用四周时间！富士康推出中文大语言模型FoxBrain

富士康旗下的鸿海研究院近日发布了一款全新的传统中文大型语言模型（LLM）——FoxBrain。这一模型的推出引起了业界的广泛关注，标志着在中文人工智能领域的一次重要进展。 FoxBrain 的训练过程在短短四周内完成，展示了强大的技术能力和高效的研发速度。