大型语言模型(LLMs)

亚马逊推出个性化购物提示,推动生成式 AI 应用

亚马逊近日在其购物工具中进一步融合了人工智能,以鼓励消费者增加购买。 该公司在周三宣布推出新功能 “兴趣”,旨在打造个性化和对话式的搜索体验。 通过这一新功能,用户可以在搜索栏中输入与自身兴趣、偏好甚至预算相关的定制化提示。

清华大学开源 Video-T1:无需重新训练 AI视频秒变高清大片

近日,清华大学的研究团队开源了其最新的研究成果——Video-T1。 这项技术的核心在于测试时缩放 (Test-Time Scaling, TTS),旨在通过在视频生成过程的推理阶段投入更多的计算资源,显著提升生成视频的质量和与文本提示的一致性,而无需重新进行昂贵的模型训练。 这一创新性的方法为视频生成领域带来了新的可能性。

无需训练!Q-Filters 实现 KV 缓存高效压缩,提升推理性能

近年来,基于 Transformer 架构的大型语言模型(LLMs)取得了显著进展,诸如 Gemini-Pro1.5、Claude-3、GPT-4和 Llama-3.1等新模型能够处理成百上千的token。 然而,这些扩展的上下文长度带来了实际应用中的一些重大挑战。 随着序列长度的增加,解码延迟上升,内存限制也成为了一个严重的瓶颈。
  • 1