Llama2

加速 AI 布局！Meta 寻求收购AI芯片公司 FuriosaAI

据《福布斯》报道，Meta（前称 Facebook）正在积极洽谈收购一家名为 FuriosaAI 的韩国芯片初创公司。此举旨在增强 Meta 的人工智能硬件基础设施，以应对日益增长的 AI 需求。 FuriosaAI 由多位前三星和 AMD 员工创办，专注于开发能够加速人工智能模型运行的芯片，适用于 Meta 的文本生成模型，如 Llama2和 Llama3等。

2/13/2025 9:47:00 AM

AI在线

《自然》杂志研究：AI 追踪他人心理状态能力与人类相当或超越人类

在本月下旬最新一期的《自然-人类行为》期刊上，刊登了一篇关于 AI 的研究论文，其中提到，在测试追踪他人心理状态能力的任务中，两类 AI 大语言模型在特定情况下，具备与人类相似甚至超越人类的表现。图源 Pixabay作为人类沟通交流、产生共鸣的关键，心理状态能力（也称心智理论）对人类的社交互动来说非常重要。该论文的第一作者 —— 德国汉堡-埃彭多夫大学医学中心的 James W. A. Strachan 与同事及合作者一起，选择能测试心理理论不同方面的任务，包括发现错误想法、理解间接言语以及识别失礼等。IT之家注：

5/25/2024 11:08:24 PM

清源

Llama2推理RTX3090胜过4090，延迟吞吐量占优，但被A800远远甩开

这是为数不多深入比较使用消费级 GPU（RTX 3090、4090）和服务器显卡（A800）进行大模型预训练、微调和推理的论文。大型语言模型 (LLM) 在学界和业界都取得了巨大的进展。但训练和部署 LLM 非常昂贵，需要大量的计算资源和内存，因此研究人员开发了许多用于加速 LLM 预训练、微调和推理的开源框架和方法。然而，不同硬件和软件堆栈的运行时性能可能存在很大差异，这使得选择最佳配置变得困难。最近，一篇题为《Dissecting the Runtime Performance of the Training,

12/27/2023 3:04:00 PM

机器之心

两行代码解决大语言模型对话局限！港中文贾佳亚团队联合MIT发布超长文本扩展技术

代码和Demo地址：：、模型偷懒、上下文越长大模型越笨......如果体验过大语言模型产品,用户多少会对文本输入长度带来的限制有所感触，比如当想和大模型讨论一些稍长的内容，需要拆分输入，而前面输入的要点，很快就会被大模型忘记。这是典型的大语言模型对话缺陷！就像先天有注意力缺陷的儿童，难以专注看完一本新书。而缺陷的关键，在于模型缺乏长文本处理能力。这个局面如今被打破。近日，贾佳亚团队联合MIT发布的新技术和新模型悄然登上各大开源网站的热榜：hugging face热榜第一、paperwithcode热度第一，Gith

10/9/2023 11:36:00 AM

新闻助手