资讯列表
石头科技增资至 1.8 亿元,经营范围新增多项 AI 业务
石头科技成立于 2014 年 7 月,是一家专注于家用智能清洁机器人及其他智能电器研发和生产的公司。
《咬文嚼字》发布 2024 年十大流行语:“数智化”“未来产业”上榜
随着AI技术的突破,我们进入了一个全新的智能时代,人工智能正在推动社会与产业革命。反映在语言上,就是人工智能语词的大量出现并广泛流行。
从本地部署到企业级服务:十种主流LLM推理框架的技术介绍与对比
大语言模型(Large Language Models, LLMs)的部署是一项具有技术挑战性的工作。 随着模型架构日益复杂,以及硬件需求不断提升,部署过程变得愈发复杂。 业界已经发展出多种解决方案,使LLM的部署和扩展变得更加便捷。
让模型预见分布漂移:动态系统颠覆性设计引领时域泛化新革命
在实际应用中,数据集的数据分布往往随着时间而不断变化,预测模型需要持续更新以保持准确性。 时域泛化旨在预测未来数据分布,从而提前更新模型,使模型与数据同步变化。 然而,传统方法假设领域数据在固定时间间隔内收集,忽视了现实任务中数据集采集的随机性和不定时性,无法应对数据分布在连续时间上的变化。
人工智能的“记忆”:个人和组织的革命性生产力
随着人工智能的不断发展,一个概念脱颖而出,成为实现个性化体验的关键:记忆(Memory)。 在Madrona与微软人工智能首席执行官Mustafa Suleyman的IA峰会炉边谈话中,他强调记忆不仅是一种功能,而且是一种重塑人工智能与人类互动方式的变革力量。 记忆使人工智能不仅可以结合智商(IQ),还可以结合情商(EQ),从而创造一种更有意义、更像人类的关系。
清华UCSD提出全新微调方法,8B小模型媲美GPT-4o!科学问题正确率提高28%
我们都知道,在科研界,LLM在解决简单科学问题时表现得游刃有余,但在应对复杂问题时往往会出现幻觉。 于是,为了让模型更靠谱,研究人员尝试给模型装上科学工具,帮助它们解决高难度任务。 然而,一旦用上工具,模型就「上瘾」了!
地区冲突助推网络攻击激增,由AI驱动的勒索软件成新威胁
据 Trellix 称,诸如俄罗斯持续入侵乌克兰以及以色列与哈马斯之间的冲突等多起地区性冲突,已导致网络攻击和黑客活动激增。 AI驱动的勒索软件助长了网络犯罪手段该研究审视了一个日益复杂的勒索软件生态系统,其中犯罪团伙采用嵌入AI的先进工具来传播勒索软件。 Trellix 的遥测数据显示,与中国相关的威胁行为体团伙仍然是国家支持的高级持续性威胁 (APT) 活动的主要来源,仅 Mustang Panda 就产生了超过 12% 的已检测 APT 活动。
AI做数学学会「动脑子」! UCL等发现LLM「程序性知识」,推理绝不是背答案
LLM,究竟会不会推理? 就在刚刚,UCL、Cohere等机构的研究人员发现:在LLM执行推理任务时,竟存在着一种「程序性知识」。 论文地址: News的热榜。
NeurIPS 2024|杜克大学&谷歌提出SLED解码框架,无需外部数据与额外训练,有效缓解大语言模型幻觉,提高事实准确性
此项研究成果已被 NeurIPS 2024 录用。 该论文的第一作者是杜克大学电子计算机工程系的博士生张健一,其主要研究领域为生成式 AI 的概率建模与可信机器学习,导师为陈怡然教授。 大语言模型(LLM)在各种任务上展示了卓越的性能。
NeurIPS 2024 | 数学推理场景下,首个分布外检测研究成果来了
本文将介绍数学推理场景下的首个分布外检测研究成果。 该篇论文已被 NeurIPS 2024 接收,第一作者王一鸣是上海交通大学计算机系的二年级博士生,研究方向为语言模型生成、推理,以及可解释、可信大模型。 该工作由上海交通大学和阿里巴巴通义实验室共同完成。
值得关注的10大终端安全解决方案和10大选型要点
10个值得关注终端安全解决方案从传统防病毒到AI驱动的智能防护,从单点防御到整体安全架构,当前终端安全产品正在经历深刻的技术变革,很多新的技术都在显著增加方案的价值。 1Singularity Endpoint SecuritySentinelOne的Singularity Endpoint Security是一款先进的端点安全解决方案,旨在通过AI技术实现自主的端点防护、检测与响应(EDR)。 该平台整合了端点保护(EPP)、EDR、物联网安全和云工作负载保护(CWPP)的功能,提供一个统一的安全平台,以应对现代复杂的网络威胁。
中国科学院研究显示,生成式 AI 将在 2023~2030 年产生 120 万~500 万吨的电子废弃物
研究显示,在不同情景下,生成式人工智能将在 2023 年至 2030 年产生 120 万至 500 万吨的电子废弃物,并对生态环境及人群健康产生影响。
生成式人工智能创造更多工作的七种方法
随着人工智能的使用持续飙升,有关商业利益的报道也在不断涌现。 但人们也看到,在更多的情况下,这项技术实际上创造了比它节省的更多的工作。 摩根大通总裁Daniel Pinto表示,该银行预计其人工智能用例的价值将从5月份的15亿美元增长到20亿美元。
美欧亚三洲开发者联手,全球首个组团训练的大模型来了,全流程开源
11 月 22 日,Prime Intellect 宣布通过去中心化方式训练完成了一个 10B 模型。 30 号,他们开源了一切,包括基础模型、检查点、后训练模型、数据、PRIME 训练框架和技术报告。 据了解,这应该是有史以来首个以去中心化形式训练得到的 10B 大模型。
Elasticsearch虽好,但矢量数据库才是未来
作者 | Jiang Chen译者 | 布加迪审校 | 重楼出品 | 51CTO技术栈(微信号:blog51cto)几十年来,以Elasticsearch为代表的关键词匹配(又称为全文搜索)一直是企业搜索和推荐引擎等信息检索系统的默认选择。 随着基于人工智能的搜索技术不断进步,如今企业组织在向语义搜索转变,从而使系统能够理解用户查询背后的含义和意图。 嵌入模型和矢量数据库已成为这一转变的核心。
微软:两个 AI 相互纠错,数学再涨 5 分
来自加州大学和微软研究院的最新研究成果:Flow-DPO。通过使用在线学习流(Flow)和直接偏好优化(DPO, Direct Preference Optimization),可以让 LLM 生成更加详细和精确的推理轨迹。
ChatGPT 拒绝谈论人名“David Mayer”,没人知道为什么
ChatGPT 两岁了,版本更新没等来,却被发现一个神秘 Bug。一个看似平平无奇的名字“David Mayer”成为头号禁忌,ChatGPT 拒绝谈论有关他的一切。
图结构转文本序列,大模型直接读懂!图推理性能大涨
大语言模型直接理解复杂图结构的新方法来了:将图(Graph)转换为适合Transformer架构的线性token序列。 belike:这种最新图线性化方法,反映了自然语言中局部依赖性和全局对齐性两个关键属性,即:不仅需要保留基于前文上下文预测下一个token的能力(局部依赖性),而且不同图的token序列应该从具有相似特征的token开始或结束(全局对齐性),就像自然语言文本经常以特定词语开头或结尾。 如此一来,在海量文本数据上训练的LLM也能更好地理解图结构中的关系和属性,如节点计数、最大度数计算和图式形状分类等图推理任务都能完成。