AI模型
xAI称已面向所有用户免费提供 Grok3 直到他们服务器崩溃
AIbase 2月20日 消息:xAI今日宣布已经正式推出其最新AI模型Grok3,并称其为"世界最聪明的AI"。 该公司表示,Grok3现已免费向公众开放试用,直到"服务器融化"。 新功能与性能根据xAI的公告,Grok3引入了两项新功能:DeepSearch:一个强大的AI代理,能够快速综合关键信息,推理冲突的事实与观点,并从复杂性中提炼出清晰度Think:一个推理模型,特别适合数学、科学和编程任务xAI强调,Grok3在推理、数学、编程、世界知识和指令遵循任务方面表现出色,并在多项基准测试中展现了卓越性能。
腾讯深度思考模型「混元T1」面向所有用户开放
腾讯宣布其深度思考模型“混元T1”正式面向所有用户开放,用户可以通过腾讯元宝平台体验并测试该模型。 此前,混元T1开启灰度测试后,受到了用户的广泛关注和积极反馈。 为了满足用户需求,腾讯紧急部署,现已实现混元T1的全面开放,所有用户均可无限量使用。
联发科推出两款多模态轻量级 AI 模型:主打繁体中文处理能力、基于 Meta Llama 3.2 打造而成
联发科创新基地(MediaTek Research)现已发布两款支持繁体中文的轻量级多模态模型,分别是号称可在手机上运行的 Llama-Breeze2-3B 模型和适用于轻薄笔记本电脑的 Llama-Breeze2-8B 模型。
Anthropic即将发布全新 AI 模型,推理能力再上新台阶
AI 初创公司Anthropic正准备推出其最新的 AI 模型,预计将在未来几周内正式发布。 根据theinformation报道,这款新模型被称为 “混合型” 模型,具备在 “深度推理” 与快速响应之间切换的能力。 这一创新设计旨在为开发者提供更加灵活的工具,以满足不同应用场景的需求。
小米公布AI通信相关专利
企查查APP显示,2月11日,北京小米移动软件有限公司申请的“一种人工智能通信方法、装置及存储介质”专利公布。 专利摘要显示,本公开是关于一种人工智能通信方法、装置及存储介质。 人工智能通信方法包括:确定第一时间,第一时间用于表示基于AI模型处理AI任务的处理时间;基于第一时间,进行基于AI模型的AI通信处理。
LG 的 Exaone AI 模型以成本效率匹敌DeepSeek
近期,美国知名研究机构 Epoch AI 发布了一份报告,正式将 LG 的 Exaone3.532B 模型评选为 “值得注意的 AI” 之一,并在成本效率方面表现尤为突出,与中国的 DeepSeek 不相上下。 LG Exaone3.5模型于2023年12月正式推出,其开发投资约为70亿韩元(约合480万美元),这一成本低于 DeepSeek 开发其 V3模型所花费的600万美元。 Epoch AI 的评估标准主要考虑了模型的性能、使用频率等因素,而这也是两年来首个获得此类认可的韩国 AI 模型,显示了 LG 在人工智能领域的突破性进展。
DeepSeek本地部署教程,小白也能搞定!
安装环境操作系统:Windows 10及以上准备工具:轻量级AI模型调用工具Ollama,调用AI模型为deepseek-r1AI 模型管理工具Cherry-Studio或AnythingLLM(二选一)资源链接:复制安装步骤第一步、下载安装Ollama并修改环境变量要运行大模型,首先需要一个好用的工具,推荐使用 Ollama ,它是一个轻量级的工具,支持快速安装和运行大语言模型(如deepseek、Llama、Qwen 等)。 ollama下载地址 :官网链接(文章开头)选择合适的操作系统下载,默认安装完成即可。 这里注意,ollama安装完成后先不要启用,因为它默认是会将模型下载到C盘的,deepseek、Qwen等模型最小也有好几个GB会占用C盘空间,所以需要先设置ollama的环境变量。
人形机器人新秀 Figure 宣布独立研发,终止与OpenAI的合作关系
近日,硅谷人形机器人公司 Figure 通过社交媒体宣布,正式终止与人工智能巨头 OpenAI 的合作。 这一决定令业内人士颇感意外,尤其是 Figure 曾在去年与 OpenAI 达成协议,共同开发新一代面向人形机器人的 AI 模型。 Figure 创始人布雷特・阿德科克(Brett Adcock)表示,公司在端到端机器人 AI 技术上取得了 “重大突破”,因此决定将重心转向自主研发。
英伟达点赞DeepSeek:是“出色的人工智能进步”
国产大模型公司DeepSeek的应用登顶苹果中国地区和美国地区应用商店免费APP下载排行榜,超越了ChatGPT。 这一成就不仅引起了市场的广泛关注,也对AI芯片龙头英伟达的股价产生了重大影响。 尽管如此,英伟达发言人仍然对DeepSeek给出了高度评价,称其为AI领域的一项卓越进步,并指出DeepSeek的工作展示了如何利用测试时间缩放技术、广泛可用的模型以及符合出口管制的计算资源来创建新型号。
Grok-3 内部测试曝光:xAI 欲打造“真理AI”,或将下周发布
据报道,虽然xAI官方尚未正式公布,但其最新模型 Grok-3 已短暂现身独立平台和X平台,并开启内部测试,预示着其正式发布已近在咫尺,有望于下周正式亮相。 有迹象表明,Grok-3的发布或将成为 AI 领域又一重大事件,有望成为目前最先进的 AI 模型。 据悉,Grok-3在回答问题方面的表现非常出色,在某些测试中甚至超越了 OpenAI 的 o1和 DeepSeek R1等领先模型。
胜过Transformer?谷歌推出新型AI模型架构Titans
自2017年推出以来,Transformer模型架构一直是人工智能的基础要素,推动了自然语言处理、机器翻译等领域的进步。 不过,该模型在可扩展性、计算效率以及应对日益复杂任务等方面,仍面临着诸多挑战。 而Titans模型架构的诞生,旨在通过整合受人类认知过程启发的机制来克服这些障碍,如记忆优先级和适应性注意力。
OpenAI 新福利:ChatGPT 用户可免费体验o3-mini
近日,OpenAI 的首席执行官阿尔特曼宣布,新的推理 AI 模型 o3-mini 将于近期正式向 ChatGPT 用户推出,涵盖免费和付费用户。 这一新模型是 o1推理模型的继任者,经过自去年12月内测以来的持续优化,旨在为用户提供更加高效、易用且经济的高级推理 AI 服务。 o3-mini 模型在特定任务的微调上取得了显著进展,使得其在处理各种复杂问题时,能够更快速、更准确地响应用户需求。
发烧友!一国外软件工程师买下OGOpenAI.com域名并重定向至DeepSeek
最近,一位软件工程师安纳奈・阿罗拉(Ananay Arora)以 “不到一顿 Chipotle 餐” 的价格购买了域名 OGOpenAI.com,并将其重定向至中国的 AI 实验室 DeepSeek。 这个决定引发了许多人的关注,因为 DeepSeek 近期在开源 AI 领域中取得了显著进展,成为了热议的话题。 DeepSeek 发布的 AI 模型在技术上与早期的 OpenAI 模型相似,能够离线使用,并且任何具备相应硬件的开发者都可以免费使用。
Hugging Face 推出小巧AI模型,助力设备性能提升
近期,人工智能开发平台 Hugging Face 团队发布了两款新型 AI 模型,SmolVLM-256M 和 SmolVLM-500M。 他们自信地声称,这两款模型是目前为止体积最小的 AI 模型,能够同时处理图像、短视频和文本数据,尤其适合内存少于1GB 的设备如笔记本电脑。 这一创新让开发者在处理大量数据时,能够以更低的成本实现更高的效率。
人工智能席卷华尔街,高盛为其员工推出了AI助手
华尔街在人工智能技术的应用上走在了前沿,尤其是生成式人工智能的迅猛发展。 高盛近日宣布推出一款名为 “GS AI 助手” 的生成式 AI 工具,旨在帮助其银行家、交易员和资产经理更高效地完成工作。 这一工具目前已向约1万名员工推出,预计在今年内将覆盖所有知识工作者。
DeepSeek新AI模型有多震撼?外媒:相当于30美元iPhone降临
DeepSeek(深度求索)再次推出新版开源AI模型,它的性能与美国最先进的AI模型虽然还有一些差距,但差距极小,成本低很多很多。 西方许多人认为,美国限制中国AI发展的企图遇挫,中国正在加速前进,以更高效率打造高端AI模型。 去年12月,杭州幻方量化推出DeepSeekV3开源大语言模型,它的性能与OpenAI 40和Anthropic Claude 3.5 .
Sam Altman称OpenAI将在几周内发布推理AI模型o3-mini
为了在人工智能技术竞赛中保持领先地位,OpenAI现在已经准备好了最新的人工智能模型,名为“o3-mini”该公司已经完成了其最新推理AI模型的第一个版本,OpenAI首席执行官Sam Altman在他的X帖子中证实了这一点。 经过外部安全研究人员的测试,新模型将在几周内推出。 值得注意的是,在2024年12月,ChatGPT制造商正式宣布开发和测试其先进的推理模型——o3和o3-mini。
英伟达发布 6.3 万亿 Token 大型 AI 训练数据库 Nemotron-CC
据英伟达官方博客,英伟达宣布推出一款名为 Nemotron-CC 的大型英文 AI 训练数据库,总计包含 6.3 万亿个 Token,其中 1.9 万亿为合成数据。英伟达声称该训练数据库可以帮助为学术界和企业界进一步推动大语言模型的训练过程。