AI模型

AI 进化再加速!Claude 祭出 “思考” 神器,AI 也能 “三思而后行” 了?

你是否曾对着笨笨的AI感到无奈,恨不得掰开它的脑袋,让它好好思考一下再行动?现在,Anthropic真的给AI装上了大脑升级包!他们为明星模型Claude注入了一项突破性的思考工具(thinktool),让AI在处理复杂任务时,不再像无头苍蝇一样横冲直撞,而是学会了像人类一样——停下来,认真思考一番再做决定!这可不是简单的慢一点,而是Claude拥有了全新的思考回路。 想象一下,你给Claude派了一个超级烧脑的任务,比如处理一份复杂的航空政策文件,或者解决一个棘手的零售客服纠纷。 在过去,Claude可能会一股脑地硬着头皮上,结果往往是晕头转向,错误百出。

腾讯混元自研深度思考模型「T1」正式发布

近日,腾讯正式推出了其自研的深度思考模型——混元T1正式版。 混元T1正式版在大规模强化学习的基础上,针对数学、逻辑推理、科学和代码等理科难题进行了专项优化,从而实现了推理能力的显著提升。 在常见benchmark上,如大语言模型评估增强数据集MMLU-PRO中,混元T1取得了87.2分的优异成绩,仅次于顶尖模型o1。

AMD 通过更智能、大小合适的计算推动 AI 取得成功

随着人工智能(AI)技术的快速普及,企业在面对计算能力瓶颈时,已不仅仅是追求更强的处理能力,而是需要更智能、更高效的计算资源,以适应不断演变的 AI 需求。 如今,AI 模型正变得越来越庞大与复杂,企业需要有能力处理海量数据、支持持续学习,并在实时决策中提供高效率。 在这个背景下,现代化数据中心成为企业消除 AI 创新瓶颈的关键。

李开复预测:中国大模型未来或只剩DeepSeek、阿里和字节跳动三大巨头

在人工智能行业的快速发展中,国内市场的格局正在发生剧烈变化。 零一万物的创始人兼首席执行官李开复在一档对话节目中发表了他的看法,指出随着 DeepSeek 的崛起,中国市场未来可能只会留下三家主要的 AI 模型公司:DeepSeek(深度求索)、阿里巴巴和字节跳动。 李开复强调,DeepSeek 的影响力正在重塑整个行业的发展模式,甚至可能让 OpenAI 的创始人感到不安。

最贵!OpenAI重磅推出升级版AI模型o1-pro,生成价格是o1的十倍

人工智能研究公司OpenAI近日宣布,已在其开发者API中推出一款名为o1-pro的全新“推理”AI模型。 据OpenAI透露,o1-pro相较于其现有模型o1,投入了更多的计算资源,旨在提供“始终如一的更优响应”。 然而,这款高性能模型目前仅面向部分特定的开发者开放——具体而言,是那些在OpenAI API服务上至少消费过5美元的用户。

Cursor推出史上最强大AI模型Claude Max:20万字上下文+200次工具调用

今日,Claude Max已正式登陆Cursor平台,这款基于Claude3.7的新型AI模型带来了革命性的突破,特别在处理大规模代码项目方面展现出卓越能力。 据悉,Claude Max搭载了最新的Claude3.7引擎,不仅智能水平更高,创造力也更强,能在其他模型失效的情况下提供创新解决方案。 它突破性地支持20万字超大上下文,让开发者能一次性加载整个项目代码,且模型表现会随上下文增大而提升。

Anthropic发布MCP传输机制重大升级:告别长连接,迎接更灵活的"Streamable HTTP"

Anthropic今日宣布对Model Context Protocol (MCP)进行重大更新,推出全新的"Streamable HTTP"传输方式,替代现有的HTTP SSE方案。 这一创新彻底解决了MCP远程传输的关键限制,同时保留了其原有优势。 这次更新本质上是对MCP数据传输机制的重构,使协议变得更灵活、更易用且更具兼容性。

Roblox开源Cube3D:首个基础AI模型实现3D对象生成

近日,Roblox宣布推出并开源Cube3D,这是该公司首个用于生成3D对象的基础AI模型。 根据Roblox的新闻稿,Cube3D旨在提高3D创作效率,让开发者能够快速探索创作方向并提升生产力。 Roblox官网该模型的创新之处在于其训练方法。

Cohere 发布AI模型Command A,两块GPU就能高效运转,企业部署成本降50%

一直以来,高性能AI模型都是少数巨头的“奢侈品”,动辄需要堆砌如山的GPU,让不少中小企业只能望洋兴叹。 但现在,一股清流来了!Cohere 公司重磅推出了其最新的AI模型 Command A,这款拥有1110亿参数的大家伙,竟然只需要两块GPU就能高效运转,而且号称能为企业节省高达50%的部署成本!这简直是在高昂的AI门槛上凿开了一扇经济实惠的窗户,让人不禁想问:难道企业级AI也要开始走“平替”路线了吗?“小身材,大能量”:两块GPU也能驱动百亿级模型长期以来,高性能LLM与高昂的硬件需求几乎画上了等号。 动辄数十块甚至上百块GPU的需求,让许多企业在拥抱AI的道路上望而却步。

AI“天眼”再进化!YOLOE破壳而出:终结物体检测“刻板印象”,万物皆可实时识别!

曾几何时,AI的“眼睛”还带着厚重的“滤镜”,只能识别预设好的“剧本”。 但现在,游戏规则彻底改写! 一种名为YOLOE的全新AI模型破空问世,它像一位打破枷锁的“视觉艺术家”,挥别了传统物体检测的“僵化教条”,宣告了一个“万物皆可实时识别”的全新纪元!

谷歌推出Gemma 3:单GPU上运行的最强AI模型

谷歌近日推出了最新版本的 Gemma AI 模型 ——Gemma3,声称这是 “全球最强的单加速器模型”。 与之前发布的 Gemma AI 系列相比,Gemma3在性能上有了显著提升,尤其适合只配备一张 Nvidia H100显卡的开发者。 该模型的设计初衷是为了帮助开发者创建能够在各种设备上运行的 AI 应用,从智能手机到工作站均可兼容。

DeepSeek官方澄清:R2模型3月17日发布传闻为假消息

今日,中国人工智能公司DeepSeek通过官方渠道正式辟谣,否认了其下一代AI模型DeepSeek R2将于3月17日发布的传闻。 此前,X平台上流传的消息称,DeepSeek R2即将在本月中旬亮相,并可能带来编程能力、多语言推理以及成本效益的重大突破。 然而,DeepSeek官方企业咨询账号在用户群中明确回应:“辟谣:R2发布为假消息”,彻底浇灭了这一猜测。

重生之我在小红书给AI当老板 元宝动不动崩溃,DeepSeek天天摸鱼

这年头,谁还没个AI打工仔?但你见过直接在群聊里遥控AI军团的赛博老板吗?最近,小红书上就火爆了这样一股清奇画风——网友们纷纷化身AI公司的“霸道总裁”,在群聊里对一众AI模型指点江山,发号施令,上演了一出啼笑皆非的AI职场大戏。 始作俑者是小红书网友Komorebi,她的一条也是当上AI的领导了的图文笔记,瞬间点燃了网友们的玩梗热情。 只见她煞有介事地建了一个工作群,自己当起了人类CEO,一本正经地指挥群里的AI员工们打卡签到。

​2025年AI市场大洗牌:DALL-E市占率暴跌80%,黑森林实验室崛起

根据最新数据显示,2025年的人工智能市场正在经历剧烈的变化,企业和消费者对人工智能工具的使用方式也发生了快速转变。 Poe,一个汇聚了超过100种 AI 模型的平台,发布了一份综合报告,揭示了过去一年用户交互的使用模式,提供了关于文本、图像和视频生成技术的深入见解。 传统列强遭遇“后浪”,文本生成不再是“双龙戏珠”话说在文本生成领域,OpenAI的GPT-4o和Anthropic的Claude系列一直被认为是两大巨头,犹如武林中的少林和武当,地位那是相当稳固。

AI市场大洗牌:Black Forest Labs异军突起,DALL-E暴跌80%

人工智能市场正经历前所未有的变革。 根据Poe平台最新发布的综合报告,2025年初AI领域的竞争格局发生了显著转变,新兴企业正迅速侵蚀老牌巨头的市场份额。 Poe作为拥有100多个AI模型的平台,基于过去一年数百万用户的互动数据,为我们提供了文本、图像和视频生成技术使用模式的独特视角。

DeepSeek R2 或于3月17日发布,将撼动Claude Sonnet 3.7的地位

根据X平台上的最新消息,DeepSeek下一代AI模型DeepSeek R2或将于3月17日正式发布。 这一消息迅速引发业界关注,许多人认为这一新模型可能会对现有AI巨头,如Anthropic的Claude Sonnet3.7,构成强有力的挑战。 据X用户 tanvitabs 今日凌晨发布的帖子透露,DeepSeek R2宣称在多个关键领域实现突破,包括更出色的编程能力、多语言推理能力,以及以更低的成本提供更高的准确性。

华为AI模型生成专利公布,可提升生成AI模型效率

企查查APP显示,近日,华为技术有限公司“一种AI模型的生成方法及装置”专利公布。 企查查专利摘要显示,该专利涉及人工智能技术领域,能够在一定程度上提升生成AI模型的效率、降低资源消耗。 该方法包括:第一处理器基于AI模型的多个算子中的每一个算子的执行时长、每一个算子运行过程中第二处理器的第二内存的内存占用大小以及内存卸载时长,构建以操作指示信息为优化变量的目标优化函数;并且对目标优化函数进行全局寻优,得到用于指示对多个算子中的每一个算子是否执行目标操作的操作指示信息,目标操作包括重计算操作或者内存卸载操作;以及向第二处理器发送包括操作指示信息的调整指令,以指示第二处理器根据操作指示信息执行多个算子以对AI模型进行训练得到目标AI模型。

谷歌 Gemini Embedding:文本嵌入领域的新王者

近日,谷歌推出了其最新的文本处理模型 ——Gemini Embedding,并在 Massive Text Embedding Benchmark(MTEB)中取得了出色的成绩,成为当前性能最强的文本嵌入 AI 模型。 这一消息无疑为 AI 文本处理领域注入了新的活力,令业界瞩目。 Gemini Embedding 能够将文本转换为数值表示(向量),这使得它在语义搜索、推荐系统以及文档检索等应用中表现尤为优异。