AI

一文读懂 OpenAI 最新 Operator

Hello folks,我是 Luga,今天我们来聊一下人工智能应用场景最新突破 - 构建高效、灵活的创新的 AI Agent。 人工智能(AI)领域正迎来一个崭新的时代,AI 不再仅仅是被动地响应指令,而是能够主动地理解用户意图,并在数字世界中自主执行任务。 OpenAI 近期发布的 Operator 正是这一变革的先锋。

中国AI太强,Meta工程师吓疯?自曝疯狂熬夜复制DeepSeek,天价高管心虚了

今天,Meta员工在匿名社区TeamBlind上的一个帖子,在业内被传疯了。 DeepSeek,真实地给了美国人亿点点「震撼」。 DeepSeek R1是世界上首个与OpenAI o1比肩的AI模型,而且与o1不同, R1还是开源模型「Open Source Model」,比OpenAI还Open!更有人曝料,DeepSeek还只是个「副项目」,主业根本不是搞大模型!

实测打脸!世界第一位AI程序员Devin:20项任务只完成了3项!14项任务彻底失败!网友:实际效果跟商业估值没关系!

编辑 | 言征出品 | 51CTO技术栈(微信号:blog51cto)10个月过去,世界“首位AI程序员”究竟如何了? 近日, Answer.AI 团队中经常试验 AI 开发工具的测试团队秉着“百闻不如一见”的精神,与最受Twitter追捧的编程神器共事了一个月,结果非常惨烈。 “作为 Answer.AI 团队中经常试验 AI 开发工具的一员,Devin 给人的感觉有些不同。

阿里通义实验室提出AnyStory:开启个性化文本到图像生成的新篇章!

在这个数字化时代,生成式AI技术正以前所未有的速度改变着我们的创作方式。 近期,阿里通义实验室发表了一篇题为《AnyStory: Towards Unified Single and Multi-Subject Personalization in Text-to-Image Generation》的论文,该论文提出了一种创新的框架,旨在通过统一的路径实现单个及多个主体的个性化文本到图像生成,为故事可视化、艺术创作乃至更多领域带来了革命性的突破。 论文中深入探讨了当前文本到图像生成技术面临的挑战,如主体一致性、细节保留以及多主体个性化等方面的不足。

Hugging Face 最小 AI 视觉语言模型登场:2.56 亿参数,内存低于 1GB PC 也能驾驭

Hugging Face 平台昨日(1 月 23 日)发布博文,宣布推出 SmolVLM-256M-Instruct 和 SmolVLM-500M-Instruct 两款轻量级 AI 模型,在 AI 算力有限的设备上,最大限度发挥其算力性能。

安卓版 Perplexity Assistant 登场:AI 多模态交互,“看”懂你的世界

Perplexity AI 公司今天(1 月 24 日)发布公告,宣布推出安卓版 Perplexity Assistant 应用程序,带来多模态交互体验和跨应用任务执行能力。

2025智能体元年!斯坦福科学家8000字讲清所有要点

许多人认为「智能体」是AI发展的终极目标。 智能体在处理复杂任务时,展现出了巨大潜力。 从协助搭建网站、管理客户账户,到开展市场调研、自动录入数据,智能体的应用场景日益广泛。

会用ChatGPT≠工程师,谷歌资深员工发文,揭秘AI编程不为人知的真相

尽管程序员们纷纷反馈用上AI辅助之后,工作效率提升,但我们用到的软件中bug依旧不少。 针对这一现象,前谷歌产品经理Peter Szalontay,以及现任的谷歌Chrome的工程团队领导Addy Osmani都给出了自己的分析,并提供了一些如何使用AI辅助编程的建议。 AI编码工具的黑暗真相1月7日,前谷歌产品经理Peter Szalontay发推,并配上了一个令人惊心动魄的标题:「无人谈论的AI编码工具的黑暗真相」。

刚刚,OpenAI首个智能体提前曝光!高级编码AI剑指400万年薪L6级工程师

AGI或许就在本周? 刚刚外媒爆料称,OpenAI暗藏的首个智能体项目「Operator」即将发布。 网友发现Operator已登陆ChatGPT,不过可能Pro用户最先用上这款AI智能体将与ChatGPT深度集成,直接可以接管你的屏幕,自动化完成任务。

两分钟完成论文调研!ByteDance Research推出论文检索智能体PaSa,远超主流检索工具

2025 被称为 Agent 元年,新年伊始,ByteDance Research 就推出了一款基于强化学习的智能体应用:论文检索智能体。 它可以模仿人类研究者调用搜索引擎、看论文、查参考文献。 繁琐冗长的论文调研,现在,只需要两分钟。

实测丨年底了,我用 AI 做了一份年终总结。

去年11月,自由画布在百度世界大会上首次亮相,各种 AI 新招式也是吊足了人们的胃口。 经过了一段时间的等待,我终于拿到了它的内测资格,成为了首批探索者。 激动之余,我和自由画布的相关负责人讨教了一下用法,听完之后第一感觉就是:好厉害、好复杂,需要好好摸索研究。

“自由画布”开启公测!百度文库AI功能MAU超9000万

1月21日,在百度AI DAY活动上,百度副总裁,文库事业部、网盘事业部负责人王颖透露,百度文库AI功能MAU已突破9000万,同时,由百度文库和百度网盘联合打造的AI创作新物种“自由画布”开启公测。  过去一年,百度文库用户数据呈高速增长,其AI功能MAU已突破9000万,AI DAU年同比增长230%;付费用户超4000万,位居全球第二、中国第一。 自依托文心大模型进行全面AI重构以来,百度文库推出智能PPT、智能写作、AI全网搜、智能有声画本、智能漫画等上百项AI能力,覆盖学习办公、家庭教育、兼职赚钱场景。

推理模型规划任务成功率从5%到95%,DeepMind遗传算法新研究火了

瞄准推理时扩展(Inference-time scaling),DeepMind新的进化搜索策略火了! 所提出的“Mind Evolution”(思维进化),能够优化大语言模型(LLMs)在规划和推理中的响应。 由于提升显著,Reddit/𝕏一时间出现了大量讨论:由于结合了遗传算法,使用Mind Evolution能让Gemini 1.5 Flash任务成功率从原本的5%左右,一下提升90个百分点。

自主操作电脑的多模态 Agent 升级,智谱 GLM-PC 开放体验

北京智谱华章科技有限公司今日发文宣布,旗下智谱 GLM-PC 开放体验,宣城“自主操作电脑的多模态 Agent 再升级”。

字节要亲手打造AGI了!神秘“Seed Edge”项目被曝光,已设置5大研究方向,探索下一代AI技术,算力不用愁!

编辑 | 伊风出品 | 51CTO技术栈(微信号:blog51cto)中国大厂开始发力AGI了! 据媒体报道,字节跳动 AGI 研究团队浮出水面,揭开了字节AGI的秘密布局! 报道称:1 月下旬,字节正式设立代号为“Seed Edge”的研究项目,核心目标是做比预训练和大模型迭代更长期、更基础的 AGI 前沿研究。

字节清华开源力作!UI-TARS原生AI智能体,人人都能拥有“智能助手”

年底国内各个AI玩家杀疯了,前两天完全开源的Deepseek R1 震撼整个AI业界,今天字节又联合清华整活,一个强大的原生的开源 AI Agent UI-TARS震撼上线看了UI-TARS的论文,我给大家划划重点【纯视觉感知】:告别文本依赖,像人眼一样“看”懂GUI! 传统的GUI自动化方案,很多都依赖于解析网页代码(HTML)或者软件的API接口。 但这种方式有两个致命缺陷:一是平台限制,不同平台、不同软件的底层代码和API都不一样,导致自动化方案难以通用;二是容易失效,一旦网页或软件界面改版,代码或API接口变动,自动化脚本就可能直接崩溃。

NVIDIA提出虚拟试衣新方法EARSB,让时尚与科技完美融合!

在数字化浪潮席卷全球的今天,科技正以前所未有的方式融入我们的生活,包括我们追求时尚的方式。 想象一下,无需亲临实体店,只需轻点屏幕,就能轻松试穿心仪的衣物,这不再是遥不可及的梦想。 NVIDIA联合波士顿大学提出了 EARSB,该模型能够智能地识别并修正初始试衣图像中的错误区域,能够针对特定错误进行精准修正,显著提升试衣效果的真实感和细节表现。

「AI没有墙超预期」Anthropic CEO达沃斯惊人预测:2027年实现超人类水平的AI

人类水平的AI或超越所有人类的AI将在两三年内到来,从内部来看,AI的发展没有遇到墙反而超预期                                                                                                                                                              --Anthropic CEO Dario Amodei华尔街日报在达沃斯世界经济论坛对 Anthropic 首席执行官 Dario Amodei 的最新采访。 采访内容主要围绕 Anthropic 的 AI 模型 Claude 的未来发展方向、AI 技术的进步速度及其对社会和劳动力市场的影响、以及 Anthropic 在行业竞争和政策监管方面的策略以下结合采访内容给大家划个重点Claude 的未来发展方向网络访问 (Web Access): Anthropic 正在积极开发 Claude 的网络访问功能,预计很快推出。 尽管企业用户是 Anthropic 的重点,但他们也认识到网络访问对于消费者和高级用户的重要性。