AI
免费体验:微软 Copilot 开放“深度思考”,你的专属 AI 策略顾问
科技媒体 Windows Latest 昨日(1 月 24 日)发布博文,报道称微软正开始邀请 Copilot 用户,免费体验“深度思考”(Think Deeper),会花费更多时间分析问题,并逐步剖析推理生成更详细、更符合用户需求的答案。
满血o3即将推出,OpenAI的Q1还有硬货!首席产品官:o1 Pro不可能一直傻乎乎地亏钱!今明两年不会推出机器人
出品 | 51CTO技术栈(微信号:blog51cto)前天,OpenAI最大的产品经理,首席产品官Weil刚剧透智能体Q1就发出。 一转头,今天就把Operator推出来了? ?
“人类终极考试”基准测试发布:顶级 AI 系统表现惨淡,回答准确率均未超 10%
非营利组织“人工智能安全中心”(CAIS)与提供数据标注和 AI 开发服务的公司 Scale AI 联合推出了一个名为“人类终极考试”(Humanity's Last Exam)的新型基准测试,旨在评估前沿 AI 系统的综合能力。这一测试因其极高的难度引起关注。
颠覆LLM格局!AI2新模型OLMo2,训练过程全公开,数据架构双升级
最近,非营利研究机构AI2上新了OLMo2系列模型,他们称之为「迄今为止最好的完全开源模型」。 OLMo 2系列包含7B和13B两个型号,相比如Llama 3.1和Qwen 2.5等开源模型达到了同等甚至更优的性能,同时FLOPS计算量更少,在性能和计算效率之间取得了极佳的平衡,为开源LLM开辟了新的可能性。 不同大小开源模型的性能对比,OLMo 2的表现优于同参数规模模型在多个下游任务上,OLMo 2展现出了强大的泛化能力和适应能力。
六大维度,LLM「问题生成」首次正面PK人类!伯克利等发布最新研究
长期以来,问题生成(Question Generation)任务都是根据「给定事实」来编写各种相关问题,已经发展出了很多自动化的方法。 大型语言模型(LLM)的兴起,极大提升了各种自然语言处理(NLP)任务的性能,其中也包括问题生成,虽然应用广泛,但还没有研究讨论过「用LLMs生成问题的特点」。 没有额外提示约束时,LLMs是更倾向于生成较长还是较短的问题?
OpenAI首个智能体Operator大测评,你也能拥有24小时私人管家!
演唱会抢票终于不用自己蹲守了,公司订餐也可以直接「无脑托管」,这就是OpenAI今天发布的Operator。 顾名思义,Operator就是能帮你端到端处理任务的AI智能体。 比较有趣的是,OpenAI针对Operator新开了一个网页operator.chatgpt.com,而不是像之前发布的功能都直接统一内置在ChatGPT中。
向视觉版o1出击,阶跃张祥雨团队推出“慢感知”,实现感知层面的推理时scaling
视觉版o1的初步探索,阶跃星辰&北航团队推出“慢感知”。 研究人员认为:1)目前多模领域o1-like的模型,主要关注文本推理,对视觉感知的关注不够。 2)精细/深度感知是一个复杂任务,且是未来做视觉推理的重要基础。
打造科学研究“革命的工具”,『AI4S攀登者行动计划』开放申请
驱动科学研究的人工智能(AI for Science,以下简称AI4S)正逐渐改变科学研究的模式,然而学科之间的“烟囱式”发展模式,既容易造成资源分散和重复投入,也在一定程度上制约颠覆性成果涌现。 同时,由于AI4S具有“极宏观拓展、极微观深入、极端条件迈进、极综合交叉”的特性,使得具有重大意义的变革性突破,难以从现有组织模式中诞生——这类突破超出了单一团队的研究能力,需要依赖大规模研究、工程与系统协作,而早期价值又难以被商业风投支持——“AI4S攀登者行动计划”旨在解决这一难题。 如果你渴望突破AI4S传统研究模式的限制,欢迎申请加入“AI4S攀登者行动计划”,与我们共同推动下一代技术变革。
活性提高42倍,ML引导的无细胞表达加速酶工程,登Nature子刊
编辑 | 萝卜皮酶是人类生活中不可或缺的天然催化剂,不仅助我们消化食物,还能增强香水香味、提高洗衣效率,甚至用于疾病治疗。 科学家们正使用酶工程创造新酶,用于吸收温室气体、降解环境毒素、研发高效药物。 但是,酶工程受限于快速生成和使用大量序列功能关系数据集进行预测设计的挑战。
一文读懂 OpenAI 最新 Operator
Hello folks,我是 Luga,今天我们来聊一下人工智能应用场景最新突破 - 构建高效、灵活的创新的 AI Agent。 人工智能(AI)领域正迎来一个崭新的时代,AI 不再仅仅是被动地响应指令,而是能够主动地理解用户意图,并在数字世界中自主执行任务。 OpenAI 近期发布的 Operator 正是这一变革的先锋。
中国AI太强,Meta工程师吓疯?自曝疯狂熬夜复制DeepSeek,天价高管心虚了
今天,Meta员工在匿名社区TeamBlind上的一个帖子,在业内被传疯了。 DeepSeek,真实地给了美国人亿点点「震撼」。 DeepSeek R1是世界上首个与OpenAI o1比肩的AI模型,而且与o1不同, R1还是开源模型「Open Source Model」,比OpenAI还Open!更有人曝料,DeepSeek还只是个「副项目」,主业根本不是搞大模型!
实测打脸!世界第一位AI程序员Devin:20项任务只完成了3项!14项任务彻底失败!网友:实际效果跟商业估值没关系!
编辑 | 言征出品 | 51CTO技术栈(微信号:blog51cto)10个月过去,世界“首位AI程序员”究竟如何了? 近日, Answer.AI 团队中经常试验 AI 开发工具的测试团队秉着“百闻不如一见”的精神,与最受Twitter追捧的编程神器共事了一个月,结果非常惨烈。 “作为 Answer.AI 团队中经常试验 AI 开发工具的一员,Devin 给人的感觉有些不同。
阿里通义实验室提出AnyStory:开启个性化文本到图像生成的新篇章!
在这个数字化时代,生成式AI技术正以前所未有的速度改变着我们的创作方式。 近期,阿里通义实验室发表了一篇题为《AnyStory: Towards Unified Single and Multi-Subject Personalization in Text-to-Image Generation》的论文,该论文提出了一种创新的框架,旨在通过统一的路径实现单个及多个主体的个性化文本到图像生成,为故事可视化、艺术创作乃至更多领域带来了革命性的突破。 论文中深入探讨了当前文本到图像生成技术面临的挑战,如主体一致性、细节保留以及多主体个性化等方面的不足。
Hugging Face 最小 AI 视觉语言模型登场:2.56 亿参数,内存低于 1GB PC 也能驾驭
Hugging Face 平台昨日(1 月 23 日)发布博文,宣布推出 SmolVLM-256M-Instruct 和 SmolVLM-500M-Instruct 两款轻量级 AI 模型,在 AI 算力有限的设备上,最大限度发挥其算力性能。
安卓版 Perplexity Assistant 登场:AI 多模态交互,“看”懂你的世界
Perplexity AI 公司今天(1 月 24 日)发布公告,宣布推出安卓版 Perplexity Assistant 应用程序,带来多模态交互体验和跨应用任务执行能力。
2025智能体元年!斯坦福科学家8000字讲清所有要点
许多人认为「智能体」是AI发展的终极目标。 智能体在处理复杂任务时,展现出了巨大潜力。 从协助搭建网站、管理客户账户,到开展市场调研、自动录入数据,智能体的应用场景日益广泛。
会用ChatGPT≠工程师,谷歌资深员工发文,揭秘AI编程不为人知的真相
尽管程序员们纷纷反馈用上AI辅助之后,工作效率提升,但我们用到的软件中bug依旧不少。 针对这一现象,前谷歌产品经理Peter Szalontay,以及现任的谷歌Chrome的工程团队领导Addy Osmani都给出了自己的分析,并提供了一些如何使用AI辅助编程的建议。 AI编码工具的黑暗真相1月7日,前谷歌产品经理Peter Szalontay发推,并配上了一个令人惊心动魄的标题:「无人谈论的AI编码工具的黑暗真相」。
刚刚,OpenAI首个智能体提前曝光!高级编码AI剑指400万年薪L6级工程师
AGI或许就在本周? 刚刚外媒爆料称,OpenAI暗藏的首个智能体项目「Operator」即将发布。 网友发现Operator已登陆ChatGPT,不过可能Pro用户最先用上这款AI智能体将与ChatGPT深度集成,直接可以接管你的屏幕,自动化完成任务。