开发

斯坦福研究:ChatGPT性能,曾出现下降趋势

斯坦福大学和加州伯克利大学的研究人员在“哈佛数据科学评论”上,发布了一篇名为《ChatGPT行为随时间变化》的论文。 研究人员通过GPT-3.5、GPT-4(2023年3月和6月两个版本)模型在数学问题、代码生成、多跳知识密集问答、美国医学执照考试、多跳知识密集型问题回答等7项任务进行了深度研究,以查看ChatGPT随着时间推移其性能的变化趋势。 结果显示, GPT-3.5 GPT-4的性能和行为在3个月内出现了明显波动。

马斯克Boss直聘新玩法:不看学历,只看代码

新鲜出炉的马斯克版Boss直聘,风格是酱婶儿的:不care工作履历,不care学历背景,甚至没上过学也不是不行。 重点就一个:just show us your code。 这就是他为自己手里𝕏招揽资深工程师人才的唯一要求。

重磅!微软发布新AI Agent,集成在office全家桶、自动化时代来了

今天凌晨,微软在官网发布了全新企业级AI助手——Microsoft 365 Copilot Chat。 Copilot Chat除了支持的传统的文本生成、文件分析(PDF、Word等)、图像生成之外,最大亮点便是支持AI Agent功能,并且集成在了Microsoft 365商业版中,可直接调用企业自有数据,执行夸端到端的超复杂自动化业务流程。 例如,在供应链管理中,Copilot Chat能够实时监控库存水平,根据销售数据和市场趋势预测需求,自动生成采购订单,并协调物流配送,提升整个供应链工作效率。

一句话让Agent自主干活,清华复旦斯坦福等开源的智能体开发框架抢先了OpenAI

近期,OpenAI CEO Sam Altman 宣布,2025 年将推出名为 “Operator” 的虚拟员工计划,AI 代理将能够自主执行任务,如写代码、预订旅行等,成为企业中的 “数字同事”。 在 OpenAI 发布 “Operator” 之前,清华、复旦和斯坦福的研究者联合提出了名为 “Eko” 的 Agent 开发框架,旨在让开发者通过简洁的代码和自然语言,快速构建可用于生产的 “虚拟员工”。 这种框架使得 AI 代理能够接管用户的电脑和浏览器,代替人类完成各种任务,为工作流程提供自动化支持。

ETH&PICO开源MADPose:通过显式仿射校正单目深度预测的相对位姿估计方法

本文经3D视觉之心公众号授权转载,转载请联系出处。 单目深度估计的关键局限和挑战近年来,基于深度学习的单目深度估计(Monocular Depth Estimation, MDE)能够从单张二维图像中提取出日益准确的三维信息。 这些进展为利用三维先验丰富传统几何计算机视觉任务开辟了新的可能性。

快上车!吴恩达老师分享自用 AI 辅助编程快速打造软件原型最佳实践

在人工智能时代,如何利用 AI 辅助编程快速构建软件原型? 吴恩达老师在这篇信中分享了他的心得与最佳实践。 他不仅介绍了自己当前使用的技术栈(包括 Python FastAPI、Uvicorn、MongoDB 等),还探讨了如何通过明确选择工具和优化开发流程,大幅提升开发效率文中重点包括:1.

使用 Teachable Machine 构建图像识别模型

Teachable Machine 是由 Google 开发的一款基于网页的工具,允许任何人在不需要深入了解编程或机器学习的情况下创建机器学习模型。 它的设计易于使用且用户友好,适合初学者、教育工作者,甚至是想要探索人工智能概念的孩子们。 Teachable Machine 支持的模型Teachable Machine 支持以下机器学习模型:图像分类 — 识别图像中的物体音频分类 — 识别声音、语音或其他音频输入姿态分类 — 识别人体姿态或动作要训练模型,您需要为 Teachable Machine 提供自己的数据集,例如图像或录音。

吴恩达对话业界领袖:揭秘2025人工智能五大风口

吴恩达(Andrew Ng)在新年伊始,与我们分享了他对人工智能未来发展的个人见解,吴老师特别指出,AI正在降低软件开发成本,使得快速构建软件原型变得前所未有的容易。 无论是为孩子制作抽认卡,还是管理国际账户的外汇汇率,亦或是自动分析用户评论以快速发现产品问题,AI辅助编码都能迅速实现这些应用。 吴恩达认为,AI辅助编码在原型开发中尤为有效,因为原型通常不需要复杂的上下文和软件集成,且在早期测试阶段对可靠性的要求相对较低。

PyTorch vs PyTorch Lightning 框架对比

在不断发展的深度学习领域,PyTorch 已经成为开发者和研究人员家喻户晓的名字。 其动态计算图、灵活性以及广泛的社区支持使其成为构建从简单神经网络到复杂前沿模型的首选框架。 然而,灵活性也带来了编写大量样板代码的责任——尤其是在训练循环、日志记录和分布式学习方面。

YOLO、SSD 和 Faster R-CNN 三种方案实现物体识别的对比

本文旨在开发一个能够准确检测和分割视频中物体的计算机视觉系统。 我将使用最先进的三种SoA(State-of-the-Art)方法:YOLO、SSD和Faster R-CNN,并评估它们的性能。 然后,我通过视觉分析结果,突出它们的优缺点。

OpenAI微软「秘密协议」首次曝光:盈利超过1000亿美元就是AGI!

何谓AGI? 就在今天,我们终于有了一个明确的、数值上的「定义」! 要知道,此前微软和OpenAI合作的基础之所以能存在,就是因为双方曾有这样一个协定——一旦OpenAI达到AGI水平,它就可以终止与微软的独家合作关系。

OpenAI 发布 o1 及开发者新工具:模型升级、实时 API 优化、偏好微调等重磅更新

OpenAI 12天发布会Day9, 今日宣布推出一系列针对开发者的强大模型、全新定制工具以及性能、灵活性和成本效益的升级,旨在助力开发者构建更智能、更强大的 AI 应用。 本次更新涵盖以下关键内容:1. API 中的 OpenAI o1:OpenAI o1 模型正式在 API 中向 5 级使用用户开放。

项目爆火立刻脱离大厂!谷歌NotebookLM核心团队集体离职,另起炉灶创业

谷歌最火爆大模型产品,背后团队刚刚集体离职创业了! 就是被大神Karpathy强烈安利、盛赞为有可能开启“和ChatGPT一样大机会”的NotebookLM,幕后的关键人物们。 团队负责人Raiza Martin(简称拉姐)在自己的社交媒体上公布了这一消息:在谷歌干了5.5年,今天是我的last day。

从本地部署到企业级服务:十种主流LLM推理框架的技术介绍与对比

大语言模型(Large Language Models, LLMs)的部署是一项具有技术挑战性的工作。 随着模型架构日益复杂,以及硬件需求不断提升,部署过程变得愈发复杂。 业界已经发展出多种解决方案,使LLM的部署和扩展变得更加便捷。

吴恩达开源大模型套件:11个模型平台一种方式调用,已获星标超1.2K

吴恩达发布的开源大模型套件aisuite,不到半天就斩获了1200 星标。 它把11家知名大模型平台集中到了一起,统一了接口,可以用相同的方式调用不同模型。 切换模型时,只需要改动一个字符串,不用在不同的API之间摸不着头脑了。

十倍开发者与AI:科技精英程序员会被取代吗?

顶尖开发人员将与现在看起来大不相同。 公司需要改变他们对高绩效开发团队的看法。 译自The 10x Developer vs.

程序员不应被AI取代写代码,而是写文档!谷歌大牛呼吁:老板们应该倾听开发者心声,现在的AI代码生成器操之过急,风险太大!

编译 | 言征出品 | 51CTO技术栈(微信号:blog51cto)对于“AI帮助生产力提高”这件事情上,开发人员与他们的老板,意见其实非常不一致。 最近, Atlassian-DX DevEx 进行了一项现状调查,结果非常有意思——调查结果显示,公司老板们认为 AI 是提高开发人员生产力和满意度的最有效方法,但高达三分之二的开发人员却不这么想,他们认为实际上没有任何显著的 AI 生产力提升。 众所周知,目前最热门的软件开发 AI 用例属于代码生成。

“稚晖君”创业项目,智元自主研发的机器人中间件 AimRT 开源

智元自主研发的机器人中间件 AimRT 开源上线。▲ AimRT 架构图官方表示,AimRT 是一个更现代、轻量易用,且高效稳定的通信开发框架,具备机器人开发流程所必备的许多实用特性,并解决了主流开源中间件的一些痛点:在软件开发效率方面,AimRT 基于现代 C 新标准开发,轻量易部署,将现代化设计模式应用在资源管控、异步编程、部署配置等方面,使得机器人应用的开发更加快捷和高效。在工具链与调测效率方面,AimRT 提供了完善的调试、性能分析工具,以及良好的可观测性支持,有助于快速发现并解决系统中的问题,相比较传