编程
Nature:科研人员最爱AI工具大盘点!从推理到编程,哪款才是最佳助手?
几乎每周都有新的、令人影响深刻的AI工具发布,研究人员纷纷踊跃尝试。 从复杂的数学问题求解,到医学诊断中的精准分析,再到代码编写与论文创作,AI工具展现了巨大的潜力。 但市面上令人眼花缭乱的AI模型,究竟哪一款才是让科研工作者效率起飞的「梦中情模」,能助力科研突破,带来事半功倍的效果呢?
宇树机器人侧空翻惊呆网友:“我**想要一个!”
这下特效视频和机器人实拍真的傻傻分不清楚了…前几天机器人卷的还是前后空翻呢,宇树现在连侧空翻都曝出来了。 干拔起跳,落地都不带晃的:以上动作,由宇树的Unitree G1呈现,就是身高1米3,售价9.9万起的那个型号。 宇树官方是酱婶描述的:这是世界上第一款征服站立侧空翻的人形机器人。
Django创造者Simon Willison分享:我如何使用LLM帮我写代码
近段时间,著名 AI 科学家 Andrej Karpathy 提出的氛围编程(vibe coding)是 AI 领域的一大热门话题。 简单来说,氛围编程就是鼓励开发者忘掉代码,进入开发的氛围之中。 更简单地讲,就是向 LLM 提出需求,然后「全部接受」即可。
AI要取代程序员?吴恩达:别信!现在学编程比以往任何时候都香
AI的爆发式发展,让很多学习编程的人或者在职的软件工程师都很迷茫焦虑,更有甚者,像Anthropic CEO Dario Amodei 前两天说:“未来 3 到 6 个月内,90% 的代码将由人工智能编写;12 个月内,几乎所有代码都可能由人工智能生成”,那么究竟将来还需不要学习编程,吴恩达老师给出了他的看法:学习编程依然非常重要以下是原文中文翻译,分享给大家吴恩达@AndrewYNg如今有些人正在劝退他人学习编程,理由是人工智能将使编程自动化。 这种建议将来会被视为史上最糟糕的职业建议之一。 我不同意那位图灵奖和诺贝尔奖得主所写的“编程这个职业很可能走向消亡 [...] 而不是变得无所不能。
Anthropic CEO:AI将在未来3到6个月内完成90%编程工作
Anthropic 公司的首席执行官达里奥・阿莫代(Dario Amodei)在美国外 Relations 委员会的一场论坛上表示,他相信,人工智能将在未来3到6个月内完成90% 的编程工作。 阿莫代提到,在12个月内,人工智能有可能实现几乎所有代码的编写,这一言论引发了广泛关注。 当时,外 Relations 委员会的会长迈克・弗罗曼(Mike Froman)询问了阿莫代关于人工智能未来最佳案例的看法。
我用 Claude Sonnet 和 DeepSeek R1 开发一个同样的工具,看谁更厉害!
先给 DeepSeek 泼一盆冷水,DeepSeek 在编程能力上和 Claude Sonnet 还是差了一大截的。 下面有使用 Sonnet 3.5 和 DeepSeek R1 配合 Trae 实现一个推文生成图片卡片小插件的过程,功能虽小,但还是能看出差距的。 这两天 Trae 不是推出了国内版吗 (), 搭载豆包和 DeepSeek 大模型,因为之前 Trae 国际版是支持 Claude Sonnet 的,最开始是 3.5,后来 Claude 升级了 3.7,隔了一天 Trae 就跟进了,而且也是完全免费的。
GPT-4.5智商测试94,登上LLM竞技场榜首!网友质疑黑幕,实测结果惊人
GPT-4.5,口碑又意外反转了? 经过3千多轮比较,GPT-4.5在全部类别拿下第一,位居LLM竞技场首位! 「不看智商看情商」的GPT-4.5,不是推理模型,此前的基准测试中基本都是全班垫底,惨不忍睹。
实测字节免费AI编程,还让不让Cursor活了
国内首个原生AI IDE(集成开发环境),来自字节,实测在此:哪怕一点代码都不懂,只要能说出自己的需求,就能靠AI开发出一个功能完备的应用。 例如如果你想做一个Flappy Bird游戏,那就用中文跟它说一声就行:生成一个网页版 Flappy Bird游戏并运行。 不难看出啊,整个过程真真儿的就是一气呵成。
NYU教授震怒警告:孩子不学编程,只会葬送美国未来!
纽约时报最近的一篇文章写得非常精彩,可能成为周末阅读量最高的文章之一。 文章认为初级程序员甚至全部软件工程师迟早被AI取代,现在的AI让人动动嘴就能做出个人应用。 对此,马库斯怒斥道——这种观点,简直就是在误人子弟!
通义灵码上线Qwen2.5-Max推理模型
2025年3月3日,通义灵码宣布上线其最新推理模型Qwen2.5-Max,为开发者带来强大的编程和数学能力支持。 Qwen2.5-Max使用了超过20万亿token的预训练数据,并结合精心设计的后训练方案,展现出卓越的性能。 在多项基准测试中,Qwen2.5-Max表现突出。
中国首个AI原生IDE:字节跳动发布AI编程工具Trae国内版
3月3日,字节跳动发布AI编程工具Trae国内版,模型搭载doubao-1.5-pro,支持切换满血版DeepSeek R1&V3。 这是国内首个AI原生集成开发环境工具(AI IDE),能充分释放AI的潜力,帮助各阶段开发者与AI流畅协作,更快、更高质量地完成编程工作,提升开发效率。 用户可通过Trae中国官网(trae.com.cn)下载体验。
中国团队首次夺魁!无问芯穹FlightVGM获FPGA'25最佳论文,峰值算力超GPU21倍
国际可重构计算领域顶级会议 ——FPGA 2025 在落幕之时传来消息,今年的最佳论文颁发给了无问芯穹和上交、清华共同提出的视频生成大模型推理 IP 工作 FlightVGM,这是 FPGA 会议首次将该奖项授予完全由中国大陆科研团队主导的研究工作,同时也是亚太国家团队首次获此殊荣。 这项工作首次在 FPGA 上实现了视频生成模型(Video Generation Models, VGMs)的高效推理,也是该团队继去年在 FPGA 上加速大语言模型 FlightLLM(FPGA’24)后的最新系列工作。 与 NVIDIA 3090 GPU 相比,FlightVGM 在 AMD V80 FPGA 上实现了 1.30 倍的性能提升与 4.49 倍的能效提升(峰值算力差距超过 21 倍)。
Claude 3.7登顶编程竞技场,大幅领先100分!最新布料模拟实测再惊艳网友
公认的编程开发能力第一! Claude 3.7 Sonnet刚刚登顶WebDev竞技场榜首。 大幅甩第二名100多分,在榜单前十的其它相邻模型分差仅为几分、几十分的情况下。
Kimi k1.6模型曝光:编程能力超越GPT-3,引领AI新风潮
最近,来自全球知名动态基准测试平台 LiveCodeBench 的信息显示,Kimi 最新发布的 k1.6模型在编程能力方面表现卓越,已经超越了 OpenAI 的 GPT-3(包括 o3mini 和 o1等版本),登上了性能排行榜的第一名。 这一消息无疑为科技界带来了激动与期待。 据月之暗面的研究员 Flood 透露,k1.6是在 k1.5的基础上进行训练和优化的,目前其性能仍在不断提升中。
AI 编码 2.0 分析、思考与探索实践:从 Cursor Composer 到 AutoDev Sketch
在周末的公司【AI4SE 效能革命与实践:软件研发的未来已来】直播里,我分享了《AI编码工具 2.0 从 Cursor 到 AutoDev Composer》主题演讲,分享了 AI 编码工具 2.0 的核心、我们的思考、以及我们的 AI 编码工具 2.0 探索实践。 在这篇文章中,我将分享这次演讲的内容,希望能够给大家带来一些启发。 一、AI 编程工具 2.0 (趋势分析)我们分析了市面上最受欢迎的 AI 编程工具,如 Cursor、GitHub Copilot Edit、WindSurf、Cline 等,简单总结一下新一代 AI 编程工具的特点:图片AI 编程工具正在从代码补全、代码预测,到更加智能、更耗费 token 的 AI 自动化编码与验证,以及正在发展中的异步 AI 编码。
AI编程工具Cursor已集成Claude 3.7 Sonnet推理模型
刚刚,Cursor AI宣布已集成Claude 3.7 Sonnet,并更新了用户界面,使其更加简洁易用。 此外,Cursor还引入了跨聊天对话功能,能够自动总结聊天摘要并继承到新开的聊天窗口中,进一步提升了用户体验。 早些时候,Anthropic公司正式发布其最新推理模型——Claude3.7Sonnet。
14岁出道编程天才:新一代码农不会写代码了,AI正培养「文盲程序员」!
AI辅助编程的时代已经到来,代码生成工具触手可及。 这本应是开发效率的巨大飞跃,但一个令人不安的问题却浮出水面:我们是否正在培养出一批只会「复制粘贴」,却对代码底层逻辑一知半解的程序员? 当便捷的AI工具取代了艰苦的学习和思考过程,我们是否在无意中扼杀了真正的技术创新和深度理解?
OpenAI 最新研究:当前 AI 模型仍无法媲美人类程序员
尽管 OpenAI 首席执行官萨姆・奥尔特曼(Sam Altman)坚称,到今年年底,人工智能模型将能够超越“低级别”软件工程师,但该公司研究人员的最新研究却表明,即使是目前最先进的 AI 模型,仍无法与人类程序员相媲美。