AI

从某个角度看,Deepseek之于AI与当年Oracle之于信息化的意义是相同的

春节前这段时间里最热的莫过于DEEPSEEK,我因为家中老人住院,春节前后都泡在医院里。 无聊的时候只能看看头条消磨时光。 最近这段时间,我的头条推送几乎被DS占据了。

DeepSeek正在杀死程序员?不,它杀死的是一整个时代

——从“人肉编码”到“AI工程化”,中国软件行业的范式革命已至导语:当技术革命的枪声响起2023年GitHub统计显示,中国开发者平均每天写300行代码,其中270行是重复性业务逻辑。 而在DeepSeek等AI编码工具冲击下,这种“人肉堆代码”的模式正在崩塌——某跨国IT服务商已裁撤40%初级Java岗位,同时开出百万年薪急招AI工程师。 这不是简单的工具替代,而是一场关乎行业生死存亡的认知革命。

OpenAI 升级 o3-mini 模型思维链,提高 AI 推理透明度

OpenAI 公司今天(2 月 7 日)在 X 平台发布推文,宣布面向免费和付费用户更新 o3-mini 的思维链,并为付费用户更新 o3-mini-high 的思维链,更透明、更详细地展示模型的“推理”步骤以及得出答案的方式。

对多模式AI应用程序进行压力测试是红队的新领域

人类的交流是多模态的。 我们用许多不同的方式接收信息,这使我们的大脑能够从不同的角度看世界,并将这些不同的信息“模式”转化为现实的综合图景。 如今,人工智能 (AI) 至少在一定程度上也能做到这一点。

网易有道全面拥抱DeepSeek-R1,推理大模型加速个性化教学升级

1月20日,DeepSeek震撼发布DeepSeek-R1,这款推理大模型在数学、编程及逻辑推理等多个领域展现出了与OpenAI顶尖模型比肩的实力,同时实现了API调用成本90%-95%的大幅缩减,无疑为科技界投下了一颗开年“重磅炸弹”。 DeepSeek-R1的深度推理能力不仅为AI产业的多元化发展开辟了新航道,也为包括教育在内的多个行业带来了革新动力。 作为教育科技企业,网易有道坚持深入挖掘教育场景下的大模型应用价值。

2025年CIO应将AI投资押注于何处

回望2024年,我们或许会发现,这是大型语言模型(LLM)成为主流的一年,每个企业级SaaS都增加了协作助手或虚拟助手功能,许多企业也首次尝到了代理式AI的滋味。 CIO们获得了可观的预算,用于利用GenAI提高生产力、节约成本并增强竞争优势。 据沃顿商学院的AI报告显示,2024年企业对GenAI的投资相比2023年增长了2.3倍,但预测未来两到五年的增幅将有所降低。

百位专家联名警告:AI或将体验痛苦!Hinton、Bengio掀AI意识大论战

如果AI系统实现意识,可能会遭受痛苦? 最近,一百多位AI从业者、实践者和思想家发出了一封公开信。 他们呼吁:要对AI意识进行负责任的研究,否则如果AI实现了意识,可能就会「遭受痛苦」。

2024 年 AI 十大故事,透视技术变革与未来挑战

编辑 | 20492024 年,人工智能技术持续改变着我们的生活和工作方式。 IEEE Spectrum 精选了年度最具影响力的 10 个 AI 故事,从技术突破到社会影响,全方位展现了 AI 发展的现状与挑战。 这些故事不仅反映了生成式 AI 的革命性进展,也揭示了其存在的局限与争议。

Nature报导:研究人员如何使用 AI?科学领域利弊调查分析

编辑 | matrix人工智能正在重塑科研领域。 根据出版公司 Wiley 最新发布的一项大规模调查显示,研究人员普遍认为在未来两年内,AI 工具将在学术研究和出版领域获得广泛接受。 这项调查涵盖了来自 70 多个国家的近 5000 名研究人员,深入探讨了他们对生成式 AI 工具的使用现状和未来展望。

微软 AI 首席执行官集结 DeepMind 旧部共筑 AI 新未来

科技媒体 Windows Central 昨日(2 月 5 日)发布博文,报道称微软正积极招兵买马,在 AI 领域和 OpenAI、Salesforce、谷歌等科技巨头展开激烈竞争。

力压DeepSeek-R1!谷歌Gemini 2.0系列集体上新,全员跻身大模型竞技场前10

终于,谷歌DeepMind坐不住了,出手就是超越DeepSeek-R1! 劈柴哥亲自官宣Gemini 2.0家族更新,分别是Gemini 2.0 Flash、Gemini 2.0 Pro、Gemini 2.0 Flash-Lite。 同时,稳居大模型竞技场第1名的推理模型Gemini 2.0 Flash Thinking,已在Gemini App中推出。

谷歌放弃AI武器禁令——这对AI的未来意味着什么

谷歌已取消其长期以来禁止使用AI制造武器和监控系统的禁令,这标志着谷歌在AI开发方面的道德立场发生了重大转变。 前员工和行业专家表示,此举可能会改变硅谷对AI安全性的看法。 这一变化于本周悄然实施,消除了谷歌AI原则中明确禁止公司开发用于武器或监控的AI的关键部分。

英特尔开源RAG Foundry 框架,可增强多种RAG用例

英特尔实验室的研究人员开源了RAG Foundry,这是一个专门用于开发、增强大模型RAG框架。 Foundry很高的灵活性和扩展性,支持设计和实验各种RAG用例,这包括数据选择、聚合、过滤、检索、文本处理、文档排名、少样本生成、提示设计、微调、推理和模型评估等。 例如,开发人员通过RAG Foundry可以选择不同的检索算法和工具,以获取与问题相关的外部信息,基本上可以实现一站式开发RAG。

为什么大语言模型难以处理长上下文?从 Transformer 到 Mamba

OpenAI 在两年前推出 ChatGPT 时,其能够处理的上下文信息仅有 8,192 个 tokens1。 换言之,如果输入的文本超过大约 15 页,它就会“遗忘”最初的上下文内容。 这一限制使得 ChatGPT 在处理任务时的规模和复杂度都受到了影响。

在 TKE 上部署 AI 大模型(以DeepSeek-R1为例)

概述本文介绍如何在 TKE 上部署 AI 大模型,以 DeepSeek-R1 为例。 部署思路使用 Ollama 运行 AI 大模型,再通过 OpenWebUI 暴露一个聊天交互的界面,OpenWebUI 会调用 ollama 提供的 API 来与大模型交互。 Ollama 与 OpenWebUI 介绍Ollama 是一个运行大模型的工具,可以看成是大模型领域的 Docker,可以下载所需的大模型并暴露 API。

AAAI 2025 | 大模型会组合关系推理吗?打开黑盒,窥探Transformer脑回路

本文作者为北京邮电大学网络空间安全学院硕士研究生倪睿康,指导老师为肖达副教授。 主要研究方向包括自然语言处理、模型可解释性。 该工作为倪睿康在彩云科技实习期间完成。

AI for ADC,ADC for AI,F5 助力企业开启 AI 应用新时代​

生成式 AI 技术的迅猛发展正引领着数字世界的变革,AI 原生应用也将随之兴起,为企业和个人带来了前所未有的便捷与高效。 然而,如何保障数据安全、实现应用高效交付以及确保 API 接口的稳定性和安全性成为亟待解决的问题。 在此背景下,F5 凭借其深厚的技术积累和创新精神,提出了“AI for ADC,ADC for AI”战略。

数学真理的极限在哪里?希尔伯特第十问题扩展版得到证明

数学世界充满了无法触及的角落,那里存在着许许多多无法解决的问题。 现在,又一个角落被照亮了。 1900 年,著名数学家大卫・希尔伯特(David Hilbert)公布了一份清单,其中包含 23 个关键问题,并希望以此指导下个世纪的数学研究。