AI

DeepSeek的爆火,背后是这些启发 ...

关注AI大模型技术的朋友们,在欢度春节的这些天,一定有被国产大模型底座DeepSeek的”横空出圈"霸屏了。 国产化大模型在算力更加“节约”的情况下,研发出了近乎和OpenAI GPT-4o同等“聪明”的大模型底座,极大地激励了国人对于AI技术研发的信心,同时也给国内外同行们带来了不少“焦虑”与“反思”。 与其他主流大模型相比,正如DeepSeek的中文名“深度求索”想表达的,它在解决具体回答任务时,不仅关注“端到端”的一问一答结果,更加关注这个答案是怎么得到的。

AI已学会自我复制!复旦新研究:开源LLM克隆成功率最高90%

AI已跨越关键「红线」,实现了自我复制。 复旦大学的研究人员在一项新研究中,展示了两种开源的LLM具备自我克隆的能力。 在没有人类帮助的情况下,AI成功实现自我复制,这不仅是它超越人类的关键一步,也是「流氓AI」出现的早期信号。

Cerebras与Perplexity携手打造超高速AI搜索模型Sonar,瞄准千亿美元市场

近日,Cerebras Systems 与 Perplexity AI 宣布达成合作,共同推出一款新的超快速 AI 搜索模型 Sonar,旨在挑战传统搜索引擎的主导地位。 合作的核心在于 Sonar 模型,该模型在 Cerebras 专用的 AI 芯片上运行,速度达到每秒1200个标记,成为目前市场上最快的 AI 搜索系统之一。 Sonar 模型建立在 Meta 的 Llama3.370B 基础上,标志着一种新型 AI 优先的搜索体验,双方对其快速性能寄予厚望。

英国版权法修订遭质疑,“内定”AI 训练版权豁免

英国卫报昨日(2 月 11 日)发布博文,报道称英国就修改版权法征求公众意见,在新的版权豁免下,拟允许人工智能(AI)公司使用创意作品训练算法。

AI 让罕见病患者重获新生:从 4000 种药物中找到救命药

在对 4000 种现有药物进行筛选后,一种人工智能工具帮助发现了一种药物,成功挽救了一名特发性多中心 Castleman 病(iMCD)患者的生命。iMCD 是一种罕见疾病,其生存率极低,且治疗选择有限。

Claude团队:用400万条对话分析AI对经济的长期影响

基于400万条Claude真实对话数据,Anthropic重磅发布全新报告! 在今天,哪些职业用AI最多? 他们都用AI干什么?

推理模型新路线开源!与DeepSeek截然不同,抛弃思维链不用人类语言思考

开源推理大模型新架构来了,采用与Deepseek-R1/OpenAI o1截然不同的路线:抛弃长思维链和人类的语言,直接在连续的高维潜空间用隐藏状态推理,可自适应地花费更多计算来思考更长时间。 例如问题:Claire每天早餐都会做一个3个鸡蛋的煎蛋卷。 她在4周内会吃多少个鸡蛋?

20个很强的DeepSeek提问公式

大家好,我是汤师爷~今天直接给大家分享DeepSeek干货内容。 要获得精准的AI回答,关键在于提问方式。 这里为你整理了20个高效提问公式,直接提升回答质量。

一文读懂DeepSeek-V3 技术报告

2023年7月17日,DeepSeek正式成立,由幻方量化提供资金支持。 梁文锋凭借其在金融和AI领域的深厚背景,带领团队开始探索生成式AI技术。 同年11月2日,DeepSeek推出首款开源模型DeepSeek Coder,支持多种编程语言的代码生成、调试和数据分析任务,为AI领域的应用奠定了基础,直到 2024 年 12 月,DeepSeek-V3的发布引发了行业震动和社会广泛关注,在他们的最新技术报告《DeepSeek-V3技术报告》中,团队详细介绍了其最新成果——DeepSeek-V3模型。

简易指南:运用AI/ML技术检测实时欺诈行为

译者 | 核子可乐审校 | 重楼随着技术的飞速发展,欺诈检测的重要意义也日益凸显。 根据注册欺诈审查师协会(ACFE)公布的数据,全球范围内的欺诈活动给企业造成的损失高达数万亿美元,占年销售总额的近5%。 随着欺诈手段愈发老练复杂,企业也开始借助AI与机器学习(ML)等前沿技术辅助分析,探索打击欺诈的新途径。

微软新研究:过度依赖人工智能会削弱人们的批判性思维

随着生成式人工智能技术的飞速发展,越来越多的人开始将 AI 工具融入日常生活和工作流程,用以处理那些繁琐且重复的任务。这样一来,人们便能腾出更多时间去应对那些需要深度思考和智力挑战的复杂任务。然而,一项由微软研究人员与卡内基梅隆大学合作开展的新研究却揭示了一个令人担忧的现象:过度依赖人工智能可能会对人们的批判性思维产生负面影响,进而导致认知能力的退化。

新研究:ChatGPT 能耗或远低于此前预估,单次查询仅约 0.3 瓦时

此前,一个被广泛引用的数据显示,ChatGPT 回答一个问题需要消耗约 3 瓦时的电量,这一数字是谷歌搜索的 10 倍。然而,Epoch AI 的研究人员认为这一数据被高估了。通过分析 OpenAI 最新的默认模型 GPT-4o,Epoch AI 发现,ChatGPT 的平均查询能耗约为 0.3 瓦时,低于许多家用电器的能耗水平。

东南大学首席教授团队论文:不受限制的人工智能必将超越人类智能

研究团队提出了一种新型的细胞级别 AI 孪生方法,通过从人脑的物理组件(如神经元、突触等)自下而上构建 AI 系统,理论上证明了不受限制的 AI 能够以任意预期的小误差逼近人类大脑及其功能系统。

中国音乐著作权协会:著作权与 AI 之间并不是零和博弈,合作共赢才是最好出路

中国音乐著作权协会今日发布《关于生成式人工智能训练使用数据资源的著作权问题》,文中探讨了由生成式 AI 引发的著作权相关问题,并表示著作权与 AI 之间合作共赢才是最好出路。

仅 4% 职业高度依赖,但中高工资岗位受影响最大!

根据人工智能公司 Anthropic 的研究,只有大约4% 的职业在其工作中使用 AI 的比例超过75%。 这项研究探讨了其 Claude 模型的使用情况,发现大约36% 的职业在至少25% 的工作任务中纳入了 AI 的使用。 这些发现与之前的报告一致,表明很少有企业全面接受这项技术。

民警利用 AI 大模型找回 70 名失踪被拐儿童,其中 18 名童年时期无照片

据媒体“新法制报”报道,今年春节前夕,南昌铁路公安处庐山站派出所民警汪挺利用 AI 大模型,将被拐 36 年且无童年照片的刘水泉“带回”了家。

一文速通 DeepSeek 家族核心技术点:从 LLM 到 R1!

DeepSeek横空出世并迅速走红,引发了全球科技圈的强烈震动,NVIDIA股价暴跌18%,全球科技股市市值蒸发近1万亿美元。 特朗普也居然公开称赞DeepSeek的崛起具有“积极意义”,并表示这给美国敲响了“警钟”。 Anthropic一方面肯定了DeepSeek的成就,另一方面却呼吁美国政府加强对华芯片管制。

AI 烧钱大战:软银孙正义高杠杆融资,撬动 5000 亿美元“星际之门”项目

彭博社今天(2 月 11 日)发布博文,报道称软银(SoftBank)集团创始人孙正义为参与“星际之门”(Stargate)项目,将采用复杂、高杠杆的项目融资模式。