AI
突发:苹果AI与阿里牵手成功!曝本地AI功能已提交网信部审批!曾考虑采用DeepSeek
编辑 | 伊风终于定了? 几经波折,苹果AI在中国的落地终于有了眉目! 阿里最终与苹果牵手成功,合作开发国行的Apple Intelligence。
DeepSeek R1 搭建个人 AI 知识库
前言上一篇文章写到了部署本地deepseek,基于这篇文章,继续讲一下如何搭建自己的知识库。 可能很多人会有疑问,本地部署有什么优势呢。 其实如果不是有特别的技术研究和比较私密的数据,可以不用搭建。
8卡32B模型超越o1预览版、DeepSeek V3,普林斯顿、北大提出层次化RL推理新范式
一.引言推理大语言模型(LLM),如 OpenAI 的 o1 系列、Google 的 Gemini、DeepSeek 和 Qwen-QwQ 等,通过模拟人类推理过程,在多个专业领域已超越人类专家,并通过延长推理时间提高准确性。 推理模型的核心技术包括强化学习(Reinforcement Learning)和推理规模(Inference scaling)。 主流的大模型强化学习算法,如 DPO、PPO、GRPO 等,通常需要在完整的思维链上进行微调,需要高质量数据、精确的奖励函数、快速反馈和在线迭代、以及大量的算力。
本地部署 DeepSeek:打造你的专属 AI 推理环境,简单明了适合新手
随着 AI 大模型的爆发,DeepSeek 作为一款备受瞩目的开源大模型,吸引了众多开发者的关注。 如何在本地搭建 DeepSeek 推理环境,以便更高效地进行 AI 研究和应用开发? 本篇文章将为你详细解析本地部署 DeepSeek 的完整流程,让你轻松打造属于自己的 AI 推理环境。
微软:生成式AI可导致人类认知能力下降
AI正在掀起一场“工作革命”,根据Anthropic公司近日发布的AI经济指数报告,在软件开发(37.2%)、艺术文化创作(10.3%)等知识密集型领域,57%的交互呈现"人机协作"特征。 但是,在“AI大大增强工作效率”的同时,是否也会对人类知识工作者产生负面影响? 近日,微软与卡耐基梅隆大学的一项研究发现,生成式人工智能可导致知识工作者的认知和批判思维能力下降。
Deepseek的前世今生
DeepSeek(深度求索)引起硅谷“恐慌”,性能超越了美国的顶尖模型,且研发成本更低,使用的芯片性能也较弱。 甚至有人猜测DeepSeek(深度求索)模型对美国股市都构成了威胁。 中国AI公司证明了用有限的计算资源,足以做出顶尖水平的模型。
新基准!威斯康星大学开源Ultra-AV:统一自动驾驶纵向轨迹数据集
摘要自动驾驶车辆在交通运输领域展现出巨大潜力,而理解其纵向驾驶行为是实现安全高效自动驾驶的关键。 现有的开源AV轨迹数据集在数据精炼、可靠性和完整性方面存在不足,从而限制了有效的性能度量分析和模型开发。 本研究针对这些挑战,构建了一个(Ultra-AV),用于分析自动驾驶汽车的微观纵向驾驶行为。
AI赋能企业数字化应用,都会遇到哪些“坑”?
这两年,在AI技术的快速发展的大趋势下,推动了很多传统企业数字化转型的进程。 然而在实际落地过程中,可以看到,AI与业务的结合,往往“雷声大、雨点小”。 很多先进技术对企业的业务影响,总是“隔靴搔痒”,让业务方对智能化技术的实际价值踌躇不定!
能量驱动注意力:提升文本到图像扩散模型的语义对齐新范式
一眼概览该论文提出了一种 基于能量的跨注意力(Energy-Based Cross-Attention, EBCA) 机制,以解决文本到图像扩散模型中的 语义不对齐(semantic misalignment) 问题。 通过建模 上下文向量的后验分布,该方法能够自适应地调整语义上下文,实现更精准的文本引导图像生成,无需额外训练,并在 多概念生成、文本引导修复、图像编辑 任务上取得了优异表现。 核心问题当前的 文本到图像扩散模型(Text-to-Image Diffusion Models)(如 Stable Diffusion、Imagen)在生成高质量图像方面取得了巨大成功。
全球首个「视频教学」基准!南洋理工、CMU发布Video-MMMU
想象一下,你正在观看吴恩达老师的机器学习课程,视频讲解清晰、动画直观,你很快掌握了核心概念,并能在考试中灵活应用,人类对这个过程再熟悉不过。 那么,如果AI也能这样学习呢? 图1 Video-MMMU提出知识获取的3大认知阶段这正是Video-MMMU试图回答的核心问题:AI能否通过观看视频获取并应用知识?
DeepSeek的爆火,背后是这些启发 ...
关注AI大模型技术的朋友们,在欢度春节的这些天,一定有被国产大模型底座DeepSeek的”横空出圈"霸屏了。 国产化大模型在算力更加“节约”的情况下,研发出了近乎和OpenAI GPT-4o同等“聪明”的大模型底座,极大地激励了国人对于AI技术研发的信心,同时也给国内外同行们带来了不少“焦虑”与“反思”。 与其他主流大模型相比,正如DeepSeek的中文名“深度求索”想表达的,它在解决具体回答任务时,不仅关注“端到端”的一问一答结果,更加关注这个答案是怎么得到的。
AI已学会自我复制!复旦新研究:开源LLM克隆成功率最高90%
AI已跨越关键「红线」,实现了自我复制。 复旦大学的研究人员在一项新研究中,展示了两种开源的LLM具备自我克隆的能力。 在没有人类帮助的情况下,AI成功实现自我复制,这不仅是它超越人类的关键一步,也是「流氓AI」出现的早期信号。
Cerebras与Perplexity携手打造超高速AI搜索模型Sonar,瞄准千亿美元市场
近日,Cerebras Systems 与 Perplexity AI 宣布达成合作,共同推出一款新的超快速 AI 搜索模型 Sonar,旨在挑战传统搜索引擎的主导地位。 合作的核心在于 Sonar 模型,该模型在 Cerebras 专用的 AI 芯片上运行,速度达到每秒1200个标记,成为目前市场上最快的 AI 搜索系统之一。 Sonar 模型建立在 Meta 的 Llama3.370B 基础上,标志着一种新型 AI 优先的搜索体验,双方对其快速性能寄予厚望。
英国版权法修订遭质疑,“内定”AI 训练版权豁免
英国卫报昨日(2 月 11 日)发布博文,报道称英国就修改版权法征求公众意见,在新的版权豁免下,拟允许人工智能(AI)公司使用创意作品训练算法。
AI 让罕见病患者重获新生:从 4000 种药物中找到救命药
在对 4000 种现有药物进行筛选后,一种人工智能工具帮助发现了一种药物,成功挽救了一名特发性多中心 Castleman 病(iMCD)患者的生命。iMCD 是一种罕见疾病,其生存率极低,且治疗选择有限。
Claude团队:用400万条对话分析AI对经济的长期影响
基于400万条Claude真实对话数据,Anthropic重磅发布全新报告! 在今天,哪些职业用AI最多? 他们都用AI干什么?
推理模型新路线开源!与DeepSeek截然不同,抛弃思维链不用人类语言思考
开源推理大模型新架构来了,采用与Deepseek-R1/OpenAI o1截然不同的路线:抛弃长思维链和人类的语言,直接在连续的高维潜空间用隐藏状态推理,可自适应地花费更多计算来思考更长时间。 例如问题:Claire每天早餐都会做一个3个鸡蛋的煎蛋卷。 她在4周内会吃多少个鸡蛋?
20个很强的DeepSeek提问公式
大家好,我是汤师爷~今天直接给大家分享DeepSeek干货内容。 要获得精准的AI回答,关键在于提问方式。 这里为你整理了20个高效提问公式,直接提升回答质量。