理论
未来教室的变革:大语言模型LLM会取代老师吗?揭秘教育新纪元
大语言模型(LLM)的发展是近年来人工智能领域的重要突破,其背后是深度学习、自然语言处理等技术的快速进步。 从早期的简单问答系统到现在能够理解和生成复杂文本的智能模型,大语言模型已经广泛应用于各个领域,包括客服机器人、智能搜索引擎、自动化写作等。 随着技术的进步,人们开始探讨这样一个问题:大语言模型是否将在未来取代老师的角色?
2/7/2025 12:54:57 PM
tune
突发!o3-mini思维链公开,却被曝光全是「作假」,奥特曼现身解释网友炸锅
OpenAI,真的被DeepSeek逼急了! 活久见,就在刚刚,OpenAI把o3-mini的「思维链」公开了。 比如问「怎么今天不是星期五啊😅」?
2/7/2025 11:20:50 AM
新智元
DeepSeek开源Janus-Pro-7B:多模态AI模型性能超越DALL-E 3 和 Stable Diffusion 3!
中国人工智能公司 DeepSeek 的 R1“推理”人工智能已经引起了广泛关注,位居应用商店排行榜首位并改变了股市。 随后DeepSeek又宣布开源新一代多模态模型Janus-Pro-7B,该模型在图像生成、视觉问答等任务中全面超越 OpenAI 的 DALL-E 3 和 Stable Diffusion 3,并以“理解-生成双路径”架构和极简部署方案引发AI社区轰动。 性能表现:小模型吊打行业巨头Janus-Pro-7B虽仅有70亿参数(约为GPT-4的1/25),却在关键测试中碾压对手:文生图质量:在GenEval测试中以80%准确率击败DALL-E 3(67%)和Stable Diffusion 3(74%)复杂指令理解:在DPG-Bench测试中达84.19%准确率,能精准生成如“山脚下有蓝色湖泊的雪山”等复杂场景多模态问答:视觉问答准确率超越GPT-4V,MMBench测试得分79.2分接近专业分析模型技术突破:像“双面神”分工协作传统模型让同一套视觉编码器既理解图片又生成图片,如同让厨师同时设计菜单和炒菜。
2/7/2025 11:00:00 AM
AIGC Studio
DeepSeek开源多模态模型Janus-Pro的ComfyUI使用教程,文中附模型和工作流下载
今天给大家介绍DeepSeek发布的Janus-Pro模型的ComfyUI实践教程,包含ComfyUI安装,模型下载,工作流下载等,欢迎大家一起交流学习,也欢迎添加公众号小助手加入读者交流群,一起探索AIGC好玩的应用。 Janus Pro 是 DeepSeek 于 2025年1月27日开源的多模态模型,同时具有图像理解和生成的能力。
2/7/2025 10:21:42 AM
AIGC Studio
轨迹预测新基准!清华开源Ultra-AV:统一自动驾驶纵向轨迹数据集
摘要自动驾驶车辆在交通运输领域展现出巨大潜力,而理解其纵向驾驶行为是实现安全高效自动驾驶的关键。 现有的开源AV轨迹数据集在数据精炼、可靠性和完整性方面存在不足,从而限制了有效的性能度量分析和模型开发。 本研究针对这些挑战,构建了一个(Ultra-AV),用于分析自动驾驶汽车的微观纵向驾驶行为。
2/7/2025 10:17:55 AM
Hang Zhou等
OpenAI联创Schulman闪电跳槽!从Anthropic转投Murati新公司
跑去隔壁Anthropic的OpenAI联创John Schulman,又又又跳槽了。 《财富》爆料,Schulman新的去向,是加入原OpenAI首席技术官Mira Murati的新创业公司。 此时距离他转投Anthropic,仅仅不到半年。
2/7/2025 10:13:16 AM
量子位
零样本 | MusicMagus:基于扩散模型的零样本文本驱动音乐编辑新方案
一眼概览MusicMagus 提出了一种基于扩散模型的零样本文本到音乐编辑方法,可在不额外训练的情况下,通过文本编辑修改音乐的风格、音色和乐器,同时保持其他属性不变。 实验表明,该方法在风格转换和音色转换方面优于现有零样本方法,并在某些任务上超越监督学习方法。 核心问题当前的文本到音乐生成模型已取得长足进展,但音乐创作往往需要反复修改,而如何在保持音乐整体结构的同时,精准编辑特定属性仍然是个挑战。
2/7/2025 10:10:05 AM
萍哥学AI
OpenAI突然公开o3思维链!网友:让我们谢谢DeepSeek
刚刚,OpenAI把o3-mini的推理思维链公开了。 从今日起,免费用户和付费用户都可以看到模型的思维过程,OpenAI终于Open一回。 图片评论区网友纷纷:让我们谢谢DeepSeek。
2/7/2025 9:05:36 AM
817样本激发7倍推理性能:上交大「少即是多」定律挑战RL Scaling范式
在追求人工智能极限的道路上,"更大即更强" 似乎已成为共识。 特别是在数学推理这一被视为 AI 终极挑战的领域,业界普遍认为需要海量数据和复杂的强化学习才能获得突破。 然而,来自上海交通大学的最新研究却给出了一个令人震惊的答案:仅需 817 条精心设计的样本,就能让模型在数学竞赛级别的题目上超越当前许多最先进模型。
2/7/2025 9:00:00 AM
机器之心
基于 Ray 的融合计算引擎在生命科学领域的应用
一、从 2024 年诺贝尔化学奖谈起2024 年诺贝尔化学奖得主都不是来自化学专业。 其中 David Baker 从事多年蛋白质设计研究,包括一些模型和传统生物信息工具,类似于现在的生成式场景。 另外两位得主来自谷歌旗下的 DeepMind 团队,该团队主要专注于蛋白质生成领域,其另一重要成就是之前在围棋比赛中战胜人类的 AlphaGo。
2/7/2025 8:50:47 AM
饶星
基于Langbase Memory Agents将任意LLM转为 可对话式AI文档助手
译者 | 刘涛审校 | 重楼在 2025 年当下,大语言模型(LLM)依旧无法获取用户的私有数据。 当用户向其询问某些与个人相关的问题时,大语言模型要么凭借推测进行回应,要么给出错误的解答。 这体现了大语言模型存在的固有局限性——它们仅基于公开信息进行训练,无法获取用户的私有上下文信息。
2/7/2025 8:44:46 AM
刘涛
从某个角度看,Deepseek之于AI与当年Oracle之于信息化的意义是相同的
春节前这段时间里最热的莫过于DEEPSEEK,我因为家中老人住院,春节前后都泡在医院里。 无聊的时候只能看看头条消磨时光。 最近这段时间,我的头条推送几乎被DS占据了。
2/7/2025 8:32:56 AM
白鳝
DeepSeek正在杀死程序员?不,它杀死的是一整个时代
——从“人肉编码”到“AI工程化”,中国软件行业的范式革命已至导语:当技术革命的枪声响起2023年GitHub统计显示,中国开发者平均每天写300行代码,其中270行是重复性业务逻辑。 而在DeepSeek等AI编码工具冲击下,这种“人肉堆代码”的模式正在崩塌——某跨国IT服务商已裁撤40%初级Java岗位,同时开出百万年薪急招AI工程师。 这不是简单的工具替代,而是一场关乎行业生死存亡的认知革命。
2/7/2025 8:30:37 AM
斯巴达人
充分利用人工智能代理实现DevOps与云服务无缝集成
译者 | 李睿审校 | 重楼人工智能(AI)的快速发展为企业优化业务运营和提高创造力创造了新的机会。 这一领域的一个关键发展是智能代理,这些代理在重塑DevOps和云交付过程中变得至关重要。 它们专为达成特定任务与目标而设计,这改变了系统在当今动态技术生态中的工作方式。
2/7/2025 8:00:00 AM
李睿
对多模式AI应用程序进行压力测试是红队的新领域
人类的交流是多模态的。 我们用许多不同的方式接收信息,这使我们的大脑能够从不同的角度看世界,并将这些不同的信息“模式”转化为现实的综合图景。 如今,人工智能 (AI) 至少在一定程度上也能做到这一点。
2/7/2025 12:14:58 AM
不到140块!李飞飞团队超低成本复刻DeepSeek R1推理!16张H100只训练了26分钟,与R1训练方法不同!
编辑 | 伊风出品 | 51CTO技术栈(微信号:blog51cto)太魔鬼了! 上周李飞飞团队发了篇新论文,再次降低了复刻o1能力的成本。 低到什么程度呢?
2/6/2025 6:37:46 PM
伊风
百度智能云上架DeepSeek R1/V3,上线首日超1.5万家客户调用
2月3日百度智能云宣布 DeepSeek-R1和 DeepSeek-V3模型上架百度智能云千帆平台,并宣布提供行业领先的超低推理价格。 模型上线首日,已有超1.5万家客户通过千帆平台进行模型调用。 为降低模型使用成本,百度智能云在推理引擎性能优化技术、推理服务工程架构创新以及推理服务全链路安全保障上的进行深度融合。
2/6/2025 5:00:40 PM
DeepSeek日活用户数突破2000万,增长势头远超ChatGPT
国内AI产品榜的最新统计数据显示,DeepSeek应用在上线仅20天后,其日活跃用户数(DAU)迅速突破2000万大关,具体数字高达2215万。 这一成绩不仅彰显了DeepSeek强大的用户吸引力,也进一步证明了AI技术在当今社会的广泛应用和巨大潜力。 用户增长迅猛,全球影响力显著提升日活用户数:截至2025年2月4日,DeepSeek的日活跃用户数已突破2000万,达到2215万。
2/6/2025 4:20:41 PM
极客AI
资讯热榜
标签云
人工智能
OpenAI
AIGC
AI
ChatGPT
DeepSeek
AI绘画
数据
机器人
谷歌
模型
大模型
Midjourney
智能
用户
学习
开源
GPT
微软
Meta
AI创作
图像
技术
论文
Stable Diffusion
马斯克
Gemini
算法
蛋白质
生成式
芯片
代码
英伟达
腾讯
神经网络
计算
研究
Sora
AI for Science
3D
Anthropic
AI设计
机器学习
GPU
开发者
场景
华为
预测
伟达
Transformer
百度
苹果
人形机器人
深度学习
AI视频
模态
xAI
驾驶
字节跳动
文本
搜索
大语言模型
Claude
Copilot
具身智能
神器推荐
LLaMA
算力
安全
应用
视频生成
科技
视觉
亚马逊
干货合集
2024
AGI
特斯拉
训练
大型语言模型