• Llama2推理RTX3090胜过4090,延迟吞吐量占优,但被A800远远甩开
  • 给Transformer降降秩,移除一定层90%以上组件LLM机能不减
  • 大模型微调非得依赖人类数据吗?DeepMind:用带反馈的自训练更好
  • 应战Transformer的Mamba是什么来头?作家博士论文理清SSM进化路径
  • Softmax注意力与线性注意力的优雅融合,Agent Attention推动注意力新升级
  • NeurIPS23|视觉 「读脑术」:从大脑流动中重修你眼中的世界
  • CPU推理提升4到5倍,苹果用闪存加速大模型推理,Siri 2.0要来了?
  • 14秒就能重建视频,还能变换脚色,Meta让视频合成提速44倍
  • arXiv大升级,论文网页版本间接看
  • AAAI 2024 | 尝试时规模顺应的鲁棒性得以保证,TRIBE在多真实场景下达到SOTA
  • 4090成A100平替?token生成速度只比A100低18%,上交大推理引擎火了
  • googleGemini技能报告出炉,作者多达900余人
  • 阿里云首创PilotScope新技巧,为AI4DB使用提速
  • NeurIPS 2023 Spotlight | 腾讯AI Lab绝悟新突破:在星际2灵活计谋应对职业选手
  • 用生物脑体制启发中断进修,让智能系统适者生存,清华朱军等团队钻研登Nature子刊封面
  • NeurIPS 2023|有效提高视频编写同等性,美图&国科大提出鉴于文生图模型新方法EI²
  • 走在GPT 4.5前面?3D、视频直接扔进对话框,大模型掌握跨模态推理
  • 源代码is all you need!7B代码小模型同尺寸无敌,性能媲美ChatGPT和谷歌Gemini
  • 陶哲轩青睐的注明助手Lean,用上了大模型
  • GPT-2能监视GPT-4,Ilya带头OpenAI超等对齐首篇论文来了:AI对齐AI取得实证结果
  • DeepMind论文登上Nature:困扰数学家几十年的难题,大模型发觉全新解
  • 大模型推理效率无损提升3倍,滑铁卢大学、北京大学等机构发布EAGLE
  • 将Transformer用于集中模型,AI 生成视频达到照片级真实感
  • 当GPT-4V充当机器人大脑,可能你都没AI会方案
个人中心
今日签到
搜索