• 替代MLP的KAN,被开源项目扩展到卷积了
  • 仅靠开源数据复刻出LLaMA3指令进修效果,在线迭代RLHF全过程解决方案来了
  • 当选国内数据库顶级集会ICDE,腾讯云数据库技巧创新获权威认可
  • ICML 2024 | 大言语模型预训练新前沿:「最好适配打包」重塑文档处理标准
  • 告别3D高斯Splatting算法,带神经弥补的频谱剪枝高斯场SUNDAE开源了
  • 我是如何赢得GPT-4提示工程大赛冠军的
  • 微软让MoE长出多个头,大幅提升大师激活率
  • 西浦、利物浦大学提出:点云数据巩固首个周全综述
  • 只需百行代码,让H100提速30%,斯坦福开源全新AI加速框架
  • 字节开源大模型量化新思绪,2-bit量化模型精度齐平fp16
  • 从零开始手搓GPU,照着英伟达CUDA来,只用两个星期
  • Flash Attention稳定吗?Meta、哈佛发现其模型权重偏颇呈现数量级波动
  • 坏了,我的RTX 3090 GPU在对我唱歌!
  • 人类偏好就是尺!SPPO对齐技术让大说话模型左右互搏、自我博弈
  • 14 项任意测下来,GPT4V、Gemini等多模态大模型竟都没什么视觉感知才能?
  • ICLR 2024 Oral|用巧妙的「传递」技巧,让神经网络的训练更加高效
  • 贾扬清、林咏华、刘威等嘉宾出席 Keynote 演讲,AICon 于 5月17日落地北京,五大看点值得期待
  • 爆火后反转?「一夜干掉MLP」的KAN:其实我也是MLP
  • 让呆板准确「看懂」手物交互作为,清华大学等提出GeneOH Diffusion办法
  • CVPR 2024 | 借助神经构造光,浙大实现动向三维现象的实时收集重修
  • 瑜伽球上遛「狗」!入选英伟达十大项目之一的Eureka有了新突破
  • 小模型机能饱和、表现不佳,根源是因为Softmax?
  • CVPR 2024 Highlight | 鉴于单曝光紧缩成像,不依赖生成模型也能从单张图象中重修三维场景
  • 跨越300多年的接力:受陶哲轩启发,数学家决定用AI形式化费马大定理的证实
个人中心
今日签到
搜索