• 模型越大,本能越好?苹果自返回视觉模型AIM:没错
  • 三个臭皮匠顶个诸葛亮?可能是真的,已证实混杂多个小模型机能比肩GPT3.5
  • 为什么普通人「出圈」,都在小红书?
  • 深挖RLHF潜力,复旦言语和视觉团队创新嘉奖模型优化,让大模型更对齐
  • 47年前经典影片另类重制,从宇宙到原子皆是生成
  • 能找神经网络Bug的可视化对象,Nature子刊收录
  • 挥舞起代码语料的魔杖,大模型和智能体将召唤出更强大的能量
  • FATE 2.0版本重磅发布:实现异构联邦学习系统互联互通
  • 首个无师自通、泛化运用各种家具家电的具身三维图文大模型系统
  • 告别逐一标注,一个提醒实现批量图片肢解,高效又准确
  • 模型A:幸亏有你,我才不得0分,模型B:俺也一样
  • 言语模型是如何感知时光的?「时光向量」了解一下
  • 只需1080ti,即可在遥感图象中对目标举行像素级定位!代码数据集已开源!
  • 高情商的NPC来了,刚伸出手,它就做好了要配合下一步作为的准备
  • 面向超长上下文,大语言模型如何优化架构,这篇综述一网打尽了
  • 这是GPT-4变笨的新解释
  • 告别冷启动,LoRA成为大模型「氮气加速器」,提速高达300%
  • 「花果山名场面」有了高清画质版,NTU提出视频超分框架Upscale-A-Video
  • 从模型、数据和框架三个视角出发,这里有份54页的高效大语言模型综述
  • 深度网络数据编码新突破,上交大SPARK登上计较机体系结构顶会
  • 大模型玩星际争霸能秀到什么程度?有意识,有预判,中科院和汪军团队发布
  • 清华大学提出三维重修的新办法:O²-Recon,用2D分散模型补全残缺的3D物体
  • GPT-4完全破解版:用最新官方API微调,想干啥就干啥,网友怕了
  • Llama2推理RTX3090胜过4090,延迟吞吐量占优,但被A800远远甩开
个人中心
今日签到
搜索