• 规模小、效率高:DeepMind推出多模态解决方案Mirasol 3B
  • 单个A100生成3D图象只需30秒,这是Adobe让文本、图象都动起来的新格式
  • GPT-4+物理引擎加持分散模型,生成视频传神、连贯、合理
  • 「GPT-4只是在收缩数据」,马毅团队造出白盒Transformer,可解释的大模型要来了吗?
  • 比「让我们一步一步思考」这句咒语还管用,提醒工程正在被改进
  • 人类考92分的题,GPT-4只能考15分:尝试一升级,大模型全都现原形了
  • 小模型如何举行上下文进修?字节跳动 & 华东师大联合提出自进化文本辨别器
  • Meta对Transformer架构下手了:新注意力体制更懂推理
  • 能总结履历、持续退化,上交把智能体优化参数的成本打下来了
  • PyTorch团队重写「分割一切」模型,比原始实现快8倍
  • 用深度催眠引导LLM「逃狱」,香港浸会大学初探可信大语言模型
  • 奖学金18万/年,香港科技大学(广州)数据迷信与分解方向招收全奖博士生
  • GPT-4V在主动驾驭上应用前景如何?面向真实场景的全面测评来了
  • googleBard「破防」,用自然语言破解,提醒注入引起数据泄漏风险
  • 真正实现一步文生图,googleUFOGen极速采样,生成高质量图像
  • 用AI大模型「改造」QQ浏览器搜刮,腾讯独家揭秘
  • 13B模型全方位碾压GPT-4?这背后有什么猫腻
  • 玩转围棋、国际象棋、扑克,DeepMind推出通用进修算法SoG
  • GPT、Llama等大模型存在「恶化咒骂」,这个bug该如何缓解?
  • 解决LLaMA、BERT等部署难题:首个4-bit浮点量化LLM来了
  • 哼两句就能变歌曲,还有国宝歌手帮你演绎,音乐 Dall·E 2 时刻来了
  • 及时文生图速度提升5-10倍,清华LCM/LCM-LoRA爆火,浏览超百万、下载超20万
  • 微软用GPT-4V解读视频,看懂电影还能讲给盲人听,1小时不是问题
  • Agent4Rec来了!大模型智能体构成引荐零碎摹拟器,摹拟实在用户交互举动
个人中心
今日签到
搜索