CVPR2024

CVPR 2024 | 打破黑白边界,融合美学与实用性的二维码生成技术来了

图表 1第一行:对于同一个二维码,我们可以提供不同美化风格的支持。第二行:放大图像的细节,可以看到我们的算法能得到细节丰富且自然的美学二维码。在数字世界与物理世界无缝连接的今天,二维码(QR codes)已经成为了连接这两个领域的重要桥梁。这种二维编码方式广泛应用于各类场景中,从广告到支付,再到信息传递,几乎无处不在。然而,尽管二维码在功能上表现出色,但它的外观却相对单调,通常以黑白方块为主,难以与现代视觉美学相契合。随着用户和行业需求的不断变化,越来越多的人希望二维码不仅能够高效传递信息,还能具有视觉上的吸引力。

CVPR 2024 | 字节提出新一代数据集COCONut,比COCO粒度分割更密集

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected][email protected]。随着人工智能的发展,语言模型和生成模型获得了大量的成功并且在设计模型的过程中,模型的参数量也越来越大。对于细粒度理解任务,模型参数量也同样在增加。然而目前现有的数据集存在规模和精度的矛盾

还得是抖音,字节推出竖屏视频理解数据集,入选CVPR2024

短视频在当下社交媒体逐渐成为主导的视频格式。传统视频处理技术和研究一般都专注于横屏视频的理解和解析,而竖屏视频因其拍摄手法和内容重点不同,展示出与横屏视频数据不同的特性。针对这一不同,字节跳动技术团队发布了专注于竖屏视频理解的数据集,提出了多个针对竖屏视频处理的技术点以及一个初始方案。这项研究对准确的竖屏视频理解和基础技术架构有较为重要的意义,论文已入选 CVPR2024。视频 demo 展示、数据特性演示以及竖屏视频类别分类,请见 :,对视频内容的分类、特征提取,以及推荐等有着重要的作用。竖屏视频是目前社交媒体平
  • 1