3D

CVPR 2022 | 精准高效估计多人3D姿态,美图&北航联合提出分布感知式单阶段模型

近日,计算机视觉顶会CVPR 2022公布了会议录取结果,美图影像研究院(MT Lab)与北京航空航天大学可乐实验室(CoLab)联合发表的论文被接收。该论文突破性地提出分布感知式单阶段模型,用于解决极具挑战性的多人3D人体姿态估计问题。该方法通过一次网络前向推理同时获取3D空间中人体位置信息以及相对应的关键点信息,从而简化了预测流程,提高了效率。此外,该方法有效地学习了人体关键点的真实分布,进而提升了基于回归框架的精度。多人3D人体姿态估计是当前的一个热点研究课题,也具有广泛的应用潜力。在计算机视觉中,基于单张R

专访生数科技唐家渝:清华系团队拿到近亿融资,用Transformer来做多模态大模型

随着GPT4的出现,多模态大模型的发展方向逐渐成为共识。近日,一支由清华人工智能研究院副院长朱军教授带领的新团队悄悄完成了近亿级天使轮融资。

2023苹果学者名单公布,AI领域11位华人:清华游凯超等人入选

在今年评选出的 22 位苹果学者之中,华人占据了一半。

Lidar 3D传感器点云数据与2D图像数据的融合标注

2D&3D融合以自动驾驶场景为例,自动驾驶汽车需要使用传感器来识别车辆周围的物理环境,用来捕获2D视觉数据,同时在车辆顶部安装雷达,用以捕捉精确目标定位的3D位置数据。激光雷达生成的点云数据可用于测量物体的形状和轮廓,估算周围物体的位置和速度,但点云数据缺少了RGB图像数据中对物体纹理和颜色等信息的提取,无法精确地将对象分类为汽车、行人、障碍物、信号灯等。所以需要将包括丰富的语义信息2D视觉图像和可以提供精确的目标定位3D点云数据进行融合,使自动驾驶系统能够精确地了解周围环境,准确做出判断,让自动驾驶功能得以广泛应

一句话生成3D模型:AI扩散模型的突破,让建模师慌了

英伟达进入 AI 生成模型领域的研究,直接比别人多一个次元:一句描述生成 3D 模型。

3D传感器芯片技术全球领先,灵明光子完成数亿元C轮融资

新一代全球领先的3D传感器芯片服务商灵明光子完成数亿元C轮融资,领投方为美团龙珠,老股东昆仲资本和高榕资本继续加注,光源资本担任独家财务顾问。融资完成后,公司将加速推进产品量产,并继续在先进领域投入研发,保持技术领先性。灵明光子致力于用国际领先的单光子探测器(SPAD)技术,为手机、激光雷达、机器人、AR设备等提供自主研发的高性能dToF深度传感器芯片。自2018年成立以来,灵明光子已迅速完成多轮融资,并引入小米、OPPO、欧菲光等产业资本,显示出市场对于灵明光子dToF芯片研发能力和应用前景的看好。dToF(di

国产工业软件弯道超车迎曙光,首款云原生CAD取得重大突破

《道德经》有云,道生一,一生二,二生三 ,三生万物。“三”往往引向无穷之数。三维家耕耘8年的科技实力即将迎来全面丰收,由此,“三体计划”横空出世。“三体计划”既包含三维家结盟三个世界顶尖技术伙伴的合作成果、在三个前沿学科的不懈探索、以及在三大科技盛会上的实力展现,也代表三维家坚持对先进技术的探索,用技术为产业开拓无限想象空间。“三体计划”最终导向三大目标:降维打击、打破边界、重塑视界。10月10日首款云原生CAD的发布开启了“三体计划”的第一篇章。2021年10月9日-10日,“智能制造和智能化管理”交流会议暨安徽

第一!科大讯飞再度刷新Cityscapes世界纪录

近日,科大讯飞凭借在道路目标检测领域多年的技术探索,刷新了Cityscapes 3D目标检测任务的全球最好成绩,得到检测分数(DS)42.9,取得了该项评测的第一名。此次也是科大讯飞继2017年、2018年参与测评之后,再一次刷新Cityscapes的世界纪录。此次评测,科大讯飞借鉴了已在城市交通出行场景下应用的Anchor-Free车辆检测技术,将2D目标检测技术升级至3D,并结合3D到2D重投影的特殊先验信息进行算法迁移。通过结合语义、上下文信息、位置先验信息以及目标形状先验信息等,提取精确的3D目标检测框,构

跳过人脸检测和关键点定位,Facebook等提出实时3D人脸姿态估计新方法

来自 Facebook AI 和美国圣母大学的研究者提出了一种 6 自由度的实时 3D 人脸姿态估计技术,可以不依赖人脸检测和人脸关键点定位独立运行。