视觉

计算机视觉项目实战：提升简历，精进技能
在计算机视觉领域，实践是检验理论、提升技能的试金石。无论是初学者还是希望进一步提升自己的专业人士，通过参与实际项目都是至关重要的。本文将引导您探索一系列计算机视觉项目，这些项目按照难度分类，旨在帮助您构建并展示您的专业技能。
理论
- 972
- 0
AGI12月13日
多榜单SOTA！SplatAD：首个实现Lidar & 视觉重建大一统框架，仿真闭环再下一城~
写在前面&笔者的个人理解在实际部署之前，大规模测试对于确保自动驾驶汽车 (SDV) 等自主机器人的安全至关重要。从收集的日志中生成数字孪生的数据驱动方法提供了一种可扩展的方式来构建多样化、逼真的测试仿真环境。与成本高昂、耗时且受物理约束限制的实际测试不同，模拟可以快速、低成本地探索多种场景，有助于优化自动驾驶车辆的安全性、舒适性和效率。
理论
- 975
- 0
自动驾驶之心12月10日
极智嘉发布全球首款搭载英特尔视觉导航模块的纯视觉机器人方案，在设备内完成所有深度计算
极智嘉（Geek ）昨日（11 月 4 日）宣布，携手英特尔发布全球首款搭载英特尔视觉导航模块的纯视觉机器人方案。 ▲ 纯视觉机器人在仓储场景的实际应用AI在线获悉，极智嘉成立于 2015 年，公司总部位于北京。极智嘉纯视觉机器人方案包含 M600 和 MP1000R 两款产品，将在 11 月 5~8 日首次亮相 2024 CeMAT 亚洲物流展极智嘉展台。
应用
- 13
- 0
沛霖（实习）11月5日
视觉定位新SOTA！华人团队开源革新框架SegVG，边界框转为分割信号 | ECCV 2024
视觉定位（Visual Grounding）旨在基于自由形式的自然语言文本表达定位图像中的目标物体。随着多模态推理系统的普及，如视觉问答和图像描述，视觉定位的重要性愈加凸显。已有的研究大致可以分为三类：两阶段方法、单阶段方法和基于Transformer的方法。
理论
- 969
- 0
新智元11月5日
AI 让手机任务自动“跑”起来！我国高校最新研究，简化移动设备操作
AI 解放碳基生物双手，甚至能让你的手机自己玩自己！你没听错 —— 这其实就是移动任务自动化。在 AI 飞速发展下，这逐渐成为一个新兴的热门研究领域。
应用
- 16
- 0
清源10月31日
一张显卡“看懂”一部电影：智源联合高校开源 Video-XL，打破长视频理解极限
长视频理解是多模态大模型的核心能力之一，也是迈向通用人工智能（AGI）的关键一步。然而，现有的多模态大模型在处理 10 分钟以上的超长视频时，仍然面临性能差和效率低的双重挑战。对此，智源研究院联合上海交通大学、中国人民大学、北京大学和北京邮电大学等多所高校，推出了小时级的超长视频理解大模型 Video-XL。
应用
- 6
- 0
汪淼10月28日
端侧最强开源 AI 模型 Llama 3.2 登场：可在手机运行，从 1B 纯文本到 90B 多模态，挑战 OpenAI 4o mini
Meta 公司昨日（9 月 25 日）发布博文，正式推出了 Llama 3.2 AI 模型，其特点是开放和可定制，开发者可以根据其需求定制实现边缘人工智能和视觉革命。Llama 3.2 提供了多模态视觉和轻量级模型，代表了 Meta 在大型语言模型（LLMs）方面的最新进展，在各种使用案例中提供了更强大的功能和更广泛的适用性。其中包括适合边缘和移动设备的中小型视觉 LLMs （11B 和 90B）…
应用
- 13
- 0
故渊9月26日
MAIA 新系统亮相：洞悉 AI 模型内在机制，审查其安全性
麻省理工学院计算机科学与人工智能实验室的研究人员开发了一种名为“MAIA”的多模式自动化可解释性代理系统，该系统可以使用视觉语言模型来自动执行各种神经网络可解释性任务。麻省理工学院（MIT）计算机科学与人工智能实验室（CSAIL）最新研发了名为 MAIA 系统，可以使用视觉语言模型来自动执行各种神经网络可解释性任务。MAIA 的全称是 Multimodal Automated Interpreta…
应用
- 13
- 0
故渊7月25日
成立仅四个月，“AI 教母”李飞飞的 World Labs 估值突破十亿美元
被誉为“AI 教母”的知名计算机科学家李飞飞 ciq 创立了一家名为 World Labs 的初创企业。据《金融时报》报道，这家公司成立仅四个月，估值便已突破十亿美元。据路透社五月报道，World Labs 的目标是赋予 AI 类似人类处理视觉数据的能力，从而实现更高级的推理，目前仍处于探索阶段。据AI在线了解，李飞飞因其对计算机视觉的贡献而闻名，计算机视觉是 AI 的一个分支，致力于帮助机器理解…
应用
- 7
- 0
远洋7月18日
2024智源大会议程公开丨生成模型
2024年6月14日-15日，第6届北京智源大会将以线下与线上结合的形式召开，线下会场设在中关村国家自主创新示范区会议中心。2024智源大会再次以全球视野，汇聚年度杰出工作研讨者，交流新思想，探讨新思路，引领新前沿。目前已正式开放报名渠道。北京智源大会倒计时：11 天生成模型论坛丨6月15日下午生成式建模是人工智能的基础范式之一，是迈向通用人工智能的重要一环。随着生成式建模方法的快速发展和模型规…
应用
- 8
- 0
新闻助手6月4日
李飞飞揭秘创业方向“空间智能”：视觉化为洞察，看见成为明白，明白导致举措
斯坦福李飞飞创业后，首次揭秘新概念“空间智能”。这不仅是她的创业方向，也是指引她的“北极星”，被她认为是“解决人工智能难题的关键拼图”。视觉化为洞察；看见成为明白；明白导致举措。李飞飞最新 15 分钟 TED 演讲完整公开，从数亿年前性命退化的起源开始，到人类如何不满足于自然赋予而发展人工智能，到下一步如何构建空间智能。而 9 年前，正是在同一个舞台上，李飞飞向天下介绍了刚诞生不久的 ImageN…
AI
- 43
- 0
清源5月16日
颜水成挂帅，昆仑万维2050全球钻研院联合NUS、NTU发布Vitron，奠定通用视觉多模态大模型终极形态
近日，由颜水成教授带队，昆仑万维2050全球钻研院、新加坡国立大学、新加坡南洋理工大学团队联合发布并开源了Vitron通用像素级视觉多模态大谈话模型。这是一款重磅的通用视觉多模态大模型，支援从视觉懂得到视觉生成、从低层次到高层次的一系列视觉义务，解决了困扰大谈话模型产业已久的图象/视频模型割裂问题，提供了一个全面同一静态图象与动态视频内容的懂得、生成、分割、编辑等义务的像素级通用视觉多模态大模型，…
应用
- 5
- 0
新闻助手4月26日
李飞飞主讲，斯坦福2024 CS231n开课，依旧座无虚席
「这是自 Karpathy 和我 2015 年启动这门课程以来的第 9 个年头，这是人工智能和计算机视觉令人难以置信的十年！」知名 AI 科学家李飞飞的计算机视觉「神课」CS231n，又一次开课了。总共 600 多位门生报名，第一堂课的现场座无虚席：从 2015 年到如今，CS231n 已经走到九个年头，也成为了一代计算机视觉专业门生心中的「必修课」：虽然课程代码不变，但可以猜到，2024 年的课…
AI
- 3
- 0
机器之心4月7日
教授何恺明在MIT的第一堂课
700 座的大教室，相比去年增加一倍容量，仍然座无虚席：这就是麻省理工学院（MIT）计算机视觉课《Advances in Computer Vision》6.8300 在 2024 新学期的盛况。今年是四位教授，每人负责一部分课程：课程信息：，能选上这课的学生太幸运了，每节都是计算机视觉顶会 CVPR Oral 的体验。对于很多人来说，其中最为期待的自然是新晋教授何恺明的课。MIT 电气工程与计算…
AI
- 90
- 0
机器之心3月11日
人工智能顶会AAAI 2024放榜！联汇科技赵天成博士团队两篇论文入选
近日，第38届国内顶级人工智能学术会议AAAI（Association for the Advancement of Artificial Intelligence）正式发布了2024年会议的录用通知，联汇科技赵天成博士团队两篇论文入选。AAAI 是由国内人工智能促进协会主办的年会，是人工智能领域中历史最悠久、涵盖内容最广泛的国内顶级学术会议之一，也是中国计算机学会（CCF）推荐的 A 类国内学术…
应用
- 17
- 0
新闻助手23年12月12日
视觉提醒新突破，IDEA研究院宣布T-Rex模型，可在图上直接选取“Prompt”
视觉提醒的新突破。
AI
- 8
- 0
机器之心23年11月23日
锐思智芯完成数亿元Pre-B轮融资，重点投入量产交付
近日，新一代混合视觉传感器芯片公司锐思智芯宣布完成数亿元Pre-B轮融资。国投创业、元禾辰坤联合领投，遐想创投、清科创投、谷雨嘉禾、同歌创投、中科先进产业基金、深圳天使母基金、讯飞创投、追远创投等老股东持续跟投。创始人邓坚表示，本轮资金主要用于企业产物量产、加速新产物研发及新范畴开拓等。锐思智芯是一家新型混合视觉传感范畴的芯片研发及整体方案提供商，中心技巧为其创始的Hybrid Vision混合视…
应用
- 18
- 0
新闻助手23年11月21日
IDC发布中国计算机视觉解决方案厂商评估，联汇科技作为主要厂商上榜
近日，国际数据公司IDC公布了《IDC MarketScape：中国计算机视觉解决方案厂商评估，2023》报告显示，2022 年，中国AI赋能的计算机视觉解决方案商场规模达123.0亿元人民币。联汇科技凭借出色的本领措施（Capabilities），包括技巧产物、服务项目与客户需要满足等本领，以及关键战略（Strategies）中的优势，成为中国计算机视觉行业领先的主要厂商（Major Playe…
应用
- 5
- 0
新闻助手23年10月27日
当前的人工智能比二年级学生聪明吗？SMART-101挑战赛现在开始了！ VLAR@ICCV 2023
使人工智能领域的真正进步和创新！
AI
- 3
- 0
机器之心23年7月17日
美图印象节宣布7款印象生产力对象，推出懂美学的视觉大模型
6月19日，美图公司举办以“AI时代的印象生产力对象”为主题的第二届印象节，现场宣布7款新品：AI视觉创作对象WHEE；AI口播视频对象开拍；桌面端AI视频编辑对象WinkStudio；主打AI贸易计划的美图计划室2.0；AI数字人生成对象DreamAvatar；美图AI帮忙RoboNeo；美图视觉大模型MiracleVision。全面提供从生活场景到生产力场景印象效劳的同时，美图公布了最新的V…
AI
- 11
- 0
美图影像研究院23年6月25日
火了一整年的多模态进修，在工业界的落地和实践进展到底怎么样了？
在小红书，看见多模态进修的无限可能。
AI
- 5
- 0
机器之心22年11月23日
ECCV 2022 | 赵天成博士OmLab团队斩获ODinW开放域标的检测双料冠军等多项荣誉并受邀进行主题报告
日前，浙江大学滨江研究院Om人工智能研究中心主任、联汇科技首席科学家赵天成博士团队 OmLab 在国际顶会ECCV 2022 ODinW 挑战赛中获得 Full-Shot（全量数据进修）赛道与Few-Shot（小样本数据进修）赛道双料冠军、在 Zero-Shot 赛道获得第四排名的佳绩。基于全新标的检测框架 OmDet 的先进性和立异价值，赵天成博士受邀发表主题报告演讲。ECCV（European…
AI
- 56
- 0
新闻助手22年10月25日
华为诺亚调研200多篇文献，视觉Transformer综述入选TPAMI 2022
华为诺亚方舟实验室联合北大和悉大整理了业界第一篇视觉Transformer综述。
AI
- 7
- 0
机器之心22年2月23日
姚班校友、斯坦福助理老师吴佳俊翻译，视觉较量争论经典《Vision》中文版面世
这本书曾深刻地影响了一代脑、认知、较量争论机视觉范畴的学者。
AI
- 40
- 0
机器之心22年1月18日