paper

ECCV 2024 Workshop自动驾驶难例场景多模态理解与视频生成征稿与挑战赛火热启动！

Workshop主页：。近年来，多模态大模型（如GPT-4V）展示了其在多模态感知与理解方面前所未有的进步。然而，利用MLLMs来应对自动驾驶中复杂场景，特别是罕见但关键的难例场景，仍然是一个未解的挑战难题。本次Workshop旨在促进多模态大模型感知与理解、先进的AIGC技术在自动驾驶系统中的应用、端到端自动驾驶等方面的创新研究。Workshop征稿本次论文征稿关注自动驾驶场景多模态感知与理解、自动驾驶场景图像与视频生成、端到端自动驾驶、下一代工业级自动驾驶解决方案等主题，包括但不限于：Corner case m

6/3/2024 9:19:00 AM

新闻助手

万字长文：哥大CV博士总结五年读博生涯，即将入职新加坡国立大学任助理教授

在这篇文章中，哥伦比亚大学博士Mike Shou讲述了自己的五年读博经历，包括如何确定研究方向、如何确定单篇论文的选题、如何做报告、如何做出职业选择等，希望可以给正在读博或准备读博的你提供一些启发。作者 Mike 是 Facebook AI 研究科学家，他将加入新加坡国立大学 NUS，任助理教授、独立博导。他于哥伦比亚大学取得博士学位，方向为视频理解和生成。他实验室正招收 2021 Fall PhD、访问博士生等。实验室网站：. 写在前面刚上大学时，听过不少学长学姐分享会；申请博士时，读了不少留学申请总结。都收获

2/9/2021 4:10:00 PM

机器之心

资讯热榜

纳米AI发布MCP万能工具箱，简化AI工具集成与调用即梦3.0海外版发布，电影级视觉与精准英文排版引领AI创作新高度 Mac也能跑Qwen3，一文看懂本地部署qwen 3配置要求 AI视频资讯早读！7个产品更新+8个案例精选 Manus开源平替！Kortix-AI正式发布开源通用AI智能体平台Suna Ollama 支持全线的 Qwen 3 模型 Qwen3正式发布，优化编码与代理能力，强化MCP支持引领AI新潮流 DeepWiki：AI驱动的GitHub代码库百科全书正式亮相

标签云

人工智能 OpenAI AIGC AI ChatGPT AI绘画 DeepSeek 数据机器人模型谷歌大模型 Midjourney 智能开源用户学习 GPT 微软 Meta 图像 AI创作技术论文 Stable Diffusion Gemini 马斯克算法蛋白质芯片生成式代码英伟达腾讯神经网络研究计算 Anthropic Sora 3D AI for Science AI设计机器学习 GPU 开发者 AI视频场景华为预测人形机器人百度苹果伟达 Transformer 深度学习 xAI 模态字节跳动 Claude 大语言模型搜索具身智能驾驶神器推荐文本 Copilot LLaMA 算力安全视觉视频生成干货合集应用训练大型语言模型科技亚马逊特斯拉 2024 AGI