vivo 自研蓝心大模型升级“自研 AI 多模态大模型”
在在举行的 vivo 影象新宏图暨 X 系列新品发布会上,vivo 宣布自研蓝心大模型升级「自研 AI 多模态大模型」,多模态技能让大模型从最原始的视觉、声音、空间等方面接触、感知、理解世界,让大模型更全面、更聪明、更强大。此外,vivo 瞥见 | 多模态大模型技能使用 ——「vivo 瞥见蓝心升级版」,帮助视障用户更好地“瞥见”世界。去年 11 月 1 日,在 2023 vivo 开发者大会上,…- 4
- 0
从基因组到蛋白质组连续翻译,南开大学开发通用跨模态数据分解步骤
编辑 | 萝卜皮近期,科学家在单个细胞内同时分解多组学模态的进展,使得细胞异质性和分子层次结构的钻研成为可能。然而,技术限制导致多模态数据的高噪声和高昂的成本。在这里,南开大学的钻研团队提出了 scButterfly,一种基于双对齐变分自动编码器和数据巩固方案的多功能单细胞跨模态翻译步骤。通过对多个数据集的全面实验,钻研职员证明 scButterfly 在保留细胞异质性、同时翻译各种背景的数据集和…- 3
- 0
参数量不到10亿的OctopusV3,如何媲美GPT-4V和GPT-4?
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected];[email protected]。- 5
- 0
颜水成挂帅,昆仑万维2050全球钻研院联合NUS、NTU发布Vitron,奠定通用视觉多模态大模型终极形态
近日,由颜水成教授带队,昆仑万维2050全球钻研院、新加坡国立大学、新加坡南洋理工大学团队联合发布并开源了Vitron通用像素级视觉多模态大谈话模型。这是一款重磅的通用视觉多模态大模型,支援从视觉懂得到视觉生成、从低层次到高层次的一系列视觉义务,解决了困扰大谈话模型产业已久的图象/视频模型割裂问题,提供了一个全面同一静态图象与动态视频内容的懂得、生成、分割、编辑等义务的像素级通用视觉多模态大模型,…- 4
- 0
鉴于Transformer的高效单阶段短时RGB-T单方向追踪格式
引言如图 1所示,现有的三阶段 RGB-T 单方向追踪收集通常采用两个独立的特色提取分支,分别负责提取两个模态的特色。然而,相互独立的特色提取分支会导致两个模态在特色提取阶段缺乏有效的信息交互。因此,一旦收集完成离线训练,其仅能从每个模态图象中提取固定的特色,无法根据实际的模态状态动态调整,以提取更具针对性的动态特色。这一局限性制约了收集对多样的方向双模态外表,以及模态外表间动态对应关系的适应能力…- 3
- 0
开启智能座舱AI时代,蔚来NOMI GPT端云多模态大模型正式上线
4月12日,蔚来宣布NOMI GPT正式开启推送。此次推送的更新是基于崭新技术架构,为NOMI量身打造NOMI GPT端云多模态大模型。NOMI GPT包含自研多模态感知、自研认知中枢、情绪引擎、多专家Agent,实行蔚来产品、服务、社区的全域贯通,提供更高效、愉悦的AI服务。升级NOMI GPT功能后,用户可以体会到大模型百科、无限趣聊、魔法氛围、趣玩表情、用车问答、AI场景生成在内的多项崭新交…- 11
- 0
中山大学团队“梗王”大模型,靠讲笑话登上 CVPR
谁能想到,只是让大模型讲笑话,论文竟入选了顶会 CVPR(国际计算机视觉与模式识别会议)!没开玩笑,这还真真儿的是一项正儿八经的研讨。例如看下面这张图,如果让你根据它来讲个笑话或梗,你会想到什么?现在的大模型看完后会说:脑子短路。再看一眼 蜘蛛侠 的海报,大模型会配一句“刚擦的玻璃不能弄脏”。李云龙 、 奥本海默 也被玩得飞起:导师读了我的论文之后……真男人不回头看爆炸。还有酱紫的:不得不说,大模…- 3
- 0
「清华系」视频生成公司生数科技宣布完成新一轮数亿元融资
近日,北京生数科技有限公司(以下简称“生数科技”)宣布完成新一轮数亿元融资,由启明创投领投,达泰资本、鸿福厚德、智谱AI、老股东BV百度风投和卓源亚洲继续跟投。本轮融资将主要用于多模态基础大模型的迭代研发、应用产品革新及市场拓展。本轮由华兴资本担任独家财务顾问。生数科技成立于2023年3月,是环球领先的多模态大模型公司,致力于图象、3D、视频等原生多模态大模型的研发。生数科技核心团队来自清华大学人…- 6
- 0
可多模态数据集成、插补和跨模态生成,中科院&树兰医院&北师大团队开发带有掩码模块的深度生成框架
编辑 | 红菜苔随着单细胞技术的发展,许多细胞特性可以被测量。此外,多组学分析技术可以同时联合测量单个细胞中的两个或多个特征。为了快速处理积累的各种数据,需要多模态数据集成的计算方法。树兰医院、中国科学院和北京师范大学的合作团队提出了 inClust ,一个用于多组学分析的深度生成框架。它建立在之前针对转录组数据所开发的 inClust 的基础上,并增加了两个专为多模式数据处理设计的掩码模块:编码…- 4
- 0
IDC发布中国计算机视觉解决方案厂商评估,联汇科技作为主要厂商上榜
近日,国际数据公司IDC公布了《IDC MarketScape:中国计算机视觉解决方案厂商评估,2023》报告显示,2022 年,中国AI赋能的计算机视觉解决方案商场规模达123.0亿元人民币。联汇科技凭借出色的本领措施(Capabilities),包括技巧产物、服务项目与客户需要满足等本领,以及关键战略(Strategies)中的优势,成为中国计算机视觉行业领先的主要厂商(Major Playe…- 5
- 0
178页!GPT-4V(ision)调理领域首个全面案例测评:离临床应用与实际决策尚有距离
上海交大&上海AI Lab发布178页GPT-4V调理案例测评,首次全面揭秘GPT-4V调理领域视觉性能。- 4
- 0
锦秋基金独家投资,生数科技完成数千万元天使+轮融资
近日,北京生数科技有限公司(简称“生数科技”)完成了数千万元天使 轮融资,本轮融资由锦秋基金独家投资。此轮资金将主要用于算法研发、产物开发和团队扩充。值得一提的是,今年六月生数科技刚获得蚂蚁集团、BV百度风投、卓源资本的近亿元天使轮融资,不到两个月的时间内已经连续获得两轮投资。生数科技是寰球领先的生成式人工智能基础设施及使用提供商,致力于打造可控多模态通用大模型,团队于今年3月发布9.5亿参数开源…- 5
- 0
专访生数科技唐家渝:清华系团队拿到近亿融资,用Transformer来做多模态大模型
随着GPT4的出现,多模态大模型的发展方向逐渐成为共识。近日,一支由清华人工智能研究院副院长朱军教授带领的新团队悄悄完成了近亿级天使轮融资。- 5
- 0
最大数据集、多义务覆盖,阿里达摩院发布首个大规模华文多模态评测基准MUGE
在计算机视觉范围甚至人工智能的发展历程中,ImageNet对于整个范围的技术进步具有至关重要的作用。随着多模态学习成为当下的新热点,为了通过大规模数据集建设和全方位模型能力评测推动多模态范围的发展,阿里达摩院推出MUGE(全称Multimodal Understanding and Generation Evaluation Benchmark)评测基准。该基准是由达摩院联合浙江大学、阿里云天池平…- 11
- 0
一个模型处理多种模态和使命,商汤等提出Uni-Perceiver,迈向通用预训练感知模型
来自商汤、西安交通大学等机构的研究者提出了一种通用感知架构 Uni-Perceiver ,该方法可以更好地将预训练中学到的知识迁移到卑鄙使命中。- 5
- 0
模态
❯
个人中心
今日签到
搜索
扫码打开当前页
返回顶部
幸运之星正在降临...
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠劵
- ¥优惠劵使用时效:无法使用使用时效:
之前
使用时效:永久有效优惠劵ID:×
没有优惠劵可用!