端到
京东联合地瓜机器人等多家企业高校,推出业内首个具身智能原子技能库架构
具身智能技术突破与应用是通向 AGI 的必经之路,目前全球科技公司正加速布局,包括特斯拉 Optimus、Agility Digit、波士顿动力 Atlas 及 Figure AI 等,今年蛇年春晚机器人“扭秧歌”也成为了人们茶余饭后的谈资。 随着大模型技术的进步,具身智能也迎来了快速的发展。 但在国内众多企业与高校推动相关技术发展的过程中,核心挑战仍在于具身操作泛化能力,即如何在有限具身数据下,使机器人适应复杂场景并实现技能高效迁移。
2/20/2025 10:09:00 AM
新闻助手
消息称微软亚洲研究院前首席研究经理谭旭加入月之暗面,研发类 GPT-4o 端到端语音模型
感谢据“晚点 Auto”昨晚报道,微软亚洲研究院前首席研究经理谭旭于 8 月加入大模型创业公司月之暗面,主要负责研发端到端语音模型。报道称,月之暗面的整个多模态研究早在去年 10 月就已开始。接近该公司人士称,目前正有 10 人左右的团队在研发视频模型,为确保产品更具差异性,对外发布计划仍在推迟。
10/23/2024 8:07:30 AM
清源
“国内首个端到端通用语音 AI 大模型”心辰 Lingo 发布,号称中文效果比 GPT-4o 更出色
西湖心辰昨日发布了心辰 Lingo 语音大模型,号称是“国内首个端到端通用语音大模型”。官方表示,针对心辰 Lingo 端到端语音大模型的能力,在多个领域和中文上进行增强,使得心辰 Lingo 的中文语音效果,相较 GPT-4o 更为出色。心辰 Lingo 于 8 月 24 日开启内测,至今已经有超千家企业用户预约测试。相比较传统 TTS,端到端语音大模型则是一种更为全面的技术,不仅可以语音识别,还集成了自然语言处理、意图识别、对话管理以及语音合成等多个环节,实现了从语音输入到语音反馈的完整交互过程。心辰 Ling
9/6/2024 6:59:42 PM
沛霖(实习)
国内首个端到端通用语音大模型——心辰Lingo开放内测预约
内容导览:国内首个端到端通用语音大模型——心辰Lingo现开放内测预约。 在技术上,心辰Lingo具备实时打断、实时指令控制、超级拟人、能说会唱等能力,拥有比 GPT-4o 更出色的中文语音效果。9月5日西湖心辰将在外滩大会上正式发布该模型,这一技术的突破或将对多个领域产生深远影响,有望引领人机交互进入一个全新的时代。登陆「心辰Lingo」语音大模型官网(),即可马上预约内测。什么是端到端语音对话模型?传统的语音交互是先将语音转成文字,再理解文字,然后生成回复文字,最后再将文字转为语音。每次交互中“语音-文本”和“
8/29/2024 2:45:00 PM
新闻助手
“国内首个能力追齐 GPT-4o 语音能力的模型”,心辰 Lingo 语音 AI 模型开放内测预约
金科汤姆猫投资的西湖心辰于今年 8 月推出心辰 Lingo 语音大模型,是国内首个端到端语音大模型,已于今天(8 月 24 日)开启内测预约。在 8 月 21 日发布的公告中,官方介绍称相比较传统 TTS,端到端语音大模型则是一种更为全面的技术,它不仅可以语音识别,还集成了自然语言处理、意图识别、对话管理以及语音合成等多个环节,实现了从语音输入到语音反馈的完整交互过程,极大地丰富了人机交互的深度和广度。AI在线援引官方新闻稿,心辰 Lingo 语音模型是国内首个能力追齐 GPT-4o 语音能力的模型,技术能力上具备
8/24/2024 9:56:44 AM
故渊
辰韬资本联合三方重磅发布《端到端自动驾驶行业研究报告》
自动驾驶技术的演进随着 AI 和大模型技术的发展进入全新阶段,“端到端自动驾驶”作为其中最重要的一项技术演进趋势近来成为自动驾驶行业关注的焦点。在端到端自动驾驶领域,无论是产业界、学术界和资本市场,里程碑事件都有发生,各大龙头企业也纷纷布局这一核心关键技术路线。2024年6月12日,辰韬资本联合南京大学上海校友会自动驾驶分会、九章智驾、宝通科技共同主办,招商银行、云道资本协办的“端到端引领自动驾驶新时代高峰论坛暨行业研究报告发布会”活动在上海成功举办。200多位产业专家、投资机构、研究机构及智能驾驶头部企业的代表共
6/12/2024 6:21:00 PM
新闻助手
2024未来汽车先行者大会丨顾维灏:AI大模型是自动驾驶实现的唯一路径
6月1日,毫末智行CEO顾维灏受邀出席2024(第二届)未来汽车先行者大会,并在现场发表主题演讲《自动驾驶3.0时代,大模型重塑汽车智能化路线》。顾维灏表示:“AI大模型是自动驾驶真正实现的唯一路径,端到端会是未来很重要的技术方向。端到端不仅仅是模型端的优化,也需要数据的供给与算力的支持。毫末DriveGPT从2022年就开始探索端到端的解决方案,一旦应用会带来非常惊艳的效果。”(毫末智行CEO顾维灏受邀出席2024未来汽车先行者大会)第二届未来汽车先行者大会以“争流”为主题,6月1日-6月2日在深圳国际会展中心(
6/1/2024 9:24:00 PM
新闻助手
- 1
资讯热榜
企业级模型推理部署工具vllm使用指南 - 部署最新deepseek-v3-0324模型
上海AI实验室开源InternVL3系列多模态大型语言模型
50组多风格提示词,全面测评Midjourney V7生图效果!
全日程揭晓!ICLR 2025论文分享会我们北京见
斯坦福2025 AI指数出炉!中美AI对决差距仅剩0.3%,DeepSeek领衔
5分钟直出46页论文!谷歌Deep Research完爆OpenAI,最强Gemini 2.5加持
击败DeepSeek-R1!豆包新推理模型仅用前者参数量1/3!还将开源两个基准,瞄准通用推理能力!
ChatGPT重大更新,能翻出所有历史对话,网友被AI聊破防了
标签云
人工智能
OpenAI
AIGC
AI
ChatGPT
DeepSeek
AI绘画
数据
机器人
谷歌
模型
大模型
Midjourney
智能
用户
学习
开源
GPT
微软
Meta
AI创作
图像
技术
论文
Stable Diffusion
马斯克
Gemini
算法
蛋白质
生成式
芯片
代码
英伟达
神经网络
腾讯
计算
研究
Sora
AI for Science
3D
AI设计
Anthropic
机器学习
GPU
开发者
场景
华为
预测
伟达
Transformer
百度
深度学习
苹果
模态
AI视频
驾驶
文本
xAI
搜索
人形机器人
大语言模型
Copilot
神器推荐
LLaMA
字节跳动
具身智能
Claude
算力
安全
应用
视频生成
科技
视觉
亚马逊
干货合集
2024
AGI
特斯拉
DeepMind
训练