达摩院
阿里通义实验室语音团队负责人鄢志杰离职
据tech星球消息,阿里通义实验室语音团队负责人鄢志杰已于 2 月 15 日正式离职,其职级为阿里原P序列体系中的P10 级别。 鄢志杰是智能语音领域专家, 2003 年进入中科大语音实验室攻读博士,师从科大讯飞创始人王仁华教授。 2008 年获博士学位后,他在微软亚洲研究院语音组担任主管研究员至 2015 年,主要研究语音识别、语音合成等领域。
3/14/2025 3:00:41 PM
AI在线
开源的胜利!RISC-V与AI今日全面「会师」
RISC-V 正在成为 AI 原生计算架构。 DeepSeek 的爆火震撼 AI 行业后,也带动相关行业余震不断。 其中,达摩院玄铁在春节期间宣布适配 DeepSeek-R1 系列蒸馏模型,引发半导体行业高度关注,新兴的开源指令集 RISC-V 在 AI 方向展现出强劲的动力。
2/28/2025 1:21:00 PM
机器之心
阿里巴巴将于28日举办玄铁RISC-V生态大会 与DeepSeek有关
阿里巴巴集团在发布最新财报后,宣布将于2月28日举办一场重要论坛,由旗下达摩院主办,主题为“2025玄铁RISC-V生态大会”。 根据官方公布的议程,达摩院首席科学家将在会上发表题为《从Deepseek创新看RISC-V的机遇》的主题演讲,同时还将发布玄铁RISC-V系列芯片。 值得注意的是,阿里巴巴集团首席执行官吴泳铭于昨日上午宣布,公司计划在未来三年内投入超过3800亿元人民币,用于加强云计算和硬件基础设施建设,这一投入总额超过了过去十年在该领域的总和。
2/25/2025 11:09:00 AM
AI在线
达摩院开源 VideoLLaMA3:仅 7B 大小,视频理解拿下 SOTA
它就是由达摩院出品的 Video LLaMA 3,以图像为中心构建的新一代多模态视频-语言模型。
2/14/2025 1:13:31 PM
清源
AI加速优化求解,达摩院连续两年获求解器全国赛事冠军
以“AI 优化求解器”助力能源绿色转型,达摩院自研“敏迭”求解器连续获得权威赛事冠军。 1月17日消息,达摩院自主研发的“敏迭”求解器在工信部产业发展促进中心组织的第二届能源电子产业创新大赛上,再次斩获“国产求解器技术专题赛”冠军。 这是继近期入选工信部“人工智能赋能新型工业化”典型应用案例后的又一殊荣。
1/21/2025 10:12:00 AM
新闻助手
阿里巴巴达摩院发布八观气象大模型:重点指标预测效果超过传统天气预报
据官方介绍,该模型在全球气象模型基础上引入区域多源数据,时空精度最高可达 1 公里 * 1 公里 * 1 小时。实际数据显示,该模型在区域辐照度、风速、云量及气温等方面的预测精度,较传统天气预报分别提高了 40%、27%、24% 和 11.8%。
11/6/2024 9:15:36 PM
远洋
阿里提出结构保持的AI视觉算法:显著提升HDR图像转LDR图像质量
9月21日,记者在2024云栖大会上获悉,阿里巴巴达摩院计算技术实验室提出了一种基于结构保持网络的AI视觉算法,可将高动态范围(HDR)场景图像自动转换为低动态范围(LDR)图像并保持其纹理细节,在常规显示设备上的图像质量相比业界提升7%。HDR图像同时包含强光源照射下的极亮区域和阴影、逆光下的极暗区域,容易出现明亮区域过曝、或者黑暗区域纯黑的情况,必须经过宽动态技术处理才能适配常规显示设备。传统的宽动态技术由于缺失自适应的局部与全局处理方法,会损失大量信息,生成结果局部粗糙或者全局锐化。业界也在探索基于AI的宽动
9/23/2024 11:17:00 AM
新闻助手
大厂掀起视频生成「军备竞赛」,AI 真能干掉好莱坞?
AI 视频圈正杀得你死我活。前脚快手高调发布可灵,后脚 Luma 不甘示弱,推出最新视频模型 Dream Machine,紧接着 Runway 横插一脚,祭出 Gen-3 这个大杀器。在微妙的 FOMO 气氛带动下,更多玩家秉持着「累死自己,卷死同行」的宗旨,一头扎进这个赛道 ——阿里巴巴达摩院押注「寻光视频创作平台」、字节即梦 AI 探索「生成式影剧」、美图 MOKI 盯上 AI 短片创作、Haiper AI 则聚焦创意表达 ……7 月 5 日的上海,火热,像极了 AI 视频圈的焦灼。这一天,上海世博展览馆 H3
7/15/2024 11:40:00 AM
机器之心
达摩院跨入 AIGC 深水区,发布一站式 AI 视频创作平台「寻光」
年初,OpenAI 推出文本-视频生成模型 Sora,只需输入提示文本描述,或输入一张图片,Sora 就能生成类似电影大片的逼真场景视频,前所未有的新奇观感,让大众直呼「现实不存在了」。 惊叹之余,Sora 所展现出的神奇「魔法」,也让业界意识到 AI 视频生成在高清晰度、高保真度、高质量方面的巨大潜力与价值。 此后,AI 视频生成模型摇身一变成为科技圈新的宠儿,并一改之前大语言模型一家独大的格局为两者的分庭抗礼。
7/10/2024 11:06:00 AM
晓楠
达摩院发布一站式AI视频创作平台"寻光",打造全新AI工作流
今年是 AI 视频生成爆发的元年,以 Sora 为代表的算法模型和产品应用不断涌现。短短几个月内,我们目睹了几十种视频生成工具的问世,基于 AI 的视频创作方式开始流行起来。但新技术也引发更多的挑战与质疑,除了大家熟知的 “开盲盒” 现象,AI 所生成的视频内容也因可控性差、处理工作流繁琐而频频被诟病。OpenAI 曾经邀请专业视频制作团队对 Sora 进行了测试,其中来自于多伦多的 Shy Kids 团队,利用 Sora 制作了一个气球人主题的短片,把创意和 AI 技术进行了完美的结合,让人印象深刻。整个短片其实
7/8/2024 4:06:00 PM
机器之心
阿里巴巴与世卫组织达成战略合作,全球推广达摩院 AI 癌症筛查技术
感谢昨日(5 月 31 日),联合国在瑞士日内瓦召开 AI for Good 全球峰会,阿里巴巴与世卫组织(WHO)数字健康合作中心达成战略合作,向全球推广达摩院 AI 癌症筛查技术。阿里巴巴表示,在国内,达摩院 AI 癌症早筛技术已经为超过 600 万人次提供服务,覆盖胰腺癌、食管癌、肠癌、胃癌、肝肿瘤等病症的筛查,国际上已经与安提瓜和巴布达卫生部达成战略合作。在此次签约后,世卫组织数字健康国际合作中心将从渠道、市场、落地、技术、标准等方面提供支持。全球更多医疗资源不均衡的发展中国家和地区将共享这项前沿成果。据阿
6/1/2024 2:35:14 PM
浩渺
达摩院2025届春招启动,开放20余类实习岗位
3月21日消息,阿里达摩院已开启春季2025届实习生招聘,面向海内外2025届应届毕业生开放20余类实习岗位。记者注意到,达摩院招聘官网放出的岗位信息,既有视频多模态理解、多语言大模型、医疗AI、运筹优化等热门的人工智能方向,更有芯片软件、芯片设计/验证/DFT、计算体系结构、编辑器与计算体系结构开发等集成电路方向。部分岗位信息显示,达摩院的研究方向注重不同领域的融合探索,如“设计探索针对新型芯片架构的编译工具链,探索流行深度学习算法在新一代计算架构芯片上的优化算法”,要求候选人有集成电路设计或深度学习算法等研究经
3/21/2024 5:53:00 PM
新闻助手
阿里达摩院发布遥感AI大模型,让AI进一步下沉到田间地头
10月20日,阿里达摩院发布业内首个遥感AI大模型,一个模型即可识别农田、农作物、建筑等地表万物,让AI进一步下沉到田间地头,大幅提升灾害防治、自然资源管理、农业估产等遥感应用的分析效率,该模型已在AI Earth地球科学云平台开放使用。遥感技术在城市运营、耕地保护、应急救灾等国计民生中的应用甚广,遥感AI则可以大幅提升既有数据的利用深度,输出更精细化、更准确的分析结果,如结合卫星照片与历史气象情况,“算”出某一块农田里作物的长势状况,让种地不再被动,而是更主动地“看天吃饭”。以往,由于遥感卫星的影像数据规模巨大、
10/20/2023 3:13:00 PM
新闻助手
使用魔搭开发自己的语音AI:从入门到精通
语音AI是最早从实验室走向应用的AI技术,其发展史就是不断创新、解锁应用的历史,从1995年 Dragon Dictate的桌面孤立词语音识别,到2011年苹果的手机语音助手SIRI,再到当下百花齐放的各种智能语音应用。由于技术的快速进步,以及各大云计算厂商以API形式提供的语音AI能力,目前开发者已能便捷使用语音AI去搭建应用。但API也存在局限性,不少开发者希望获得更多、更底层的把控力,希望对API背后AI模型有更深入的了解;不只是开发应用,还可以开发模型;不只是调用API接口,还可以通过对模型的训练或微调(f
12/1/2022 3:26:00 PM
机器之心
达摩院发布AI遥感分析云平台,助力提升地球科学研究效率
3月3日,达摩院发布AI Earth地球科学云平台,平台集成了PB级开源卫星遥感数据、十余种遥感AI算法、云端高性能计算和存储资源,助力研究者开展农业灾害分析、气候变化分析、水体水质分析等科研工作。卫星遥感影像是人类对地观测的重要信息来源,但获取、处理以及分析应用卫星遥感数据的链路较长、成本较高。研究人员需要向卫星数据运营机构申请获取数据或者下载行业公开数据,在本地计算机存储配置后才能进行数据分析。而分析环节对机器的计算和存储资源要求较高,普通计算机无法满足大规模影像数据分析的需求。另外,现有分析方法自动化程度低、
3/3/2022 4:34:00 PM
新闻助手
- 1
资讯热榜
上海AI实验室开源InternVL3系列多模态大型语言模型
Haisnap横空出世,小白用户也能轻松打造AI应用
「交交」媲美GPT-4o!上海交大推出口语对话情感大模型,首个纯学术界自研!
本地部署DeepSeek+DiFy平台构建智能体应用
kimi开源视觉语言模型 Kimi-VL 与 Kimi-VL-Thinking,多项基准超越 GPT-4o
韩国初创公司 RLWRLD 获 1480 万美元融资,致力于机器人基础模型开发
击败DeepSeek-R1!豆包新推理模型仅用前者参数量1/3!还将开源两个基准,瞄准通用推理能力!
谷歌 Gemini AI 新功能 Circle Screen 曝光:圈选截屏特定区域,实现精准搜索
标签云
人工智能
OpenAI
AIGC
AI
ChatGPT
DeepSeek
AI绘画
数据
机器人
谷歌
模型
大模型
Midjourney
智能
用户
学习
开源
GPT
微软
Meta
AI创作
图像
技术
论文
Stable Diffusion
马斯克
Gemini
算法
蛋白质
生成式
芯片
代码
英伟达
神经网络
腾讯
计算
研究
Sora
AI for Science
3D
Anthropic
AI设计
机器学习
GPU
开发者
场景
华为
预测
伟达
Transformer
百度
苹果
深度学习
AI视频
模态
人形机器人
驾驶
xAI
文本
搜索
字节跳动
大语言模型
Copilot
Claude
具身智能
神器推荐
LLaMA
算力
安全
应用
视频生成
科技
视觉
亚马逊
干货合集
2024
AGI
特斯拉
DeepMind
训练