应用
无问芯穹夏立雪:目标将大模型算力成本压缩四个数量级,为算力市场带来增量
算力不足仍然是制约通用人工智能发展的重要因素。GPU Utils 今年 8 月的一份数据显示,全球目前 H100 等效算力的供给缺口达到 43 万张。在解决算力不足的问题上,除了抢购和囤积英伟达,更多的方案正在浮出水面。清华系创业公司无问芯穹,是这个赛道上的一个答题者。不久前,机器之心介绍了来自无问芯穹(Infinigence AI)、清华大学和上海交通大学的联合团队所提出的一种新方法 FlashDecoding 。这项工作不仅能将 GPU 推理提速 2-4 倍,还能同时支持 NVIDIA 和 AMD 的 GPU
12/25/2023 3:30:00 PM
机器之心
自己发基准自己第一,Anyscale行为惹社区吐槽
前一天发布 LLMPerf 排行榜,宣称要推动大型语言模型推理领域的发展,鼓励创新与超越。第二天就收获 AI 社区的大量吐槽,原因是排行榜的「基准甚至没有得到很好的校准」。这是 Anyscale 这家初创公司正在经历的事情。Anyscale 是一家专注分布式计算领域的美国初创公司,虽然创立仅三年时间,但却收获了不少的关注。首先就是 Anyscale 旗下开源项目 Ray 带来的光环。Ray 是一个开源的分布式计算框架,可以将 AI/ML 和 Python 的 workload 从单机拓展至多台计算机上,从而提高 w
12/25/2023 3:25:00 PM
机器之心
无限新衣服零元购,阿里Outfit Anyone实现真人百变换装
不实际试穿,就能尝试各种服饰,虚拟试衣技术让「QQ秀」升级成了真人版,为时尚行业打开了新世界的大门。然而,现有的虚拟试衣方法在逼真性和细节上的一致性方面还存在挑战。虽然扩散模型在创造高品质和真实感图像方面表现出众,但在虚拟试衣等特定场景中,它们在维持控制力和一致性方面还有待提高。Outfit Anyone 利用了一种创新的双流条件扩散模型,有效地解决了这些问题,能够精确地处理服装的变形效果,实现更加逼真的试穿体验。Outfit Anyone 最大的特点是其极强的适应性和广泛的应用范围,不仅能调整以适应不同的姿势和体
12/25/2023 3:20:00 PM
机器之心
智能澎湃,大有可为——机器之心2023年度榜单揭晓
人工智能发展史上有几个重要的年份:比如 1956、2012…… 如今又多了个 2023 。这一年,ChatGPT 引爆的「百模大战」在国内外科技领域打响,没有一家公司敢在这样一个充满变革机遇的时间窗口松懈。与此同时,基于大模型打造应用的创业者也迎来了新的机遇,ChatGPT、Midjourney、Pika Lab等现象级应用已经足以让他们感受到大模型尚未完全爆发的潜力,也让他们感觉自己身处各种新的现象级应用爆发的前夕。在无数科研人员、从业者的努力下,2023 年中国人工智能领域已经诞生了一些新的成果,这些人的努力值
12/25/2023 2:55:00 PM
机器之心
OpenAI计划新一轮融资,估值超1000亿美元
OpenAI 将成为仅次于字节、SpaceX 的全球第三大初创公司。大语言模型技术领先的 OpenAI,马不停蹄又要融资了。本周五据彭博社报道,OpenAI 正在开始讨论讨论筹集新一轮融资,估值将达到超过 1000 亿美元。这笔交易将为 OpenAI 这个 ChatGPT 提出者的融资历程再添上重要一笔。有匿名知情人士表示,可能参与本轮融资的投资者们已在参与初步讨论。其表示,本轮融资的条款、估值和时间安排等细节尚未最终确定,且仍可能继续发生变化。根据 CBInsights 的数据,如果该轮融资按照计划进行,将使 O
12/25/2023 2:50:00 PM
机器之心
量子计算凛冬将至,LeCun:现实冷酷,炒作太多
距离技术成熟永远「还差五年」?「量子计算,寒冬将至了?」本周五,AI 先驱 Yann LeCun 的一番言论引发了人们的讨论。这位 AI 领域的著名学者表示,量子计算正在进入一个艰难时刻。与此同时,很多科技领域专家认为,目前的量子计算技术进步很多趋向于炒作,距离实际应用仍然很遥远。对此,很多人同样持有悲观态度。让我们看看 IEEE 的这篇文章是怎么说的:量子计算机革命可能比许多人想象的更遥远、更有限。一直以来,量子计算机都被期许为一种能够解决广泛问题的强大工具,可应用的方向包括金融建模、优化物流和加速机器学习。量子
12/25/2023 2:44:00 PM
机器之心
阿里mPLUG-Owl新升级,鱼与熊掌兼得,模态协同实现MLLM新SOTA
OpenAI GPT-4V 和 Google Gemini 都展现了非常强的多模态理解能力,推动了多模态大模型(MLLM)快速发展,MLLM 成为了现在业界最热的研究方向。MLLM 在多种视觉-语言开放任务中取得了出色的指令跟随能力。尽管以往多模态学习的研究表明不同模态之间能够相互协同和促进,但是现有的 MLLM 的研究主要关注提升多模态任务的能力,如何平衡模态协作的收益与模态干扰的影响仍然是一个亟待解决的重要问题。论文地址:: 体验地址: 体验地址:,阿里多模态大模型 mPLUG-Owl 迎来大升级,通过模态协
12/25/2023 2:33:00 PM
李亚洲
Midjourney V6迎来大升级:网友惊呼生成效果太逼真
和 DALL-E 3 等图像生成模型相比,谁的效果会更好呢?你真的会被 Midjourney V6 alpha 版本测试的生成效果震撼到。输入提示:「电影镜头,一个 50 岁留着灰胡子、穿着棕色夹克、戴着红色围巾的黑人男子站在一个 20 岁左右的白人女子旁边,她穿着深蓝和乳白色千鸟格外套,戴着黑色针织帽。午夜,他们走在街道中央,被路灯柔和的橙色光芒照亮。」图源:,v 5.2 的生成效果肉眼可见的差距,人物脸部细节刻画的不是很细致,衣服纹理、褶皱表现的很少:Midjourney V6 生成雨中的马斯克:图源::图源:
12/25/2023 12:04:00 PM
机器之心
击败扩散模型,清华朱军团队基于薛定谔桥的新语音合成系统来了
近日,由清华大学计算机系朱军教授课题组发布的基于薛定谔桥的语音合成系统 [1],凭借其 「数据到数据」的生成范式,在样本质量和采样速度两方面,均击败了扩散模型的 「噪声到数据」范式。论文链接:: 代码实现: 2021 年起,扩散模型(diffusion models)开始成为文本到语音合成(text-to-speech, TTS)领域的核心生成方法之一,如华为诺亚方舟实验室提出的 Grad-TTS [2]、浙江大学提出的 DiffSinger [3] 等方法均实现了较高的生成质量。此后,又有众多研究工作有效提升了扩
12/25/2023 11:54:00 AM
机器之心
大模型竟然能玩手机了,还能用软件修图:「AppAgent」会成为2024年的新趋势吗?
这就是2024年的新趋势吗?近日,一项名为 AppAgent 的创新技术引起了广泛关注。简单来说,AppAgent 的智能代理能力可以用于操作任何 App,它在 50 个复杂手机任务上展示了强大的能力。AppAgent 幕后团队来自腾讯,相关技术论文也已经公布。论文地址::,这项技术通过引入一种基于大型语言模型(LLMs)的多模态智能代理(Agent)框架,赋予了智能体操作智能手机应用的能力。与传统的智能助手如 Siri 不同,AppAgent 不依赖于系统后端访问,而是通过模拟人类的点击和滑动等操作,直接与手机应
12/25/2023 11:34:00 AM
机器之心
2024年怎么过?这是Sam Altman希望你早些知道的事
机器之能报道编辑:吴昕这个家伙正在塑造世界,如果他学到了什么,我们应该注意。「日子很长,但几十年很短。」Sam Altman 九年前写下这篇箴言体博客时,不知是否预感过自己会成为那个领导 AI 革命的人。2023 年行将结束之际,他时隔多年重拾箴言体,发布了一篇题为《那些我希望有人告诉我的(事)》的博客,将过去一年所学凝结在了十七条短句中。(下文黑体部分,对黑体部分的解读来自编辑。)过去一年激动又疯狂。Altman 领导的 OpenAI 推出了一个世人真正喜欢并从中受益的 AI 工具,世界也开始认真对待 AI 。从
12/22/2023 6:35:00 PM
机器之能
Nature|从1.07亿个分子中发现新抗菌化合物,MIT团队开发用于抗生素发现的DL方法
编辑 | 萝卜皮当前,迫切需要发现新结构类别的抗生素来解决持续存在的抗生素耐药性危机。深度学习方法有助于探索化学空间;这些通常使用黑盒模型并且不提供化学见解。麻省理工学院(MIT)的研究人员开发了一种用于抗生素发现的深度学习方法,并表明它可以从大型化学库中识别出潜在的抗生素。研究人员用该方法从药物再利用中心(包含约 6,000 个分子)中发现了 halicin 和 abaucin,并从 ZINC15 库中的约 1.07 亿个分子中发现了新的抗菌化合物。图示:Yann LeCun 转发了这项研究的 Twitter 报
12/22/2023 3:20:00 PM
ScienceAI
医渡科技发布自研医疗大模型,多个医疗任务场景评测表现超越GPT
2023年12月21日,由医渡科技主办、华为技术有限公司(以下简称“华为”)协办的“2023医疗智能大会”在京举行。大会以“智绘医疗,创见未来”为主题,深入探讨了人工智能等新技术为医疗行业带来的机遇与变革。会上,医渡科技自主研发的医疗垂域大模型正式发布,这是国内首个面向医疗垂直领域多场景的专业大语言模型,医渡科技医疗场景解决方案也随之迎来全面升级。与此同时,医渡科技与华为在会上签署深化合作协议,并联合推出智慧医疗解决方案,加速推动医疗健康行业的智能化转型。医渡科技CEO、联合创始人徐济铭表示,与以往AI浪潮不同,此
12/21/2023 7:59:00 PM
新闻助手
成立仅半年,Mistral估值暴涨七倍,开源重塑AI战局
机器之能报道编辑:Sia烧钱的闭源,逆袭的开源。当 LLaMA 被泄露出去、任何人都可以下载时,开源的命运齿轮已经开始转动,并在 Mistral AI 最新一轮融资中达到高潮。七个月前,来自 Meta 和谷歌的研究人员在巴黎成立了 Mistral AI 。短短六个月,这家拥有22名员工的初创企业在最近 A 轮融资中筹集了 4.15 亿美元,估值从 2.6 亿美元狂飙到 20 亿美元,涨了七倍多。同时,公司也低调发布了大模型 Mixtral 8X7B。Mixtral 8x7B 采用了一种独特的架构方法——专家混合 (
12/21/2023 6:37:00 PM
机器之能
“数智说”工业智能化论坛成功举办
为了进一步汇聚起推进新型工业化的强大合力,推动数字蝶变行动落地见效,12 月 16 日,数智上海 2023 峰会“数智说”工业智能化论坛在上海市杨浦区举办,邀请高校知名专家学者、高端制造业企业和科技企业代表,共享工业数智化丰富经验成果与未来趋势洞见。活动由上海市城市数字化转型工作领导小组办公室、上海市经济和信息化委员会、上海市杨浦区人民政府指导,上海市杨浦区科学技术委员会、上海市城市数字化转型应用促进中心主办,中国联合网络通信有限公司上海市分公司联合主办,机器之心(上海)科技有限公司承办。上海市经济和信息化委员会软
12/21/2023 5:49:00 PM
新闻助手
”数智说”算力新基建论坛圆满举办
作为助推数字经济发展的“重要底座”,我国算力基础设施建设近年来正不断跑出建设“加速度”,为千行百业的数字化转型提供着坚实的算力支撑。12 月 16 日,数智上海 2023 峰会“数智说”算力新基建论坛在上海杨浦顺利举办。相关政府主管部门领导,智算服务供应商、运营商、云计算服务商、AI 芯片企业代表以及上海市算力网络协会代表齐聚一堂,共论产业发展新趋势、新格局。本次活动由上海市城市数字化转型工作领导小组办公室、上海市经济和信息化委员会、上海市杨浦区人民政府指导,上海市杨浦区科学技术委员会、上海市城市数字化转型应用促进
12/21/2023 5:45:00 PM
新闻助手
开创全新通用3D大模型,VAST将3D生成带入「秒级」时代
生成式 AI 在 3D 领域在很长一段时间内都在等待自己的「ChatGPT」时刻。传统 3D 建模涉及游戏、影视、建筑等多个行业,普遍依赖专业人员手动操作,生产周期短则几天,多则以月为单位,单个 3D 模型的创建成本至少需要几千元。生成式 AI 技术在 2D 图像生成领域的成功经验,让人们看到了 AI 在变革 3D 建模这件事上的潜力。一个万亿美元级别的赛道似乎从此开启,但当前市面上的 3D 生成类的 AI 技术仍然存在各种不足,大家都在期待出现一个让自己眼前一亮的产品。2021 年 1 月初,OpenAI 发布
12/21/2023 3:03:00 PM
机器之心
资讯热榜
标签云
人工智能
OpenAI
AIGC
AI
ChatGPT
DeepSeek
AI绘画
数据
机器人
谷歌
模型
大模型
Midjourney
智能
用户
学习
开源
GPT
微软
Meta
AI创作
图像
技术
论文
Stable Diffusion
马斯克
Gemini
算法
蛋白质
生成式
芯片
代码
英伟达
腾讯
神经网络
计算
研究
Sora
AI for Science
3D
Anthropic
AI设计
机器学习
GPU
开发者
场景
华为
预测
伟达
人形机器人
Transformer
百度
AI视频
苹果
深度学习
模态
字节跳动
xAI
驾驶
文本
搜索
大语言模型
Claude
Copilot
具身智能
神器推荐
LLaMA
算力
安全
应用
视频生成
视觉
科技
亚马逊
干货合集
2024
AGI
特斯拉
训练
大型语言模型