应用
视觉Mamba来了:速度提升2.8倍,内存能省87%
Vision Mamba 不是个普通模型。号称「全面包围 Transformer」的 Mamba,推出不到两个月就有了高性能的视觉版。本周四,来自华中科技大学、地平线、智源人工智能研究院等机构的研究者提出了 Vision Mamba(Vim)。论文地址:::Vision Mamba: Efficient Visual Representation Learning with Bidirectional State Space Model效果如何呢?在 ImageNet 分类任务、COCO 对象检测任务和 ADE20
1/19/2024 11:41:00 AM
机器之心
一键实景转动画,清华系初创公司全球首发4D骨骼动画框架,还能生成个性化角色
前几日,苹果宣布首款虚拟头显设备 Vision Pro 将于 2 月 2 日正式发售,XR 设备作为下一代终端预计将迎来快速发展。未来随着虚拟显示设备的普及,数字交互将从平面走向立体,立体模型、立体动画将成为未来主流的内容形态,虚实融合下的多维沉浸式交互也将成为潮流。但从数据规模看,现阶段内容产业的数据积累仍以 2D 图像、平面视频为主,3D 模型、4D 动画等数据基础较为薄弱。其中,4D 动画是在传统 3D 模型的基础上引入时间序列,即随时间变化的 3D 模型,可以呈现出动态立体效果,在游戏动画、电影特效、虚拟现
1/19/2024 11:35:00 AM
机器之心
AIGC时代的「数字生命计划」已启动!
从碳基生命到硅基生命的剧变正在悄然降临。即使总是伴随着关于伦理、人性与法律等问题的争论,人类从来没有放弃过挣脱时空限制、实现灵魂永恒的尝试。近几年《上载新生》《万神殿》《爱死机》《西部世界》这些剧作,无不在重温着二十多年前《黑客帝国》和《楚门世界》的内核。而《流浪地球 2》的上映,更将「数字生命」的讨论推向了高潮。影片中研究员图恒宇在女儿丫丫濒死时用数字生命卡保留了她生命的数据,在超级计算机 550 w 的多次迭代后,数据形态的图丫丫拥有了自我意识,获得了「完整的一生」。《流浪地球 2》剧照,图恒宇和丫丫简而言之,
1/19/2024 11:23:00 AM
机器之心
论学手艺,波士顿动力机器人可不是他们的对手
机器之能报道编辑:陈萍、Sia波士顿动力机器人运动技能的提升并没有很大程度改善人形机器人进入日常家庭服务的能力。基于大型语言模型(LLM)的生成 AI 取得突破后,人形机器人“大脑”演化也开始狂飙突进,曾被认为过于耸人听闻且效率低下的人形机器人开始以新的方式掌握人类基本生活技能,走进我们的生活。Keppler人形机器人人类拥有灵活的双手,可以辅助我们完成复杂的任务。可惜,除了跑酷跳跃,我们没有看到波士顿动力的机器人做过任何家务,比如叠衣服或者其他需要用到灵活手指的活儿。不过,给下面这些人形机器人安上一双手后,大家干
1/18/2024 5:04:00 PM
机器之能
奥数能力金牌级:DeepMind几何推理模型登上Nature,代码开源,菲尔兹奖得主点赞
这项工作代表了 AI 在数学推理上的能力突破,是开发通用 AI 系统方面的重要里程碑。这一次,人工智能算法在数学奥林匹克竞赛(IMO)上取得了重大成绩突破。在今天发表的国际权威期刊《自然》杂志最新一期上,论文《Solving olympiad geometry without human demonstrations》向世人介绍了 AlphaGeometry,专家表示,这是人工智能朝着具有人类推理能力方向迈进的重要一步。论文链接: 也在论文发表的第一时间将代码和模型开源,GitHub:,来自 Google Deep
1/18/2024 11:56:00 AM
机器之心
新一代注意力机制Lightning Attention-2:无限序列长度、恒定算力开销、更高建模精度
Lightning Attention-2 是一种新型的线性注意力机制,让长序列的训练和推理成本与 1K 序列长度的一致。大语言模型序列长度的限制,极大地制约了其在人工智能领域的应用,比如多轮对话、长文本理解、多模态数据的处理与生成等。造成这一限制的根本原因在于当前大语言模型均采用的 Transformer 架构有着相对于序列长度的二次计算复杂度。这意味着随着序列长度的增加,需要的计算资源成几何倍数提升。如何高效地处理长序列一直是大语言模型的挑战之一。之前的方法往往集中在如何让大语言模型在推理阶段适应更长的序列。比
1/18/2024 11:39:00 AM
机器之心
参会指南|倒计时 2 天,AI 视频生成论坛即将开启!
「视频生成前沿研究与应用」机器之心 AI 技术论坛将于本周六(1月20日)正式开启。本次活动是 2024 年机器之心主办的首场线下交流活动,期待到场的朋友们都能收获满满。为了帮助大家更全面、充分地了解大会内容,丝滑参会,机器之心特别整理了一份详细的参会指南,请查收!签到指南签到时间:2024.01.20 09:00-09:25签到地点:北京市西城区设计之都大厦一层昆仑巢签到程序:参会者持活动行签到二维码扫码签到确认后,领取活动日程和参会手环。(二维码和手环是活动结束后领取奖品的必要证明,请注意留存。)午休时间:1
1/18/2024 11:34:00 AM
机器之心
数智上海 2023 峰会 | 上海云网协同高性能算力基础设施建设进展如何?产业链各方分享最新进展
云赛智联所属上海科技网络通信有限公司总经理肖晓滨,中国通信服务上海公司绿色数据中心产品基地技术总监王斌,联通(上海)产业互联网有限公司副总经理朱奕健,中科曙光上海区域技术总监韩雪兵等进行了主题演讲。圆桌环节,机器之心运营总监、副主编闻菲主持,中国通信服务上海公司副总经理、上海市算力网络协会副理事长武广,科华数据云集团副总裁欧阳江涛,UCloud 优刻得服务器中心及 AI 算力负责人丁振雷等交流了观点。智算服务供应商、运营商、云计算服务商以及行业协会代表从各自视角出发,分享了上海算力新型基础设施建设前沿进展及智算趋势
1/18/2024 11:07:00 AM
新闻助手
数智上海 2023 峰会 | 如何做好数字金融大文章?这些金融机构、科技企业以及数字供应链企业这么说
2023 年 10 月的中央金融工作会议首次系统提出了金融「五篇大文章」,其中「数字金融」占据重要篇幅。基于此,日前圆满落幕的数智上海 2023 峰会上,特别举办了「数智说」金融科技与数实融合论坛。工行科创企业金融服务中心(上海)总经理方奇,星环科技金融行业助理副总裁张晓明,中电金信研究院副院长、中国电子自主计算体系专家组成员陈书华,数库科技创始人兼总裁沈鑫,海通证券投资银行部高级副总裁朱威进行了主题演讲。圆桌环节,上海大学经济学院副教授巫景飞主持,工行科创企业金融服务中心(上海)总经理方奇,道口金科联合创始人、C
1/18/2024 10:57:00 AM
新闻助手
数智上海2023峰会 | 5G规模化应用、AI大模型能力跃升,制造业数智转型面临哪些机遇与挑战?
工业智能化对于推动制造业数字化转型、加快实现新型工业化、发展壮大实体经济、促进数字经济和实体经济的深度融合具有重要的意义。日前圆满落幕的数智上海 2023 峰会上,特别举办了一场「数智说」工业智能化论坛。中国商飞信息化副总师苏爱华,中国联通装备制造军团高级总监、中国联通集团工业互联网领军专家沈洲,中交疏浚集团技术中心副总经理戴文伯,联想智能制造行业首席架构师秦晓东,节卡机器人 CIO 杨万利进行了主题演讲。圆桌环节,上海交通大学机械与动力工程学院教授&博士生导师、上海市智能制造研发与转化功能型平台副总经理郑宇主持,
1/18/2024 10:54:00 AM
新闻助手
ComfyUI SVD 图片转短视频工作流分享!低配置也能用!
大家好,这里是和你们一起探索 AI 的花生~
之前为大家推荐过一些可以将图像转为动图或者短视频的 AI 工具,比如 LeiaPix Converter、Runway、Pika 等,今天再为大家推荐一种在本地免费实现图像转短视频的方式,即在 ComfyUI 中使用开源模型 Stable Video Diffusion (SVD),经测试 8G 的显存也能用,并且效果也相当不错。
相关推荐:一、Stable Video Diffusion 简介
Stable Video Diffusion(SVD)是 Stabilit
1/18/2024 8:25:54 AM
夏花生
高清视频一键生成!AIGC 免费视频生成神器 MorphStudio
前言
人人都能一键生成高质量视频的时代终于来了,视频“黑马”Morph Studio 来袭,只需要打几个字描述一下你想要的画面,就能瞬间生成视频。
还有一个非常重要的一点,Morph Studio 高清画质,超长视频,完全免费!接下来让我们来试一试吧。
使用体验
目前,Morph Studio 处于 Beta 阶段,完全免费,需要在 Discord 中使用。
更多干货:一、加入频道
网站中点击加入:
也可在 Discord 中邀请加入: 、加入公共子区
目前,Morph Studio 有五个公共子区,点击左侧公共
1/18/2024 6:13:51 AM
yaoyao
蚂蚁集团开源新算法,可助大模型推理提速2-6倍
近日,蚂蚁集团开源了一套新算法,可帮助大模型在推理时,提速2至6倍,引起业内关注。图:新算法在不同开源大模型上的提速表现。这套新算法名为Lookahead推理加速框架,能做到效果无损,即插即用,该算法已在蚂蚁大量场景进行了落地,大幅降低了推理耗时。以Llama2-7B-chat模型与Dolly数据集为例,实测token生成速度可由48.2个/秒,升至112.9个/秒,提速2.34倍。而在蚂蚁内部的RAG(检索增强生成)数据集上,百灵大模型AntGLM 10B版本的加速比达到5.36,与此同时,显存增加和内存消耗几乎
1/17/2024 7:41:00 PM
新闻助手
AI PC热再现CES2024,行业求解落地路线
机器之能报道作者:Sia过去一年,我们见证了 ChatGPT 引爆生成式 AI。既然可以在云端花近百亿人民币创建一个万亿参数的模型,那么,如何让无数消费者使用它呢?作为全球最大的科技硬件博览会,塞进大模型的终端设备成为本届 CES 一大亮点。 一、AI PC 之热 生成式人工智能(AI)在个人电脑(PC)领域的应用成为新一轮角力之处,芯片领域竞争也在白热化。英伟达、AMD、英特尔和高通均在本次博览会上展示了其在集成 AI 技术方面的最新进展,这些技术旨在提升个人电脑的性能和用户体验,特别是在生成式 AI 上。 英伟
1/17/2024 5:46:00 PM
机器之能
最接近GPT-4的国产大模型诞生了
2024 年,国产大模型的第一个重磅消息,来自智谱 AI。在 1 月 16 日举办的 2024 智谱 AI 技术开放日 Zhipu DevDay 上,智谱 AI 正式发布新一代基座大模型「GLM-4」。经历了三个月的技术迭代,GLM-4 相比上一代基座模型 GLM-3 实现了 60% 的性能全面提升,直接逼近 GPT-4。一方面,GLM-4 支持更长的上下文、更强的多模态能力;另一方面,GLM-4 支持更快的推理、更多并发,大大降低了推理成本。同时,GLM-4 也增强了智能体能力,智谱 AI 正式上线了「GLM-4
1/17/2024 3:02:00 PM
机器之心
ICLR 2024接收率31%,清华LCM论文作者:讲个笑话,被拒了
你被拒了吗?ICLR 2024 国际学习表征会议已经来到了第十二届,将于今年 5 月 7 日 - 11 日在奥地利维也纳会展中心举行。在机器学习社区中,ICLR 是较为「年轻」的学术顶会,它由深度学习巨头、图灵奖获得者 Yoshua Bengio 和 Yann LeCun 牵头举办,2013 年才举办了第一届。不过 ICLR 很快获得学术研究者们的广泛认可,被认为是深度学习顶会。在 Google Scholar 的学术会议 / 杂志排名中,ICLR 目前排名第十位,要高于 NeurIPS。今日,ICLR 2024
1/17/2024 2:55:00 PM
机器之心
终于,NLP顶会ACL投稿不用匿名了
再也不怕大会投稿被占坑了?对于自然语言处理领域的研究人员,最近有一条好消息。近日,计算语言学协会年会(ACL)正式宣布,该系列会议论文投稿已取消匿名期,同时允许作者在投稿期间宣传自身工作。新规定直接适用于下一个审稿周期。今年的 ACL 是第 62 届,将于 2024 年 8 月 11 日至 16 日在泰国曼谷举行。自 2022 年起,ACL 启用了滚动审稿机制(ACL Rolling Review,ARR),每月设 deadline。需要注意的是,在上一个截止日期之前提交给评审流程的论文仍受旧匿名政策的约束。大会声
1/17/2024 2:46:00 PM
机器之心
Stability AI发布Stable Code 3B模型,没有GPU也能本地运行
Stable Code 3B 的性能优于类似大小的代码模型,并且与 CodeLLaMA 7B 的性能相当,尽管其大小只有 CodeLLaMA 7B 的 40%。在文生图领域大火的 Stability AI,今天宣布了其 2024 年的第一个新 AI 模型:Stable Code 3B。顾名思义,Stable Code 3B 是一个拥有 30 亿参数的模型,专注于辅助代码任务。 无需专用 GPU 即可在笔记本电脑上本地运行,同时仍可提供与 Meta 的 CodeLLaMA 7B 等大型模型具有竞争力的性能。2023
1/17/2024 2:41:00 PM
机器之心
资讯热榜
标签云
人工智能
OpenAI
AIGC
AI
ChatGPT
DeepSeek
AI绘画
数据
机器人
谷歌
模型
大模型
Midjourney
智能
用户
学习
开源
GPT
微软
Meta
AI创作
图像
技术
论文
Stable Diffusion
马斯克
Gemini
算法
蛋白质
生成式
芯片
代码
英伟达
腾讯
神经网络
计算
研究
Sora
AI for Science
3D
Anthropic
AI设计
机器学习
GPU
开发者
场景
华为
预测
伟达
人形机器人
Transformer
百度
AI视频
苹果
深度学习
模态
xAI
字节跳动
驾驶
文本
搜索
大语言模型
Claude
Copilot
具身智能
神器推荐
LLaMA
算力
安全
应用
视频生成
视觉
科技
亚马逊
干货合集
2024
AGI
特斯拉
大型语言模型
训练