资讯列表
数智上海2023峰会 | 5G规模化应用、AI大模型能力跃升,制造业数智转型面临哪些机遇与挑战?
工业智能化对于推动制造业数字化转型、加快实现新型工业化、发展壮大实体经济、促进数字经济和实体经济的深度融合具有重要的意义。日前圆满落幕的数智上海 2023 峰会上,特别举办了一场「数智说」工业智能化论坛。中国商飞信息化副总师苏爱华,中国联通装备制造军团高级总监、中国联通集团工业互联网领军专家沈洲,中交疏浚集团技术中心副总经理戴文伯,联想智能制造行业首席架构师秦晓东,节卡机器人 CIO 杨万利进行了主题演讲。圆桌环节,上海交通大学机械与动力工程学院教授&博士生导师、上海市智能制造研发与转化功能型平台副总经理郑宇主持,
ComfyUI SVD 图片转短视频工作流分享!低配置也能用!
大家好,这里是和你们一起探索 AI 的花生~
之前为大家推荐过一些可以将图像转为动图或者短视频的 AI 工具,比如 LeiaPix Converter、Runway、Pika 等,今天再为大家推荐一种在本地免费实现图像转短视频的方式,即在 ComfyUI 中使用开源模型 Stable Video Diffusion (SVD),经测试 8G 的显存也能用,并且效果也相当不错。
相关推荐:一、Stable Video Diffusion 简介
Stable Video Diffusion(SVD)是 Stabilit
高清视频一键生成!AIGC 免费视频生成神器 MorphStudio
前言
人人都能一键生成高质量视频的时代终于来了,视频“黑马”Morph Studio 来袭,只需要打几个字描述一下你想要的画面,就能瞬间生成视频。
还有一个非常重要的一点,Morph Studio 高清画质,超长视频,完全免费!接下来让我们来试一试吧。
使用体验
目前,Morph Studio 处于 Beta 阶段,完全免费,需要在 Discord 中使用。
更多干货:一、加入频道
网站中点击加入:
也可在 Discord 中邀请加入: 、加入公共子区
目前,Morph Studio 有五个公共子区,点击左侧公共
蚂蚁集团开源新算法,可助大模型推理提速2-6倍
近日,蚂蚁集团开源了一套新算法,可帮助大模型在推理时,提速2至6倍,引起业内关注。图:新算法在不同开源大模型上的提速表现。这套新算法名为Lookahead推理加速框架,能做到效果无损,即插即用,该算法已在蚂蚁大量场景进行了落地,大幅降低了推理耗时。以Llama2-7B-chat模型与Dolly数据集为例,实测token生成速度可由48.2个/秒,升至112.9个/秒,提速2.34倍。而在蚂蚁内部的RAG(检索增强生成)数据集上,百灵大模型AntGLM 10B版本的加速比达到5.36,与此同时,显存增加和内存消耗几乎
Nature 子刊 | 化学家和机器人都可以读懂,用于机器人合成可重复性的通用化学编程语言
编辑 | X有关化学合成的文献数量快速增长;然而,实验室之间共享和评估新流程需要很长时间。在此,来自加拿大不列颠哥伦比亚大学(UBC)和英国格拉斯哥大学的研究团队,提出了一种方法,使用通用化学编程语言(χDL)在两个实验室的四种不同硬件系统上编码和执行各种化学反应的合成程序,包括还原胺化、成环、酯化、碳-碳键形成和酰胺偶联。每个反应大约有 50 行代码,所提方法使用抽象来有效地压缩化学协议。不同的机器人平台始终如一地产生预期的合成,每步产量高达 90%,从而实现更快、更安全的研究工作流程,可以通过数量增加而不是规模
AI PC热再现CES2024,行业求解落地路线
机器之能报道作者:Sia过去一年,我们见证了 ChatGPT 引爆生成式 AI。既然可以在云端花近百亿人民币创建一个万亿参数的模型,那么,如何让无数消费者使用它呢?作为全球最大的科技硬件博览会,塞进大模型的终端设备成为本届 CES 一大亮点。 一、AI PC 之热 生成式人工智能(AI)在个人电脑(PC)领域的应用成为新一轮角力之处,芯片领域竞争也在白热化。英伟达、AMD、英特尔和高通均在本次博览会上展示了其在集成 AI 技术方面的最新进展,这些技术旨在提升个人电脑的性能和用户体验,特别是在生成式 AI 上。 英伟
最接近GPT-4的国产大模型诞生了
2024 年,国产大模型的第一个重磅消息,来自智谱 AI。在 1 月 16 日举办的 2024 智谱 AI 技术开放日 Zhipu DevDay 上,智谱 AI 正式发布新一代基座大模型「GLM-4」。经历了三个月的技术迭代,GLM-4 相比上一代基座模型 GLM-3 实现了 60% 的性能全面提升,直接逼近 GPT-4。一方面,GLM-4 支持更长的上下文、更强的多模态能力;另一方面,GLM-4 支持更快的推理、更多并发,大大降低了推理成本。同时,GLM-4 也增强了智能体能力,智谱 AI 正式上线了「GLM-4
ICLR 2024接收率31%,清华LCM论文作者:讲个笑话,被拒了
你被拒了吗?ICLR 2024 国际学习表征会议已经来到了第十二届,将于今年 5 月 7 日 - 11 日在奥地利维也纳会展中心举行。在机器学习社区中,ICLR 是较为「年轻」的学术顶会,它由深度学习巨头、图灵奖获得者 Yoshua Bengio 和 Yann LeCun 牵头举办,2013 年才举办了第一届。不过 ICLR 很快获得学术研究者们的广泛认可,被认为是深度学习顶会。在 Google Scholar 的学术会议 / 杂志排名中,ICLR 目前排名第十位,要高于 NeurIPS。今日,ICLR 2024
终于,NLP顶会ACL投稿不用匿名了
再也不怕大会投稿被占坑了?对于自然语言处理领域的研究人员,最近有一条好消息。近日,计算语言学协会年会(ACL)正式宣布,该系列会议论文投稿已取消匿名期,同时允许作者在投稿期间宣传自身工作。新规定直接适用于下一个审稿周期。今年的 ACL 是第 62 届,将于 2024 年 8 月 11 日至 16 日在泰国曼谷举行。自 2022 年起,ACL 启用了滚动审稿机制(ACL Rolling Review,ARR),每月设 deadline。需要注意的是,在上一个截止日期之前提交给评审流程的论文仍受旧匿名政策的约束。大会声
Stability AI发布Stable Code 3B模型,没有GPU也能本地运行
Stable Code 3B 的性能优于类似大小的代码模型,并且与 CodeLLaMA 7B 的性能相当,尽管其大小只有 CodeLLaMA 7B 的 40%。在文生图领域大火的 Stability AI,今天宣布了其 2024 年的第一个新 AI 模型:Stable Code 3B。顾名思义,Stable Code 3B 是一个拥有 30 亿参数的模型,专注于辅助代码任务。 无需专用 GPU 即可在笔记本电脑上本地运行,同时仍可提供与 Meta 的 CodeLLaMA 7B 等大型模型具有竞争力的性能。2023
机器人领域首个开源视觉-语言操作大模型,RoboFlamingo框架激发开源VLMs更大潜能
还在苦苦寻找开源的机器人大模型?试试RoboFlamingo!近年来,大模型的研究正在加速推进,它逐渐在各类任务上展现出多模态的理解和时间空间上的推理能力。机器人的各类具身操作任务天然就对语言指令理解、场景感知和时空规划等能力有着很高的要求,这自然引申出一个问题:能不能充分利用大模型能力,将其迁移到机器人领域,直接规划底层动作序列呢?对此,ByteDance Research 基于开源的多模态语言视觉大模型 OpenFlamingo 开发了开源、易用的 RoboFlamingo 机器人操作模型,只用单机就可以训练。
Stable Diffusion ComfyUI 基础教程(七)如何使用三大微调模型:Embeddings、Lora、Hypernetwork
前言:
在我们绘图过程中我们用到了 Checkpoint 模型和 VAE 模型,但是还有另外三种可以辅助我们出图的模型没有给大家介绍,他们分别是 Embeddings(嵌入)、Lora(低秩适应模型)、Hypernetwork(超网络)这三种模型;
在开始讲解这三个模型之前我们一定要记住不止 Checkpoint(大模型)分 SD1.4、SD1.5、SDXL1.0 等基础算法型号,这三个模型同样也分,我们在使用时要选择对应基础算法型号才能正常使用。
今天我们就讲讲这三种模型分别是什么原理、有什么作用和怎么使 用。
上海人工智能实验室团队开发具有多核光纤单元旋转功能的AI驱动投影断层扫描
编辑 | 白菜叶光学断层扫描已成为一种非侵入性成像方法,可提供对亚细胞结构的三维洞察,从而能够更深入地了解细胞功能、相互作用和过程。传统的光学断层扫描方法受到有限的照明扫描范围的限制,导致分辨率各向异性和细胞结构的不完整成像。为了克服这个问题,上海人工智能实验室、德国德累斯顿工业大学(Technische Universität Dresden)以及马克斯·普朗克学会(Max Planck Society)的研究人员采用了紧凑的多核光纤细胞旋转器系统,该系统有助于对微流控芯片内的细胞进行精确的光学操纵,从而实现具有
在24项场景中优于人类医生,Google团队开发基于自博弈的诊断对话大模型
编辑 | 白菜叶医学的核心在于医患对话,熟练的病史采集为准确的诊断、有效的管理和持久的信任铺平了道路。能够进行诊断对话的人工智能(AI)系统可以提高护理的可及性、一致性和质量。然而,学习临床医生的专业知识是一个巨大的挑战。Google Research 和 Google DeepMind 的 AI 团队开发了 AMIE(Articulate Medical Intelligence Explorer),这是一种基于大型语言模型(LLM)的人工智能系统,针对诊断对话进行了优化。AMIE 使用一种新颖的基于自博弈(se
全球最长开源!元象开源大模型XVERSE-Long-256K,无条件免费商用!
元象发布全球首个上下文窗口长度256K的开源大模型XVERSE-Long-256K,支持输入25万汉字,让大模型应用进入“长文本时代”。该模型全开源,无条件免费商用,且附带手把手训练教程,让海量中小企业、研究者和开发者更早一步实现“大模型自由”。全球主流长文本大模型图谱 参数量和高质量数据量决定了大模型的计算复杂度,而长文本技术(Long Context)是大模型应用发展“杀手锏”,因技术新、研发难度高,目前多为闭源付费提供。 XVERSE-Long-256K支持超长文本输入,可用于大规模数据分析、多文档阅读理解
为什么普通人「出圈」,都在小红书?
解码小红书推荐系统:为什么在这里普通人更容易被看见?出差期间,我在酒店百无聊赖地打开了小红书。一篇看似平淡无奇的笔记吸引了我的注意——一位 ID 叫「倚着彩虹看夕阳」的用户发帖,说自己在酒店的床上看西游记时,感觉到前所未有的放松。从标题到配图,这篇发布于去年 5 月的笔记没有任何明显的爆点,但显然在小红书上引发了广泛的共鸣,收到了大量的点赞、收藏和评论。我也被吸引,陷入了#走不出的评论区。现代人的信息获取方式很大程度上受推荐系统所影响,这篇笔记在发布 8 个月后依然能进入我的视野,小红书的推荐系统功不可没。相比之下
微软Copilot大会员来了:每月20刀,人人都能用
覆盖 Office 全家桶,免费的移动版 App 也同期上线。去年 9 月,微软宣布了大模型 Copilot 能力加入 Office 和 Windows 11 的新计划。今天,该能力终于覆盖到了全体用户。1 月 15 日,微软正式发布 Copilot Pro,其每月订阅费用为 20 美元,可解锁访问 Word、Excel 和 PowerPoint 等 Office 常用办公软件中的大模型能力,同时优先访问最新的 OpenAI 模型。在其之上,你也可以基于需求构建起属于自己的 Copilot GPT。Copilot
Yann LeCun发来肯定:腾讯人像照片生成可以随便玩了
AI 帮你成为百变星君。这一次,Yann LeCun 首次跻身「百变大咖」。身穿钢铁侠的衣服、戴着酷酷的墨镜面无表情地注视着你,一身古装在故宫门前打卡留念……就连本人也出来转发并喊话,「左下角这幅文艺复兴时期的画,是我的最爱。」性感女神寡姐身穿紫色巫师服注视着远方,还可以戴着圣诞帽和你对视:身穿太空服的奥特曼看起来萌萌的,把头发染成红色也毫无违和感上述研究便是来自南开大学、腾讯等机构提出 PhotoMaker,这是一种高效的个性化文本到图像生成方法。相关论文《PhotoMaker:Customizing Reali