资讯列表
过于可爱!手把手教你用SD做人气超高的毛绒玩具
大家好,这里是和你们一起探索 AI 绘画的花生~
最近网上看到一些用 Stable Diffusion 生成的毛绒玩具,非常可爱。我也尝试了一下,效果很不错,还能体验一下自己做周边设计师的快乐。这种效果做起来其实并不难,基本思路还是 controlnet 控制外形 lora 生成特殊材质。那今天就为大家分享 3 种不同材质的毛绒玩具的生成方法,打开你的 Stable Diffusion WebUI 我们马上开始 ~
相关推荐:一、真实毛绒 lora
这是最近非常火的一个毛绒玩具 Lora,可以生成宜家或 jel
保姆级教程!AI视频生成神器 Pika Labs 使用指南
今天为大家带来最近爆火的 AI 生成式视频神器 Pika labs 的使用教程。
关于Pika 的介绍:背景简介
Pika 是什么?用生成式 AI 技术能够生成和编辑 3D 动画、动漫、卡通和电影等各种风格的视频。也是 Runway Gen-2 的最强竞品。
那么,今天就带来 Pika Labs 的完整使用指南(目前社区为试用版,最多可以生成三秒),大家可以先行体验,后续排队拿到 1.0 体验资格后会继续为大家带来更新。
一、注册&如何使用
1. 注册 discord 账号
相信大概部分用过 MJ 的小伙伴已经有账
试了试Meta的最新语音生成器,逼真得有点毛骨悚然
机器之能报道编辑:吴昕这段《小红帽》故事中的所有音频都是 AI 生成的,你能听出来吗?机器之能报道编辑:吴昕这段《小红帽》故事中的所有音频都是 AI 生成的,你能听出来吗?试听地址: Audiobox Maker,你可以在 Meta 刚刚发布的一个新的交互式网站 audiobox.metademolab 上找到它。有了它,仅用几分钟的时间,机器之心也随意生成了关于五月天假唱热搜的对话:试听地址: Audiobox Maker ,即使是小白用户也可以设计、生成不同人物(比如小红帽、大灰狼和外婆)的声音文件,同时添加不
连看好莱坞大片都学会了!贾佳亚团队用2token让大模型卷出新境界
家人们谁懂,连大模型都学会看好莱坞大片了,播放过亿的GTA6预告片大模型还看得津津有味,实在太卷了!而让LLM卷出新境界的办法简单到只有2token——将每一帧编码成2个词即可搞定。等等!这种大道至简的方法有种莫名的熟悉感。不错,又是出自香港中文大学贾佳亚团队。这是贾佳亚团队自8月提出主攻推理分割的LISA多模态大模型、10月发布的70B参数长文本开源大语言模型LongAlpaca和超长文本扩展术LongLoRA后的又一次重磅技术更新。而LongLoRA只需两行代码便可将7B模型的文本长度拓展到100k token
10年前,word2vec经典论文就预定了今天的NeurIPS时间检验奖
在 ChatGPT 引爆 AI 热潮的 2023,一项推动NLP新时代到来的研究拿到了 NeurIPS 时间检验奖。NeurIPS 是当前全球最负盛名的 AI 学术会议之一,全称是 Neural Information Processing Systems,神经信息处理系统大会,通常在每年 12 月由 NeurIPS 基金会主办。大会讨论的内容包含深度学习、计算机视觉、大规模机器学习、学习理论、优化、稀疏理论等众多细分领域。12 月 10 日,NeurIPS 2023 在美国路易斯安那州新奥尔良市拉开帷幕。根据官网
ChatGPT越来越懒,都学会反过来PUA人类了
OpenAI 表示自 11 月 11 日以来,他们就没有更新过模型,模型行为是不可预测的,他们正在研究如何修复。不知你有没有注意到,最近一段时间,GPT-4 变得有些「懒惰」,现在的它,老是拒绝执行某些任务或直接返回简化的结果。 这个问题得到很多网友的共鸣,纷纷开始抱怨 ChatGPT 变「懒惰」这个事实。用户声称,最近使用 GPT-4 或 ChatGPT API 时,在高峰时段响应变得非常缓慢且敷衍。在某些情况下,它会拒绝回答,而在另一些情况下,如果出现一系列问题,对话就会中断。 据报道,如果用户请求 GPT-4
数智蝶变进行时,产学大咖齐聚探索新型工业化「上海方案」
制造业是立国之本、强国之基,是实体经济的重要支撑。上海市推动制造业高质量发展,率先探索具有新时代特征的新型工业化道路。实施智能工厂领航计划、「工赋上海」行动计划,打造工业互联网平台,培育「工赋链主」企业…… 谋篇布局、统筹推进,上海全面推动制造业数字蝶变。为了进一步汇聚起推进新型工业化的强大合力,推动数字蝶变行动落地见效,在即将举办的数智上海 2023 峰会・上海城市数字化转型体验周开幕式上,将特别举办「数智说」工业智能化论坛。12 月 16 日下午,上海杨浦五角场凯悦酒店,论坛将汇聚上海交通大学知名专家学者,中国
2024年AI趋势看这张图,LeCun:开源大模型要超越闭源
能感受到其中的趋势吗?2023 年即将过去。一年以来,各式各样的大模型争相发布。当 OpenAI 和谷歌等科技巨头正在角逐时,另一方「势力」悄然崛起 —— 开源。开源模型受到的质疑一向不少。它们是否能像专有模型一样优秀?是否能够媲美专有模型的性能?迄今为止,我们一直还只能说是某些方面接近。即便如此,开源模型总会给我们带来经验的表现,让我们刮目相看。开源模型的兴起正在改变游戏规则。如 Meta 的 LLaMA 系列以其快速迭代、可定制性和隐私性正受到追捧。这些模型被社区迅速发展,给专有模型带来了强有力的挑战,能够改变
当GPT-4V充当机器人大脑,可能你都没AI会规划
来自清华大学交叉信息研究院的研究者提出了「ViLa」(全称 Robotic Vision-Language Planning)算法,其能在非常复杂的环境中控制机器人,为机器人提供任务规划。【关注机器之心视频号,第一时间看到有趣的AI内容】GPT-4V 已经能帮我们设计网站代码,控制浏览器,这些应用集中在虚拟数字世界中。假如我们把 GPT-4V 带入现实世界,让它作为控制机器人的大脑,会有什么有趣的结果呢?最近,来自清华大学交叉信息研究院的研究者提出「ViLa」算法,实现了让 GPT-4V 走进物理世界中,为机器人操
就像Word中的文本自动更正一样,大语言模型自动更正化学工艺流程图
编辑 | 紫罗过程工程是化学、物理、生物过程的设计、运行、控制、优化与强化。涉及大量的工业领域,如化学、材料、农业、制药、生物技术工业等。过程工程领域广泛使用过程流程图 (PFD) 以及过程和仪表图 (P&ID) 来表示过程流程和设备配置。然而,P&ID 和 PFD(以下称为流程图)可能包含导致安全隐患、低效操作和不必要费用的错误。纠正和验证流程图是一个繁琐的手动过程。来自荷兰代尔夫特理工大学的研究人员提出了一种新颖的生成人工智能方法,用于自动识别流程图中的错误并向用户建议更正,即自动更正流程图。受到用于人类语言语
Protein BLAST会成为过去吗?AlphaFold等对蛋白结构的搜索是否会取代对序列的搜索
编辑 | 白菜叶像 AlphaFold 这样的蛋白质结构搜索工具会用 BLAST 取代蛋白质序列搜索吗?德累斯顿工业大学的研究团队讨论了使用结构搜索进行远程同源性检测的前景,以及为什么蛋白质 BLAST 作为领先的序列搜索工具应努力纳入结构信息。BLAST 广泛用于分子生物学中搜索核苷酸和蛋白质序列。BLAST 推出三十年后,结构预测出现了重大突破,出现了 RoseTTAFold 和 AlphaFold 等工具。因此,主要序列数据库中的每个蛋白质序列现在都带有一个 3D 折叠模型。虽然这不会影响(非编码)核苷酸序列
人工智能顶会AAAI 2024放榜!联汇科技赵天成博士团队两篇论文入选
近日,第38届国际顶级人工智能学术会议AAAI(Association for the Advancement of Artificial Intelligence)正式发布了2024年会议的录用通知,联汇科技赵天成博士团队两篇论文入选。AAAI 是由国际人工智能促进协会主办的年会,是人工智能领域中历史最悠久、涵盖内容最广泛的国际顶级学术会议之一,也是中国计算机学会(CCF)推荐的 A 类国际学术会议。据了解,本届AAAI会议共有12100篇投稿(主赛道),打破历史纪录,经过全面而严格的审查程序,共有2342篇论文
为通用人工智能提速,蚂蚁图计算连续四次打破权威测评世界纪录
近日,国际关联数据基准委员会(Linked Data Benchmark Council,以下简称LDBC)发布了图数据基准测评“LDBC SNB-BI”最新结果。由蚂蚁集团自研的流式图计算引擎TuGraph Analytics在30TB规模的数据集上成功完成了基准测试,数据规模和性能打破了此前美国某图数据库厂商的公开纪录,关键指标中的并发吞吐量提升至2.84倍,查询能力提升至1.86倍。 LDBC官方公布蚂蚁LDBC SNB-BI测评新纪录在本次测评中,测试产品需要快速导入和分析30TB 规模的数据,处理多达72
MIT顶尖机器人学家创业,融资数千万,受线虫启发开发液态网络,叫板OpenAI
机器之能报道编辑:吴昕MIT 计算机科学和人工智能实验室 CSAIL 孵化的创业公司—— Liquid AI 终于结束隐身模式,公开与 OpenAI 和其他公司的大型语言模型竞争。近日,Liquid AI 官宣已筹集 3750 万美元。就种子轮而言,这个数字相当可观。投资人不乏一些大人物,比如 GitHub 联合创始人 Tom Preston Werner、Shopify 联合创始人 Tobias Lütke 和 Red Hat 联合创始人 Bob Young。融资后,公司估值 3.03 亿美元。著名机器人学家和计
第一波!2023年12月精选实用设计工具合集
大家好,这是 2023 年 12 月的第 1 波干货合集!这次的合集依然是以 AI 工具为主,有意思的是,如今的的 AI 工具越来越细化,越来越专业化,今天推荐的 AI 产品设计工具 Vizcom、AI LOGO 生成工具 LOGO Diffusion,都是这样的工具。此外,今天的列表中,还有第三方 GPT 商店,Blender 资源下载插件,以及高清图片下载工具。
当然,在此之前记得看看往期干货中有没有你感兴趣的素材:下面我们具体看看这一期的干货:
1、基于 AI 的产品可视化生成工具
Vizcom 的产品设计
全面超越GPT-4?一文详解Google新模型Gemini
大家好我是花生~
最近 Google 发布了一个新的多模态大模型 Gemini,在 AI 模型领域掀起了一轮新的讨论热潮,风头一时间甚至盖过了 GPT-4。那么 Gemini 的具体功能有哪些,相比其他大模型又有何特点呢?今天我们就一起来看看。
了解 GPT-4:一、 Gemini 的功能
Google 称 Gemini 是其历史上最强大、最通用的模型,在许多基准测试中都具有最先进的性能。Google DeepMind 的 CEO Demis Hassabis 称 Gemini 可以像人类一样理解我们周围的世界,并
助力AI技术共享,蚂蚁开源又一核心技术“因果学习系统 OpenASCE”
当地时间 12 月 10 日,为期 6 天的 AI 国际顶会 NeurIPS (Neural Information Processing Systems) 在美国路易斯安那州新奥尔良市开幕。NeurIPS 是全球人工智能和机器学习领域的顶级会议,与 ICML 并称为人工智能领域难度最大,水平最高,影响力最强的会议。会议首日,中国互联网企业蚂蚁集团受邀举办主题为“知识增强 AI 在垂直行业的应用探索”(Knowledge-enhanced AI for Industry Verticals)的研讨会,并在会上开源了
夸张!EMNLP投稿近5000篇,奖项出炉:北大、腾讯摘最佳长论文
本届 EMNLP 大会在投稿人数上创了新高,整体接收率也较上届略有提升。EMNLP 是自然语言处理领域的顶级会议之一,EMNLP 2023 于 12 月 6 日 - 10 日在新加坡举行。因为今年 ChatGPT 的爆火带动大模型、NLP 概念,EMNLP 2023 的投稿论文数量也达到近 5000 篇,甚至略高于 ACL 2023。在接收率方面,长论文接收率为 23.3%,短论文接收率为 14%,整体接收率为 21.3%。这一数据相较 EMNLP 2022 的 20% 略有提升。我们从这次 EMNLP 的 loc