资讯列表

微软TaskWeaver开源框架:携手数据分析与行业定制,打造顶级Agent解决方案

数据分析一直是现代社会中的重要工具,它帮助我们洞察本质、发现规律并指导决策。然而,数据分析过程往往复杂且费时,因此我们期望存在一个智能助手助力用户直接 “与数据对话 “。得益于大语言模型(LLM)的发展,虚拟助手和 Copilot 等智能 Agent 纷纷涌现,它们在自然语言理解和生成方面的表现令人叹为观止。但遗憾的是,在处理复杂数据结构(如 DataFrame, ndarray 等)和引入领域知识方面,现有的 Agent 框架仍然举步维艰,而这恰恰是数据分析和专业领域中的核心需求。为了突破这一瓶颈,微软推出了 T

第三波!2024年1月精选实用设计工具合集

大家好,这是 2024 年 1 月的第三波干货合集!这一期干货合集打头的一个免费的在线 AI 壁纸生成工具,之后是字体海报灵感设计网站和类似 Pinterest 的在线灵感搜集网站,此外还有无代码网站设计和生成工具 ReadyMag 以及特别有自己一套风格的免费图库 KaboomPics ,最后是一组免费矢量涂鸦素材。 当然,在此之前记得看看往期干货中有没有你感兴趣的素材:下面我们具体看看这一期的干货: 1、在线 AI 壁纸生成工具 AI 大模型到底是哪个,但是总体上来看有很大概率是一个基于 Stable Dif

龙年春节专题!7 款高质量 Stable Diffusion WebUI 模型推荐

大家好我是花生~ 上次推荐了 15 组春节主题的 Midjourney 提示词,不知道大家用起来了没有?今天继续推荐 7 款龙年春节主题的 Stable Diffusion 模型,在 WebUI 或 ComyfyUI 可以用它们免费出图,还可以结合控制插件 ControlNet 让生成的图像更符合设计需求。 相关推荐:一、年货街 | 新年电商营销场景 这是一个专门生成电商年货促销场景的 Lora,以中式建筑 街道为画面主元素,整体的 3D 质感非常不错,很适合作为 Banner 或者长图的背景素材。 1. 模型网址

完蛋,CES 2024被机器人包围了

机器之能报道编辑:佳琪2024 年国际消费电子展(CES)这一科技界的风向标活动刚刚落幕。作为全球备受瞩目的科技盛会,CES 吸引了来自 150 多个国家和地区的 4000 多家尖端科技企业。各家品牌纷纷秀出了最先进的技术和产品。英伟达的 AI PC 布局、英特尔最新的第 14 代处理器、发布 3 天即售罄 3 万台的 Rabbit R1...... 今年的 CES 见证了亿点点新变革的发生。超过 13 万名参会者亲临现场,体验了一把「黑科技照进现实」的震撼。在 CES 的展厅里,机器人总是最引人注目的焦点,其中有

我们是怎么一步步被Hugging Face收购的:开源库Gradio构建者分享背后故事

Gradio CEO 兼联合创始人 Abubakar Abid 谈了谈 Gradio 被收购的内幕故事。不知大家是否还记得 2021 年年末,Hugging Face 宣布收购 Gradio 一事。两年过去了,Gradio 是如何成长起来的,又是如何被收购的,Gradio CEO 兼联合创始人 Abubakar Abid 说出了一些内幕故事。图源: 是一个开源的 Python 库,可让你快速为机器学习模型、API 或任意 Python 函数构建演示或 Web 应用程序。只需几行代码,就可以让你的机器学习模型从抽象晦

深挖RLHF潜力,复旦语言和视觉团队创新奖励模型优化,让大模型更对齐

继第一份大模型对齐技术报告(Secrets of RLHF in Large Language Models Part I)获 NeurIPS 2023 workshop best paper 后,第二份报告强势归来,复旦语言和视觉团队联合推出的第二份报告将进入这一领域更深层的探索和优化之旅。在首份报告中,复旦团队揭示了 RLHF 在大语言模型中的基本框架,并深入分析了 PPO 算法的内部机制,特别是 PPO-max 的高级版本在策略模型训练稳定性中的关键作用。现在,复旦团队进一步挖掘 RLHF 的潜力,重点关注奖

央企第一家:中国电信开源星辰语义大模型,共享超1T 高质基础数据

2024 年伊始,中国电信开源星辰语义大模型- 7B,成为第一家开源大模型的央企。同时开源的还有超 1T 的高质量清洗基础数据。 随着新一轮科技革命和产业变革加速演进,拥抱 AI 成为中国电信当下发展的核心战略之一。2019 年,中国电信在原数据中心基础上成立大数据和 AI 中心。2023 年11 月,中国电信注资 30 亿元成「中电信人工智能科技有限公司」(以下简称中电信 AI 、 AI 团队),牵头打造中国电信 AI 核心技术。同月,中国电信发布千亿级星辰语义大模型。 开源项目链接地址            

AI:你总要高清视频,它来了

以后,就算是跑着拍视频,FMA-Net也能给你处理得非常满意。Magnific 图像超分 & 增强工具还正在火热体验中,它强大的图像升频与再创能力收获一致好评。现在,视频领域也有了自己的 Magnific。拍摄的街道视频一片模糊,仿佛高度近视没戴眼镜一样:与之相比,下面的视频清晰度高了很多:视频画面两边形成鲜明的对比:左边视频已经模糊的看不清人脸,而右边视频建筑物的纹理也看得清清楚楚:行驶的汽车仿佛从一个模糊的世界穿越到高清世界:不同的方法进行比较,明显看到右下角的视频在微小的细节恢复方面更加清晰:通过上述展示,我

Transformer的无限之路:位置编码视角下的长度外推综述

在自然语言处理(Natural Language Processing,NLP)领域,Transformer 模型因其在序列建模中的卓越性能而受到广泛关注。然而,Transformer 及在其基础之上的大语言模型(Large Language Models,LLMs)都不具备有效长度外推(Length Extrapolation)的能力。这意味着,受限于其训练时预设的上下文长度限制,大模型无法有效处理超过该长度限制的序列。文本续写和语言延展是人类语言的核心能力之一,与之相对的,长度外推是语言模型智能进化的重要方向,

助力碳纳米材料研究,上海交大团队开发数据驱动的主动学习框架

编辑 | X碳纳米材料的可控合成,比如单晶、大面积石墨烯,手性碳纳米管,是实现其在未来电子或能源设备中潜在应用的关键挑战。基底催化生长为碳纳米结构的可控合成提供了一种非常有前途的方法。然而,动态催化表面的生长机制和更通用的设计策略的发展仍然是一个挑战。近日,来自上海交通大学和日本东北大学(Tohoku University)的研究团队,展示了主动机器学习模型如何有效地揭示基底(Substrate)催化生长中涉及的微观过程。研究利用分子动力学和蒙特卡罗方法的协同方法,并通过高斯近似势增强,对 Cu(111) 上的石墨

描述液体和软物质的AI方法,开启密度泛函理论新篇章

编辑 | 白菜叶拜罗伊特大学(Universität Bayreuth)的科学家开发了一种利用人工智能研究液体和软物质的新方法,开启了密度泛函理论的新篇章。我们生活在一个高度技术化的世界,在这个密集而复杂的相互关联的网络中,基础研究是创新发展的引擎。这里的新方法,可以对广泛的模拟技术产生巨大影响,从而可以在计算机上更快、更精确、更深入地研究复杂物质。将来,这可能会对产品和工艺设计产生影响。新制定的神经数学关系可以很好地表示液体的结构,这一事实是一项重大突破,为获得深入的物理见解开辟了一系列可能性。「在这项研究中,我

Nat.Commun.|山东大学团队基于图transformer开发了一种稀有细胞群组学分析方法

编辑 | 萝卜皮稀有细胞群是肿瘤进展和治疗反应的关键,提供了潜在的干预目标。然而,它们的计算识别和分析通常落后于主要细胞类型。为了填补这一空白,山东大学的研究团队引入了 MarsGT:使用单细胞图 transformer 进行稀有群体推断的多组学分析。它使用基于概率的异质图 transformer 对单细胞多组学数据识别稀有细胞群。MarsGT 在识别 550 个模拟数据集和 4 个真实人类数据集中的稀有细胞方面优于现有工具。该研究以「MarsGT: Multi-omics analysis for rare po

斯坦福Christopher Manning获2024 IEEE冯诺依曼奖,曾培养陈丹琦等多位华人学生

近日,2024 年度 IEEE 冯诺伊曼奖项结果正式公布,本年度奖项由斯坦福教授、AI 学者克里斯托弗・曼宁(Christopher Manning)获得,获奖理由为「促进自然语言计算表示和分析方面的进展」。IEEE 约翰・冯・诺依曼奖章(IEEE John von Neumann Medal)于 1990 年设立,以著名数学家、代计算机创始人之一约翰・冯・诺依曼的名字命名,旨在表扬在计算机科学和技术领域取得突出成就的科学家。约翰・冯・诺依曼在高级研究所的工作促成了 1952 年 IAS 二进制存储程序计算机的诞生

即插即用,完美兼容:SD社区的图生视频插件I2V-Adapter来了

图像到视频生成(I2V)任务旨在将静态图像转化为动态视频,这是计算机视觉领域的一大挑战。其难点在于从单张图像中提取并生成时间维度的动态信息,同时确保图像内容的真实性和视觉上的连贯性。大多数现有的 I2V 方法依赖于复杂的模型架构和大量的训练数据来实现这一目标。近期,由快手主导的一项新研究成果《I2V-Adapter: A General Image-to-Video Adapter for Video Diffusion Models》发布,该研究引入了一个创新的图像到视频转换方法,提出了一种轻量级适配器模块,即

五种资源类别,如何提高大语言模型的资源效率,超详细综述来了

本综述深入探讨了大型语言模型的资源高效化问题。近年来,大型语言模型(LLM)如 OpenAI 的 GPT-3 在人工智能领域取得了显著进展。这些模型,具有庞大的参数量(例如 1750 亿个参数),在复杂度和能力上实现了飞跃。随着 LLM 的发展趋势朝着不断增大的模型规模前进,这些模型在从智能聊天机器人到复杂数据分析,乃至于多领域研究中的应用越发广泛。然而,模型规模的指数级增长带来了巨大的资源需求,尤其是在计算、能源和内存等方面。这些资源的巨大需求使得训练或部署这样庞大的模型成本高昂,尤其是在资源受限的环境(如学术实

47年前经典影片另类重制,从宇宙到原子皆是生成

从广角视图到微距拍摄,每一步由你来决定。以躺在草坪上的男人为中心,将镜头画面按照 10 倍的比例不断扩展,你将看到一亿光年外的场景。以躺在草坪上的男人为中心,每次画面镜头缩减 90%,单个质子将充满整个镜头。让人震惊的是,这两组画面来自 1977 年的经典短片《Powers of Ten》。在评论区中,有人表示这个视频在 2022 年依然被当做经典出现在课堂中。有网友对于这个视频的制作表示无法想象。从银河系外层直达细胞内部,这样的跨度让人更加直观地感受到了宇宙中存在的巨大尺度。原视频观看地址:,制作类似的动画或互动

ChatGPT在亚马逊上「开网店」,一夜之间成了网红

最快的铺货方式?「我们的 [产品] 可用于多种任务,例如 [任务 1]、[任务 2] 和 [任务 3],使其成为你家庭的多功能补充。」没想到,ChatGPT 的机器人话竟然在电商网站上火了。GPT-5 的发布还尚需时日,最近 OpenAI 正在发力大语言模型的应用,开出了应用商店 GPT Store。与此同时,用户们也在积极探索各种 ChatGPT 的应用方向。然而这场探索在一些领域却走上了歪路子。众所周知,在亚马逊等大型电商网站上经常会出现一些来源可疑的产品,从爆炸的微波炉到没有检测功能的烟雾探测器,商品评论位置

这里,就是国内 AI 视频生成最前沿的研究与应用

AI 视频生成领域究竟有多疯狂?短短不到两个月的时间,数款 AI 视频生成模型、框架相继发布,视频生成的效果也越来越好。而在这背后,早已离不开国内 AI 视频生成的力量。互联网大厂纷纷联合高校、研究院等组织深入技术突破和技术创新,创业公司不甘示弱,你追我赶,好一派百花齐放、百家齐鸣之景象。而机器之心有幸将这支技术中坚力量汇聚一堂,下周六(1.20)在北京西城昆仑巢,欢迎对 AI 视频生成领域感兴趣的朋友们前来,共同交流学习。对于身处 AI 浪潮之中的每一个人而言,抓住时代机遇时不我待。机器之心 AI 技术论坛「视频