资讯列表
央企第一家:中国电信开源星辰语义大模型,共享超1T 高质基础数据
2024 年伊始,中国电信开源星辰语义大模型- 7B,成为第一家开源大模型的央企。同时开源的还有超 1T 的高质量清洗基础数据。 随着新一轮科技革命和产业变革加速演进,拥抱 AI 成为中国电信当下发展的核心战略之一。2019 年,中国电信在原数据中心基础上成立大数据和 AI 中心。2023 年11 月,中国电信注资 30 亿元成「中电信人工智能科技有限公司」(以下简称中电信 AI 、 AI 团队),牵头打造中国电信 AI 核心技术。同月,中国电信发布千亿级星辰语义大模型。 开源项目链接地址
AI:你总要高清视频,它来了
以后,就算是跑着拍视频,FMA-Net也能给你处理得非常满意。Magnific 图像超分 & 增强工具还正在火热体验中,它强大的图像升频与再创能力收获一致好评。现在,视频领域也有了自己的 Magnific。拍摄的街道视频一片模糊,仿佛高度近视没戴眼镜一样:与之相比,下面的视频清晰度高了很多:视频画面两边形成鲜明的对比:左边视频已经模糊的看不清人脸,而右边视频建筑物的纹理也看得清清楚楚:行驶的汽车仿佛从一个模糊的世界穿越到高清世界:不同的方法进行比较,明显看到右下角的视频在微小的细节恢复方面更加清晰:通过上述展示,我
Transformer的无限之路:位置编码视角下的长度外推综述
在自然语言处理(Natural Language Processing,NLP)领域,Transformer 模型因其在序列建模中的卓越性能而受到广泛关注。然而,Transformer 及在其基础之上的大语言模型(Large Language Models,LLMs)都不具备有效长度外推(Length Extrapolation)的能力。这意味着,受限于其训练时预设的上下文长度限制,大模型无法有效处理超过该长度限制的序列。文本续写和语言延展是人类语言的核心能力之一,与之相对的,长度外推是语言模型智能进化的重要方向,
助力碳纳米材料研究,上海交大团队开发数据驱动的主动学习框架
编辑 | X碳纳米材料的可控合成,比如单晶、大面积石墨烯,手性碳纳米管,是实现其在未来电子或能源设备中潜在应用的关键挑战。基底催化生长为碳纳米结构的可控合成提供了一种非常有前途的方法。然而,动态催化表面的生长机制和更通用的设计策略的发展仍然是一个挑战。近日,来自上海交通大学和日本东北大学(Tohoku University)的研究团队,展示了主动机器学习模型如何有效地揭示基底(Substrate)催化生长中涉及的微观过程。研究利用分子动力学和蒙特卡罗方法的协同方法,并通过高斯近似势增强,对 Cu(111) 上的石墨
描述液体和软物质的AI方法,开启密度泛函理论新篇章
编辑 | 白菜叶拜罗伊特大学(Universität Bayreuth)的科学家开发了一种利用人工智能研究液体和软物质的新方法,开启了密度泛函理论的新篇章。我们生活在一个高度技术化的世界,在这个密集而复杂的相互关联的网络中,基础研究是创新发展的引擎。这里的新方法,可以对广泛的模拟技术产生巨大影响,从而可以在计算机上更快、更精确、更深入地研究复杂物质。将来,这可能会对产品和工艺设计产生影响。新制定的神经数学关系可以很好地表示液体的结构,这一事实是一项重大突破,为获得深入的物理见解开辟了一系列可能性。「在这项研究中,我
Nat.Commun.|山东大学团队基于图transformer开发了一种稀有细胞群组学分析方法
编辑 | 萝卜皮稀有细胞群是肿瘤进展和治疗反应的关键,提供了潜在的干预目标。然而,它们的计算识别和分析通常落后于主要细胞类型。为了填补这一空白,山东大学的研究团队引入了 MarsGT:使用单细胞图 transformer 进行稀有群体推断的多组学分析。它使用基于概率的异质图 transformer 对单细胞多组学数据识别稀有细胞群。MarsGT 在识别 550 个模拟数据集和 4 个真实人类数据集中的稀有细胞方面优于现有工具。该研究以「MarsGT: Multi-omics analysis for rare po
斯坦福Christopher Manning获2024 IEEE冯诺依曼奖,曾培养陈丹琦等多位华人学生
近日,2024 年度 IEEE 冯诺伊曼奖项结果正式公布,本年度奖项由斯坦福教授、AI 学者克里斯托弗・曼宁(Christopher Manning)获得,获奖理由为「促进自然语言计算表示和分析方面的进展」。IEEE 约翰・冯・诺依曼奖章(IEEE John von Neumann Medal)于 1990 年设立,以著名数学家、代计算机创始人之一约翰・冯・诺依曼的名字命名,旨在表扬在计算机科学和技术领域取得突出成就的科学家。约翰・冯・诺依曼在高级研究所的工作促成了 1952 年 IAS 二进制存储程序计算机的诞生
即插即用,完美兼容:SD社区的图生视频插件I2V-Adapter来了
图像到视频生成(I2V)任务旨在将静态图像转化为动态视频,这是计算机视觉领域的一大挑战。其难点在于从单张图像中提取并生成时间维度的动态信息,同时确保图像内容的真实性和视觉上的连贯性。大多数现有的 I2V 方法依赖于复杂的模型架构和大量的训练数据来实现这一目标。近期,由快手主导的一项新研究成果《I2V-Adapter: A General Image-to-Video Adapter for Video Diffusion Models》发布,该研究引入了一个创新的图像到视频转换方法,提出了一种轻量级适配器模块,即
五种资源类别,如何提高大语言模型的资源效率,超详细综述来了
本综述深入探讨了大型语言模型的资源高效化问题。近年来,大型语言模型(LLM)如 OpenAI 的 GPT-3 在人工智能领域取得了显著进展。这些模型,具有庞大的参数量(例如 1750 亿个参数),在复杂度和能力上实现了飞跃。随着 LLM 的发展趋势朝着不断增大的模型规模前进,这些模型在从智能聊天机器人到复杂数据分析,乃至于多领域研究中的应用越发广泛。然而,模型规模的指数级增长带来了巨大的资源需求,尤其是在计算、能源和内存等方面。这些资源的巨大需求使得训练或部署这样庞大的模型成本高昂,尤其是在资源受限的环境(如学术实
47年前经典影片另类重制,从宇宙到原子皆是生成
从广角视图到微距拍摄,每一步由你来决定。以躺在草坪上的男人为中心,将镜头画面按照 10 倍的比例不断扩展,你将看到一亿光年外的场景。以躺在草坪上的男人为中心,每次画面镜头缩减 90%,单个质子将充满整个镜头。让人震惊的是,这两组画面来自 1977 年的经典短片《Powers of Ten》。在评论区中,有人表示这个视频在 2022 年依然被当做经典出现在课堂中。有网友对于这个视频的制作表示无法想象。从银河系外层直达细胞内部,这样的跨度让人更加直观地感受到了宇宙中存在的巨大尺度。原视频观看地址:,制作类似的动画或互动
ChatGPT在亚马逊上「开网店」,一夜之间成了网红
最快的铺货方式?「我们的 [产品] 可用于多种任务,例如 [任务 1]、[任务 2] 和 [任务 3],使其成为你家庭的多功能补充。」没想到,ChatGPT 的机器人话竟然在电商网站上火了。GPT-5 的发布还尚需时日,最近 OpenAI 正在发力大语言模型的应用,开出了应用商店 GPT Store。与此同时,用户们也在积极探索各种 ChatGPT 的应用方向。然而这场探索在一些领域却走上了歪路子。众所周知,在亚马逊等大型电商网站上经常会出现一些来源可疑的产品,从爆炸的微波炉到没有检测功能的烟雾探测器,商品评论位置
这里,就是国内 AI 视频生成最前沿的研究与应用
AI 视频生成领域究竟有多疯狂?短短不到两个月的时间,数款 AI 视频生成模型、框架相继发布,视频生成的效果也越来越好。而在这背后,早已离不开国内 AI 视频生成的力量。互联网大厂纷纷联合高校、研究院等组织深入技术突破和技术创新,创业公司不甘示弱,你追我赶,好一派百花齐放、百家齐鸣之景象。而机器之心有幸将这支技术中坚力量汇聚一堂,下周六(1.20)在北京西城昆仑巢,欢迎对 AI 视频生成领域感兴趣的朋友们前来,共同交流学习。对于身处 AI 浪潮之中的每一个人而言,抓住时代机遇时不我待。机器之心 AI 技术论坛「视频
智能高效、无广免费,「天工AI」超能搜索一键get!
在昨晚刚刚结束的《最强大脑》第11季第二期的比赛中,来自苏州大学的参赛选手郭菲蓉以百分之百的正确率与2分26秒的最短用时,夺得了“听风者”摩尔斯电码挑战的第一名。在现场,「天工AI」也跟庞博一起,借助摩尔斯电码向坚守舞台十年的蒋昌建老师献上了最深情、最科技的AI表白——十年老蒋,不同凡响!“听风者”摩尔斯电码挑战某种意义上再现了译电员的极限工作场景,也是「天工AI」与节目组一同向这些历史上的“最强大脑”们献上的崇高致敬。“听风者”需要拥有极强的记忆力与反应速度,并经过长期刻苦练习,才能第一时间翻译出“风声”中潜藏的
如何高效部署大模型?CMU最新万字综述纵览LLM推理MLSys优化技术
近日,CMU Catalyst 团队推出了一篇关于高效 LLM 推理的综述,覆盖了 300 余篇相关论文,从 MLSys 的研究视角介绍了算法创新和系统优化两个方面的相关进展。在人工智能(AI)的快速发展背景下,大语言模型(LLMs)凭借其在语言相关任务上的杰出表现,已成为 AI 领域的重要推动力。然而,随着这些模型在各种应用中的普及,它们的复杂性和规模也为其部署和服务带来了前所未有的挑战。LLM 部署和服务面临着密集的计算强度和巨大的内存消耗,特别是在要求低延迟和高吞吐量的场景中,如何提高 LLM 服务效率,降低
能找神经网络Bug的可视化工具,Nature子刊收录
近来,《自然》子刊收录了一项能找出神经网络在哪里出错的研究成果。研究团队提供了一种利用拓扑学描述神经网络的推断结果与其分类之间关系的可视化方法。这项成果能够帮助研究人员推断神经网络推理过程中发生混淆的具体情况,让人工智能系统更加透明。研究人员发现,在神经网络推理的某些数据图中存在尖峰,这些尖峰往往出现在神经网络判断模糊与产生错误的地方。观察这些尖峰,研究人员可以更容易发现人工智能系统中的故障点。从分析癌症突变的原因到决定谁应该获得贷款,在解决这些问题的过程中,仿照人脑的神经网络比人类表现得更加快速、准确、公正。但是
仅靠13页PPT,OpenAI投的这家人形机器人创业公司又融了1亿美元
机器之心报道编辑:杜伟不到一年时间,挪威人形机器人公司 1X 已经筹集到了超过 1.2 亿美元。还记得去年 OpenAI 领投的一家挪威机器人公司「1X」吗?当时该公司在 A2 轮融资中筹集到了 2350 万美元,由 OpenAI 创业基金领投、老虎环球以及一个挪威投资者组成的财团参投。今日,1X 官宣 B 轮融资筹集到 1 亿美元。作为一家 AI 和机器人公司,1X 的愿景是用机器人造福社会,满足全球劳动力需求。本轮融资方主要包括瑞典 EQT Ventures 风投基金和其他著名的全球投资者。1X 成立于 201
3D版Midjourney来了?Luma AI发布Genie 1.0,生成手办只需10秒
机器之心报道机器之心编辑部文生 3D 模型又来新玩家。随着生成式 AI 的浪潮席卷而来,科技公司都在冲击 AIGC 的下一个突破口 —— 3D 生成。目前,文生 3D 在学术界取得了许多新突破。在产业界,无论是像英伟达这样的行业巨头,还是像 Stability AI 这样的中坚力量,都推出了自己的文生 3D 工具。虽然 3D 生成领域一直「卷」到飞起,但是好像一直没有出现一款效果足够惊艳,生成速度足够快的代表性产品。如今,一直致力于 3D 内容生产的 Luma AI 向这一领域发起了挑战。就在昨天,Luma AI
如何根据游戏素材制作主题头像框?实战教程来了!
在 APP 的日常运营中,我们设计的同学经常会接到主题活动类的设计需求,其中活动头像框就是一个主要的类型。
主题头像框能满足用户的个性化需求,可以充当活动奖品,提高用户对活动的参与积极性,也有着一定的活动推广作用。
那么对于大部分手绘能力并不突出的 UI 设计师,怎样能在短期内利用素材制作活动主题的头像框呢?本期文章我将结合以往我做过的主题头像框,给大家讲解我的思路与方法。
相关干货:一、素材分析与制作思路
在需求开始前,我们一定要和需求方做好沟通,确定好需求方的想法与要求,提出自己对于元素、颜色、质感等元素大致思