资讯列表
低成本快速定制大模型,这次我们来深度探讨下RAG 和向量数据库
当今人工智能领域,最受关注的毋庸置疑是大模型。然而,高昂的训练成本、漫长的训练时间等都成为了制约大多数企业入局大模型的关键瓶颈。这种背景下,向量数据库凭借其独特的优势,成为解决低成本快速定制大模型问题的关键所在。向量数据库是一种专门用于存储和处理高维向量数据的技术。它采用高效的索引和查询算法,实现了海量数据的快速检索和分析。如此优秀的性能之外,向量数据库还可以为特定领域和任务提供定制化的解决方案。科技巨头诸如腾讯、阿里等公司纷纷布局向量数据库研发,力求在大模型领域实现突破。大量中小型公司也借助向量数据库的能力快速进
Runway新功能「运动笔刷」再次惊艳AI圈:随手一涂,图片就动起来了
网友:我都不敢想象一年后的视频技术会有多先进。一段五十秒的预告视频,再次让 AI 圈沸腾了。昨日 Runway 宣布,即将在视频生成工具 Gen-2 中上线「Motion Brush」(运动笔刷)功能,一种可控制生成内容移动的新方法。这次的玩法,甚至不需要输入文字,只要有手就够了。任选一张图片,画笔涂抹到哪里,哪里就立刻动起来:不管是水流、云彩、火焰、烟雾还是人物,都能高度还原其动态。这就是传说中的「点石成金」吗?网友看完表示:我都不敢想象一年后的视频技术会有多先进……毕竟在 2023 年初,从文本生成视频还是一件
斯坦福提出对比偏好学习:无需强化学习即可从人类反馈中学习
我们知道,ChatGPT 的成功离不开 RLHF 这个「秘密武器」。不过 RLHF 并不是完美无缺的,存在难以处理的优化难题。本文中,斯坦福大学等研究机构的团队探索用「对比偏好学习」替换掉「强化学习」,在速度和性能上都有不俗的表现。在模型与人类意图对齐方面,根据人类反馈的强化学习(RLHF)已经成为一大流行范式。通常来说,RLHF 算法的工作过程分为两个阶段:一、使用人类偏好学习一个奖励函数;二、通过使用强化学习优化所学习的奖励来对齐模型。RLHF 范式假定人类偏好的分布遵照奖励,但近期有研究认为情况并非如此,人类
GPT-4比你更会问问题:让大模型自主复述,打破与人类对话的壁垒
在最新的人工智能领域动态中,人工生成的提示(prompt)质量对大语言模型(LLM)的响应精度有着决定性影响。OpenAI 提出的建议指出,精确、详细且具体的问题对于这些大语言模型的表现至关重要。然而,普通用户是否能够确保他们的问题对于 LLM 来说足够清晰明了?值得注意的是,人类在某些情境下的自然理解能力与机器的解读存在明显差异。例如,“偶数月” 这一概念,在人类看来很明显指的是二月,四月等月份,而 GPT-4 却可能将其误解为天数为偶数的月份。这不仅揭示了人工智能在理解日常语境上的局限性,也促使我们反思如何更有
顶配MacBook Pro 16上的M3 Max是什么水平?有人花56000元进行了评测
能取代酷睿 i9 和 RTX 显卡吗?10 月 31 日,苹果在「史上最短发布会」上发布了新一代笔记本电脑和 Mac,与之而来的还有新一代 M3 芯片。新一代芯片第一次使用领先的 3 纳米制程工艺,加入了动态缓存、硬件光追、网格着色等新技术,号称可以打英特尔的处理器加独立显卡,只用一半功耗就能达到 M1 芯片的相同算力。这一切使得 Apple Silicon M 系列芯片达到了新的高度。在英特尔不断提升制程工艺,高通即将入局 PC 领域的现在,苹果芯片是否仍具有竞争力在正式发布后不久,有关 M3 系列芯片的评测也陆
英伟达特供版芯片将上市:性能最高不到H100的20%
国内芯片未来能否实现替代?10 月 17 日,美国商务部放出最严对华出口管制规定,H800 等 AI 加速器成为制裁的焦点。因为制裁涉及显卡功率和算力的限制,继 H100 之后,英伟达专为符合要求设计的定制芯片也因此受限。新的禁令已在 10 月 23 日生效。有经销商表示,在 A800 和 H800 GPU 无法进口后,英伟达为国内市场专门开发了一款新服务器芯片和两款新 GPU,英伟达将在未来几天内向国内制造商交付三款新芯片。继 A800 和 H800 GPU 之后,英伟达开发了 HGX H20 以及 GPU L2
谷歌DeepMind给AGI划等级,猜猜ChatGPT在哪个位置
AGI 该如何划分,谷歌 DeepMind 给出了标准。我们到底该如何定义 AGI(通用人工智能)?如果你要求 100 位 AI 专家进行解答,你可能会得到 100 个相关但不同的定义。现阶段,AGI 是 AI 研究中一个重要且存在争议的概念,有研究者认为 AGI 已经出现在最新一代大语言模型(LLM)中;还有一些人预测人工智能将在大约十年内超越人类,甚至断言当前的 LLM 就是 AGI。深入理解 AGI 的概念很重要,因为它映射了人工智能所要达到的目标、对事物的预测以及带来的风险。我们该如何划分 AGI 等级呢?
通用异常检测新曙光:华科大等揭秘GPT-4V的全方位异常检测表现
异常检测任务旨在识别明显偏离正常数据分布的异常值,在工业检验、医学诊断、视频监控和欺诈检测等多个领域都发挥了重要作用。传统的异常检测方法主要依赖于描述正常数据分布以进行正异常样本的区分。然而,对于实际的应用而言,异常检测也需要理解数据的高层语义,从而深入理解 “什么是异常”。要实现更准确且智能的异常检测,我们需要关注以下关键步骤:1. 理解多样数据类型和类别不同领域的数据集包含各种数据类型和类别,如图像、视频、点云、时间序列等。每种数据类型可能需要不同的异常检测方法,每个物体类别可能对应不同的正常标准,因此深入理解
Luma AI推出神器Genie!通过文本生成高精度3D模型,免费使用!
大家好,这里是和你们一起探索 AI 的花生~
之前为大家推荐过一个 AI 神器 Meshy,可以通过文本生成一个完整的 3D 模型,今天要说的 Genie 也是一个 3D 模型生成工具,但生成的模型更精致逼真,还可以修改表面材质。Genie 目前正免费开放测试,我们一起看看来如何使用~
相关推荐:一、Genie 简介
Genie 是一个可以通过文本生成 3D 模型的 AI 神器,由 Luma AI 推出,一经发布就受到了很多关注,因为它的 3D 模型处理速度极快,可以生成多种风格,精度上比也目前其他工具都更好,还支
实战案例!如何快速通过Stable Diffusion生成角色固定姿势?
本文主要分为两部分:软件篇(如何搭建 Stable Diffusion 环境)
实战篇(如何完成一张立绘)软件部分会为大家推荐一些 B 站优秀的 UP 主的教程,讲解的十分详细。
本文会先带大家了解模型、VAE 和 LORA 这三个概念。而实战部分会以出草图 - 大量 AI 出图 - 局部修改(AI 迭代)- 再次修改,这样一个过程。
AI角色相关干货:一、软件篇
前期需要准备:Stable Diffusion 本地包、Stable Diffusion 模型、VAE 和 LORA。
1. Stable Diffus
Character.AI 上线GroupChat,让1800万个机器人加入人类群聊
机器之能报道编辑:吴昕三人行,必有我师(现在包括 AI)。这种组队方式为互动和迸发创造力开辟了新的可能性。在 Character.AI 位于加州帕洛阿尔托的人工智能总部,员工们一开始似乎在努力工作,目不转睛地盯着电脑显示器。但他们中的许多人不是在编程,而是全神贯注地和同事以及 character.AI 的 AI 聊天机器人群聊。周三, Character.AI 推出了一项新的群聊功能(Group Chat): 每月支付 9.99 美元,就能和平台上 1800 万个聊天机器人(比如,拿破仑、马斯克、托尼·斯塔克或者居
MIT学者讲述生成式 AI 的故事,它会越来越了解你,你也不得不了解它
作者 | Adam Zewe快速浏览一下资讯类网站就会发现,如今生成人工智能似乎变得无处不在。事实上,其中一些新闻资讯可能是由生成式人工智能帮忙撰写的,例如 OpenAI 的 ChatGPT。但当人们说「生成式人工智能」时,他们真正的意思是什么?在过去几年生成式人工智能热潮之前,当人们谈论人工智能时,通常他们谈论的是可以学习根据数据进行预测的机器学习模型。例如,使用数百万个示例对此类模型进行训练,以预测特定 X 射线是否显示肿瘤迹象,或者特定借款人是否可能拖欠贷款。生成式人工智能可以被认为是一种机器学习模型,经过训
多伦多大学团队使用AlphaFold获得对蛋白质结构的新见解
编辑 | 萝卜皮AlphaFold 蛋白质结构数据库包含数百万种蛋白质的预测结构。对于大多数含有本质无序区域 (IDR) 的人类蛋白质,这些区域不采用稳定的结构,通常认为这些区域具有较低的 AlphaFold2 置信度分数,反映了低置信度的结构预测。多伦多大学(University of Toronto)的研究团队表明 AlphaFold2 为近 15% 的人类 IDR 分配了可信结构。通过与已知条件折叠(即在结合或其他特定条件下)的 IDR 子集的实验 NMR 数据进行比较,研究人员发现 AlphaFold2 通
太疯狂,GPTs上线:奥特曼表演手搓马斯克大模型,还有人已搞出第三方市场(附教程)
奥特曼:看我给你们整个活。前几天开发者大会上 OpenAI 说过,只要买会员,你就可以基于新版 GPT-4 大模型开发自己的应用,大家都跃跃欲试。今天凌晨,这个叫 GPTs 的功能正式开放了。所有的 ChatGPT Plus 订阅用户都可以从头到脚自定义 GPT,无需任何编码知识,就能根据教学、游戏或创意设计等不同任务构建专属 GPT。比如 OpenAI CEO 山姆・奥特曼亲自示范了如何开发一个全新的 GPT 应用,和马斯克家的「Grok」同名:顺带隔空喊话:用 GPTs 吧,(马斯克)你不用费那么多事儿。技术领
华人团队获最佳论文、最佳系统论文,CoRL获奖论文出炉
聚焦大模型 机器人。自 2017 年首次举办以来,CoRL 已经成为了机器人学与机器学习交叉领域的全球顶级学术会议之一。CoRL 是面向机器人学习研究的 single-track 会议,涵盖机器人学、机器学习和控制等多个主题,包括理论与应用。2023 年的 CoRL 大会于 11 月 6 日至 9 日在美国亚特兰大举行。据官方数据透露,今年来自 25 个国家的 199 篇论文入选 CoRL,热门主题包括 manipulation、强化学习等。虽然相比于 AAAI、CVPR 等大型 AI 学术会议,CoRL 的会议规
李飞飞团队新作:脑控机器人做家务,让脑机接口具备少样本学习能力
能动脑的,绝不用动手的。未来也许只需动动念头,就能让机器人帮你做好家务。斯坦福大学的吴佳俊和李飞飞团队近日提出的 NOIR 系统能让用户通过非侵入式脑电图装置控制机器人完成日常任务。NOIR 能将你的脑电图信号解码为机器人技能库。它现在已能完成例如烹饪寿喜烧、熨衣服、磨奶酪、玩井字游戏,甚至抚摸机器狗等任务。这个模块化的系统具备强大的学习能力,可以应对日常生活中复杂多变的任务。大脑与机器人接口(BRI)堪称是人类艺术、科学和工程的集大成之作。我们已经在不胜枚举的科幻作品和创意艺术中见到它,比如《黑客帝国》和《阿凡达
让AI模型成为GTA五星玩家,基于视觉的可编程智能体Octopus来了
电子游戏已经成为如今现实世界的模拟舞台,展现出无限可能。以游戏《侠盗猎车手》(GTA)为例,在 GTA 的世界里,玩家可以以第一人称视角,在洛圣都(游戏虚拟城市)当中经历丰富多彩的生活。然而,既然人类玩家能够在洛圣都里尽情遨游完成若干任务,我们是否也能有一个 AI 视觉模型,操控 GTA 中的角色,成为执行任务的 “玩家” 呢?GTA 的 AI 玩家又是否能够扮演一个五星好市民,遵守交通规则,帮助警方抓捕罪犯,甚至做个热心肠的路人,帮助流浪汉找到合适的住所?目前的视觉 - 语言模型(VLMs)在多模态感知和推理方面
AIGC实战案例!如何10秒快速生成IP海报?
众所周知,各大厂目前都在 AIGC 的领域探索实践,也有非常多的外部设计师制作了大量的 AIGC 相关授课,很多同学因为不清楚具体能得到什么价值或者收获而停止了脚步。今天我来为大家分享一下经过实际探索且落地的 Stable diffusion 的 IP 海报生成流程,内容很干请上车坐稳。
更多AI实战案例:先来看一下达达骑士 IP 的效果:
V1 模型生成V2 模型生成V3 模型生成一、运用 SD 训练 IP 的流程和技巧(LoRA 篇)
先来介绍一下什么是 LoRA。
大家刚接触 stable diffusion