资讯列表

太疯狂,GPTs上线:奥特曼表演手搓马斯克大模型,还有人已搞出第三方市场(附教程)

奥特曼:看我给你们整个活。前几天开发者大会上 OpenAI 说过,只要买会员,你就可以基于新版 GPT-4 大模型开发自己的应用,大家都跃跃欲试。今天凌晨,这个叫 GPTs 的功能正式开放了。所有的 ChatGPT Plus 订阅用户都可以从头到脚自定义 GPT,无需任何编码知识,就能根据教学、游戏或创意设计等不同任务构建专属 GPT。比如 OpenAI CEO 山姆・奥特曼亲自示范了如何开发一个全新的 GPT 应用,和马斯克家的「Grok」同名:顺带隔空喊话:用 GPTs 吧,(马斯克)你不用费那么多事儿。技术领

华人团队获最佳论文、最佳系统论文,CoRL获奖论文出炉

聚焦大模型 机器人。自 2017 年首次举办以来,CoRL 已经成为了机器人学与机器学习交叉领域的全球顶级学术会议之一。CoRL 是面向机器人学习研究的 single-track 会议,涵盖机器人学、机器学习和控制等多个主题,包括理论与应用。2023 年的 CoRL 大会于 11 月 6 日至 9 日在美国亚特兰大举行。据官方数据透露,今年来自 25 个国家的 199 篇论文入选 CoRL,热门主题包括 manipulation、强化学习等。虽然相比于 AAAI、CVPR 等大型 AI 学术会议,CoRL 的会议规

李飞飞团队新作:脑控机器人做家务,让脑机接口具备少样本学习能力

能动脑的,绝不用动手的。未来也许只需动动念头,就能让机器人帮你做好家务。斯坦福大学的吴佳俊和李飞飞团队近日提出的 NOIR 系统能让用户通过非侵入式脑电图装置控制机器人完成日常任务。NOIR 能将你的脑电图信号解码为机器人技能库。它现在已能完成例如烹饪寿喜烧、熨衣服、磨奶酪、玩井字游戏,甚至抚摸机器狗等任务。这个模块化的系统具备强大的学习能力,可以应对日常生活中复杂多变的任务。大脑与机器人接口(BRI)堪称是人类艺术、科学和工程的集大成之作。我们已经在不胜枚举的科幻作品和创意艺术中见到它,比如《黑客帝国》和《阿凡达

让AI模型成为GTA五星玩家,基于视觉的可编程智能体Octopus来了

电子游戏已经成为如今现实世界的模拟舞台,展现出无限可能。以游戏《侠盗猎车手》(GTA)为例,在 GTA 的世界里,玩家可以以第一人称视角,在洛圣都(游戏虚拟城市)当中经历丰富多彩的生活。然而,既然人类玩家能够在洛圣都里尽情遨游完成若干任务,我们是否也能有一个 AI 视觉模型,操控 GTA 中的角色,成为执行任务的 “玩家” 呢?GTA 的 AI 玩家又是否能够扮演一个五星好市民,遵守交通规则,帮助警方抓捕罪犯,甚至做个热心肠的路人,帮助流浪汉找到合适的住所?目前的视觉 - 语言模型(VLMs)在多模态感知和推理方面

AIGC实战案例!如何10秒快速生成IP海报?

众所周知,各大厂目前都在 AIGC 的领域探索实践,也有非常多的外部设计师制作了大量的 AIGC 相关授课,很多同学因为不清楚具体能得到什么价值或者收获而停止了脚步。今天我来为大家分享一下经过实际探索且落地的 Stable diffusion 的 IP 海报生成流程,内容很干请上车坐稳。 更多AI实战案例:先来看一下达达骑士 IP 的效果: V1 模型生成V2 模型生成V3 模型生成一、运用 SD 训练 IP 的流程和技巧(LoRA 篇) 先来介绍一下什么是 LoRA。 大家刚接触 stable diffusion

腾讯蒋杰:坚持用技术服务应用,腾讯混元大模型已接入180多个业务

“腾讯正在持续探索大模型应用场景,目前内部超180项业务已经接入腾讯混元大模型进行内测”,11月9日,腾讯集团副总裁蒋杰在2023年世界互联网大会乌镇峰会上表示。腾讯集团副总裁 蒋杰作为腾讯全链路自研的实用级大模型,自2023年9月首次面向公众亮相以来,腾讯混元大模型在内部业务的应用不断深化,同时在文化沟通、生产提效、科技普惠多个领域探索落地场景,发掘应用价值。在文化沟通方面,腾讯混元大模型的多语种翻译以及最新的文生图、文生3D等能力,可以有效增进沟通,帮助跨文化背景的人更好地交流。例如,通过腾讯混元,人们可以便捷

「iPhone杀手」真来了:无屏、集成GPT-4、OpenAI CEO和微软背书,699美元

机器之能报道编辑:sia如果说有一家公司真正拥抱了 ChatGPT 时代,那就是 Humane。将 AGI(通用人工智能)视为只存在于云中的东西,很奇怪。一次采访中, OpenAI CEO Sam Altman 对记者说,人类仅仅充当 AGI 的肢体也「好像不太对劲。」「我们生活在物理世界中,我们也希望(AGI)在物理世界中发生。」 事实上,无论是 OpenAI 还是 Sam Altman 都有投资智能硬件公司。OpenAI 被爆料与前苹果首席设计师 Jony Ive 联手打造 AI 硬件,消息暂时没了下文,但 S

“重构未来 产业智能跃迁”2023大模型产业前沿论坛即将开启!

2023年是人工智能技术革命的拐点,也是新一轮科技创新、产业升级的重要引擎。站在由AI大模型所开启的智能化时代开端,新一轮科技革命和产业变革正在向纵深演进,以数字生产力推动的数字业务时代正迸发出前所未有的发展机遇。11月23日,由中关村科金与中国信通院人工智能创新中心、人工智能关键技术和应用评测工业和信息化部重点实验室联合主办的2023大模型产业前沿论坛将于北京丽亭华苑酒店正式启幕。本次论坛以“重构未来,产业智能跃迁”为主题,来自产学研投的各界代表,将围绕“大模型产业升级·重塑·革新”展开全景式解构,深度探索大模型

谷歌科学家 Nature 评论:人工智能如何更好地理解大脑

编译 | 绿萝2023 年 11 月 7 日,Google Research 高级研究科学家,Google 团队连接组学负责人 Viren Jain,在《Nature》发表了题为《人工智能如何更好地理解大脑》(How AI could lead to a better understanding of the brain)的评论文章。论文链接:?这是数学家、理论家和实验学家长期以来一直在问的一个问题——无论是出于创造人工智能 (AI) 的愿望,还是因为只有当数学或计算机能够重现其行为时,才能理解像大脑这样的复杂系统

大模型走捷径「刷榜」?数据污染问题值得重视

我直接看答案。生成式 AI 元年,大家的工作节奏快了一大截。特别是,今年大家都在努力卷大模型:最近国内外科技巨头、创业公司都在轮番推出大模型,发布会一开,个个都是重大突破,每一家都是刷新了重要 Benchmark 榜单,要么排第一,要么第一梯队。在兴奋于技术进展速度之快后,很多人发现似乎也有些不对味:为什么排行榜第一人人有份?这是个什么机制?于是乎,「刷榜」这个问题也开始备受关注。近日,我们关注到朋友圈和知乎社区对大模型「刷榜」这一问题的讨论越来越多。特别是,知乎一篇帖子:如何评价天工大模型技术报告中指出很多大模型

OpenAI上线新功能太强了,服务器瞬间被挤爆

让 ChatGPT 服务器宕机,你参与了吗?OpenAI 开发者日上新功能太火爆,服务器都挤爆了。太平洋时间 11 月 8 日上午 6 点左右开始,ChatGPT 服务器宕机超过 90 分钟,用户访问会收到「ChatGPT 目前已满载(ChatGPT is at capacity right now)」的消息。随后,OpenAI 接连发布两次「服务器中断」警告 —— 一次部分中断、一次全线中断,并称正在调查宕机原因,进行修复和监控。最新状态显示:「ChatGPT 和 API 仍然会出现周期性中断。」OpenAI 表

关于计算+天文,一群“仰望星空者”讨论了什么?

随着天文数据的爆炸式增长以及计算技术的飞速发展,天文学领域正在发生一场科研范式的变革。11月6日至7日,之江实验室计算天文(杭州)国际会议举行,来自澳大利亚、法国、德国、日本、中国等五个国家的300余名“仰望星空者”相聚杭州,共同研讨智能计算和天文学如何实现更好的融合发展,以推动科学发现和技术创新。“之江实验室一直致力于用计算推动创新。我们希望天文学家和计算科学家能够紧密合作,探索计算技术如何助力科研,实现计算驱动的科学发现和技术创新。”之江实验室主任、中国工程院院士王坚在致辞中表示。               

开发者「第二大脑」来袭,GitHub Copilot更新,人类开发参与进一步减少

Copilot 帮助开发者完成更大、更复杂的任务。是什么让 Andrej Karpathy 感慨,人类在软件开发过程中直接编写代码的贡献将越来越小,直接输入和监督作用将更加抽象化。最终,人类的角色将仅仅是进行基本的审核和确认,而不再是主要的编程和开发者。原来是 GitHub 新发布的 Copilot Workspace,它重新构想了开发者的内部流程。如果 AI 开发工具是开发者的第二双手,那么 Copilot Workspace 将是开发者的「第二个大脑」。在编码的过程中,最头疼的莫过于遇到不熟悉的软件仓库、编程语

用语言对齐多模态信息,北大腾讯等提出LanguageBind,刷新多个榜单

北京大学与腾讯等机构的研究者们提出了多模态对齐框架 ——LanguageBind。该框架在视频、音频、文本、深度图和热图像等五种不同模态的下游任务中取得了卓越的性能,刷榜多项评估榜单,这标志着多模态学习领域向着「大一统」理念迈进了重要一步。 在现代社会,信息传递和交流不再局限于单一模态。我们生活在一个多模态的世界里,声音、视频、文字和深度图等模态信息相互交织,共同构成了我们丰富的感知体验。这种多模态的信息交互不仅存在于人类社会的沟通中,同样也是机器理解世界所必须面对的挑战。如何让机器像人类一样理解和处理这种多模态的

首款生成式AI移动芯片天玑9300:能跑330亿参数大模型

AI 画图一秒生成,大语言模型一秒 20 token。2023 年是生成式 AI 的元年,我们手上的移动设备也在加速进入大模型时代。11 月 6 日晚,联发科(MediaTek)正式发布了年度旗舰 SoC 天玑 9300,这款芯片通过 4 4 全大核的设计,在性能与能耗等方面,全面超越了安卓和苹果竞品。更为值得关注的是,今年的旗舰芯片被定义为 5G 生成式 AI 移动芯片,提供了远超以往的高智能、高性能、高能效、低功耗卓越特性。天玑 9300 采用台积电新一代 4nm 工艺,拥有 227 亿个晶体管。为了提供生成式

圆桌论道 | 聚焦 AI Agent,RLChina 2023 大会日程预览

导读由中国计算机学会 (CCF) 与 RLChina 强化学习社区联合主办的 RLChina 2023 大会将于 11 月 24 日至 26 日在苏州 CCF 业务总部召开。本次大会荣幸邀请到包括英国皇家工程院院士郭毅可教授、菲尔兹奖得主 Laurent Lafforgue 教授、北京大学邓小铁教授、华为语音语义首席科学家刘群教授以及伦敦大学学院汪军教授在内的 40 余位嘉宾共同探讨大模型与 AI Agent 领域的前沿工作。欢迎感兴趣的研究者莅临会议!活动安排主 题RLChina 2023——大模型与 AI Ag

神仙插件 LightFlow!一键复用SD WebUI工作流

大家好,这里是和你们一起探索 AI 绘画的花生~ 今天为大家推荐一个非常好用的 Stable Diffusion WebUI 插件 LightFlow,它可以将一张图像的生成参数和相关设置保存为文件,这样无论是复用图像生成信息还是分享给别人都非常方便,可以有效提升我们的出图效率。 :一、LightFlow 简介 Github 主页: 官方飞书文档: LightFlow 开源社区: 在 WebUI 中,当我们想复现某张图像的效果时,一般会去「图像浏览库」中找到对应的图像,然后将生成信息发送到文生图中进行修改。这

目标智能体社会,MetaGPT携手Jürgen Schmidhuber团队

现代人工智能之父Jürgen:“将人类文明视为一个更宏伟计划的一部分”