资讯列表

ChatGPT与DALL·E 3之间的行业「黑话」被人发现了

原来,礼貌和强调(emphasis)在大型语言模型(LLMs)的沟通中也发挥着意想不到的作用。上个月底,OpenAI 发布了最新图像生成器 DALL・E 3,除了炸裂的生成效果外,最大看点是其与 ChatGPT 的集成。DALL・E 3 构建在 ChatGPT 之上,用 ChatGPT 来创建、拓展和优化 prompt。这样一来,用户无需在 prompt 上花费太多时间。随着用户不断测试 DALL・E 3 应用程序的功能,有人开始注意到一些非常有趣的 bug,显示出了 DALL・E 3 与 ChatGPT 之间共享

解决大模型复现难、协作难, 这支95后学生团队打造了一个国产AI开源社区

过去十年间,AI 技术经历了巨大的飞跃,无论是在自然语言处理、图像识别,还是在更多的创新领域,AI 的影响已无所不在。伴随着研究数量的爆炸性增长,学术界和工业界同样面临着一些挑战,其中就包括「论文复现」和「跨学科协作」的难题。特别是当我们来到了大模型时代,面对动辄百亿参数量的模型研究,开源、复现、协作变得更加重要,但难度却更上一层楼。论文复现,首先是评判一项成果价值的重要参考因素。同时,在快速发展的 AI 领域,确保研究的可复现性将更好地推动知识的积累和技术的普及,也是维护学术诚信和促进持续创新的关键所在。面对这些

清华朱文武团队:开源世界首个轻量图自动机器学习库AutoGL-light

清华大学朱文武教授团队自 2020 年发布智图库(AutoGL)以来,在图自动机器学习的可解释性和可泛化能力等方面取得新进展,特别关注于图 Transformer、图分布外泛化(OOD)、图自监督学习等方面,发表图神经架构搜索评测基准,并在中国新一代开源创新服务平台 GitLink 上发布首个轻量智图库(AutoGL-light)。智图库回顾图(graph)是描述数据间关系的一般抽象,广泛存在于不同的研究领域中并有许多重要应用,例如社交网络分析、推荐系统、交通预测等互联网应用,新药物发现、新材料制备等科学应用(AI

220亿晶体管,IBM机器学习专用处理器NorthPole,能效25倍提升

IBM 再度发力。随着 AI 系统的飞速发展,其能源需求也在不断增加。训练新系统需要大量的数据集和处理器时间,因此能耗极高。在某些情况下,执行一些训练好的系统,智能手机就能轻松胜任。但是,执行的次数太多,能耗也会增加。幸运的是,有很多方法可以降低后者的能耗。IBM 和英特尔已经试验过模仿实际神经元行为设计的处理器。IBM 还测试了在相变存储器中执行神经网络计算,以避免重复访问 RAM。现在,IBM 又推出了另一种方法。该公司的新型 NorthPole 处理器综合了上述方法的一些理念,并将其与一种非常精简的计算运行方

有了GPT-4之后,机器人把转笔、盘核桃都学会了

GPT-4 和强化学习强强联合,机器人的未来将是什么样子?在学习方面,GPT-4 是一个厉害的学生。在消化了大量人类数据后,它掌握了各门知识,甚至在聊天中能给数学家陶哲轩带来启发。与此同时,它也成为了一名优秀的老师,而且不光是教书本知识,还能教机器人转笔。这个机器人名叫 Eureka,是来自英伟达、宾夕法尼亚大学、加州理工学院和得克萨斯大学奥斯汀分校的一项研究。这项研究结合了大型语言模型和强化学习的研究成果:用 GPT-4 来完善奖励函数,用强化学习来训练机器人控制器。借助 GPT-4 写代码的能力,Eureka

聚焦计算赋能创新,第三届智能计算创新论坛成功举行

新型计算方法的最新发展状况如何?能够帮助实现智能计算系统的先进技术是怎样的?如何利用智能方法辅助计算系统设计、调度和理论研究?怎样推动智能计算软硬件平台在科学研究、产业创新和社会发展中得到更广泛的应用?10月19日-20日,由之江实验室与Science/AAAS共同主办第三届智能计算创新论坛顺利举行,美国国家工程院院士、摩根大通人工智能研究负责人Manuela Veloso,中国科学院院士、之江实验室计算材料首席科学家张统一,清华大学类脑计算研究中心主任施路平教授,英国帝国理工学院教授Björn W.Schulle

评论能力强于GPT-4,上交开源13B评估大模型Auto-J

随着生成式人工智能技术的快速发展,确保大模型与人类价值(意图)对齐(Alignment)已经成为行业的重要挑战。虽然模型的对齐至关重要,但目前的评估方法往往存在局限性,这也让开发者往往困惑:大模型对齐程度如何?这不仅制约了对齐技术的进一步发展,也引发了公众对技术可靠性的担忧。为此,上海交通大学生成式人工智能实验室迅速响应,推出了一款全新的价值对齐评估工具:Auto-J,旨在为行业和公众提供更加透明、准确的模型价值对齐评估。论文地址:::,该项目开源了大量资源,包括:Auto-J 的 130 亿参数模型(使用方法,训

智加科技多项成果亮相ITS World Congress 两款智能重卡计划量产

2023年10月16日-20日,第29届智能交通世界大会(ITS World Congress)在苏州国际博览中心成功举办。智能交通世界大会被誉为智能交通领域的“奥运会”,是智能交通领域最具影响力的综合性国际会议,也是智能交通业界规格最高、规模最大、范围最广的成果展示与技术交流平台。智加科技携自动驾驶技术多项应用成果精彩亮相在第29届智能交通世界大会。与两大头部重卡主机厂达成合作 两款智能重卡计划量产智加科技宣布联合江淮汽车专为快递快运市场打造的智能重卡K7 ,将于10月底量产交付于中通快运,在双十一快递快运运营中

​参数少近一半,性能逼近谷歌Minerva,又一个数学大模型开源了

大模型家族来了一个专门解决数学问题的「新成员」——Llemma。如今,在各种文本混合数据上训练出来的语言模型会显示出非常通用的语言理解和生成能力,可以作为基础模型适应各种应用。开放式对话或指令跟踪等应用要求在整个自然文本分布中实现均衡的性能,因此更倾向于通用模型。不过如果想要在某一领域(如医学、金融或科学)内最大限度地提高性能,那么特定领域的语言模型可能会以给定的计算成本提供更优越的能力,或以更低的计算成本提供给定的能力水平。普林斯顿大学、 EleutherAI 等的研究者为解决数学问题训练了一个特定领域的语言模型

如何使用ChatGPT定制各种实用小工具?我总结了6个!

ChatGPT 的能力让人难以想象,限制 ChatGPT 能力的只会是使用者的想象力。 在日常使用中,我通过 ChatGPT 定制了很多实用小工具。以前需要借助其他产品完成的需求,现在通过 ChatGPT 就可以完成,而且效果很好。 之前我分享了如何使用 ChatGPT 做定制化模型:一、翻译工具 在以前日常工作生活中,需要翻译时,我都是通过搜索使用百度/谷歌翻译。 对于句子的翻译,机器翻译往往不够精准,有一股机译的味道。而 ChatGPT 具备强大的语言能力,在翻译这一点上质量更高。 如下图,当我输入英文,则 C

科学家使用外推ML方法加速发现新型催化剂

编辑 | 萝卜皮设计新型催化剂是解决许多能源和环境挑战的关键。尽管包括机器学习 (ML) 在内的数据科学方法有望加速催化剂的开发,通过机器学习方法很少发现真正新颖的催化剂,因为它最大的局限性是假设无法推断和识别特殊材料。北海道大学(Hokkaido University)的研究人员展示了一种外推机器学习方法来开发新型多元素反向水煤气变换催化剂。使用 45 个催化剂作为初始数据点,并执行闭环发现系统的44个循环(ML预测 实验),研究人员对总共 300 种催化剂进行了实验测试,并鉴定出 100 多种催化剂,这些催化剂

中国科大团队开发用于原子系统对外部场响应的通用机器学习模型

编辑 | 萝卜皮机器学习的原子间相互作用势使得封闭系统的高效、准确的分子模拟成为可能。然而,可以极大地改变化学结构或反应性的外部场,很少被包含在当前的机器学习模型中。中国科学技术大学的研究人员提出了一种通用场诱导递归嵌入原子神经网络(field-induced recursively embedded atom neural network,FIREANN)模型,该模型将伪场矢量依赖特征整合到原子描述符中,以表示具有严格旋转等变性的系统-场相互作用。这种「一体式」方法将偶极矩和极化率等各种响应特性与单个模型中的场相

大厂出品!如何用 ControlNet 实现精准的画面色彩控制?

颜色控制一直是 AIGC 的难点,prompt 会污染、img2img 太随机… 今天带来利用controlnet,实现对画面颜色的有效控制。都说AIGC是抽卡,但对把它作为工具而非玩具的设计师,必须掌握如何控制它,让我们一起开始可控AI生成。 更多相关干货:一、想给 AI 点颜色瞧瞧,怎么这么难 大家或许已经通过各种《三分钟包会》《五分钟出道》的教程,可以手拿把掐的将一张商品图,完美植入需要的背景中。客观的说,无论从角度、投影、还是商品与背景的语义关系,以下都能算是合格的图片。但是作为视力 255³的设计师,总能

病毒式传播的短视频,也许就是这个GPT-4工具剪出来的

器之能报道编辑:大盘鸡真正实现人人能做短视频。「视频为王」的环境下,短视频可谓是正在称霸,它的传播速度甚至被称为「病毒式」传播。正是短视频传播迅速、内容简练、节奏快速,填补了快节奏生活的空白。你会不会也经常看短视频来充当自己休闲时光的活动?短视频虽然看着简单,但是制作起来也是颇为费心的。想要将内容极度精炼、做到短时间内快速吸引观众的眼球、视频节奏好,这都需要反复琢磨。Klap 的出现,或许能帮助大家更好地制作短视频。官方网站地址: 是一款 AI 驱动的工具,旨在自动创建短视频内容。它所使用的 AI 技术由 Open

腾讯OCR团队斩获ICDAR大赛四项冠军

在全球文字识别(OCR)领域顶级盛会ICDAR 2023上,腾讯OCR团队基于自研算法,斩获四项冠军,这是继2017年、2019年、2021年以来,连续四届参会同时创造佳绩,共获得18项官方认证冠军,展示了腾讯OCR技术在全球的一流水平。ICDAR大会是全球文档图像分析识别领域公认的权威学术会议,每两年举办一次,赛事举办至今已经吸引了超过100多个国家的近8000支队伍参与其中。ICDAR竞赛因其极高的技术难度和强大的实用性享誉国内外,与赛后非正式刷榜不同,ICDAR官方认证的正式竞赛采用全新的数据集,并且在比赛期

OpenAI终于Open一回:DALL-E 3论文公布、上线ChatGPT,作者一半是华人

打开 ChatGPT 就能用 DALL・E 3 生成图片了,OpenAI 还罕见地发布了一些技术细节。终于,「OpenAI 又 Open 了」。在看到 OpenAI 刚刚发布的 DALL・E 3 相关论文后,一位网友感叹说。DALL・E 3 是 OpenAI 在 2023 年 9 月份发布的一个文生图模型。与上一代模型 DALL・E 2 最大的区别在于,它可以利用 ChatGPT 生成提示(prompt),然后让模型根据该提示生成图像。对于不擅长编写提示的普通人来说,这一改进大大提高了 DALL・E 3 的使用效率

在RTX 4090被限制的时代下,让大模型使用RLHF更高效的方法来了

该论文介绍了一种名为 ReMax 的新算法,专为基于人类反馈的强化学习(RLHF)而设计。ReMax 在计算效率(约减少 50% 的 GPU 内存和 2 倍的训练速度提升)和实现简易性(6 行代码)上超越了最常用的算法 PPO,且性能没有损失。论文链接::李子牛,许天,张雨舜,俞扬,孙若愚,罗智泉机构:香港中文大学(深圳),深圳市大数据研究院,南京大学,南栖仙策开源代码:,所有图片来自于论文。背景今年,以 ChatGPT 为首的大语言模型(Large Language Models, LLMs) 在各个方面大放光彩

阿里达摩院发布遥感AI大模型,让AI进一步下沉到田间地头

10月20日,阿里达摩院发布业内首个遥感AI大模型,一个模型即可识别农田、农作物、建筑等地表万物,让AI进一步下沉到田间地头,大幅提升灾害防治、自然资源管理、农业估产等遥感应用的分析效率,该模型已在AI Earth地球科学云平台开放使用。遥感技术在城市运营、耕地保护、应急救灾等国计民生中的应用甚广,遥感AI则可以大幅提升既有数据的利用深度,输出更精细化、更准确的分析结果,如结合卫星照片与历史气象情况,“算”出某一块农田里作物的长势状况,让种地不再被动,而是更主动地“看天吃饭”。以往,由于遥感卫星的影像数据规模巨大、