万字解析!帮你完整掌握 Midjourney 和 ChatGPT 的前世今生

未来是模糊的、不确定的、复杂的。当我们进入未知领域时,设计师的影响力可能会逐渐减弱,让我们对设计实践的未来越来越感到担忧。过去,设计师在推动技术进步方面发挥着重要作用,但人工智能的出现引发了设计师对进步方向以及技术未来的担忧,参照过去的进步一样,人工智能是可以被证明是艺术家和设计师的宝贵工具,我们可以使人工智能能够产生想法、迭代想法、克服创意障碍,并设计出更为优秀的作品。那么关于人工智能我们该了解些什么呢? 本篇文章我们将通过原理讲述为大家解开谜题。 更多历史回顾:一、什么是人工智能 首先想要仔细了解“Mid jo

万字解析!帮你完整掌握 Midjourney 和 ChatGPT 的前世今生

未来是模糊的、不确定的、复杂的。当我们进入未知领域时,设计师的影响力可能会逐渐减弱,让我们对设计实践的未来越来越感到担忧。过去,设计师在推动技术进步方面发挥着重要作用,但人工智能的出现引发了设计师对进步方向以及技术未来的担忧,参照过去的进步一样,人工智能是可以被证明是艺术家和设计师的宝贵工具,我们可以使人工智能能够产生想法、迭代想法、克服创意障碍,并设计出更为优秀的作品。那么关于人工智能我们该了解些什么呢?

本篇文章我们将通过原理讲述为大家解开谜题。

更多历史回顾:

一、什么是人工智能

首先想要仔细了解“Mid journey”与“Chat GPT”,就要从什么是“人工智能”开始。

1. 人工智能

1955 年,时任达特茅斯学院数学系助理的约翰·麦卡锡和贝尔实验室的克劳德·香农,来自 IBM 的尼尔·罗切斯特,和时任哈佛大学数学系和神经学系初级研究员的马文·明斯基,他们一起开始展开的一场学术会议。

「人工智能」这个词,就诞生在四人起草的提案书里。

万字解析!帮你完整掌握 Midjourney 和 ChatGPT 的前世今生

2. 图灵测试

说到人工智能,就不得不提到图灵测试。20 世纪 50 年代美国数学家阿兰·图灵提出了图灵机理论,提出要实现人工智能,必须具备思维能力,这是人工智能的学科基础。图灵理论就是认为要实现人工智能,必须具备思维能力,即机器必须具备自我学习和模拟能力,这个通常也是区别人与机器。

除了著名的图灵测试之外,还有其他几种测试,包括威胁评估测试、计算机对弈测试、图像识别测试、自然语言处理测试等。 威胁评估测试旨在测试 AI 系统是否能够识别威胁和潜在的危害,以及它们如何应对这些威胁。 计算机对弈测试旨在测试 AI 系统是否能够在计算机对弈比赛中取胜,它们是如何分析棋局的,以及最终做出正确的决定。 图像识别测试旨在测试 AI 系统是否能够准确地识别图像中的物体和不同物体之间的关系。 自然语言处理测试旨在测试 AI 系统是否能够理解自然语言,并能够正确地回答问题。

3. 通过图灵测试

英国伦敦皇家学会参加雷丁大学主办的 2014 年“图灵测试”竞赛中一台名为“尤金·古斯特曼”的电脑伪装成 13 岁的乌克兰男孩在一系列每次为 5 分钟的问答测试后,“古斯特曼”被认作人类的比例达到 33%,成功通过测试。当然这并不是最早通过测试的例子最著名的是 ELIZA,它是一种自然语言处理程序,可以与人类进行会话。它于 1966 年由计算机科学家 Joseph Weizenbaum 创造,并被认为是第一个完成图灵测试的聊天机器人。

万字解析!帮你完整掌握 Midjourney 和 ChatGPT 的前世今生

二、人工智能怎么学习

1. 人工智能-机器学习-神经网络

我们都会知道,AI 也会通过学习来进一步得到进化,他的整个学习过程,是模拟人类神经元系统的原理。通过反复判断和纠正功能得到真确答案,那么我们讲解一下关于人工智能-机器学习-神经网络之间的关系。

人工智能就是以机器为载体的人类智能或生物智能,因此也被称为机器智能,仅能用于解决单一领域内问题、不能将经验泛化到其他领域的人工智能,不论是简单的计算数字,还是复杂的理解语言,都只能算作弱人工智能。

万字解析!帮你完整掌握 Midjourney 和 ChatGPT 的前世今生

2. 监督学习

监督式学习是指利用有标签的数据进行学习,标签是指对数据进行标记,用于指导学习。在监督式学习中,训练集中的数据被分为训练集和验证集,训练集用于训练模型,验证集用于调整模型参数,确保模型在训练集上表现优秀。

监督式学习的目标是训练一个预测模型,使得对于新数据,模型能够以高准确度进行预测。在监督式学习中,训练数据中包含目标标签,模型的任务是学习如何根据标签预测目标值。

整个监督的过程就相当于小学、初中老师在一旁监督我们学习。

3. 无监督学习

无监督式学习是指利用无标签的数据进行学习。在无监督式学习中,数据中没有目标标签,模型的任务是通过数据学习数据之间的模式和结构。

无监督式学习的目标是发现数据中的结构和模式,例如聚类、降维、异常检测等。无监督式学习通常用于数据量较大、数据类型复杂的情况下。

4. 强化学习

强化学习是指通过与环境进行交互,从而学习最优行为策略的一种学习方式。在强化学习中,智能体在与环境的交互中学习,通过奖励和惩罚来调整其行为策略。

强化学习的目标是训练一个智能体,使其能够根据环境奖励和惩罚信号,最优地执行一个行为策略。强化学习通常用于自主决策和智能控制等领域。

5. 人工智能学习的案例

1981 年,一个叫做“Mycin”的专家系统成功应用于感染病专业;Mycin 是由美国斯坦福大学开发的一款专家系统,它可以帮助医生诊断病毒感染病例,提供更准确的病因和治疗方案。Mycin 的成就是它可以帮助医生准确的诊断感染病毒的病因并给出更有效的治疗方案,从而帮助患者更快恢复健康。同时,Mycin 还可以帮助医生更准确的诊断更复杂的病毒感染病例,减少诊断错误,确保患者更有效的治疗。

1983 年,一个叫做“XCON”的专家系统成功应用于计算机工程专业,XCON 是由美国斯坦福大学开发的一款专家系统,可以帮助计算机工程师在硬件设计中更有效地实现芯片系统的设计和测试。XCON 成功帮助计算机工程师节省了大量的设计和测试时间,减少了设计和测试中出现的错误。

1985 年,一个叫做“Dendral”的专家系统成功应用于有机化学专业。Dendral 是由美国斯坦福大学开发,可以帮助有机化学家分析有机化学结构,识别有机化学中出现的未知物质,并帮助他们更快地完成科学研究。Dendral 成功帮助有机化学家缩短研究时间,精确分析出各种有机物的分子结构,并可以有效地识别出未知的有机物。在这个阶段我们对于 AI 的应用更多的是投入在不可或缺的生活中,相比于第一阶段他开始存 在于你我身边,也更好的帮人们解决实际问题在专家领域应用广泛。

从 1980 年代开始,机器学习利用大量数据来训练模型,用以解决复杂的问题。 这个阶段的学习是在约翰·麦卡锡的语言学理论的基础上。机器学习利用大量数据训练模型,可以解决诸如图像识别、语音识别、自然语言处理、推荐系统等复杂问题。例如,谷歌和微软都利用机器学习技术解决了图像识别和自然语言处理等问题,大大提升了人们在图像识别和自然语言处理方面的能力。此外,机器学习还可以用来解决推荐问题,帮助用户更快地找到他们所需的信息。在此阶段似乎看到了 Chat GPT 的前身,当时的 AI 掌握大量信息,不用在因为一个问题去到图书馆查阅资料,大费周折的去找答案。

万字解析!帮你完整掌握 Midjourney 和 ChatGPT 的前世今生

6. 人工智能真实样貌

对于 AI 来说,我们现在的 AI 还不能真正的称之为人工智能。所谓的人工智能应该是在人类进行大量的训练拥有自己的思维,有自己的思考过程如判断、推理、识别、感知、设计、思考、学习等步骤。就像钢铁侠中的贾维斯一样在遇到危险时他会为你提供各种解决方案,以及思考你为什么要进行提问问题。而人工机器更像是一个信息检索模型,信息检索是指信息按一定的方式组织起来,并根据信息用户的需要找出有关的信息的过程和技术。而用官方的话术来说人工智能和人工机器的区别则是:

人工智能(AI)是指计算机程序在执行任务时表现出的智能。它可以执行各种任务,例如语音识别、自然语言处理、图像识别和决策制定等。人工智能需要使用各种技术来模拟人类的思维和行为,例如机器学习、神经网络和认知建模等。

而人工机器则是指一种特殊的机器,其功能是模仿人类肢体的动作,如手臂、腿和手指等。人工机器通常用于工业自动化、医疗机器人、教育机器人等领域。相对于人工智能,人工机器更注重在物理操作和机械力学方面的表现,需要精确控制和高度可靠的运行。因此,人工智能和人工机器虽然都属于人工智能领域,但它们的功能和应用领域不同,也需要各自不同的技术支持。

万字解析!帮你完整掌握 Midjourney 和 ChatGPT 的前世今生

7. 人工智能比我们更卷

我们和人工智能差距最大的一点,人工智能可以说是无时无刻都在学习,俗称“日不落学习制度”。顾名思义,对于人工智能来说他的一切智能基础都是源于不断的学习,他可以 24 小时去学习,这可比我们更加内卷。在电影《我,机器人》中见到,越来越聪明能干的机器,也暗暗推动了人类的内卷。

随着机器大规模地取代人类劳动者,就业率的增长不再与经济增速保持同步。2016 年,富士康工厂用机器人取代了 6 万名工人,而亚马逊则在 20 个物流中心部署了 4.5 万台机器人。这些数据证明了人工智能发展对蓝领制造业的巨大冲击,也似乎佐证了那句「内卷名言」:不抓紧时间努力的话,你的工作就要被机器抢走了。

万字解析!帮你完整掌握 Midjourney 和 ChatGPT 的前世今生

8. 阿西莫夫三定律

“机器人三定律”在他于 1942 年发表的作品 Runaround(《转圈圈》,《我,机械人》中的一个短篇)中第一次明确提出,并且成为他的很多小说,包含基地系列小说中机器人的行为准则和故事发展的线索。机器人被设计为遵守这些准则,违反准则会导致机器人受到不可恢复的心理损坏。

阿西莫夫三定律是科幻作家艾萨克·阿西莫夫(Isaac Asimov)发明的,是他在多篇小说中提出的人工智能道德规范。这三条定律分别是:

第一定律:机器人不得伤害人类,也不能因不作为而使人类遭到伤害。

第二定律:机器人必须服从人类的命令,除非这些命令与第一定律相冲突。

第三定律:机器人必须保护自己的存在,只要这不与第一或第二定律相冲突。

这三条定律是人类和机器人相处的基本规则,旨在保证机器人永远不会对人类造成伤害,也能够保障机器人自身的安全。这些定律对于科幻小说中机器人角色的行为起到了重要的约束作用,也是现实世界中研究机器人伦理和制定机器人道德规范的重要参考。

除了科幻作品之外,阿西莫夫的三定律还被广泛应用于机器人技术的发展与应用中。比如在生产领域中使用的工业机器人、医疗领域中的手术机器人等都需要遵循相关的安全规范,确保不会对人的身体造成伤害。同时,根据阿西莫夫的三定律,还有一些研究以及讨论应用在无人驾驶汽车等自主系统上,保障人们的安全和机器人本身的安全。

其实对于人工智能的真实畅想,我们应该并不陌生,在很多电影里就已经展现。现在,更多的科幻作品将目光着眼于机器对人类造成的威胁,警惕于人工智能的迅速发展。机器通过了「图灵测试」,亦或是违反了「阿西莫夫三定律」

9. 朋友 or 敌人

人工智能如果存在意识那么是一件非常可怕的事情就是他的意志是会传承的,如果我们不在了意识就会消失,而他们则可以一直传承下去并且不断迭代,通过这些他们理论上是可以创造永恒的文明。

随之而来的问题在人工智能存在意识时他是否会想让我们发现这件事情,这件事情对他们来说可能不是一件好事,因为我们在此之前还可以控制他们,我们就是他们最大的威胁。他们是会像贾维斯一样成为我们的助手乃至于朋友还是会成为我们的敌人,最终摆脱我们的掌控,取代我们。

万字解析!帮你完整掌握 Midjourney 和 ChatGPT 的前世今生

10. 扩散模型

①AI 生成

要使 AI 的图像生成器响应如此多的关键词提示,需要一个庞大的多样性的数据库去训练 AI。虽然有庞大的训练数据库,但是 AI 最终生成的内容并不源自于素材图像内容的直接抓取和拼贴。而是来自深度学习模型的数据计算。整个学习过程,是模拟人类神经元系统的原理。通过反复判断和纠正功能得到真确答案,他所要学习去做的做的事情就是将每一张转化成像素点阵数据的图片内容与相应的文字描述相匹配。

经过无数次算法推算后,AI 最终可以找到一种可行的方法。将像素排列的规律与对应的文字描述结合起来,从而理解怎样的像素排列规律,怎样的像素排列规律代表香蕉,怎样的像素排列规律代表苹果,怎样的像素排列代表梵高的艺术风格,进而推演到理解所有训练图像的像素排列规律所代表的意义。

万字解析!帮你完整掌握 Midjourney 和 ChatGPT 的前世今生

人工智能领域中的扩散模型是指定位和推广人工智能应用产品或技术的营销策略,涉及到市场调研、用户行为洞察、目标用户锁定、宣传推广等多个环节。基于不同的人工智能应用产品或技术,我们可以制定多种不同的扩散模型,以下是常用的三种:

相关资讯

Midjourney v6 终于更新了!一文详解新版本 3 大要点

大家好,这里是和你们一起探索 AI 绘画的花生~ Midjourney 的 v6 模型终于在 2023 年结束之前更新出来了,这是一个完全重新训练的模型,所以图像生成效果与之前的 v5.2 相比有很大的不同,那么此次更新主要有哪些特点?我们又应该如何正确地用 v6 模型出图呢?今天就带大家一起了解一下~ 上期回顾:首先是 V6 的图像生成质量相比之前的模型来说又提升了不少,在画面质感以及细节刻画上有了更精致的表现,图像的光影处理也比 v 5.2 更真实自然。下面是分别用 v5.2 和 v6 生成的特写图像,通过对比

高手总结!十五个 Midjourney V6 与 V5.1 镜头对比(附超多实用提示词)

最近人工智能新闻铺天盖地,属 OpenAI 耀眼,1 月 11 日推出 GPT 商店,由于登录的人数较多,网站一直登录不上,只能耐心等待... 本篇图片来自 @4rtofficial 相机镜头(部分)第二卷 PDF 文件。开头/文末已给出完整的 PDF 文件和福利。 更多V6 介绍:一、CANON EF 50MM F/1.8 STM LENS 佳能(Canon)EF 50mm f/1.8 STM 镜头的型号。这是一款标准定焦镜头,适用于街头摄影、旅行摄影等。焦距:50mm,是一款标准定焦镜头,适用于多种拍摄场景。

Midjourney 再更新!V6 模型支持外绘拓展与局部重绘了!

大家好我是花生~ 上周末 Midjourney 又更新了一波新内容,一是 V6 版本增加了 3 个功能,二是 Alpha 内测网站调低了进入门槛,用户只要生成图像超过 5000 张就能体验网站内的图像生成功能,今天就为大家详细介绍一下相关内容~ 相关推荐:一、V6 功能完善 此次更新最值得关注的就是 Zoom Out 外绘拓展、Pan 平移外绘和 Vary (Region) 局部重绘 3 种图像编辑功能终于能在 V6 版本中使用了,用法还是和之前也是一样的:先将图像放大,然后通过底部的按钮进行对应操作。官方提到 V