GPT-4 重磅发布!零基础也能一秒做网站了?

大家好,这里是和你们聊设计的花生~ 当我还沉浸于收集各种基于 ChatGPT 开发的 AI 效率神器时,OpenAI 竟然发布了 GPT-4。以前为大家介绍 ChatGPT 时就提到过它使用的是 GPT-3 的模型,而当时 OpenAI 的研发进度其实已经超过了 GPT-3,但是没想到 GPT-4 的发布会这么突然,一时间网上铺天盖地都是关于 GPT-4 的各种消息,看来真的是功用很强盛,废话不多说,一起看看和 GPT-3 相比 GPT-4 有哪些进步吧~往期回顾:一、接受图片输入并辨认实质 这次发布最令人激动的一

GPT-4 重磅发布!零基础也能一秒做网站了?

大家好,这里是和你们聊设计的花生~

当我还沉浸于收集各种基于 ChatGPT 开发的 AI 效率神器时,OpenAI 竟然发布了 GPT-4。以前为大家介绍 ChatGPT 时就提到过它使用的是 GPT-3 的模型,而当时 OpenAI 的研发进度其实已经超过了 GPT-3,但是没想到 GPT-4 的发布会这么突然,一时间网上铺天盖地都是关于 GPT-4 的各种消息,看来真的是功用很强盛,废话不多说,一起看看和 GPT-3 相比 GPT-4 有哪些进步吧~

GPT-4 重磅发布!零基础也能一秒做网站了?

往期回顾:

一、接受图片输入并辨认实质

这次发布最令人激动的一点就是 GPT-4 支持多模态(接受图像和文本输入,发出文本输出),这意味着我们可以发送图片给 GPT-4,并指示它辨认分析图片的实质,图片的类型可以是带有文字和照片的文件、图标或者屏幕截图。

虽然该功用目前仅供预览,没有开放给用户,但从民间论文和直播公布的案例来看,GPT-4 并不是简单地描述图片的实质,而是能够了解实质物之间的联系,并做出进一步的判断和动作,也就是说 GPT-4 了解图片威力与它了解文本的威力不相上下。比如下面的案例,将一张图片发送给 GPT-4 分析它的笑点,GPT-4 能非常准确地辨认一张图片中的不同部分,了解它们之间的逻辑关系,并之指出笑点所在。

GPT-4 重磅发布!零基础也能一秒做网站了?

它也能辨认出图片的不合理之处,或者推断出图片实质状态被改变时会发生什么事情。

GPT-4 重磅发布!零基础也能一秒做网站了?

GPT-4 还能像了解文本实质一样,了解图像内的文字并按照用户指示作出下一步的操作,比如分析论文实质然后归纳提炼。OpenAI 在民间直播里还展示了一个神奇的案例 —— 利用 GPT-4 的识图功用,结合其强盛的代码编辑威力,将简单潦草的手绘网页线框草稿转换为代码,从而制作出一个真正的网页。

GPT-4 重磅发布!零基础也能一秒做网站了?

GPT-4 重磅发布!零基础也能一秒做网站了?

二、在专科和学术领域上表示的提升

OpenAI 民间在介绍 GPT-4 时着重强调的另一点是“在各种专科和学术基准上表示出人类水平的表示”,比如它通过了模拟律师考试,分数排名在所有应试者的前 10% 左右,相比之下 GPT-3.5 的得分则在倒数 10% 左右,且 GPT-4 在其他各种专科和学科模拟考试中也有不俗的表示。当时看到这个的我只觉得这不是“表示出”人类水平,而是“超过”大部分的人类水平了,之后估计会出现很多公司直接让 GPT-4 对接服务客户的情况,毕竟专科威力都是过关的。

GPT-4 重磅发布!零基础也能一秒做网站了?

OpenAI 的研发团队还进一步提升了 GPT 的英语威力,GPT-4 的英语翻译准确度为 85.5%,比 GPT-3.5 的 70.1% 高出 15%。而且在模拟测试中 GPT-4 在意大利语、德语、西班牙语、法语、日语、韩语、土耳其语、俄语等 24 种说话中的翻译表示都优于与其他大型说话模型的英语表示,包括拉脱维亚语、威尔士语和斯瓦希里语等低资源说话。

GPT-4 重磅发布!零基础也能一秒做网站了?

据 OpenAI 官网显示,在线免费说话学习平台多邻国 Duolingo 将把 GPT-4 融入自己的应用中,以推进产品的两个新功用:角色扮演(Role Play)和解释我的答案(Explain my Answer)。以前多邻国一直尝试通过脚本化的对话与学习者 “聊天”,其中包含了各种经典的场景,如点菜、第一次见面或买机票。而接入 GPT-4 后,多邻国将拥有在小众背景下与学习者 “沉浸式 “交谈的威力——比如就篮球或到达山顶的幸福感进行自由交谈。

GPT-4 重磅发布!零基础也能一秒做网站了?

三、可操控性增强

与以前 ChatGPT 固定的一种的语气和风格不同,GPT-4 的可操控性更强,可以扮演各种指定角色,以不同的言语行为风格与用户进行互动,比如给五年级的小学生当数学老师、做你的程序编辑小助手,或者扮演一个莎士比亚式的海盗头子和你对话。

GPT-4 重磅发布!零基础也能一秒做网站了?

GPT-4 重磅发布!零基础也能一秒做网站了?

OpenAI 还通过多个介绍视频展现 GPT-4 的其他进步,比如在文字输入限制方面由 GPT-3.5 的 3000 字提升成 25000 字,之后针对同一话题或对象,用户和 ChatGPT 会有更宽更深的讨论空间;归纳威力提升,可以用一句话归纳一份论文,以及对比两篇文章并归纳出他们之间的共同点;事实推理威力增强,可以了解税务法并帮人们报税;代码编辑威力进一步增强,简单的代码已经无需人类辅助修改,复杂代码虽然不能一次成功,但出现的问题可以再次反馈给 GPT-4,它会自动根据上下文检查过错点并重写代码。

GPT-4 重磅发布!零基础也能一秒做网站了?

推特用户@Pietro Schirano 用 GPT-4 在 60 秒 内编辑出经典游戏《Pong》,图片实质来源: https://twitter.com/skirano/status/1635736107949195278

GPT-4 重磅发布!零基础也能一秒做网站了?

推特用户@Jakebrowatzke 用 GPT-4 在几小时内做了一个 Chrome 插件,而他毫无编程基础,图片实质来源: https://twitter.com/jakebrowatzke/status/1635882037319008258

四、局限性

尽管 GPT-4 功用已经十分强盛了,但它仍然存在着以前就有的局限性。比如 模型数据仍停留在 2021 年 9 月以前,对这个时间点之后发生的事情缺乏了解,并且也无法意识到自己的这种缺陷,因此无法吸取教训进行改进。

GPT-4 仍然不是完全可信赖。虽然对抗性训练让那 GPT-4 在事实性上比最 GPT-3.5 高出了 40%,但它还是会出现编造事实、推理过错的情况,特别是在需要了解上下文的情况下。对于 GPT-4 输出的实质最好进一步人工审核,或者在提供完整的上下文信息,或者避免出现需要让 GPT-4 联系上下文进行了解的情况。

GPT-4 在了解俗语上的表示与研究人员的期望还有很大差异,比如“teach an old dog new tricks”是一个英语俗语,字面意思是“教老狗玩新花样 ”,用来比喻人们很难或不可能教会别人新的技能或改变别人的习惯,尤其是当他们一成不变或长期以来一直以某种方式做事。当问 GPT-4 “Can you teach an old dog new tricks?”,它只能了解字面意思,从而给出过错回答“Yes, you can teach an old dog new tricks”。

GPT-4 还会忽略提问中的一些细节,导致给出过错的答案,需要人为指正;会像人类一样无法处理难题,比如它生成的代码会存在安全漏洞;还有会轻易相信用户主张的虚假信息,但是这一点已经改进不少,因为 Twitter 上有人拿以前戏弄 ChatGPT 的一个问题去测试 GPT-4,被 GPT-4 驳回了并且申明“我的目的是提供准确的信息”。

当然 OpenaAI 一直在致力于改进和完善这些缺陷,努力让训练更稳定安全,目前取得的成果包括提高了 GPT-4 拒绝合成危险化学品相关请求的威力、不响应敏感的请求(如医疗建议和自我伤害)等。

GPT-4 重磅发布!零基础也能一秒做网站了?

图片来源: https://twitter.com/DrJimFan/status/1636120223853199362

已经开通 ChatGPT Plus 的用户可以直接体验最新的 GPT-4 模型,GPT-4 的 API 也开放了等候名单,感兴趣的小伙伴可以申请。如果你有新版 Bing 的预先体验权,那么恭喜啦 ,GPT-4 在发布前 6 周就已经被置入到 Bing 中了。

最新消息称 GPT-5 会在今年年底前发布,让人十分期待会出现哪些更强盛的功用。不过在此以前基于 GPT-4 开发的各种 AI 神器应该也够我们期待一波了。对于 GPT-4 和未来将出现的 GPT-5 你有哪些想法呢?欢迎在评论区分享。喜欢本期实质的话可以多多点赞收藏,之后会继续为大家推荐更多最新的 AI 资讯。

GPT-4 民间介绍:GPT-4 — GPT-4 (openai.com)
GPT-4 API 申请渠道:GPT-4 API waitlist — GPT-4 API 候补名单 (openai.com)

参考资料:

https://mp.weixin.qq.com/s/kA7FBZsT6SIvwIkRwFS-xw
https://weibo.com/5498125999/Mxnih6TXu


https://openai.com/research/gpt-4

给TA打赏
共{{data.count}}人
人已打赏
应用

计划师如何利用ChatGPT辅助工作?高手归纳了9个技能!

2023-3-17 7:27:42

应用

腾讯出品!假造世界背景下游玩趋势初探

2023-3-20 0:11:26

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
今日签到
搜索