人机交互大迈步,OpenAI GPT-4o 演示视频引热议:AI 之间也能聊天

OpenAI 昨日凌晨发布 GPT-4o 模型,可以视为 GPT-4 的升级版本,可以实时推理处理音频、视觉和文本内容,而且能更加无缝地和 ChatGPT 交互。OpenAI 总裁兼联合创始人格雷格・布罗克曼(Greg Brockman)随后发布了上手演示,让两台运行 GPT-4o 的设备进行语音或视频交互。布罗克曼在演示开始之前,表达了自己的期望:让两台 AI 聊天机器人互相交流。布罗克曼向其中 A 聊天机器人讲述了他的期望,并让 B 聊天机器人可以调用摄像头观察周围世界。B 聊天机器人会调用前置摄像头,并清晰地

OpenAI 昨日凌晨发布 GPT-4o 模型,可以视为 GPT-4 的升级版本,可以实时推理处理音频、视觉和文本内容,而且能更加无缝地和 ChatGPT 交互。

人机交互大迈步,OpenAI GPT-4o 演示视频引热议:AI 之间也能聊天

OpenAI 总裁兼联合创始人格雷格・布罗克曼(Greg Brockman)随后发布了上手演示,让两台运行 GPT-4o 的设备进行语音或视频交互。

布罗克曼在演示开始之前,表达了自己的期望:让两台 AI 聊天机器人互相交流。布罗克曼向其中 A 聊天机器人讲述了他的期望,并让 B 聊天机器人可以调用摄像头观察周围世界。

B 聊天机器人会调用前置摄像头,并清晰地描绘出用户的穿着和所处的环境。然后 A 聊天机器人可以与它对话并提出问题,包括移动摄像头和它所看到的内容。

对话中,新版本 ChatGPT 不仅能通过视觉 AI 能力理解摄像头中发生的事情,同时还能够将理解的内容通过语音交互,进行更加丰富有趣的互动,同时还支持中途打断和对话插入,且具备上下文记忆能力。IT之家附上演示视频如下:

相关资讯

微软限制执法机构使用 Azure 人工智能进行实时面部识别

微软似乎并不希望执法部门利用 Azure OpenAI 进行实时面部识别,该公司最近修改了其有关警方使用人工智能服务的行为准则。图源 PixabayIT之家注意到,执法机构近年来越来越多地采用人工智能技术。例如,军警技术供应商 Axon 最近宣布,他们将利用 GPT-4 模型的功能来转录移动摄像头录制的音频,这可以大大加快警方报告的制作速度。然而,最近更新的 Azure 人工智能行为准则直接针对移动摄像头。The Register 发现,微软严格禁止将 Azure 人工智能用于警用执法记录仪和车载摄像头的实时面部识

为巴黎奥运安保“铺路”,戛纳电影节将部署可识别可疑行为的 AI 摄像头

5 月 14-25 日,包括一些举世闻名的影星、名人在内的约 4 万人将飞抵法国蔚蓝海岸,出席一年一度的戛纳电影节。据法新社报道,当地政府部门近日宣布投入了 17 台配备 AI 技术的实验性摄像头,它们可以识别可疑事件或行为,也可以帮助检测被不慎遗弃的包裹。戛纳市长 David Lisnard 表示,当地市政厅从 2019 年起,就已经要求投入监控系统,最后为了应对今年 7 月的巴黎奥运安保工作,监控系统相关法律得到修改之后才获准部署。David 还表示,戛纳已经拥有全法“最为密集”的摄像头网络 —— 一共 884

美国华盛顿装上 AI 防空摄像头,22 年老设备下岗

美国国防部刚刚部署了一个摄像系统,该系统使用了一种基于人工智能的视觉识别系统,名为增强型区域态势感知(ERSA)系统。ERSA 系统还具有机器学习功能,使其在各种锁定模式下追踪物体的能力大大增强,甚至能够捕捉到像以各种模式飞行的鸟儿这样的小目标。