应用
4万亿个晶体管,单机可训练比GPT4大10倍的模型,最快最大的芯片面世
刚刚,芯片创业公司 Cerebras 宣布了该公司历史上最重要的消息,「我们发布了世界上最快的芯片,该芯片拥有高达 4 万亿个晶体管。」一直以来,Cerebras 一直在往「大」的芯片方面发展,此前他们发布的晶圆级引擎(Wafer Scale Engine,WSE-1)面积比 iPad 还大。第二代 WSE-2 虽然在面积上没有变化,但却拥有惊人的 2.6 万亿个晶体管以及 85 万个 AI 优化的内核。而现在推出的 WSE-3 包含 4 万亿个晶体管,在相同的功耗和价格下,WSE-3 的性能是之前记录保持者 WS
四足机器人 ANYmal 解锁新技能:可跑酷,应对工地、灾区等复杂地形
四足机器人 ANYmal 解锁新技能--跑酷。来自苏黎世联邦理工学院的科研团队近日再次升级四足机器人 ANYmal,让其驾驭城市复杂环境,利用运动技巧顺利通过障碍物,并且能熟练应对建筑工地或灾区常见的复杂地形。该团队由机械与工艺工程系的 Marco Hutter 教授领导,结合机器学习与基于模型的控制,升级算法让其可以准确识别和通过碎石堆中的缝隙 / 凹槽,从而可以灵活穿梭复杂地形。ANYmal 可以攀爬障碍物,并执行动态动作从障碍物上跳下来。在这个过程中,ANYmal 像孩子一样通过不断尝试和犯错来学习。现在,当
OpenAI机器人,一出手就是王炸
机器之能报道作者:机器之心编辑部网友:波士顿动力要整点新舞步,才能让Figure 01下热搜。「借助 OpenAI 的能力,Figure 01 现在可以与人全面对话了!」本周三,半个硅谷都在投的明星机器人创业公司 Figure,发布了自己第一个 OpenAI 大模型加持的机器人 demo。这家公司在 3 月 1 日刚刚宣布获得 OpenAI 等公司的投资,才十几天就直接用上了 OpenAI 的多模态大模型。如你所见,得到 OpenAI 大模型能力加持的 Figure 01 现在是这个样子的。它可以为听从人类的命令,
专访上海大学倪兰教授:语言学与手语识别技术的融合突破,解锁交流障碍|GAIR live
在语言学的广阔天地中,手语研究曾是一片未被充分开垦的荒地。 上海大学的倪兰教授,作为中国大陆培养的第一位「手语语言学」方向博士,在谈到自己选择手语方向时仍忍不住感慨,“往前推二十年,语言学界几乎无人涉足这一领域。 ”然而,时光流转至今,这一领域的现状是否得到了改善?
首款生成式 AI 安全解决方案,微软 Copilot for Security 4 月 1 日上线
感谢微软去年 3 月宣布推出 Security Copilot 服务, 当时微软声称这是世界上第一个基于生成式 AI 的安全产品。现在,微软宣布更名后的“Copilot for Security”将于 4 月 1 日正式上线。据介绍,这款行业领先的产品是唯一一款生成式 AI 解决方案,可帮助安全和 IT 专业人员增强其技能、进行更多协作、查看更多内容并更快地做出响应。 在微软最近进行的一项研究中,经验丰富的安全分析师通过使用 Copilot ,在处理常见安全任务中速度提高了 22%,同时将准确性提高了 7%。 此外
定位“神队友”,谷歌发布 SIMA 模型:具备约 600 项游戏技能
谷歌 DeepMind 团队近日发布了 SIMA 模型,通过训练和学习游戏技能,让其整体操作风格更接近于人类。SIMA 的全称是“Scalable, Instructable, Multiworld Agent”(可扩展、可指导、多世界 Agent),目前仅处于研究阶段,未来可以和你一起玩游戏。SIMA 的定位并非是游戏中的 AI NPC,而是要成为你的队友,默契配合你的操作。SIMA 结合自然语言和图像识别技术,能够理解 3D 游戏世界,希望能成为玩家的默契队友。谷歌与 Hello Games、Embracer、
OpenAI 提供支持,Figure 01 人形机器人演示,网友:未来 5-10 年开启疯狂时代
感谢初创公司 Figure AI 今天发布一段新视频,展示了人形机器人 Figure 01 所具备的技能,网友在视频中留言:“未来 5-10 年绝对是一个疯狂的时代”。Figure 01 身高 167.64 厘米(5 英尺 6 英寸),重 59.8 千克(132 磅),最多可负重 20 千克(44 磅),移动速度为每秒 1.2 米(约每小时 2.7 英里)。Figure 01 最大的亮点在于利用 OpenAI 的大型语言模型,可以和人类进行正常的完整对话。由于 OpenAI 模型还支持多模态输入,因此可为 Figu
Midjourney 重大更新!深度解析「角色一致性」命令
预告了好久的 MJ 角色一致性功能终于来了, 新的命令“ --cref ”与 样式参考 “--sref”功能类似,但它不是匹配参考样式,而是尝试让角色匹配 "角色参考 "图像,--cref 目前只适用于 niji 6 和 v6 模型。官方文档说明看下图:一、基础使用方法
在提示后输入 --cref URL 并输入字符图像的 URL 网址,再使用--cw 来修改参考强度
默认强度 100 (--cw 100),使用脸部、头发和衣服
OpenAI 首席技术官:文生视频工具 Sora 数月内将公开发布,拟支持生成音频
《华尔街日报》当地时间 13(今)日刊登了对 OpenAI 首席技术官米拉・穆拉蒂的采访。她表示,Sora 将在今年推出,“可能要等几个月”。穆拉蒂表示,除了面向公众公开提供 Sora 外,OpenAI 还计划加入音频生成功能,可能会使场景更为逼真。此外,公司还计划允许用户自己编辑 Sora 生成的内容,“因为 AI 工具并不总能生成准确的结果”。她说,公司正在试图找寻方法,使用户可以自行编辑、创作影音内容。当被问及 OpenAI 使用了哪些数据来训练 Sora 时,穆拉蒂没有给出非常具体的答案:“我不打算详谈所使
“美版饿了么”DoorDash 上线 AI 新工具:可识别顾客、外卖小哥之间的冲突并提供对策
美国餐饮外卖行业巨头 DoorDash 公司今日宣布,其 App 内将上线一个名为“SafeChat ”的新工具,以检测顾客和外卖小哥之间的交流是否存在辱骂或骚扰言论。官方声称这个新工具每分钟可审查 1400 余条顾客、骑手之间的私信,涵盖包括英语、法语、中文普通话在内的多种语言,但目前仍需通过人工监督审查。功能方面,该工具将针对不同的被骚扰对象提供相对应的措施:若顾客被骚扰:可快捷联系 DoorDash 的支持团队若外卖小哥被骚扰:可通过对应入口快速取消订单。如果在配送过程中被对方辱骂或骚扰,可在不影响自身评级的
马斯克再次嘲讽 OpenAI,为其制作“谎言” Logo
感谢聊天机器人 ChatGPT 在 2022 年发布时,鲜有人知道其母公司 OpenAI 的创始成员之一是埃隆・马斯克。如今时隔一年多,几乎所有关注科技领域的人都知道马斯克与 OpenAI 的渊源,以及他早在 2018 年就已离开该公司的事实。IT之家注意到,马斯克一直对 ChatGPT 持批评态度,经常抨击其“过于政治正确”。他还最近对 OpenAI 提起诉讼,称该公司在成为营利性公司后抛弃了最初的使命。近日马斯克在社交平台 X 上回应网友时,直接将 OpenAI 称为一个“骗子”,还为其制作新 Logo 进行嘲
欧洲议会通过《人工智能法案》:禁止人工智能操纵人类行为、利用人类弱点
感谢欧洲议会今日以 523 票赞成、46 票反对、49 票弃权的压倒性多数支持通过了《人工智能法案》,据悉,这项法案将会“具有里程碑意义”。欧洲议会表示,该法案旨在保护基本权利、环境可持续性等方面免受“高风险人工智能”的影响,同时促进创新,以将欧洲“打造成为该领域的领导者”。综合界面新闻、BBC 报道,该法案将禁止一部分“威胁公民权利”的人工智能应用,包括基于敏感特征的生物识别分类系统,以及从互联网或闭路电视录像中无目标地抓取面部图像,以创建面部识别数据库。此外,操纵人类行为或利用人类弱点的人工智能也将被禁止。该法
马斯克:到 2029 年,人工智能可能会比所有人类都更聪明
感谢人工智能 (AI) 超越人类智能的可能性几十年来一直备受科技专家、科学家和未来学家们的热烈讨论和争辩。然而,自生成式人工智能聊天机器人 ChatGPT 发布以来,关于人工智能将取代人类的争论愈演愈烈。生成式人工智能的出现使得谷歌、 Meta、亚马逊甚至微软等科技巨头纷纷加入战局,竞相研发自己的语言模型。鉴于人工智能领域的飞速发展,特斯拉 CEO 埃隆・马斯克 (Elon Musk) 认为人工智能超越人类智能的时刻即将到来。他甚至大胆预测,到 2029 年底,人工智能将超越整个人类种族的智力水平。马斯克的言论源于
宏碁 CEO 陈俊圣:AI PC 浪潮将逐步推进,显示面板市场供过于求
据台媒《经济日报》报道,宏碁 CEO 陈俊圣在近日接受媒体采访时表示 AI PC 浪潮将随软硬件生态的丰富逐渐推进,目前供应端的主要问题是显示面板供过于求。陈俊圣表示:AMD、英特尔、高通先后推出 AI PC 处理器方案,软件应用方面谷歌、微软也不断出新。整体 AI PC 浪潮不是一蹴而就,而是波波推进,每一波都是一个新的需求刺激点,每一个刺激点宏碁都会跟上。宏碁 CEO 认为 AI PC 概念仍处于爬升状态,产品线和应用都在丰富的过程中,目前商用端市场需求较为明确,整体接受度“还不错”。宏碁目前 AI PC 出货
用大模型测试人格 / 抑郁 / 认知模式:通过游戏剧情发展测量心理特质,清华出品
心理测量在精神健康、自我了解、和个人发展方面都发挥着重要的作用。传统的心理测量范式以自我报告类型的问卷为主,常常通过参与者回忆自己的日常生活行为模式或情绪状态进行测量。这样的测量方式虽然高效便捷,但可能引发参与者的抗拒心理,降低被测意愿。随着大语言模型(LLM)的发展,很多研究发现 LLM 能够展现出稳定的人格特质,模仿人类细微的情绪与认知模式,还能辅助各种各样的社会科学仿真实验,为教育心理学、社会心理学、文化心理学、临床心理学、心理咨询等诸多心理学研究领域,提供了新的研究思路。近日,清华大学的研究团队基于大语言模
Meta 新建两座数据中心集群:内含超 4.9 万块英伟达 H100 GPU,专门训练 Llama3
感谢Meta 公司当地时间 12 日通过官方新闻稿公布了两座新的数据中心集群,该公司正希望通过英伟达的 GPU,在以 AI 为重点的开发中脱颖而出。据悉,这两座数据中心的唯一目的,是在消费者特定应用领域(IT之家注:包含声音或图像识别)中进行 AI 研究和大语言模型的开发,每个集群都包含了 24576 块英伟达 H100 AI GPU,将用于自家大语言模型 Llama 3 的训练。两座新建的数据中心集群都具有 400Gbps 互联功能,其中一个集群采用了 Meta 基于 Arista 7800 自主开发的 Fabr
一帮狠人攒的机器人公司浮出水面,背靠OpenAI,拿下7000万美元融资
机器之能报道编辑:吴昕争夺大脑控制权的战争越来越激烈了。又是一家要做机器人“大脑”的公司,虽然官网都没做好,但已拿到7000万美元投资,包括OpenAI的钱。“字数越少,事情越大” 用来形容这家机器人 AI 公司的初次亮相再合适不过。新公司名叫 Physical Intelligence(简称 PI,同 π ),打开官网的一瞬还以为自己误入某位程序员的个人博客:目前公司官网主页的内容,有些寒酸啊寥寥数句, 雄心立现。“...... 一家将通用 AI 带入物理世界的新公司,......开发基础模型和学习算法,为今
Sora 团队负责人称 Sora“还不是一个产品”,短期不会向公众开放
感谢近日,YouTube 频道 WVFRM Podcast 在其节目中,邀请了 OpenAI 旗下文生视频模型 Sora 的核心团队成员参与访谈。IT之家注:三名成员包括 Bill Peebles、Tim Brooks 和 Aditya Ramesh,均为 Sora 项目负责人。这三名负责人谈到了 Sora 何时可供用户使用的问题,其称目前 Sora 仍处于反馈获取阶段,“还不是一个产品,短期之内不会向公众开放。”对于什么时候把它变成一个产品,我们目前甚至没有任何时间表。我们正处于获取反馈阶段。我们肯定会改进它,但