应用
武汉大学首个人形机器人“天问”亮相:身长 1.7m、体重 65kg、36 个自由度
武汉大学首个人形机器人“天问”亮相。据武汉大学工业科学研究院副教授李淼介绍,“天问”一名的取名灵感来源于《楚辞》中屈原的千古名篇《天问》。▲ 图源武汉大学,下同AI在线获悉,今年 3 月 18 日,人形机器人“天问”项目正式立项;6 月完成样机组装、启动联调联试;如今熟练掌握走、跑、跳等基本技能。经过数月的不断调试和修复,团队从整体结构、电路、算法等层面确定了下肢用强化 sim2real 和上肢用模仿扩散模型的技术路线,并初步实现了机器人稳定行走的功能。“天问”机器人身长 1.7m、体重 65kg,拥有一双引人瞩目
真·AI程序员来了,阿里云「通义灵码」全面进化,全流程开发仅用几分钟
5 分钟就能完成真人程序员一天的工作量。太轻松了。在 AI 程序员的帮助下,一个几乎没有专业编程经验的初中生,在人头攒动的展台上从零开始,两分钟就做出了一个倒计时网页。他需要做的,只是输入包含几句话的提示词。数秒钟后,大模型就生成了代码,还列出了环境需求,复制完代码就可以使用了。这不是程序员父亲带自家小孩做的网红项目,而是人人都可以尝试的事。在大模型的帮助下,代码正在成为低门槛的设计工具。昨天,阿里云完成了「可能是历史上最大规模的模型开源发布」,开源了通义千问 Qwen2.5 系列模型,又在云栖大会的年度重磅发布中
o1带火的CoT到底行不行?新论文引发了论战
To CoT or not to CoT?OpenAI ο1 的诞生极大地提升了人们对 LLM 推理能力和思维链(CoT)的兴趣。一时之间,似乎思维链很快就会成为所有 LLM 的标配,但思维链并非万能,就连 OpenAI 自己也提到 o1 在某些任务上的表现并不比 GPT-4o 强,尤其是以语言为中心的任务。近日,一篇来自德克萨斯大学奥斯汀分校、约翰·霍普金斯大学和普林斯顿大学的论文引发了热议,其模仿莎士比亚《哈姆雷特》的台词提出了一个对 AI 研究者和实践者来说至关重要的问题:To CoT or not to
别Cursor了,集成o1的GitHub Copilot让网友直呼要回归
waitlist 挤爆了。草莓大模型又来了。昨天,GitHub CEO Thomas Dohmke 预告了一则关于草莓模型的推文,一时间勾起了很多人的好奇心。很多人猜测 GitHub Copilot 要集成 OpenAI 最新的 o1 系列模型了,毕竟再不升级就可能要被最近势头很猛的 Cursor 抢走更多用户了。果不其然,今天一大早,GitHub 便官宣了在 VSCode 中为 GitHub Copilot Chat 开放 o1-preview 和 o1-mini 的早期访问权。同时,用户也可以在 Github
OpenAI o1 全方位 SOTA 登顶 lmsys 排行榜:数学能力碾压 Claude 和谷歌 Gemini 模型,o1-mini 并列第一
o1 模型发布 1 周,lmsys 的 6k 投票就将 o1-preview 送上了排行榜榜首。同时,为了满足大家对模型「IOI 金牌水平」的好奇心,OpenAI 放出了 o1 测评时提交的所有代码。万众瞩目的最新模型 OpenAI o1,终于迎来了 lmsys 竞技场的测评结果。不出意外,o1-preview 在各种领域绝对登顶,超过了最新版的 GPT-4o,在数学、困难提示和编码领域表现出色;而 o1-mini 虽然名字中自带「mini」,但也和最新版的 GPT-4o 并列综合排名第二,困难提示、编码、数学
华为云AI原生基础设施CloudMatrix亮相全联接大会
今天,在华为全联接大会 2024 上,华为云发布了 AI 原生云基础设施架构 CloudMatrix,以满足 AI 时代企业对于算力的大规模、高效稳定、弹性灵活的需求。华为云 AI 原生云基础设施架构 CloudMatrix 正式发布如今,AI 算力需求高速增长,正在超越对通用算力的需求。构建弹性、高效的多元算力基础设施是 AI 发展的关键。为了进一步提升 AI 原生基础设施的效能,华为云推出 AI 原生云基础设施 CloudMatrix,将 CPU、NPU、DPU、存储和内存等资源全部互联和池化,构建「一切可池化
OpenAI 再成“榜一大哥”:o1-preview AI 模型更轻松驾驭数学、编程等任务
科技媒体 The Decoder 昨日(9 月 19 日)发布博文,报道称在聊天机器人竞技场(Chatbot Arena)上,OpenAI 的新人工智能模型 o1-preview 和 o1-mini 问鼎榜首。聊天机器人竞技场简介聊天机器人竞技场是一个比较人工智能模型的平台,它利用 6000 多个社区评分对新的 OpenAI 系统进行了评估。结果结果显示,o1-preview 和 o1-mini 尤其在数学任务、复杂提示和编程方面表现出色。Lmsys 提供的数学模型优势图表清楚地显示,o1-preview 和 o1
Runway Gen-3的视频转绘功能太牛了!大片制作0门槛!
大家好我是花生~
Runway 在推出 Gen-3 Alpha 视频生成模型后,还一直有一些小的更新,比如推出了新的 Turbo 模型,生成速度比原来快了 7 倍;支持尾帧控制;支持将视频延长至 40s 等,都是非常符合用户需求的优化提升。
而它前几天推出的 V2V (Video to Video) 功能,更是将 AI 视频在风格转绘上的水平提升到了一个新的高度,再次秀了一波「AI 视频生成王者」的实力。该功能一经推出就受到众多专业 AI 视频创作者的称赞,并迅速衍生出多种玩法,很有潜力成为一个新的流量风口,喜欢
第三波!2024年9月精选实用设计工具合集
大家好,这是 2024 年 9 月的第 3 波干货合集!
今天推荐近期发现的一些有用、有意思的设计素材。工具合集类的网站一直是我的最爱,今天的合集当中有一个专注于发掘宝藏设计资源的合集网站,此外,还有 Spotify 出品的创作工具,可以生成 UI 和代码的多功能 AI 工具,还有渐变背景素材,以及非常实用的一套 Midjourney 风格提示词库。
当然,在继续阅读下去之前,记得看看往期干货中有没有你感兴趣的素材:下面我们具体看看这一期的干货:
1、宝藏设计资源和工具合集
,你的设计速度不够快、效率不够高、效果不
本土自研再上新!安谋科技发布首款“玲珑”DPU和新一代VPU
2024年9月19日,安谋科技(中国)有限公司(以下简称“安谋科技”)正式推出本土自研的首款“玲珑”D8/D6/D2显示处理器,以及新一代的“玲珑”V510/V710视频处理器。聚焦国内前沿技术趋势,安谋科技自研业务产品矩阵持续扩容,全新亮相的处理器新品能够满足多样化智能应用场景的性能功耗配置需求,助力国产芯片厂商在多媒体技术领域实现创新跃进。安谋科技产品研发副总裁刘浩表示:“当前,基于视频图像的数字多媒体技术与各领域的融合正不断提速,由此催生了许多智能化程度更高、人机交互更流畅的新业态和新应用。在‘玲珑’D8/D
研究称生成式 AI 耗水量巨大:使用 GPT-4 生成 100 字文本需消耗 3 瓶水
据《华盛顿邮报》报道,美国加州大学河滨分校的一项新研究揭示了生成式 AI 的惊人环境成本,尤其是其对水资源的消耗。研究发现,即使只是生成文本,AI 也需要大量的水来冷却服务器。再加上其对电网的巨大压力,进一步凸显了 AI 发展的环境挑战。图源 Pexels研究指出,AI 的用水量因州和数据中心位置的不同而有所差异,但总体而言,水耗与电费成反比。AI在线注意到,得州的水耗最低,生成一封 100 字的电子邮件仅需 235 毫升水,而华盛顿则高达 1,408 毫升,相当于三瓶 16.9 盎司的矿泉水。此外,数据中心本身就
谷歌前高管创办的 Brightband 公司获 1000 万美元融资,可用 AI 预测极端天气
据彭博社报道,由谷歌前高管创办的初创公司 Brightband 周四(今日)宣布,其已获得 1000 万美元(AI在线备注:当前约 7089.5 万元人民币)A 轮融资。该轮融资由 Prelude Ventures 领投,参与投资者包括贝恩资本旗下的 Future Back Ventures 和 Slack 联合创始人卡尔・亨德森。图源 Pexels该公司由前谷歌高管朱利安・格林和三位科学家于今年夏天创立,旨在利用 AI 技术改善天气预报。该公司目的是开发一款付费产品,以及一个基于原始天气观测训练的开源 AI 预测
普渡初代类人形机器人 PUDU D7 发布:算力 200 TOPS、自由度 30 DOF
普渡机器人今日发布初代类人形机器人 PUDU D7,基于仿生双臂和全向移动底盘设计,能够在多个场景中执行复杂任务操作。AI在线注意到,PUDU D7 预计将在 2025 年实现商业化落地。该机器人身高 165 厘米,重量 45 公斤,仿生臂的单臂展达到 65 厘米,整机拥有 30 个自由度,配备灵巧手后,自由度将提升至 50。PUDU D7 具备类人的构型,底部配备通用的移动能力,底盘支持 360 度全向移动,最大速度 2 米 / 秒,能在最大 10 度的斜坡上稳定运行。D7 的电池容量超过 1KWh,可持续工作超
引领通用具身新时代:普渡发布首款类人形机器人PUDU D7
9月19日,全球服务机器人领军企业普渡机器人正式发布其初代类人形机器人PUDU D7。基于仿生双臂和全向移动底盘设计,PUDU D7能够在多个场景中执行复杂任务操作,更好地满足跨行业客户真实的多样化需求。该款机器人预计将在2025年实现全面商业化落地,为通用具身服务机器人的商业化应用带来突破性变革。普渡初代类人形机器人PUDU D7普渡机器人创始人兼CEO张涛表示:“作为普渡的核心价值观,发明家精神推动我们不断创新与进步。PUDU D7的发布标志着我们在构建专用型机器人、类人形机器人和人形机器人的重要一步。通过推进
快手可灵 AI 发布 1.5 模型:新增“运动笔刷”,支持生成 1080p 视频
快手可灵 AI 今日面向全球发布可灵 1.5 模型,新增“运动笔刷”功能。据介绍,“运动笔刷”功能为图片中的元素(人或物体等)指定运动轨迹,还支持额外指定静止区域,提升画面可控性。同时,可灵 AI 的视频画质有所提升,支持生成 1080p 视频,同时构图更美观、动作更合理、文本相关性提升。快手高级副总裁盖坤 9 月 13 日在投资者日上披露,截至目前,已有超过 260 万人使用过快手的视频生成大模型可灵 AI,并累计生成超 2700 万个视频。产品发布以来,可灵 AI 已进行了 9 次迭代和升级,近期,可灵 AI
CoT能让模型推理能力无上限?田渊栋、LeCun下场反对:两层MLP还能模拟全世界呢
「这相当于在理论上,两层神经网络在理论上可以拟合任何数据,我们就盲目相信并应用在所有场景中。」大模型新范式 OpenAI o1 一经发布,如何「复刻」出 o1 便成为了 AI 圈最热的话题。由于 OpenAI 对技术细节守口如瓶,想从 AI 那里「套话」,让它复述完整的内部推理过程,多问几句,OpenAI 直接发邮件警告要撤销你的使用资格。想从技术报告中想找出点蛛丝马迹,也同样困难。于是,大家将目光转向了以往类似的研究成果,希望从中找到些线索。比如,Google Brain 推理团队创建者 Denny Zhou 立
阿里云Qwen2.5发布!再登开源大模型王座,Qwen-Max性能逼近GPT-4o
人工智能领域再度迎来重磅消息! 2023 年 8 月,通义首次开源后迅速引起全球开发者的关注和热议,短短一年时间内,阿里云大模型又迎来了重要升级。 在 9 月 19 日的云栖大会上,CTO 周靖人宣布:通义千问发布新一代开源模型 Qwen2.5,开源旗舰模型 Qwen2.5-72B 性能超越 Llama 3.1-405B,再次登上全球开源大模型的王座;通义旗舰模型 Qwen-Max 全方位升级,性能已经逼近 GPT-4o。 发布现场,图源:泽南通义千问凭借不
留子们用火星文写避雷帖,AI竟看懂了?我们实测:几乎全军覆没
AI好好用报道编辑:杨文这种用法也是够邪门的。留子们在写一种很新的差评。由于全球点评打卡平台,都有个自动翻译的功能,为了防止被店家骚扰,也为了给同胞避雷,身在海外的国人们,想出各种奇招优雅给差评。例如,打 5 分忽悠老板,再用中文加密:用中文谐音写了一堆差评,然后在结尾给个虚假好评,商家拿翻译器一翻,只看到一个早餐不错。还有人费老大劲儿,用米粒摆出「报吃」的汉字,中国人一看就懂:更有甚者,重启上古火星文,直接干翻各类翻译器。但是,最近有网友发现,这段如同计算机乱码的火星文差评,AI 竟然也能读懂啦。-1-「哈利・波