资讯列表
小爱同学开启多模态功能内测招募,适配小米 14、Redmi K70 系列手机等
感谢小米现已开启“小爱同学多模态功能内测”,拥有以下机型的用户可以在 3 月 23 日之前申请报名,将从 3 月 18 日到 4 月 15 日推送内测:Xiaomi MIX Fold 3Xiaomi MIX Fold 2Xiaomi MIX 4Xiaomi 14 系列 (含 14/14 Pro / 14 Ultra)Xiaomi 13 系列 (含 13/13 Pro / 13 Ultra)Xiaomi 12 系列 (含 12/12 Pro / 12 Pro 天玑版 / 12S / 12S Pro / 12S Ult
对话上交苏剑波教授:直面手语的「方言」多样性与系统「通用性」挑战|GAIR live
作为上海交通大学自动化系的资深教授,苏剑波坚守着一条科研信条:研究工作需源源不断地注入活力。 他曾阐释这一理念:“一个研究者在踏入某一科学领域时,应选取一个能够长期深耕、并随着理论及技术进步而能不断更新研究内容的主题,这才是研究者始终能保持学术活力的根本原因。 ”苏教授的研究领域覆盖了智能机器人理论与技术、多传感器信息与智能融合、机器学习与人机交互等科学研究持续的热点领域。
对话南佛罗里达大学孙宇教授:当大语言模型用于机器人任务规划丨IJAIRR
现代化社会,哪些工作场景最需要机器人的帮助? 在工业领域,有著名的机器人“四大家族”——发那科、ABB、安川、库卡,经过百余年的发展技术越发成熟,在工业场景已经得到深入而广泛的应用。 相比之下,生活场景中的服务型机器人历史则短得多。
腾讯联合清华大学、香港科技大学推出全新图生视频模型“Follow-Your-Click”:用户指哪动哪
感谢腾讯和清华大学、香港科技大学联合推出全新图生视频模型 “Follow-Your-Click”,目前已经上架 GitHub(代码四月公开),同时还发表了一篇研究论文(IT之家附 DOI:2403.08268)。这款图生视频模型主要功能包括局部动画生成和多对象动画,支持多种动作表达,如头部调整、翅膀拍动等。据介绍, Follow-Your-Click 可以通过用户的点击和简短动作提示生成局部图像动画。用户只需点击对应区域,加上少量提示词,就可以让图片中原本静态的区域动起来,一键转换成视频,比如让物体微笑、跳舞或飘动
人形机器人:视频里性感,现实中孤独
机器之能报道编辑:Sia“我们的一些竞争对手曾公开声明,他们使用五根手指的手基本上是为了进行品牌推广。”昨天 Figure 01 又让无数人惊掉下巴。这次不是融资金额,而是一边归置餐具一边唠嗑的能力。形成鲜明对比的是,在北美最大的制造业和供应链贸易盛会 MODEX 上,人形机器人少得可怜。除了 Digit,还有一个给人取零食的人形机器人,不过是靠远程操控。Reflex Robotics 的人形机器人能从不同高度的货架上拿取物品,底部是轮子,不是自主运行,而是远程操控。对手上热搜,一支由八台 Digit 组成的工作小
智谱AI狂飙:与商业化博弈的一年
2023 年 12 月 AI 科技评论在搜狐网络大厦见到智谱AI COO 张帆时,张帆如是说。 张帆在 2023 年 3 月加入中国大模型领域“当红炸子鸡”智谱负责商业化,他感慨:“大模型不仅把知识给压缩了,还把时间给压缩了。 ”最直接的体现是,在过去的 9 个月,张帆以每个月见大约 100 家客户的速度在推进智谱的大模型商业化,2023 年结束时,张帆团队已拜访了上千家客户。
苹果大模型MM1杀入场:300亿参数、多模态、MoE架构,超半数作者是华人
苹果也在搞自己的大型多模态基础模型,未来会不会基于该模型推出相应的文生图产品呢?我们拭目以待。今年以来,苹果显然已经加大了对生成式人工智能(GenAI)的重视和投入。此前在 2024 苹果股东大会上,苹果 CEO 蒂姆・库克表示,今年将在 GenAI 领域实现重大进展。此外,苹果宣布放弃 10 年之久的造车项目之后,一部分造车团队成员也开始转向 GenAI。如此种种,苹果向外界传达了加注 GenAI 的决心。目前多模态领域的 GenAI 技术和产品非常火爆,尤以 OpenAI 的 Sora 为代表,苹果当然也想要在
Sora竟是用这些数据训练的?OpenAI CTO坦白惹众怒
采访首次揭示出 Sora「有所为(比如,将生成效果逼向极限)」和「有所为不为(比如短期内不开放、不生成公众人物)」背后的深层考量——找到一条将 AI 融入日常生活的正确道路是极其困难的,但也绝对值得一试。OpenAI 的 Sora 在今年 2 月横空出世,把文生视频带向了新阶段。它能够根据文字提示生成超现实场景。Sora 的可适用人群受限,但是在各媒体平台上,Sora 的身影无处不在,大家都在期待着使用它。在前几天的访谈中,三位作者透露出 Sora 的更多细节,包括它处理手部时仍然存在困难,但正在优化。他们也对 S
18个月,开创AI药研先例,Insilico公开其首款AI药物研发全过程,登Nature子刊
编辑 | 凯霞去年 6 月,Insilico Medicine 宣布全球首款 AI 设计的药物 INS018_055 进入 II 期临床试验,首批患者给药。近日,Insilico 在《Nature Biotechnology》发表题为《A small-molecule TNIK inhibitor targets fibrosis in preclinical and clinical models》的文章,重点介绍了其声称的第一个 AI 生成和发现的药物 INS018_055 的整个历程。Insilico 创始人
Nature子刊 | KAUST团队训练大语言模型,进行作为近似语义蕴涵的蛋白质功能预测
编辑 | 萝卜皮基因本体论(Gene Ontology,GO)是一种公理理论,目前拥有超过 100,000 条公理,描述了三个子本体中蛋白质的分子功能、生物过程和细胞位置。使用 GO 预测蛋白质的功能需要模型拥有学习和推理能力。科学家已经开发出多种方法来自动预测蛋白质功能,但有效利用 GO 中的所有公理进行知识增强学习仍然是一个挑战。阿卜杜拉国王科技大学(King Abdullah University of Science & Technology,KAUST)的研究人员开发了 DeepGO-SE,这是一种使用预
星舰首次进入太空轨道,里程碑式突破:人类离火星旅行又近一步
它会带我们飞向外星吗?成功入轨,星舰 Starship 这次向前迈进了一大步。美国东部时间 3 月 14 日早上 9 点 25 分,随着人们整齐一致的倒数声,星舰在得克萨斯州南部博卡奇卡海滩附近的 Starbase 基地顺利升空。今天的发射准备工作较为顺利。在短暂推迟后,33 台猛禽发动机均成功点火并顺利升空。火箭在 52 秒达到最大动压点(Max Q),这是一个航空术语,指飞行器在飞行过程中经历最大动态压力的位置。2 分 42 秒后,一二级火箭成功完成了热分离。星舰飞船 SN28 启动 6 台猛禽发动机把自己推离
技术大揭秘!荣耀曝光首款AI PC,MagicBook Pro 16现场谍照抢先看
笔记本未来已来?生成式人工智能在个人电脑(PC)领域的应用成为新一轮角力之处,当前芯片厂商和 PC 品牌商都十分看好 AI PC 市场。相较于普通的 PC,AI PC 通过在电脑端运行经过压缩和优化的大模型,让用户体验到更多生成式 AI 应用,比如文生图、智能创作。2024 开年伊始,芯片和 PC 厂商便开始在 AI PC 领域发力。在 1 月 CES2024 博览会上,英伟达、AMD、英特尔和高通均秀起了各自在集成 AI 技术方面的最新进展。而对于 PC 厂商而言,要抓住这波生成式 AI 发展机遇,通过性能强大、
提升生成式零样本学习能力,视觉增强动态语义原型方法入选CVPR 2024
虽然我从来没见过你,但是我有可能「认识」你 —— 这是人们希望人工智能在「一眼初见」下达到的状态。为了达到这个目的,在传统的图像识别任务中,人们在带有不同类别标签的大量图像样本上训练算法模型,让模型获得对这些图像的识别能力。而在零样本学习(ZSL)任务中,人们希望模型能够举一反三,识别在训练阶段没有见过图像样本的类别。生成式零样本学习(GZSL)是实现零样本学习的一种有效方法。在生成式零样本学习中,首先需要训练一个生成器来合成未见类的视觉特征,这个生成过程是以前面提到的属性标签等语义描述为条件驱动的。有了生成的视觉
讲座预约 | 四位专家大论道 :AI+手语识别,技术革新与应用前景|GAIR live
在这个充满创新的时代,技术正以前所未有的速度改变我们的生活。 然而,对于那些生活在无声世界中的听障和聋哑人士来说,沟通的障碍依然存在。 幸运的是,手语识别技术的出现,为打破这一障碍带来了希望。
海尔联合乐聚展出人形机器人“夸父”:支持洗衣、浇花等操作,搭载开源鸿蒙
感谢3 月 14 日至 16 日,海尔机器人、乐聚机器人在 2024 年中国家电及消费电子博览会(简称:AWE)联合展出了国内首款面向家庭场景的人形机器人 ——Kuavo(夸父)。IT之家从官方获悉,Kuavo(夸父)作为国内首款可跳跃、可适应多地形行走的开源鸿蒙人形机器人,在 AWE 展会现场除了展示其跳跃、快走等控制性能,还展示了洗衣、浇花、插花、晾衣服等近期学习的手部操作成果。去年 12 月底,乐聚机器人与海尔家庭机器人达成了战略合作,计划推进人工智能及机器人在海尔智慧家庭场景中的应用及服务机器人产业发展。官
李开复旗下 AI 模型“零一万物 API”上线,支持文档理解、图片问答等
感谢李开复旗下零一万物日前上线官方 API ,用户可以体验 Yi 系列 AI 大模型,其中包含 yi-34b-chat-0205、yi-34b-chat-200k、yi-vl-plus。IT之家汇总如下:yi-34b-chat-0205:基于开源版进行深度优化的版本,指令遵循能力提升近 30%,模型回复延迟大大降低。适用于聊天、问答、对话、协作、翻译等场景。yi-34b-chat-200k:200K 超长上下文,支持处理约 20w ~ 30w 个中文汉字(约为 1 本《哈利波特》)或英文单词。适用于多篇文档内容理解
3 个实用小技巧,帮你更好地使用 Midjourney 新功能 Character Reference !
大家好,这里是和你们一起探索 AI 绘画的花生~
继推出 Style Reference 风格一致性功能后,Midjourney 终于在前几天上线了备受大家期待的新功能 Character Reference (角色参考),用于保持角色形象的一致性。前面已经有文章详细讲解了 Character Reference 的具体用法,今天我再推荐 3 个实用小技巧,帮助大家更好地使用这项新功能。
相关推荐回顾:一、提升人物面部相似度
Character Reference 可以让我们在生成不同图像时,保持其中角色形象的一致
4 万亿晶体管 5nm 制程,全球最快 AI 芯片 WSE-3 碾压 H100:单机可训 24 万亿参数 LLM,Llama 70B 一天搞定
【新智元导读】AI 世界的进化快得有点跟不上了。刚刚,全球最强最大 AI 芯片 WSE-3 发布,4 万亿晶体管 5nm 工艺制程。更厉害的是,WSE-3 打造的单个超算可训出 24 万亿参数模型,相当于 GPT-4 / Gemini 的十倍大。全球最快、最强的 AI 芯片面世,让整个行业瞬间惊掉了下巴!AI 芯片初创公司 Cerebras 重磅发布了「第三代晶圆级引擎」(WSE-3)。性能上,WSE-3 是上一代 WSE-2 的两倍,且功耗依旧保持不变。90 万个 AI 核心,44GB 的片上 SRAM 存储,让