资讯列表
3D大模型助力,15分钟即可训练高质量、个性化的数字人模型,代码已开放
AIxiv专栏是AI在线发布学术、技术内容的栏目。 过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。 如果您有优秀的工作想要分享,欢迎投稿或者联系报道。
新视角设计下一代时序基础模型,Salesforce推出Moirai-MoE
AIxiv专栏是AI在线发布学术、技术内容的栏目。 过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。 如果您有优秀的工作想要分享,欢迎投稿或者联系报道。
95 后创业者 VAST 宋亚宸:要做3D「抖音」内容平台
2022 年 9 月接近尾声的一天,Google 发布了文生 3D 技术DreamFusion,利用预训练的 2D 文本到图像扩散模型,提出SDS(score distillation scapling)方法,首次完成开放域文本到 3D的合成。 听到这个消息时,宋亚宸非常激动,他在商汤时就很关注 3D 生成技术。 DreamFusion的发布对于整个3D领域是一个大的转折点,意味着 3D内容制作的成本和门槛趋近于零,虽然生成的 3D模型效果很差,但已经是一个大的技术变革。
实时音视频领域拓荒者的十年
2015 年,声网将WebRTC大会引入中国,筹办了第一届面向国内开发者、业务人员和用户的RTC(实时视音频)大会。 在大会开始的前夕,现任声网市场VP、RTC大会主策人彭小欢失眠了,她非常担心明天会不会有人来。 一晃十年过去了,当年的RTC大会早已升级为RTE(实时互联网)大会, 10 月 25 日RTE 2024也如期而至,但早已不用担心是否有人光顾,现场可谓是座无虚席。
大模型已过时,小模型SLM才是未来?苹果正在研究这个
手机还是更适合小模型大模型虽然好,但我的笔记本和手机都跑不动呀。 就算勉强能跑起来,也是奇慢无比。 而与此同时,对适合移动和边缘设备的小模型的需求却在不断增长,因为这些模型似乎才能真正满足人们的日常需求。
软银 CEO 孙正义力挺人工超级智能:正为下一步“重大行动”准备数千亿美元
据路透社报道,软银集团 CEO 孙正义于本周二(29 日)重申,他坚信人工超级智能( ASI )即将到来,并认为实现这一愿景将需要数千亿美元的投入。 孙正义在沙特利雅得的一场会议上对全球商业、科技和金融领袖们表示,人工超级智能的智能将是人类大脑的 1 万倍,并预计将在 2035 年之前诞生。 目前他正在筹集资金,为下一步“重大行动”做好准备。
扎克伯格押注 AI:Meta 正推动美国政府使用其 Llama 模型
Meta 首席执行官马克・扎克伯格在第三季度财报电话会议上表示,Meta 正在“与公共部门合作,推动 Llama AI 模型在整个美国政府机构中得到应用”。 这一消息引发了诸多疑问:哪些政府部门将使用 Meta 的 AI 模型? 这些模型将用于何种用途?
OpenAI ChatGPT 高级语音模式已登陆 Windows 和 Mac 平台,对话更自然
OpenAI 今日宣布,ChatGPT 的高级语音模式(Advanced Voice Mode,简称 AVM)现已登陆 Windows 和 Mac 平台。 AVM 基于 OpenAI 最先进的 GPT-4o 模型运行,允许用户像与真人对话一样与 ChatGPT 进行交流,包括打断、停顿等自然语言行为。 OpenAI 表示,AVM 提供了更自然、实时的对话体验,能够实时感知和回应用户的情绪。
OpenAI 开源 SimpleQA 新基准,专治大模型“胡言乱语”
当地时间 30 日,OpenAI 宣布,为了衡量语言模型的准确性,将开源一个名为 SimpleQA 的新基准,可衡量语言模型回答简短的事实寻求(fact-seeking)问题的能力。 AI 领域中的一个开放性难题是如何训练模型生成事实正确的回答。 当前的语言模型有时会产生错误输出或未经证实的答案,这一问题被称为“幻觉”。
小罗伯特・唐尼拒绝被“AI 化”:如果有高管想这样做,自己就起诉
据《综艺(Variety)》当地时间 28 日报道,小罗伯特・唐尼( Robert Downey Jr. )在最近参加的“ On With Kara Swisher ”播客节目中,向好莱坞发出明确警告:“我打算起诉所有批准使用我的数字复制品的未来高管们。 ”唐尼这位奥斯卡影帝反对利用 AI 技术或深度伪造来在荧幕上复刻他的形象。
Cyan青心意创震撼发布“全面拟人”机器人OrcaⅠ,机器人开始懂情感、有温度
10月30日,Cyan青心意创(原“青心创新/萨恩异创”)正式发布了独立自研的通用人形机器人OrcaⅠ的动态视频,展示了其在“拟人直膝”状态下的行走、爬坡、原地转圈、行走/站立状态下的步态恢复、户外路面行走等运动控制能力,大语言模型加持下兼具情绪表达的自然语言交互能力,以及在保证精准控制状态下丝滑流畅的双臂操作能力。 相较于市面上常见的“机械感”过重的机器人设计,OrcaⅠ摆脱了传统观念中人们对于“机器人”的固有印象,在本体设计、运动控制、自然语言对话、双臂操作等多个维度实现技术突破,并最终赋予其更为灵动自然的运动表现、更为逼真的人机交互、更为精准平滑的双臂操作,全栈技术领域处于行业顶尖水平。 摆脱传统“机械感”,让机器人“全面拟人”如何让机器人“全面拟人”——这是Cyan在机器人研发阶段所重点攻克的技术难点。
AI + 影视,学会「避坑」再「吟诗 」|CNCC 2024
“在影视行业,越专业的人越觉得 AI 就是个傻瓜相机! 它只会产生一些让人「致幻」的 demo,实际应用起来往往会让人大失所望。 ”“艺术创作不仅是结果,也是过程,而 AI 可能永远学不会艺术创作的过程,AICG也永远不会懂艺术。
恭喜!陈长汶教授荣获ACM SIGMM 2024杰出技术成就奖
国际计算机协会(ACM)多媒体会议是计算机图形学与多媒体领域顶级会议,被中国计算机学会列为 A 类会议。 今年的 ACM MM 于 10 月 28 日 – 11 月 1 日在澳大利亚墨尔本隆重举行! 今天,在火热进行中的大会上,SIGMM 杰出技术成就奖揭晓,陈长汶教授因在多媒体计算、通信和应用方面的杰出技术贡献荣获该奖项。
全球首个开源 AI 标准发布,微软、谷歌、亚马逊、Meta、英特尔、三星等巨头制定
在本月底的 2024 年 ALL THINGS OPEN 大会上,开源组织 Open Source Initiative(OSI)正式发布开源人工智能定义(OSAID)1.0 版本,标志着全球首个开源 AI 标准的诞生。 OSI 成立于 1998 年,是一个全球性的非营利组织,旨在定义和“管理”所有开源事物。 OSAID 标准由超过 25 个组织共同设计,包括微软、谷歌、亚马逊、Meta、英特尔、三星、Mozilla 基金会、Linux 基金会、Apache 软件基金会等,该标准可以帮助验证一个 AI 系统是否可以被视为开源 AI。
4499元起,小米15系列发布,还有钻石限定版
在昨天从手机到平板电脑、手表、智能家具和 SU7 Ultra 电车(还有澎湃 OS 2)的发布活动中,雷军表示,其中最推荐买的还属小米 15 手机。 10 月 29 日,小米召开新品发布会,正式发布迈向 AI 全生态的小米澎湃 OS 2(Xiaomi HyperOS 2),和坚持体验优先、产品力越级对标的 Xiaomi 15 系列。 Xiaomi 15 起售价 4499 元,Xiaomi 15 Pro 起售价 5299 元,10 月 31 日早 10 点正式开售。
微软 Github 推出 Spark AI 工具:降低开发门槛,日常语言描述搞定整个应用
科技媒体 maginative 昨日(10 月 29 日)发布博文,报道称微软旗下的代码托管平台 Github 推出 Spark,让用户仅通过日常语言描述,就能构建完善的应用功能。 用户借助 Spark 工具,并不需要编写代码以及深厚的编程专业知识,只需要详细解释希望开发的应用功能,从托管到数据存储,Spark 工具能自动处理所有复杂的技术细节。 AI在线附上演示视频如下: 在描述应用想法时,用户可以实时看到应用构建的过程。
东南大学联合团队“半机械人仿生奥运会”夺冠,在“上肢义肢”组拿下 90 分
感谢AI在线从《苏州日报》和东南大学获悉,当地时间 10 月 26 日下午,在苏黎世举行的第三届全球辅助技术奥运会(又称“半机械人仿生奥运会”)上,中国“90 后”科研团队和来自苏州的参赛残疾人选手徐敏,经过两天三轮的预赛、决赛比拼,最终以 90 分的优异成绩战胜法国队和意大利队,荣获大赛“上肢义肢”组冠军。 据悉,这是中国科研团队首次在国际科技助残赛事中夺得冠军,也打破了往届假肢组均为纯机械式假肢摘得冠军的纪录,展现了人机共融“中国智造”辅助技术站在全球巅峰的绚丽风采。 本次代表中国出征的上肢假肢手团队已在过往的挑战赛中积累了丰富参赛经验。
准确、高效、物理有效,中科大、北大提出「两段式」分子对接统一框架DeltaDock
编辑 | KX分子对接是一种预测配体结合姿势的技术,在基于结构的药物设计中对于理解蛋白质-配体相互作用至关重要。 最近,几何深度学习 (GDL) 对接方法,比传统采样方法具有更高的效率和准确性。 然而,当前的方法通常是针对特定的对接设置量身定制的,并且会忽略蛋白质侧链结构,难以处理大型结合口袋,难以预测物理有效结构。