AI资讯列表 - AI在线

AI 让手机任务自动“跑”起来！我国高校最新研究，简化移动设备操作

AI 解放碳基生物双手，甚至能让你的手机自己玩自己！你没听错 —— 这其实就是移动任务自动化。在 AI 飞速发展下，这逐渐成为一个新兴的热门研究领域。

Python 成 GitHub 最受欢迎编程语言，AI 成主要推动力

GitHub 年度报告《Octoverse》显示，Python 首次超越 JavaScript 成为 GitHub 上最受欢迎的编程语言。这主要是受到人工智能（AI）开发需求激增的推动，Python 还被广泛应用于数据科学和开源项目的开发。报告指出，与生成式 AI 相关的项目贡献量在过去一年中增长了 59%，AI 相关的公共项目的贡献量几乎比 2023 年翻了一番，印度、德国、日本和新加坡是这些贡献的主要来源。

知乎直答上线专业搜索：国内首个 AI 搜索、正版论文库一站式解决方案

知乎日报今天宣布，知乎 AI 搜索产品知乎直答正式上线“专业搜索”功能，引入维普、知乎精选等专业内容源，涵盖超过 5000 万篇中英文文献数据，是国内首个提供 AI 搜索和正版论文库一站式解决方案的产品。据介绍，“专业搜索”旨在为专业人士和学术研究者提供更深入、更高效的知识获取方式。相比于通用的 AI 搜索，其在专业数据源、文件上传和交互体验三大方面进行了重要升级，将为专业工作和学术研究的效率提升带来巨大帮助。

全自动打工「人」！波士顿动力Atlas进厂视频火了，不断电不下班

波士顿动力Atlas进厂打工，不靠远程操控，转身动作像惊悚电影。波士顿动力的人形机器人，进厂了。本周三，波士顿动力发来一条喜讯。

登上生图排行榜第一的red_panda，是家创业公司，不是国产模型

大家别猜了，「red_panda」（小熊猫）模型有主了。谜底解开了。前几天在 Hugging Face 文本转图像排行榜上排名第一的 red_panda，是一个名为 Recraft V3 的模型，由 AI 初创公司 Recraft 提供。

3D大模型助力，15分钟即可训练高质量、个性化的数字人模型，代码已开放

AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年，AI在线AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。

新视角设计下一代时序基础模型，Salesforce推出Moirai-MoE

95 后创业者 VAST 宋亚宸：要做3D「抖音」内容平台

2022 年 9 月接近尾声的一天，Google 发布了文生 3D 技术DreamFusion，利用预训练的 2D 文本到图像扩散模型，提出SDS（score distillation scapling）方法，首次完成开放域文本到 3D的合成。听到这个消息时，宋亚宸非常激动，他在商汤时就很关注 3D 生成技术。 DreamFusion的发布对于整个3D领域是一个大的转折点，意味着 3D内容制作的成本和门槛趋近于零，虽然生成的 3D模型效果很差，但已经是一个大的技术变革。

实时音视频领域拓荒者的十年

2015 年，声网将WebRTC大会引入中国，筹办了第一届面向国内开发者、业务人员和用户的RTC（实时视音频）大会。在大会开始的前夕，现任声网市场VP、RTC大会主策人彭小欢失眠了，她非常担心明天会不会有人来。一晃十年过去了，当年的RTC大会早已升级为RTE（实时互联网）大会， 10 月 25 日RTE 2024也如期而至，但早已不用担心是否有人光顾，现场可谓是座无虚席。

大模型已过时，小模型SLM才是未来？苹果正在研究这个

手机还是更适合小模型大模型虽然好，但我的笔记本和手机都跑不动呀。就算勉强能跑起来，也是奇慢无比。而与此同时，对适合移动和边缘设备的小模型的需求却在不断增长，因为这些模型似乎才能真正满足人们的日常需求。

软银 CEO 孙正义力挺人工超级智能：正为下一步“重大行动”准备数千亿美元

据路透社报道，软银集团 CEO 孙正义于本周二（29 日）重申，他坚信人工超级智能（ ASI ）即将到来，并认为实现这一愿景将需要数千亿美元的投入。孙正义在沙特利雅得的一场会议上对全球商业、科技和金融领袖们表示，人工超级智能的智能将是人类大脑的 1 万倍，并预计将在 2035 年之前诞生。目前他正在筹集资金，为下一步“重大行动”做好准备。

扎克伯格押注 AI：Meta 正推动美国政府使用其 Llama 模型

Meta 首席执行官马克・扎克伯格在第三季度财报电话会议上表示，Meta 正在“与公共部门合作，推动 Llama AI 模型在整个美国政府机构中得到应用”。这一消息引发了诸多疑问：哪些政府部门将使用 Meta 的 AI 模型？这些模型将用于何种用途？

OpenAI ChatGPT 高级语音模式已登陆 Windows 和 Mac 平台，对话更自然

OpenAI 今日宣布，ChatGPT 的高级语音模式（Advanced Voice Mode，简称 AVM）现已登陆 Windows 和 Mac 平台。 AVM 基于 OpenAI 最先进的 GPT-4o 模型运行，允许用户像与真人对话一样与 ChatGPT 进行交流，包括打断、停顿等自然语言行为。 OpenAI 表示，AVM 提供了更自然、实时的对话体验，能够实时感知和回应用户的情绪。

OpenAI 开源 SimpleQA 新基准，专治大模型“胡言乱语”

当地时间 30 日，OpenAI 宣布，为了衡量语言模型的准确性，将开源一个名为 SimpleQA 的新基准，可衡量语言模型回答简短的事实寻求（fact-seeking）问题的能力。 AI 领域中的一个开放性难题是如何训练模型生成事实正确的回答。当前的语言模型有时会产生错误输出或未经证实的答案，这一问题被称为“幻觉”。

小罗伯特・唐尼拒绝被“AI 化”：如果有高管想这样做，自己就起诉

据《综艺（Variety）》当地时间 28 日报道，小罗伯特・唐尼（ Robert Downey Jr. ）在最近参加的“ On With Kara Swisher ”播客节目中，向好莱坞发出明确警告：“我打算起诉所有批准使用我的数字复制品的未来高管们。 ”唐尼这位奥斯卡影帝反对利用 AI 技术或深度伪造来在荧幕上复刻他的形象。

Cyan青心意创震撼发布“全面拟人”机器人OrcaⅠ，机器人开始懂情感、有温度

10月30日，Cyan青心意创（原“青心创新/萨恩异创”）正式发布了独立自研的通用人形机器人OrcaⅠ的动态视频，展示了其在“拟人直膝”状态下的行走、爬坡、原地转圈、行走/站立状态下的步态恢复、户外路面行走等运动控制能力，大语言模型加持下兼具情绪表达的自然语言交互能力，以及在保证精准控制状态下丝滑流畅的双臂操作能力。相较于市面上常见的“机械感”过重的机器人设计，OrcaⅠ摆脱了传统观念中人们对于“机器人”的固有印象，在本体设计、运动控制、自然语言对话、双臂操作等多个维度实现技术突破，并最终赋予其更为灵动自然的运动表现、更为逼真的人机交互、更为精准平滑的双臂操作，全栈技术领域处于行业顶尖水平。摆脱传统“机械感”，让机器人“全面拟人”如何让机器人“全面拟人”——这是Cyan在机器人研发阶段所重点攻克的技术难点。

AI + 影视，学会「避坑」再「吟诗」｜CNCC 2024

“在影视行业，越专业的人越觉得 AI 就是个傻瓜相机！它只会产生一些让人「致幻」的 demo，实际应用起来往往会让人大失所望。 ”“艺术创作不仅是结果，也是过程，而 AI 可能永远学不会艺术创作的过程，AICG也永远不会懂艺术。

恭喜！陈长汶教授荣获ACM SIGMM 2024杰出技术成就奖

国际计算机协会（ACM）多媒体会议是计算机图形学与多媒体领域顶级会议，被中国计算机学会列为 A 类会议。今年的 ACM MM 于 10 月 28 日 – 11 月 1 日在澳大利亚墨尔本隆重举行！今天，在火热进行中的大会上，SIGMM 杰出技术成就奖揭晓，陈长汶教授因在多媒体计算、通信和应用方面的杰出技术贡献荣获该奖项。

资讯列表