资讯列表

AI 让手机任务自动“跑”起来!我国高校最新研究,简化移动设备操作

AI 解放碳基生物双手,甚至能让你的手机自己玩自己! 你没听错 —— 这其实就是移动任务自动化。 在 AI 飞速发展下,这逐渐成为一个新兴的热门研究领域。

Python 成 GitHub 最受欢迎编程语言,AI 成主要推动力

GitHub 年度报告《Octoverse》显示,Python 首次超越 JavaScript 成为 GitHub 上最受欢迎的编程语言。 这主要是受到人工智能(AI)开发需求激增的推动,Python 还被广泛应用于数据科学和开源项目的开发。 报告指出,与生成式 AI 相关的项目贡献量在过去一年中增长了 59%,AI 相关的公共项目的贡献量几乎比 2023 年翻了一番,印度、德国、日本和新加坡是这些贡献的主要来源。

知乎直答上线专业搜索:国内首个 AI 搜索、正版论文库一站式解决方案

知乎日报今天宣布,知乎 AI 搜索产品知乎直答正式上线“专业搜索”功能,引入维普、知乎精选等专业内容源,涵盖超过 5000 万篇中英文文献数据,是国内首个提供 AI 搜索和正版论文库一站式解决方案的产品。 据介绍,“专业搜索”旨在为专业人士和学术研究者提供更深入、更高效的知识获取方式。 相比于通用的 AI 搜索,其在专业数据源、文件上传和交互体验三大方面进行了重要升级,将为专业工作和学术研究的效率提升带来巨大帮助。

全自动打工「人」!波士顿动力Atlas进厂视频火了,不断电不下班

波士顿动力Atlas进厂打工,不靠远程操控,转身动作像惊悚电影。 波士顿动力的人形机器人,进厂了。 本周三,波士顿动力发来一条喜讯。

登上生图排行榜第一的red_panda,是家创业公司,不是国产模型

大家别猜了,「red_panda」(小熊猫)模型有主了。 谜底解开了。 前几天在 Hugging Face 文本转图像排行榜上排名第一的 red_panda,是一个名为 Recraft V3 的模型,由 AI 初创公司  Recraft 提供。

3D大模型助力,15分钟即可训练高质量、个性化的数字人模型,代码已开放

AIxiv专栏是AI在线发布学术、技术内容的栏目。 过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。 如果您有优秀的工作想要分享,欢迎投稿或者联系报道。

新视角设计下一代时序基础模型,Salesforce推出Moirai-MoE

AIxiv专栏是AI在线发布学术、技术内容的栏目。 过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。 如果您有优秀的工作想要分享,欢迎投稿或者联系报道。

95 后创业者 VAST 宋亚宸:要做3D「抖音」内容平台

2022 年 9 月接近尾声的一天,Google 发布了文生 3D 技术DreamFusion,利用预训练的 2D 文本到图像扩散模型,提出SDS(score distillation scapling)方法,首次完成开放域文本到 3D的合成。 听到这个消息时,宋亚宸非常激动,他在商汤时就很关注 3D 生成技术。 DreamFusion的发布对于整个3D领域是一个大的转折点,意味着 3D内容制作的成本和门槛趋近于零,虽然生成的 3D模型效果很差,但已经是一个大的技术变革。

实时音视频领域拓荒者的十年

2015 年,声网将WebRTC大会引入中国,筹办了第一届面向国内开发者、业务人员和用户的RTC(实时视音频)大会。 在大会开始的前夕,现任声网市场VP、RTC大会主策人彭小欢失眠了,她非常担心明天会不会有人来。 一晃十年过去了,当年的RTC大会早已升级为RTE(实时互联网)大会, 10 月 25 日RTE 2024也如期而至,但早已不用担心是否有人光顾,现场可谓是座无虚席。

大模型已过时,小模型SLM才是未来?苹果正在研究这个

手机还是更适合小模型大模型虽然好,但我的笔记本和手机都跑不动呀。 就算勉强能跑起来,也是奇慢无比。 而与此同时,对适合移动和边缘设备的小模型的需求却在不断增长,因为这些模型似乎才能真正满足人们的日常需求。

软银 CEO 孙正义力挺人工超级智能:正为下一步“重大行动”准备数千亿美元

据路透社报道,软银集团 CEO 孙正义于本周二(29 日)重申,他坚信人工超级智能( ASI )即将到来,并认为实现这一愿景将需要数千亿美元的投入。 孙正义在沙特利雅得的一场会议上对全球商业、科技和金融领袖们表示,人工超级智能的智能将是人类大脑的 1 万倍,并预计将在 2035 年之前诞生。 目前他正在筹集资金,为下一步“重大行动”做好准备。

扎克伯格押注 AI:Meta 正推动美国政府使用其 Llama 模型

Meta 首席执行官马克・扎克伯格在第三季度财报电话会议上表示,Meta 正在“与公共部门合作,推动 Llama AI 模型在整个美国政府机构中得到应用”。 这一消息引发了诸多疑问:哪些政府部门将使用 Meta 的 AI 模型? 这些模型将用于何种用途?

OpenAI ChatGPT 高级语音模式已登陆 Windows 和 Mac 平台,对话更自然

OpenAI 今日宣布,ChatGPT 的高级语音模式(Advanced Voice Mode,简称 AVM)现已登陆 Windows 和 Mac 平台。 AVM 基于 OpenAI 最先进的 GPT-4o 模型运行,允许用户像与真人对话一样与 ChatGPT 进行交流,包括打断、停顿等自然语言行为。 OpenAI 表示,AVM 提供了更自然、实时的对话体验,能够实时感知和回应用户的情绪。

OpenAI 开源 SimpleQA 新基准,专治大模型“胡言乱语”

当地时间 30 日,OpenAI 宣布,为了衡量语言模型的准确性,将开源一个名为 SimpleQA 的新基准,可衡量语言模型回答简短的事实寻求(fact-seeking)问题的能力。 AI 领域中的一个开放性难题是如何训练模型生成事实正确的回答。 当前的语言模型有时会产生错误输出或未经证实的答案,这一问题被称为“幻觉”。

小罗伯特・唐尼拒绝被“AI 化”:如果有高管想这样做,自己就起诉

据《综艺(Variety)》当地时间 28 日报道,小罗伯特・唐尼( Robert Downey Jr. )在最近参加的“ On With Kara Swisher ”播客节目中,向好莱坞发出明确警告:“我打算起诉所有批准使用我的数字复制品的未来高管们。 ”唐尼这位奥斯卡影帝反对利用 AI 技术或深度伪造来在荧幕上复刻他的形象。

Cyan青心意创震撼发布“全面拟人”机器人OrcaⅠ,机器人开始懂情感、有温度

10月30日,Cyan青心意创(原“青心创新/萨恩异创”)正式发布了独立自研的通用人形机器人OrcaⅠ的动态视频,展示了其在“拟人直膝”状态下的行走、爬坡、原地转圈、行走/站立状态下的步态恢复、户外路面行走等运动控制能力,大语言模型加持下兼具情绪表达的自然语言交互能力,以及在保证精准控制状态下丝滑流畅的双臂操作能力。 相较于市面上常见的“机械感”过重的机器人设计,OrcaⅠ摆脱了传统观念中人们对于“机器人”的固有印象,在本体设计、运动控制、自然语言对话、双臂操作等多个维度实现技术突破,并最终赋予其更为灵动自然的运动表现、更为逼真的人机交互、更为精准平滑的双臂操作,全栈技术领域处于行业顶尖水平。 摆脱传统“机械感”,让机器人“全面拟人”如何让机器人“全面拟人”——这是Cyan在机器人研发阶段所重点攻克的技术难点。

AI + 影视,学会「避坑」再「吟诗 」|CNCC 2024

“在影视行业,越专业的人越觉得 AI 就是个傻瓜相机! 它只会产生一些让人「致幻」的 demo,实际应用起来往往会让人大失所望。 ”“艺术创作不仅是结果,也是过程,而 AI 可能永远学不会艺术创作的过程,AICG也永远不会懂艺术。

恭喜!陈长汶教授荣获ACM SIGMM 2024杰出技术成就奖

国际计算机协会(ACM)多媒体会议是计算机图形学与多媒体领域顶级会议,被中国计算机学会列为 A 类会议。 今年的 ACM MM 于 10 月 28 日 – 11 月 1 日在澳大利亚墨尔本隆重举行! 今天,在火热进行中的大会上,SIGMM 杰出技术成就奖揭晓,陈长汶教授因在多媒体计算、通信和应用方面的杰出技术贡献荣获该奖项。