应用
明略 走过冬天
作者 | 陈彩娴 王悦编辑 | 陈彩娴在多位明略旧部的眼中,明略创始人吴明辉这两年最大的变化就是「话变少了」。 最先感知到这一变化的,是参加过 2020 年明略年会的员工。 当时新冠疫情还未爆发,新年伊始,明略在北京怀柔中国村包了一个 2000 人的场地举办年会,年会上,这位明略科技的掌舵人精神饱满、意气风发,在台上慷慨演说,畅谈对明略 3.0 时代的美好设想。
OpenAI 邀请艺术家们试用文生视频工具 Sora:气球脑袋、会飞的猪
感谢近日,OpenAI 公司近日邀请部分艺术家试用了其人工智能视频创作工具 Sora。通过使用 Sora,艺术家们创作了一系列惊艳的实验性短片,将人工智能的强大和新奇展现得淋漓尽致。 与我们熟悉 OpenAI 的聊天机器人 ChatGPT 和图片生成平台 DALL-E 不同,Sora 目前仍未面向大众开放。本周一,OpenAI 公司在其博客中发布了一篇名为“Sora:第一印象”的文章,展示了视觉艺术家、设计师、创意总监和电影制作人使用 Sora 创作的成果。这些短片时长从 20 秒到一分半不等,画面精美绝伦,
解密机器人大模型RFM-1:Covariant创始人陈曦专访
作者:王建明来源:微信公众号「石麻笔记」2024年3月,在通用机器人的发展史上,绝对是值得纪念的一个月。3月11日,知名AI机器人创业公司Covariant推出了首个机器人基础模型RFM-1(Robot Foundation Model-1),这是世界上首个基于真实任务数据训练的机器人大模型,也是最接近于解决真实世界任务的机器人大模型;次日,Covariant创始人Pieter Abbeel的徒弟和徒孙Sergey Levine和Chelsea Finn宣布创办Pi(Physical Intelligence),一
消息称高通、谷歌、英特尔等联合开发 AI 软件:让代码不挑硬件,打破英伟达统治格局
感谢英伟达凭借 AI 芯片的领先,如今已成为行业巨无霸,包括微软等巨头也需要与其合作,全球超过 400 万开发者依靠英伟达的 CUDA 软件平台来构建 AI 和其他应用。据路透社报道,为了打破这一局面,包括高通、谷歌和英特尔在内的科技公司联盟,计划从软件入手与英伟达解绑,帮助 AI 开发者不必依赖英伟达平台。高通 AI 和机器学习主管 Vinesh Sukumar 在接受路透社采访时表示:“我们实际上是在向开发者展示如何从英伟达平台迁移出来。”UXL 基金会是一家科技公司联盟,以英特尔开发的一项 OneAPI 技术
人人都能做音乐!Suno v3 一键生成高质量中文歌曲!
大家好,这里是和你们一起探索 AI 的花生~
之前为大家推荐 AI 音乐生成工具时提到过 Suno,它可以根据提示词生成带完整歌词和旋律的歌曲。最近 Suno 推出了新的 v3 版本,不仅在质量上有了大幅提升,还支持自定义歌词,然后让 AI 生成旋律并演唱,这让用户可以更准确地表达自己的情感和思想,而且歌曲的整体效果也非常不错,因此目前非常火热。今天就为大家详细介绍一下 Suno V3 的用法。
推荐:Suno V3
网站直达:
Suno V3 目前是免费开放给所有人使用的,新用户每天登录后会赠送的 50 积分,
特斯拉招聘人形机器人 Optimus 用户手册撰写员,明年开始交付
特斯拉正在招聘一位服务技术撰写员(Service Technical Writer),专为其人形机器人 Optimus 编写用户手册。此举暗示着特斯拉人形机器人项目取得了重大进展,并且可能比预期进度更快实现量产。该职位描述中写道:“我们正在寻找一位热衷机器人领域,拥有扎实技术交流背景的资深服务技术撰写员加入团队。该岗位主要职责是为人形机器人系统创建全面易懂的文档,包括服务手册、故障排除指南、维护程序和培训材料。理想的候选人需要具备出色的写作能力、技术知识以及将复杂的技术信息转化为清晰易懂的文档,以满足客户和服务技术
消息称 Meta 正积极开展 AI 人才战:候选人无需面试,小扎亲自“摇人”
据 The Information 北京时间今晚报道,为了在争夺人工智能研究人员方面取得更大优势,Meta 正在采取一系列“非常规举措”,进一步加大了这场 AI 人才战的火药味。图源 Pexels报道称,这一系列的举措包括在不面试候选人的情况下向他们提供工作机会等,更为此前威胁离职的员工增加薪资 —— 在此之前,Meta 的“长期做法”是不加薪。另据两位查看过 Meta 相关邮件的人士透露,公司首席执行官马克・扎克伯格亲自写信给谷歌 DeepMind 部门的研究人员,想要将其纳入麾下,表明这家社交媒体公司“非常重视
Windows 智能助理 Copilot 遭嫌弃,用户要求微软将其移除
微软将智能助理 Copilot 置于 Windows 任务栏正中央的举措遭到了许多用户的强烈反对。在有关 Copilot 图标位置的 Reddit 帖子中,用户们更倾向于将 Copilot 放置在任务栏的最右侧,靠近时钟、通知和显示桌面按钮的位置。微软将 Copilot 作为 Windows 体验核心部分的这一做法遭到了用户群体的普遍抵制。此前,微软曾表示 Copilot 未来盈利潜力巨大,即使目前尚在摸索阶段。在 Reddit 论坛上,用户们纷纷表达了对 Copilot 的不满,其中充斥着诸如“让它从我的电脑里滚
AI 在用| GPT-4、Claude 3 带你看懂宜家安装说明书
以大模型、AIGC为代表的人工智能浪潮已经在悄然改变着我们生活及工作方式,但绝大部分人依然不知道该如何使用。因此,我们推出了「AI在用」专栏,通过直观、有趣且简洁的人工智能使用案例,来具体介绍AI使用方法,并激发大家思考。 我们也欢迎读者投稿亲自实践的创新型用例。今天,我们分享 X 用户 @gabchuayz 的案例—— 利用 Claude 3 Opus (最贵的一款)视觉推理能力,读懂宜家家具安装说明书!案例地址: Workbech 来接入 Claude 3 Opus首先,进入 Claude 3 Opus ,
OpenAI 公关跳起来捂他嘴:Transformer 作者公开承认参与 Q*!
Transformer 作者中唯一去了 OpenAI 的那位,公开承认了:他参与了 Q * 项目,是这项新技术的发明者之一。这几天除了英伟达老黄组局把 Transformer 作者聚齐,他们中的几位还接受了连线杂志的采访,期间出了这么一个小插曲。当记者试图询问 Lukasz Kaiser 更多关于 Q * 的问题时时,OpenAI 的公关人员几乎跳过桌子去捂他的嘴。结合阿尔特曼在接受采访时,毫不迟疑地拒绝了相关提问,“我们还没准备好谈论这个话题”。神秘 Q*,成了 OpenAI 当前最需要保守的秘密之一。不过对于
准确率达95.16%,快速识别恶性肿瘤细胞,厦大和上海交大团队开发域泛化深度学习算法
编辑 | 萝卜皮单细胞和空间转录组测序是两种最近优化的转录组测序方法,越来越多地用于研究癌症和相关疾病。细胞注释,特别是恶性细胞注释,对于这些研究中的深入分析至关重要。然而,当前的算法缺乏准确性和泛化性,使得难以一致、快速地从泛癌数据中推断出恶性细胞。为了解决这个问题,厦门大学和上海交通大学的研究团队提出了 Cancer-Finder,一种基于域泛化(Domain Generalization,DG)的深度学习算法,可以快速识别单细胞数据中的恶性细胞,平均准确率达到 95.16%。重要的是,通过用空间转录组数据集替
努比亚 Z60 Ultra 摄影师版手机支持双向通话 AI 实时翻译
努比亚官方今日公布了旗下 Z60 Ultra 摄影师版手机的 AI 翻译功能。据官方介绍,该功能拥有两大亮点,支持 AI 双向通话实时翻译和 AI 面对面智慧翻译。目前,官方没有进一步描述 AI 翻译功能的展现形式,尚不清楚该功能是采用类似“同声传译”的形式还是“字幕翻译”形式。此外,努比亚官方还公布 Z60 Ultra 摄影师版手机的其他 AI 功能,如:融合 AI 影像大模型、AI“魔法功能”以及 AI 智慧语音功能。努比亚融合 AI 影像大模型 —— Neovision 泰山 AI 影像的官方解释为“计算摄影
首个 AI 游戏引擎或颠覆任天堂 / 暴雪?0 代码即可创建,黄仁勋预测 5-10 年游戏完全由 AI 生成
【新智元导读】还有什么领域没有被 AI 渗透?继音乐之后,首个 AI 游戏引擎已经完全凭几个字,就能创建游戏资产和动画了。老黄预测,未来 5-10 年我们将看到完全由 AI 生成的游戏。「未来 5-10 年,我们可以看到完全由 AI 生成的游戏」。这是近日 GTC 2024 大会之后,黄仁勋接受媒体时采访时发表的最新看法。其实,现在的游戏创建,早已到了只说一句话的地步了!近日,一家专注研发无代码游戏引擎的初创公司 BuildBox AI,发布了新一代 AI 游戏引擎 ——Buildbox 4 Alpha。它可以做到
字节跳动提速 AI:Flow 部门下设四大业务线,挖角大批百度阿里员工
3 月 25 日下午消息,近日,字节跳动推出 AI 角色互动 App“话炉”,从而引发外界对其探索 AI 社交赛道的关注。据了解,“话炉”由字节跳动的 Flow 部门打造。新浪科技独家获悉,Flow 部门隶属于字节跳动的产品研发与工程部(内部简称“PDI”),目前下设四大业务线,包括 AI 教育、国际化、社区和豆包,“话炉”则属于社区业务线旗下。在今年 1 月的 2024 年年度全员会上,字节跳动 CEO 梁汝波提到,公司直到 2023 年才开始讨论 GPT,而业内做得比较好的大模型创业公司都是在 2018 年至
词曲创作只需几秒,「AI作曲家」Suno引爆音乐圈,第一手体验和攻略来了
有了 Suno 这个「作曲助手」,人人都可以创建自己想听的歌曲。自从 ChatGPT 在 2022 年底爆火以来,我们已经看到 AI 生成的诸多艺术创作成果:ChatGPT 写出过情节引人入胜的网文,Midjourney 生成过肉眼难辨的人像。最近,AI 搞创作的风终于吹到了「歌曲生成」领域,一款名为 Suno 的 AI 驱动的歌曲生成器,在社区内开始了病毒式传播。其实此前陆续推出的 AI 音乐生成器并不少,比如 Adobe 的 Project Music GenAI , YouTube 的 Dream Track
离职谷歌的Transformer作者创业,连发3个模型(附技术报告)
去年 8 月,两位著名的前谷歌研究人员 David Ha、Llion Jones 宣布创立一家人工智能公司 Sakana AI,总部位于日本东京。其中,Llion Jones 是谷歌 2017 年经典研究论文《Attention is all you need》的第五作者,该论文提出了深度学习架构 transformer。transformer 对整个机器学习领域产生了重要影响,并且是 ChatGPT 等生成式 AI 模型的基础。论文于 2017 年 6 月首次发表后,随着全球对生成人工智能人才竞争不断升温,论文作
剑桥团队开源:赋能多模态大模型RAG应用,首个预训练通用多模态后期交互知识检索器
PreFLMR模型是一个通用的预训练多模态知识检索器,可用于搭建多模态RAG应用。模型基于发表于 NeurIPS 2023 的 Fine-grained Late-interaction Multi-modal Retriever (FLMR) 并进行了模型改进和 M2KR 上的大规模预训练。论文链接: 链接:::PreFLMR: Scaling Up Fine-Grained Late-Interaction Multi-modal Retrievers背景尽管多模态大模型(例如 GPT4-Vision、Gemi
通用文档理解新SOTA,多模态大模型TextMonkey来了
最近,华中科技大学和金山的研究人员在多模态大模型 Monkey [1](Li et al., CVPR2024)工作的基础上提出 TextMonkey。在多个场景文本和文档的测试基准中,TextMonkey 处于国际领先地位,有潜力带来办公自动化、智慧教育、智慧金融等行业应用领域的技术变革。论文链接:: 是一个专注于文本相关任务(包括文档问答和场景文本问答)的多模态大模型(LMM)。相比于 Monkey,TextMonkey 在多个方面进行改进:通过采用零初始化的 Shifted Window Attention,