AI资讯列表 - AI在线

阿里出品！用一篇文章帮你了解AI数字人行业

人工智能（AI）技术的进步不仅改变了我们生活的方方面面，还在各行各业中展现出了巨大的潜力。AI 数字人，作为人工智能技术的一个重要分支，正在逐渐成为众多行业关注的焦点。这些虚拟的数字角色不仅具有逼真的外观和行为，还能够以超乎想象的方式与人类交互，从而提供全新的服务体验和业务机会。本文整理了 AI 数字人相关的基础概念、趋势报告、热点案例、AI 数字人平台和开源项目，以及作为设计师我们能用这些 AI 能力产出哪些有意思的工作。：一、AI 数字人基础概念 1. 什么是 AI 数字人？ "数字人"是指利用先进的计算机图

消息称微软携手 OpenAI 打造新 AI 超算：代号“星际之门”、投入 1000 亿美元

感谢根据国外科技媒体 The Information 报道，微软正携手 OpenAI，投入 1000 亿美元（IT之家备注：当前约 7240 亿元人民币），开发代号为“Stargate”的全新人工智能超级计算机。Stargate 也是一部 1994 年上映的电影名称，中文译名为《星际之门》。IT之家查询相关资料，米高梅和华纳兄弟公司有意重启 1994 年的经典科幻电影《星际之门》，由著名导演罗兰・艾默里奇 (Roland Emmerich) 来执导，重启之后的《星际之门》将拍摄成三部曲形式。回归到微软和 OpenA

大佬出走后首个发布，Stability 官宣代码模型 Stable Code Instruct 3B

【新智元导读】Stability AI 在大佬出走后似乎并未受到影响，最近又官宣了新的代码模型 Stable Code Instruct 3B，在之前的基础上更进一步，干掉了所有同级竞品，甚至能和 7B、15B 的模型掰手腕。大佬出走后，第一个模型来了！就在今天，Stability AI 官宣了新的代码模型 Stable Code Instruct 3B。要说 Stability 也是真的很神奇，首席执行官辞职了，Stable Diffusion 其中几位作者也离开了，投资公司出了点故障，自己的工资也可能要发不起了

微软照片应用加入 Copilot 插件，可创建幻灯片和设置桌面壁纸

微软悄悄为其照片应用加入了一个 Copilot 的插件，旨在帮助用户以一种更智能的方式管理照片。不过这项功能目前尚处于初始阶段，其功能比较有限。这一消息由 Windows 爱好者 @PhantomOfEarth 率先在社交平台 X 上披露，搭载此项新 AI 功能的照片应用版本号为 2024.11030.22001.0。如果你的应用是此版本，只需前往插件设置区，即可找到开启 Copilot 功能的开关。但需要注意的是，目前版本的 Copilot 插件仅能帮助用户在应用内创建和浏览照片幻灯片，以及将指定照片设置为桌面背

印度总理莫迪会见比尔・盖茨，探讨科技“平民化”等话题

据《印度斯坦时报》等当地传媒报道，印度总理莫迪当地时间周五会见了微软联合创始人比尔・盖茨，双方共同讨论了人工智能、数字鸿沟及技术赋能等一系列话题。莫迪称相信技术的平民化，它为每个人提供了平等的机会，目前正在将技术带入乡村。他还表示，自己经常听说世界上存在数字鸿沟，决定不允许印度出现类似情况。“我决定不允许印度出现数字鸿沟，因此将基础设施带到了全国各地的村庄…… 公共基础设施的数字化，本身就是一项重大要求。”莫迪表示印度需要数字化的公共基础设施，盖茨补充说“印度在这方面处于领先地位”。盖茨还称，吸引他访问印度的不仅是

AI 在用 | 有了这个超级提示和Claude 3，不听播客也能搞定节目内容

机器之能报道编辑：Cardinal以大模型、AIGC为代表的人工智能浪潮已经在悄然改变着我们生活及工作方式，但绝大部分人依然不知道该如何使用。因此，我们推出了「AI在用」专栏，通过直观、有趣且简洁的人工智能使用案例，来具体介绍AI使用方法，并激发大家思考。我们也欢迎读者投稿亲自实践的创新型用例。不用听完冗长的播客就能迅速掌握节目内容？X 用户 @genie0309 利用 Claude 3 Opus 做到了这一点。这位用户是一位连续创业者、投资人，平时重度依靠播客获取深度信息，然而优质播客节目时长至少 45 分

优于SOTA，腾讯AI Lab开发双重扩散模型，实现靶标配体3D分子生成和先导化合物优化

编辑 | 萝卜皮基于结构的生成化学，通过探索广阔的化学空间来设计对靶标具有高结合亲和力的配体，在计算机辅助药物发现中至关重要。然而，传统的计算机方法受到计算效率低下的限制，机器学习方法则因自回归采样而面临瓶颈。为了解决这些问题，腾讯 AI lab、香港城市大学、锐格医药（Regor Therapeutics Group）的研究人员开发了一种条件深度生成模型 PMDM，用于生成适合特定靶标的 3D 分子。PMDM 由具有局部和全局分子动力学的条件等变扩散模型组成，使 PMDM 能够考虑条件蛋白质信息从而有效地生成分子

在好莱坞发动“魅力攻势”，消息称 OpenAI 向派拉蒙、环球等影业巨头展示 Sora

感谢据英国《金融时报》报道，OpenAI 近期在好莱坞发动了一场“魅力攻势”—— 与派拉蒙、环球和华纳兄弟探索等主要电影公司举行会议，展示其视频生成技术 Sora，并缓解对人工智能模型将损害电影行业的担忧。报道援引多位知情人士消息称，OpenAI 首席执行官山姆・阿尔特曼和首席运营官布拉德・莱特凯普在近期数日间举行的会议上，向影业巨头高管们做了 Sora 的产品介绍。参与会议的人员表示，OpenAI 正在就如何推出 Sora 寻求影业高管们的意见。一些观看了演示的人说，他们可以看到 Sora 或类似的人工智能产品如

周鸿祎自称“开源信徒”：宣布将开源 360 智脑 7B 模型，支持 50 万字长文本输入

感谢360 创始人周鸿祎近日透露即将开源 360 智脑 7B（70 亿参数模型），支持 360k（50 万字）长文本输入。周鸿祎表示，前段时间大模型行业卷文本长度，100 万字“很快将是标配”。“我们打算将这个能力开源，大家没必要重复造轮子，定为 360k 主要是为了讨个口彩。”他还自称“开源的信徒”，信奉开源的力量。据介绍，360 智脑长文本能力已入驻大模型产品“360AI 浏览器”。周鸿祎还谈到了小模型的优势：其认为小模型速度快、用户体验也好，单机单卡就能跑，具备更高的性价比。目前，360AI 浏览器已向用户免

AI创业吧！不缺计算资源那种

大模型技术革命爆发一年多，对大众来说，大模型神秘的样子逐渐清晰，AI 创业也从兴奋期慢慢开始务实。当前 AI 技术创业周期已经进入应用层，甚至已经开始快速迭代。3 月 13 号，a16z 发布了 TOP50 AI 应用，和半年前相比，已换血一半。技术改变世界的过程，正是创业浪潮大浪淘金的过程。创业项目逐渐成熟的同时，暴露出更多问题，技术、成本、场景、商业化…… 每个环节都需要解决。技术创业进入应用落地阶段，创业者所需要的创新要素和资源一直在变化。阿里云伴随着时代周期，和创业者来到关卡，为时代浪潮提供助力。3 月 2

Attention isn’t all you need！Mamba混合大模型开源：三倍Transformer吞吐量

Mamba 时代来了？自 2017 年开创性研究论文《Attention is All You Need》问世以来，transformer 架构就一直主导着生成式人工智能领域。然而，transformer 架构实际上有两个显著缺点：内存占用大：Transformer 的内存占用量随上下文长度而变化。这使得在没有大量硬件资源的情况下运行长上下文窗口或大量并行批处理变得具有挑战性，从而限制了广泛的实验和部署。随着上下文长度的增加，推理速度会变慢：Transformer 的注意力机制随序列长度呈二次方扩展，并且会降低吞

马斯克大模型Grok1.5来了：推理能力大升级，支持128k上下文

马斯克搞大模型，速度也奇快。Grok 1 开源才刚有 10 天，Grok 1.5 就来了。本周五早上，马斯克旗下的人工智能公司 xAI 正式推出了 Gork 大模型的最新版本 Grok-1.5。新一代模型实现了长上下文理解和高级推理能力，计划将在未来几天内向早期测试人员和 X 平台（前 Twitter）上的现有 Grok 用户提供。上周一，马斯克刚刚开源了 3140 亿参数的混合专家（MoE）模型 Grok-1。通过开源 Grok-1 的模型权重和网络架构，Gork 项目已展示了 xAI 截至去年 11 月所取得的

DeepMind终结大模型幻觉？标注事实比人类靠谱、还便宜20倍，全开源

DeepMind 这篇论文一出，人类标注者的饭碗也要被砸了吗？大模型的幻觉终于要终结了？今日，社媒平台 reddit 上的一则帖子引起网友热议。帖子讨论的是谷歌 DeepMind 昨日提交的一篇论文《Long-form factuality in large language models》（大语言模型的长篇事实性），文中提出的方法和结果让人得出大胆的结论：对于负担得起的人来说，大语言模型幻觉不再是问题了。我们知道，大语言模型在响应开放式主题的 fact-seeking（事实寻求）提示时，通常会生成包含事实错误的内

Champ首发开源：人体视频生成新SOTA，5天斩获1k星，demo可玩

一张照片一段视频，就能让照片活起来！近日，由阿里、复旦大学、南京大学联合发布的可控人体视频生成工作 Champ 火爆全网。该模型仅开源 5 天 GitHub 即收获 1k 星，在 Twitter 更是「火出圈」，吸引了大量博主二创，浏览量总量达到 300K。目前 Champ 已经开源推理代码与权重，用户可以直接从 Github 上下载使用。官方 Hugging Face 的 Demo 已经上线，封装的 Champ-ComfyUI 也正在同步推进中。GitHub 主页显示团队将会在近期开源训练代码及数据集，感兴

WeFit-2024：女性科技精英共话AI新质生产力，展望未来科技新篇章

2024年3月28日，春意盎然的午后，深圳市南山区妇女联合会携手深圳市人工智能学会，在深圳西丽湖人才服务中心迎来了第三届信息科技女性精英论坛——WeFit-2024。本次盛会以“AI助推新质生产力”为主题，汇聚了众多科技领域的女性精英，共同探讨人工智能如何引领生产力的革新与进步。在开幕式上，深圳市人工智能学会常务副理事长兼秘书长、北京大学深圳研究生院党委副书记邹月娴博士担纲主持。

提前 0.9 秒预测，Emo 机器人问世：能同步模仿你的面部表情

名为 Emo 的仿人机器人近日问世，它会观察你的面部表情，然后可以镜像模仿你的面部表情，达到你笑它也笑的效果。人工智能（AI）目前快速发展，现在固然可以在很大程度上模仿人类语言，不过放在实体机器人中，互动往往会产生“恐怖谷理论”（Uncanny Valley），一个重要的原因是机器人无法复制复杂的非语言暗示和举止。纽约哥伦比亚大学的霍德・利普森（Hod Lipson）及其同事们创造了一个名为 Emo 的机器人，它利用人工智能模型和高分辨率摄像头预测人们的面部表情，并试图复制这些表情。它能在某人微笑前约 0.9 秒预

OPPO / 一加 ColorOS AI 功能上新：支持英语教学、面试培训和问答互动

OPPO 官方今日宣布，ColorOS 全新 AI 功能上线，IT之家整理此次更新重点内容如下：新增小布英语老师，支持 AI 模拟真人教学，提供一对一口语陪练。新增小布面试官，支持 AI 模拟面试，帮助用户掌握面试技巧。新增小布问答，该功能旨在帮助用户完成各类商品评论、社交平台文案，以及全套旅行规划等。上述功能体验路径：在负一屏搜索“小布助手”，点击进入，选择对应的功能模块便可开启使用。IT之家附已支持该功能的机型和注意事项如下：适配机型OPPO Find N3 系列OPPO Find X7 系列OPPO Find

AMD潘晓明：携手产业链合作伙伴迈入AI PC新时代

近日，在北京举办的 AMD AI PC 创新峰会上，AMD 携手 OEM 合作伙伴联想和华硕，以及生态系统合作伙伴百川智能、有道、游戏加加、生数科技、始智 AI 等共庆 AI PC 腾飞之年，展示了 Ryzen AI PC 生态系统的强大实力，以及 AMD 在中国 AI PC 生态系统中的良好发展势头，将创新领先的 AI PC 体验带给最终用户。在峰会上，AMD 高级副总裁，大中华区总裁潘晓明首先做了隆重的开场致辞，形象地从 “天时、地利、人和” 三个角度谈及，“AI 是当前最热门、最火爆的话题，AI 的爆炸式增长