AI资讯列表 - AI在线

大模型首次接入天文望远镜：“星语 3.0”发布，基于阿里通义千问

4 月 14 日，中国科学院国家天文台人工智能工作组发布新一代天文大模型 ——“星语 3.0”。“星语 3.0”基于阿里云通义千问开源模型打造，目前已成功接入国家天文台兴隆观测站望远镜阵列 —— Mini“司天”。据介绍，随着望远镜数量的不断增加，如何控制大型望远镜阵列已成为当今天文界共同面临的挑战。以往天文观测主要依赖观测助手和科研人员的配合。科研人员往往需要根据观测所在地气象情况修改观测计划，在观测室等待数据返回并实时分析数据，再根据结果修改观测计划。重要观测目标的每个环节都需要人工参与，效率低且难以同时控制多

从AIGC到AGI，为什么我们需要更多的“技术信仰派”？

整理 | 伊风采访 | 张晓楠嘉宾 | 巴川、朱雷、肖然作为AIGC应用落地元年，2024开年就抛给我们一些不太好回答的问题：在以探索AGI为长期目标时，我们该坚守技术信仰吗？除了复制国外GPT-4、Sora这样的成功案例，我们该如何寻求更大发展和突破？即便算力问题得以解决，算法的难题如何跨越？国内企业为什么大都部署多个大模型？为什么并非所有企业都该拥抱AIGC？前不久51CTO全新直播栏目《AIGC实战派》有幸邀请到竞技世界首席数据科学家巴川，元语智能联合创始人兼COO、SuperCLUE社区发起人朱雷以及Tho

刘强东 AI 数字人“采销东哥”明日开启京东直播首秀

感谢京东官宣，刘强东 AI 数字人“采销东哥”将于明日（4 月 16 日）下午 6 点 18 分开启“直播首秀”，同时亮相京东家电家居、京东超市采销直播间。届时，用户打开京东 App 点击首页底部通栏，即可进入直播间。 ▲ 该视频由京东言犀提供技术支持在去年 7 月，京东推出言犀大规模预训练语言模型，面向多模态，深入零售、物流、工业等产业场景。京东集团 CEO 许冉在峰会上表示，大模型在京东内部已经取得明确的实践效果。“我们内部的大量业务场景都在深入探索，将大模型结合进自己的业务流程中，比如用大模型提升智能客服水平

登Science，药物亲和力＜5纳摩尔，加州大学开发特异性药物结合蛋白的从头计算方法

编辑 | 萝卜皮随着抗癌研究的不断深入，科学家们一直在寻找新的方法来提高治疗效果并减少副作用。小分子结合蛋白的从头设计技术是解决这一问题的关键。然而，高亲和力结合和可调特异性，通常需要在计算设计后进行复杂的筛选和优化，这为研究造成了重大阻碍。加州大学旧金山分校的研究人员开发了一种名为 COMBS 的从头蛋白质设计计算方法，并设计了能与新兴抗癌药物紧密结合的蛋白质。实验验证表明，所设计的蛋白质与药物的亲和力强度达到了小于 5 纳摩尔的水平；X 射线晶体结构证实了所设计蛋白质与药物相互作用的准确性。这表明，科学家可以通

RBR50 2024：OpenAI上榜，人形机器人势不可挡

机器之能报道编辑：吴昕2024 年，发那科公司交付了第 100 万台工业机器人。同时，OpenAI 上榜也展示出生成式 AI 与机器人技术的日益相关性。Robotics Business Review RBR 50 榜单已经成为全球机器人行业重要风向标。每年 4 月，Robotics Business Review 都会评选出全球最具创新性和影响力的 50 家机器人企业和机构，许多业内知名企业波士顿动力、发那科、亚马逊、英伟达、优傲、Locus Robotics 等都曾入选 RBR50 榜单。2024 年，传统工业

融合 ChatGPT+DALL・E 3，贾佳亚团队新作开源畅玩：识图推理生图一站解决

在开源社区中把 GPT-4 Dall・E 3 能⼒整合起来的模型该有多强？香港中文大学终身教授贾佳亚团队提出多模态模型 Mini-Gemini：更高清图像的精确理解、更高质量的训练数据、更强的图像解析推理能力，还能结合图像推理和生成，堪称王炸。Mini-Gemini 还提供了 2B 小杯到 34B 的超大杯，最强模型在多个指标上相比谷歌的 Gemini Pro 甚至 GPT-4V 都不遑多让。目前，Mini-Gemini 从代码、模型到数据已全部开源，登上了 PaperWithCode 热榜。Mini-Gemini

三星 Galaxy AI 即将支持粤语、阿拉伯语等更多语言

三星电子宣布 Galaxy AI 即将支持更多语言，包括阿拉伯语、印尼语、俄语、澳大利亚英语、粤语和加拿大法语，将于 4 月起未来数月陆续上线，每种语言都可以在设置中，以语言包的形式下载使用。结合既有的 13 种语言，三星将为全球更多 Galaxy 用户提供 Galaxy AI 的能力。此外，除前述语言外，三星计划在今年稍晚进一步扩大支持语言，包括罗马尼亚语、土耳其语、荷兰语、瑞典语、繁体中文和欧洲葡萄牙语。三星电子移动通信部门总裁卢泰文表示：“三星致力于将移动 AI 普及给所有人，Galaxy AI 翻译功能的语

OpenAI 在东京开设亚洲首个办事处，将发布日语优化型 GPT-4 模型

感谢OpenAI 今日通过官方博客页面宣布，公司在亚洲的首个办事处落户日本东京，将业务扩展到亚洲。OpenAI 表示将致力于与当地政府、企业和研究机构合作，开发安全的人工智能工具，满足当地的独特需求。OpenAI 还将发布针对日语进行优化的 GPT-4 定制模型。与 GPT-4 Turbo 相比，它在日文文本方面的性能有所提高，运行速度最多可提高三倍。与此同时，该模型提高了翻译和总结日语文本的性能和成本效益。在当地最常用的英语学习 App“Speak”即采用了 OpenAI 提供的技术，在用户练习出错时讲解的速度提

GPT-4 整治学术不端：人大 / 浙大团队实测 7000 篇论文，撤稿预测与人类 95% 一致

【新智元导读】人大与浙大学者发现，GPT-4 对于论文给出的撤稿预测结果，竟然和人类审稿人有将近 95% 的相似性。看来大模型虽然有可能引发学术不端，但也有办法维护科研诚信啊。学术论文的撤稿事件时有发生，这不仅损害了科研诚信，也可能对公众信任和科学进展产生负面影响。传统上，学术界依赖同行评审和出版后的读者反馈来识别和纠正问题论文，但这些方法可能无法及时发现所有问题，尤其是在当前科研论文出版数量急剧增加的背景下。在这种情况下，如何快速识别存在问题的论文，并促进它们的撤稿，成了学术界亟待解决的一个难题。最近，来自中国人

Marvell 美满电子获得新 AI 芯片订单，到 2026 财年相关业务收入将达 25 亿美元

Marvell 美满电子在上周举办的一场有关 AI 基础设施领域的投资者活动上表示其新近获得了一份来自大型科技公司的 AI 芯片订单。Marvell 宣称，包括这份订单在内，其已从“四家美国超大型企业”中的三家拿下定制芯片订单，包括为客户 A 定制 AI 训练加速器和 AI 推理加速器，为客户 B 定制 Arm 架构 CPU 和近日的为客户 C 定制 AI 加速器。▲ 图源 Marvell 美满电子官方，下同Marvell 表示，客户 A 的 AI 训练加速器和客户 B 的 Arm 架构 CPU 已处于产能爬坡阶段

上海举办国内首个 AI 音乐会

4 月 13 日至 14 日，上海民族乐团国乐与 AI 音乐会《零・壹｜中国色》，在第 39 届上海之春国际音乐节首演，这是全国首台 AI 创作的国乐音乐会。据悉，《零・壹｜中国色》由上海民族乐团、腾讯音乐娱乐集团（TME）、1862 时尚艺术中心联合主办，参演曲目以颜色为创作灵感，由腾讯音乐娱乐集团和腾讯 AI Lab 联合研发的 AI 音乐大模型“琴乐大模型”创作，并经过乐团演奏家们二度创作最终成曲，通过大自然色彩的起承转合千变万化，让观众从乐曲中感受到不同的色彩演绎。IT之家附重点节目名单如下：笙曲《东方既白

除了唱歌，AI还能替你演出？又一AI公司将虚拟人推到新高度

用 Suno 十秒写歌，是不是已经很震撼？现在不仅如此，用最新的 AI 工具，我们还可以快速生成歌手唱歌 MV。最近，一家名为 AKOOL 的 AI 公司推出了一个唱歌虚拟人工具，用户只需在平台上选择虚拟人，简单输入歌词指令，便可生成能唱歌的虚拟人 MV。视频中的 “歌手” 在雪地里随着音乐翩翩起舞，“假唱” 对口型也毫不逊色。声音、面容，一键替换 AKOOL 拥有丰富的 AI 换脸视觉表现技术以及成熟的声音克隆技术。在 Tiktok 上，用 AKOOL 制作的换脸、换声视频非常风靡，受到很多人的欢迎。去年， A

马斯克的首款多模态大模型来了，GPT-4V又被超越了一次

自从 2023 年 11 月 Grok 首次亮相以来，马斯克的 xAI 正在大模型领域不断取得进步，向 OpenAI 等先行者发起进攻。在 Grok-1 开源后不到一个月，xAI 的首个多模态模型就问世了。昨天，xAI 推出了 Grok-1.5V，该模型不仅能理解文本，还能处理文档、图表、截图和照片中的内容。官方博文表示：「Grok-1.5V 在许多领域都能媲美当前顶尖的多模态模型，从多学科推理到理解文档、科学图表、图表、截图和照片。」 xAI 还表示，在接下来的几个月里，预计将在图像、音频和视频等各种模态上显著提

培育发展金融领域新质生产力，“AI+金融”论坛在浦东新区成功举办

4 月 12 日，在上海市浦东新区科技和经济委员会指导下，由上海市浦东新区产业发展促进中心、上海市浦东新区投资促进二中心、上海陆家嘴（集团）有限公司主办，上海浦东科技创业中心、中国建设银行上海浦东分行、机器之心（上海）科技有限公司承办的 “AI 金融” 论坛在张江科学城・数智天地成功举办。浦东新区科技和经济委员会副主任夏玉忠，北蔡镇人民政府党委书记殷宏、上海陆家嘴（集团）有限公司总经理蔡嵘，建行上海浦东分行党委书记邹林出席了本次论坛。来自大模型企业、金融科技企业、金融机构及高校的嘉宾和 300 多位专业观众参加了本

曾爆火的 InstantID又有了新玩法：风格化图像生成，已开源

InstantID 原班团队推出了风格迁移的新方法 InstantStyle。风格化图像生成，也常称为风格迁移，其目标是生成与参考图像风格一致的图像。此前基于 diffusion 的方法（比如 LoRA）通常需要批量的同风格数据进行训练，无法迁移到新的风格中，或者基于 inversion（如 StyleAlign），通过将风格图像还原到 latent noise 后，将其前向传播得到的 K、V 用于替换风格图像生成中的 K、V，但这类方法往往由于 inversion 的操作，造成风格退化。最近，InstantID

GPT超越扩散、视觉生成Scaling Law时刻！北大&字节提出VAR范式

新一代视觉生成范式「VAR: Visual Auto Regressive」视觉自回归来了！使 GPT 风格的自回归模型在图像生成首次超越扩散模型，并观察到与大语言模型相似的 Scaling Laws 缩放定律、Zero-shot Task Generalization 泛化能力：论文标题: "Visual Autoregressive Modeling: Scalable Image Generation via Next-Scale P

全球AI顶会NeurlPS开始收高中生论文了

卷高考之后的下一步，卷论文？培养 AI 人才，要从娃娃抓起，这句话似乎越来越不像开玩笑了。本周五，顶级学术会议 NeurIPS 开设高中生论文 Track 的消息引爆了人工智能社区。消息援引自大会组织方的一项新公告。请注意，这不是 workshop，是主会议：NeurIPS 2024 邀请高中生提交有关机器学习社会影响主题的研究论文。组委会将选出一部分决赛入围者以虚拟方式展示他们的项目，并将在 NeurIPS 主页上重点展示他们的作品。此外，最多五个获奖项目的主要作者将受邀参加在温哥华举行的 NeurIPS 202

OpenAI推销ChatGPT to B业务，微软客户也是目标

奥特曼接待了数百名 500 强公司的高管。技术领先的 OpenAI，正在稳步推进大模型能力的落地。据路透社等媒体报道，OpenAI 首席执行官山姆・奥特曼（Sam Altman）本月在旧金山、纽约和伦敦接待了数百名《财富》500 强公司高管，他和其他 OpenAI 高管在会上推销了供企业使用的人工智能服务，同时还与自己的资金支持者微软的产品进行了一番比对。这些类似路演的活动表明，在通过消费级产品 ChatGPT 引发生成式人工智能爆炸式增长之后，OpenAI 正在寻求从世界各地的企业那里增加新的收入来源 —— 其中