AI资讯列表 - AI在线

OpenAI 在东京开设亚洲首个办事处，将发布日语优化型 GPT-4 模型

感谢OpenAI 今日通过官方博客页面宣布，公司在亚洲的首个办事处落户日本东京，将业务扩展到亚洲。OpenAI 表示将致力于与当地政府、企业和研究机构合作，开发安全的人工智能工具，满足当地的独特需求。OpenAI 还将发布针对日语进行优化的 GPT-4 定制模型。与 GPT-4 Turbo 相比，它在日文文本方面的性能有所提高，运行速度最多可提高三倍。与此同时，该模型提高了翻译和总结日语文本的性能和成本效益。在当地最常用的英语学习 App“Speak”即采用了 OpenAI 提供的技术，在用户练习出错时讲解的速度提

GPT-4 整治学术不端：人大 / 浙大团队实测 7000 篇论文，撤稿预测与人类 95% 一致

【新智元导读】人大与浙大学者发现，GPT-4 对于论文给出的撤稿预测结果，竟然和人类审稿人有将近 95% 的相似性。看来大模型虽然有可能引发学术不端，但也有办法维护科研诚信啊。学术论文的撤稿事件时有发生，这不仅损害了科研诚信，也可能对公众信任和科学进展产生负面影响。传统上，学术界依赖同行评审和出版后的读者反馈来识别和纠正问题论文，但这些方法可能无法及时发现所有问题，尤其是在当前科研论文出版数量急剧增加的背景下。在这种情况下，如何快速识别存在问题的论文，并促进它们的撤稿，成了学术界亟待解决的一个难题。最近，来自中国人

Marvell 美满电子获得新 AI 芯片订单，到 2026 财年相关业务收入将达 25 亿美元

Marvell 美满电子在上周举办的一场有关 AI 基础设施领域的投资者活动上表示其新近获得了一份来自大型科技公司的 AI 芯片订单。Marvell 宣称，包括这份订单在内，其已从“四家美国超大型企业”中的三家拿下定制芯片订单，包括为客户 A 定制 AI 训练加速器和 AI 推理加速器，为客户 B 定制 Arm 架构 CPU 和近日的为客户 C 定制 AI 加速器。▲ 图源 Marvell 美满电子官方，下同Marvell 表示，客户 A 的 AI 训练加速器和客户 B 的 Arm 架构 CPU 已处于产能爬坡阶段

上海举办国内首个 AI 音乐会

4 月 13 日至 14 日，上海民族乐团国乐与 AI 音乐会《零・壹｜中国色》，在第 39 届上海之春国际音乐节首演，这是全国首台 AI 创作的国乐音乐会。据悉，《零・壹｜中国色》由上海民族乐团、腾讯音乐娱乐集团（TME）、1862 时尚艺术中心联合主办，参演曲目以颜色为创作灵感，由腾讯音乐娱乐集团和腾讯 AI Lab 联合研发的 AI 音乐大模型“琴乐大模型”创作，并经过乐团演奏家们二度创作最终成曲，通过大自然色彩的起承转合千变万化，让观众从乐曲中感受到不同的色彩演绎。IT之家附重点节目名单如下：笙曲《东方既白

除了唱歌，AI还能替你演出？又一AI公司将虚拟人推到新高度

用 Suno 十秒写歌，是不是已经很震撼？现在不仅如此，用最新的 AI 工具，我们还可以快速生成歌手唱歌 MV。最近，一家名为 AKOOL 的 AI 公司推出了一个唱歌虚拟人工具，用户只需在平台上选择虚拟人，简单输入歌词指令，便可生成能唱歌的虚拟人 MV。视频中的 “歌手” 在雪地里随着音乐翩翩起舞，“假唱” 对口型也毫不逊色。声音、面容，一键替换 AKOOL 拥有丰富的 AI 换脸视觉表现技术以及成熟的声音克隆技术。在 Tiktok 上，用 AKOOL 制作的换脸、换声视频非常风靡，受到很多人的欢迎。去年， A

马斯克的首款多模态大模型来了，GPT-4V又被超越了一次

自从 2023 年 11 月 Grok 首次亮相以来，马斯克的 xAI 正在大模型领域不断取得进步，向 OpenAI 等先行者发起进攻。在 Grok-1 开源后不到一个月，xAI 的首个多模态模型就问世了。昨天，xAI 推出了 Grok-1.5V，该模型不仅能理解文本，还能处理文档、图表、截图和照片中的内容。官方博文表示：「Grok-1.5V 在许多领域都能媲美当前顶尖的多模态模型，从多学科推理到理解文档、科学图表、图表、截图和照片。」 xAI 还表示，在接下来的几个月里，预计将在图像、音频和视频等各种模态上显著提

培育发展金融领域新质生产力，“AI+金融”论坛在浦东新区成功举办

4 月 12 日，在上海市浦东新区科技和经济委员会指导下，由上海市浦东新区产业发展促进中心、上海市浦东新区投资促进二中心、上海陆家嘴（集团）有限公司主办，上海浦东科技创业中心、中国建设银行上海浦东分行、机器之心（上海）科技有限公司承办的 “AI 金融” 论坛在张江科学城・数智天地成功举办。浦东新区科技和经济委员会副主任夏玉忠，北蔡镇人民政府党委书记殷宏、上海陆家嘴（集团）有限公司总经理蔡嵘，建行上海浦东分行党委书记邹林出席了本次论坛。来自大模型企业、金融科技企业、金融机构及高校的嘉宾和 300 多位专业观众参加了本

曾爆火的 InstantID又有了新玩法：风格化图像生成，已开源

InstantID 原班团队推出了风格迁移的新方法 InstantStyle。风格化图像生成，也常称为风格迁移，其目标是生成与参考图像风格一致的图像。此前基于 diffusion 的方法（比如 LoRA）通常需要批量的同风格数据进行训练，无法迁移到新的风格中，或者基于 inversion（如 StyleAlign），通过将风格图像还原到 latent noise 后，将其前向传播得到的 K、V 用于替换风格图像生成中的 K、V，但这类方法往往由于 inversion 的操作，造成风格退化。最近，InstantID

GPT超越扩散、视觉生成Scaling Law时刻！北大&字节提出VAR范式

新一代视觉生成范式「VAR: Visual Auto Regressive」视觉自回归来了！使 GPT 风格的自回归模型在图像生成首次超越扩散模型，并观察到与大语言模型相似的 Scaling Laws 缩放定律、Zero-shot Task Generalization 泛化能力：论文标题: "Visual Autoregressive Modeling: Scalable Image Generation via Next-Scale P

全球AI顶会NeurlPS开始收高中生论文了

卷高考之后的下一步，卷论文？培养 AI 人才，要从娃娃抓起，这句话似乎越来越不像开玩笑了。本周五，顶级学术会议 NeurIPS 开设高中生论文 Track 的消息引爆了人工智能社区。消息援引自大会组织方的一项新公告。请注意，这不是 workshop，是主会议：NeurIPS 2024 邀请高中生提交有关机器学习社会影响主题的研究论文。组委会将选出一部分决赛入围者以虚拟方式展示他们的项目，并将在 NeurIPS 主页上重点展示他们的作品。此外，最多五个获奖项目的主要作者将受邀参加在温哥华举行的 NeurIPS 202

OpenAI推销ChatGPT to B业务，微软客户也是目标

奥特曼接待了数百名 500 强公司的高管。技术领先的 OpenAI，正在稳步推进大模型能力的落地。据路透社等媒体报道，OpenAI 首席执行官山姆・奥特曼（Sam Altman）本月在旧金山、纽约和伦敦接待了数百名《财富》500 强公司高管，他和其他 OpenAI 高管在会上推销了供企业使用的人工智能服务，同时还与自己的资金支持者微软的产品进行了一番比对。这些类似路演的活动表明，在通过消费级产品 ChatGPT 引发生成式人工智能爆炸式增长之后，OpenAI 正在寻求从世界各地的企业那里增加新的收入来源 —— 其中

CVPR 2024 | 仅需文本或图像提示，新框架CustomNeRF精准编辑3D场景

美图影像研究院（MT Lab）与中国科学院信息工程研究所、北京航空航天大学、中山大学共同提出了 3D 场景编辑方法 ——CustomNeRF，同时支持文本描述和参考图像作为 3D 场景的编辑提示，该研究成果已被 CVPR 2024 接收。自 2020 年神经辐射场 (Neural Radiance Field, NeRF) 提出以来，将隐式表达推上了一个新的高度。作为当前最前沿的技术之一，NeRF 快速泛化应用在计算机视觉、计算机图形学、增强现实、虚拟现实等领域，并持续受到广泛关注。有赖于易于优化和连续表示的特点，

谁说大象不能起舞! 重编程大语言模型实现跨模态交互的时序预测 | ICLR 2024

最近，来自澳大利亚蒙纳士大学、蚂蚁集团、IBM 研究院等机构的研究人员探索了模型重编程 (model reprogramming) 在大语言模型 (LLMs) 上应用，并提出了一个全新的视角：高效重编程大语言模型进行通用时序预测 –- 其提出的 Time-LLM 框架无需修改语言模型即可实现高精度时序预测，在多个数据集和预测任务中超越了传统的时序模型，让 LLMs 在处理跨模态的时间序列数据时展现出色，就像大象起舞一般！近期，受到大语言模型在通用智能领域的启发，「大模型时序 / 时空数据」这个新方向迸发出了许

阿尔特曼“亲自带货”，消息称 OpenAI 向数百名世界 500 强高管推荐 ChatGPT 企业版

据路透社报道，OpenAI 首席执行官萨姆・阿尔特曼本月在旧金山、伦敦和纽约等地分别接待了数百名《财富》世界 500 强公司的高管。与会者表示，阿尔特曼与其他 OpenAI 高管一同在这些地方为企业提供了人工智能服务，某些情况下更与其“金主”微软进行正面交锋。OpenAI 以消费产品引起了生成式 AI 的爆炸式发展，目前这一最新举动标志着 OpenAI 正寻求从全球企业获得新的收入来源。仅在上个星期之内，就已有两次在美国举行的会面和一次在英国伦敦举行的会面。与会者表示，阿尔特曼在每个城市的活动中直接面向 100 多

古尔曼：苹果 iOS 18 的首批 AI 功能将完全运行于设备端

据彭博社记者马克・古尔曼（Mark Gurman）透露，苹果将于 iOS 18 推出的首批全新 AI 功能将完全运行于设备端，而无需依赖云服务器。古尔曼今日在其 Power On 通讯的问答环节中表示：“随着全球都在翘首期盼苹果在 6 月 10 日发布的重磅 AI 技术，目前看来首批功能将完全在设备上运行。这意味着为这些新功能提供支持的大型语言模型将不会用到云端处理。”古尔曼还指出，苹果未来可能会提供一些基于云端的 AI 功能，这些功能可能由谷歌的 Gemini 或其他供应商提供支持。据报道，苹果已经与谷歌、Op

设计素材不用愁！6 组高质量插画类 Midjourney 提示词

大家好，这里是和你们一起探索 AI 的花生~ 插画是平面设计中不可或缺的一部分，扁平、3D、等距、孟菲斯等风格的插画素材目前在设计中也被广泛应用。所以今天继续为大家整理 5 类插画主题的 Midjourney 提示词，帮助我们更快速高效地生成相关素材~ 上期回顾：一、黑白线条插画 ① A shrimp, hand-drawn outline style, isolated on white background, black and white --ar 1:1 --style raw 一只虾，手绘轮廓风格，隔绝在

工信部：应大力发展基于 AI 大模型的智能装备、软件等产品

据工信部官网，人工智能赋能新型工业化企业座谈会暨第八次制造业企业座谈会于前日召开。工业和信息化部党组书记、部长金壮龙在会上表示，要大力发展基于 AI 大模型的智能装备、软件等智能产品。会中，来自人工智能技术供给侧、智能化转型需求侧的 11 家企业负责人互相交流发言，介绍了底层核心技术研发、工业应用场景开拓、产业生态构建等方面的创新实践，并提出针对性意见建议。另有 14 家企业作书面交流。IT之家注意到，工业和信息化部党组书记、部长金壮龙指出，要落实全国新型工业化推进大会部署，以人工智能和制造业深度融合为主线，以智能

国内首个公共安全领域大模型算法“天擎”通过备案，支持案情推理等

感谢4 月 11 日，国家互联网信息办公室发布第五批深度合成服务算法备案信息的公告，由国投智能研发的“天擎公共安全大模型算法”通过深度合成服务算法备案，成为国内首个通过备案的公共安全领域大模型算法。IT之家了解到，国投智能为国投集团参与国家数字经济安全稳定发展平台，研发发布了美亚“天擎”公共安全大模型。据介绍，美亚“天擎”公共安全大模型拥有丰富的公共安全行业知识，具备强大的警务意图识别、警务情报分析、案情推理，智能指挥调度，法律法规知识库，报告文书生成等业务理解和推理能力，能够从海量数据中持续自我进化，实现行业知识