AI资讯列表 - AI在线

5亿个token之后，我们得出关于GPT的七条宝贵经验

ChatGPT 正确的使用姿势。自 ChatGPT 问世以来，OpenAI 一直被认为是全球生成式大模型的领导者。2023 年 3 月，OpenAI 官方宣布，开发者可以通过 API 将 ChatGPT 和 Whisper 模型集成到他们的应用程序和产品中。在 GPT-4 发布的同时 OpenAI 也开放了其 API。一年过去了，OpenAI 的大模型使用体验究竟如何，行业内的开发者怎么评价？最近，初创公司 Truss 的 CTO Ken Kantzer 发布了一篇题为《Lessons after a half-b

MLLM真能看懂数学吗？MathVerse来了次摸底测评，放出当天登热榜

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：[email protected]；[email protected]。1、背景在大算力的数字化时代下，大语言模型（LLM）以其令人瞩目的发展速度，正引领着技术的潮流。基于它们强大的文本理解和生成能力，各大研究机构正在探索如何将这些能力扩展至视觉领域，构建一

消息称三星电子在硅谷开设先进处理器实验室，聚焦 RISC-V IP 开发

据韩媒 Sedaily 报道，三星电子通过旗下三星综合研究院（SAIT，Samsung Advanced Institute of Technology）在美国硅谷开设了面向人工智能芯片设计的先进处理器实验室。该实验室将专注于 RISC-V 架构处理器 IP 的设计工作，最终目标是打造基于 RISC-V 架构的自研人工智能芯片，打破英伟达在人工智能芯片领域的霸权。三星电子目前的大部分处理器产品均基于 Arm 架构，这意味着其受制于 Arm 公司的处理器设计，同时需要向 Arm 公司支付相对较高的 IP 授权费用。相

4000万蛋白结构训练，西湖大学开发基于结构词表的蛋白质通用大模型，已开源

编辑 | ScienceAI蛋白质结构相比于序列往往被认为更加具有信息量，因为其直接决定了蛋白质的功能。而随着AlphaFold2带来的巨大突破，大量的预测结构被发布出来供人研究使用。如何利用这些蛋白质结构来训练强大且通用的表征模型是一个值得研究的方向。西湖大学的研究人员利用Foldseek来处理蛋白质结构，将其编码成一维的离散token，并与传统的氨基酸进行结合，形成了结构感知词表（Structure-aware Vocabulary），以此将结构信息嵌入到模型输入中，增强模型的表征能力。在预训练上，论文使用了目

台积电：AI 服务器处理器需求快速增长，预计到 2028 年贡献 20% 营收

台积电在昨日的季度财报电话会议上表示，AI 服务器处理器需求强劲，并将持续快速增长，到 2028 年相关业务可贡献总收入的 20%。台积电方面将 AI 服务器处理器狭义定义为执行 AI 训练和推理的 GPU、CPU 和 AI 加速器，不包含网络边缘和消费级设备上的 AI 处理器。台积电 CEO 魏哲家表示，今年台积电在 AI 服务器处理器方面的营收预计将相对去年翻倍，占整体收入的约一成。未来 5 年相关收入将在今年的基础上实现 50% 的复合年增长率，到 2028 年可贡献总体收入的 20%。魏哲家称，台积电是 A

蚂蚁集团、浙江大学联合发布开源大模型知识抽取框架OneKE

近日，由蚂蚁集团和浙江大学联合研发的大模型知识抽取框架OneKE宣布开源，并且捐赠给OpenKG开放知识图谱社区。知识图谱是实现大模型可信可控的关键技术之一，知识抽取可助力构建领域知识图谱。OneKE致力于帮助研究人员和开发者更好地处理信息抽取、文本数据结构化、知识图谱构建等问题。比如，通过OneKE抽取风险事件、人物实体、机构实体等可以清晰呈现事件脉络、事件发展趋势和实体之间关联，构建好的图谱可以帮助大模型实现跨实体、跨文档的复杂推理。OneKE支持中英双语，支持OpenSPG及DeepKE开源框架，可开箱即用

端到端自动驾驶、多模态场景大脑、全新3D交互：商汤绝影大模型即将亮相北京车展

商汤绝影将带来面向量产的真·端到端自动驾驶解决方案UniAD上车演示首秀商汤绝影打造敏锐洞察、深度思考、高效执行的多模态场景大脑“Vision Pro”裸眼上车，商汤绝影将展示全球首创3D高精视线交互时隔四年，2024北京国际汽车展览会将于4月25日至5月4日重磅回归。作为行业首个提出感知决策一体化自动驾驶通用模型的公司，商汤绝影将带来面向量产的真·端到端自动驾驶解决方案UniAD的上车演示首秀，同时还会展示以多模态场景大脑为核心的AI大模型座舱产品矩阵和全新座舱3D交互。目前，通用人工智能正在和智能汽车产业深度融

港股IPO招股异常火爆，唯一盈利的「AIGC第一股」是怎么炼成的？

4 月 16-19 日，AI 公司「出门问问」在港交所招股。据悉，出门问问的港股打新持续火爆，首日发售超额认购超 8 倍，目前已近 30 倍覆盖。另招股首日，国际配售部分已超额，其中国际及中资意见领袖型机构均积极下单参与。除了 AIGC 风口之上的赛道火爆，在二级市场，更有分析师将出门问问定位为「唯一盈利的 AIGC」股。目前，热炒一年多的生成式 AI 浪潮在二级市场并没有太多标的。因此，出门问问的上市对二级市场来说是一个很好的补充，市场本身表现出了一定的热情。从招股书中看，出门问问的商业模式十分清晰，来自 AI

谁才是最强的？清华给海内外知名大模型做了场综合能力评测

在 2023 年的 “百模大战” 中，众多实践者推出了各类模型，这些模型有的是原创的，有的是针对开源模型进行微调的；有些是通用的，有些则是行业特定的。如何能合理地评价这些模型的能力，成为关键问题。尽管国内外存在多个模型能力评测榜单，但它们的质量参差不齐，排名差异显著，这主要是因为评测数据和测试方法尚不成熟和科学，而好的评测方法应当具备开放性、动态性、科学性和权威性。为提供客观、科学的评测标准，清华大学基础模型研究中心联合中关村实验室研制了 SuperBench 大模型综合能力评测框架，旨在推动大模型技术、应用和生态

2024谷歌研究学者计划名单公布：清华、北大、上交ACM班等校友在列

2024 年谷歌研究学者计划共涉及 12 个领域，多位华人学者获奖。2024 年谷歌研究学者计划（Research Scholar Program）获奖名单公布了。获奖者最高将获得 6 万美元奖金，用于支持研究工作。今年该计划共涉及 12 个领域，包括算法与优化；应用科学；人机交互；健康研究；机器学习和数据挖掘；机器感知；系统；自然语言处理；隐私；量子计算；安全；软件工程和编程语言。链接：（排名不分先后）：算法与优化顾研（Yan Gu）：加州大学河滨分校Yihan Sun：加州大学河滨分校获奖研究：图挖掘的高效并行

Lydia 动作大模型亮相，虚拟动点助力“利亚德集团2024年生态合作伙伴大会”

随着「百模大战」进入白热化阶段，通用大模型的优势和弊端都已渐渐显露。与此同时，能应用在特定行业的垂直大模型，具备优越的落地场景，有更多来自市场的切实需求。利亚德集团的动作大模型便是行业垂直大模型的代表。

华为Pura70系列发布：麒麟9010+可伸缩镜头，上线秒抢光

新手机依然难抢。今天上午 10 点，华为 Pura70 系列手机直接开售了。本周一，华为宣布 P 系列升级为 Pura，首款机型就是今天推出的华为 Pura 70。根据华为商城显示，新一代 Pura70 共有四个版本。其中两个型号 Pura70 Ultra 和 Pura70 Pro 立即开售，但瞬间即宣告缺货；Pura70 Pro 和 Pura70 则预计会在 4 月 22 日上午 10：08 开售。从官方宣传视频中可以看到，华为 Pura70 系列采用了全新的三角造型主摄像头模组设计，定位为年度影像旗舰标杆，不

波士顿动力新版人形机器人Atlas问世，纯电驱动

「退役」仅一天，波士顿动力 Atlas 机器人就回来了。今天凌晨，我们见证了新一代人形机器人 Atlas 的诞生。新机器人的视频一出，我们立即理解了波士顿动力为何退役已开发十多年的旧版 Atlas—— 人形机器人，现在应该有的是超越人类的灵活性。Atlas 机器人躺平在实验室的地板上，看起来是仰卧，但突然关节反转站了起来，腿部巧妙的旋转方式有效地做到了人类无法做到的事。当 Atlas 完全站立时，它背对着镜头，然后头部旋转 180 度左右，然后躯干也随之旋转。它站立了一会儿，我们第一次清晰地看到它的头部 —— 一个

生成式AI如何告别色情、版权困扰？基于权重显著性的机器遗忘算法有奇效

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：[email protected]；[email protected]。近期，硅谷 AI 公司 OpenAI 可谓是话题度拉满，先是一出「宫斗戏」引起舆论哗然，后是公布 Sora 效果炸裂受到了全网的一致好评。在这期间，一桩诉讼案件同样引爆了热点 —— 因

让蒙娜丽莎唱饶舌，微软发布 VASA-1 模型：图 + 音频可生成短视频

微软亚洲研究院（Microsoft Research Asia）近日发表论文，介绍了全新的 VASA-1 模型，用户只需要提供一张静态肖像图片和一段语音音频片段，该模型就能自动让图片中的人物自动说话。 VASA-1 特别有趣的地方在于，它能够模拟自然的面部表情、各种情绪和唇部同步，最重要的是几乎没有人工痕迹，如果不细看很难发现。研究人员承认，与所有其他模型一样，该模型目前还无法妥善处理头发等非刚性元素，但整体效果要比其它同类模型要更为优秀。研究人员还表示 VASA-1 支持离线 batch 处理模式下，以 45

Meta AI 全球市场扩张，并上线网页版 meta.ai

Meta 公司近日宣布 Llama 3 大语言模型之外，扩展 Meta AI 服务到美国之外的 13 个国家和地区，还宣布上线专门的聊天网站：meta.ai。Meta 公司在新闻稿中表示开始在全球市场扩展 Meta AI，在澳大利亚、加拿大、南非和新加坡等国家和地区推出英语版本。IT之家附上 Meta AI 扩展的国家和地区如下澳大利亚加拿大加纳牙买加马拉维新西兰尼日利亚巴基斯坦新加坡南非乌干达赞比亚津巴布韦Meta AI 整合了 Llama 3 大语言模型，速度更快、智能性更高、功能更强，是执行各种任务的理想选择

Meta 发布 Llama 3，号称是最强大的开源大语言模型

感谢Meta 公司今天发布新闻稿，宣布推出下一代大语言模型 Llama 3，共有 80 亿和 700 亿参数两种版本，号称是最强大的开源大语言模型。Meta 声称，Llama 3 的性能优于 Claude Sonnet、Mistral Medium 和 GPT-3.5，IT之家附上 Llama 3 的主要特点如下：向所有人开放：Meta 开源 Llama 3 的 80 亿参数版本，让所有人都能接触最前沿的人工智能技术。全球各地的开发人员、研究人员和好奇心强的人都可以进行游戏、构建和实验。更聪明、更安全：Llama

LTX Studio 最新测评! 颠覆传统的一站式 AI 视频创作神器

大家好，这里是和你们一起探索 AI 的花生~ AI 视频生成工具正在被越来越多地应用到实际创作中，大家应该看过不少用 AI 生成的 “电影预告片”，比如 CCTV6 电影频道发起的 “AI 影像人才优选计划” 中的短片《玉覆荆楚》，效果就非常惊艳。像此类视频一般需要先写好剧本分镜，然后用 Midjourney 或者 SD 出图，再用 Runway 或者 Dreamina 这样的 AI 视频工具分别生成动态，最后再导入 Pr 或者剪映中进行后期编辑处理，最终形成一个完整的短片。不过今天我要为大家介绍一款新的工具 L