AI资讯列表 - AI在线

谷歌推出 Gemini 1.5 Pro 公共预览版，现已支持处理音频

谷歌之前在 Google Next 大会上宣布将首次通过其 AI 应用平台 Vertex AI 向公众开放 Gemini 1.5 Pro。谷歌现已推出 Gemini 1.5 Pro 公共预览版，并借此为其赋予了“耳朵”，从而帮助用户处理音频内容，例如可以直接上传一份音频文件让它来分析，或者上传一份财报电话会议录音或视频来让它总结。据称，这个 Gemini 系列中定位“中量级”模型的版本在性能上已经超越了自家更大的模型 ——Gemini Ultra。谷歌称，Gemini 1.5 Pro 可以理解复杂的指令，并且无需对

AI在用| 万万没想到，科技论文还能这么读

机器之能报道编辑：Cardinal以大模型、AIGC为代表的人工智能浪潮已经在悄然改变着我们生活及工作方式，但绝大部分人依然不知道该如何使用。因此，我们推出了「AI在用」专栏，通过直观、有趣且简洁的人工智能使用案例，来具体介绍AI使用方法，并激发大家思考。我们也欢迎读者投稿亲自实践的创新型用例。Claude 3 具有非常大的内存（ 200k 上下文窗口）和很强的调用准确性，它的上下文能力也因此成为最受欢迎、应用最广的技能。我们介绍过如何利用这种能力，没时间收听播客也能获取核心内容。今天，我们再介绍一个新技能，

Nat. Mach. Intell.|设计超高效疫苗，普林斯顿团队开发首个解码mRNA序列大模型

图来自网络编辑 | ScienceAI普林斯顿王梦迪团队迎来了一项具有划时代意义的突破，该团队开发了世界首个解码mRNA非翻译区域序列的大模型，用于准确预测从mRNA到蛋白质的转录功能，及设计新序列用于mRNA疫苗。该研究论文的题目是「A 5’ UTR Language Model for Decoding Untranslated Regions of mRNA and Function Predictions」，已被《Nature Machine Intelligence》接收。这篇论文意味着大语言模型可以用于

不牺牲算法，不挑剔芯片，这个来自中科院的团队正在加速国产AI芯片破局

不降低大模型算法精度，还能把芯片的算力利用效率提升 2~10 倍，这就是编译器的魅力。在《沙丘》构建的未来世界里，「得香料者得天下」。但在生成式 AI 席卷的智能世界里，得 GPU 者得天下。前段时间，外媒 The Information 曝出了一则重磅消息：微软和 OpenAI 正在规划一个雄心勃勃的数据中心项目 —— 建造一台名为「星际之门」的 AI 超级计算机。这台计算机将配备数百万个专用服务器芯片，是目前一些最大数据中心的 100 倍。当然，这个计划是相当烧钱的，成本可能高达 1000 亿美元，令其他公司望

联发科推出生成式 AI 服务平台“达哥”，支持“最强繁体中文大模型”MR BreeXe

感谢据联发科官方消息，在今日举行的生成式 AI 论坛期间，联发科生成式 AI 服务平台 MediaTek DaVinci 正式推出，亦称“联发科技达哥”，目前已有超过 40 家厂商加入其生态系统。据悉，该工具最初为集团内部生成式 AI 工具，被广泛应用于软件开发的需求分析和规格设计、人资的自动媒合、财务的报销流程、法务的专利翻译和合约诉讼等，集团渗透率达到 96%。同时，联发创新基地还发布了该平台最新的繁体中文大型语言模型 MediaTek Research BreeXe（IT之家下文简称 MR BreeXe）。

纯C语言手搓GPT-2，前OpenAI、特斯拉高管新项目火了

「Real men program in C.」众所周知，大语言模型还在快速发展，应该有很多可以优化的地方。我用纯 C 语言来写，是不是能优化一大截？也许很多人开过这样的脑洞，现在有大佬实现了。今天凌晨，前特斯拉 Autopilot 负责人、OpenAI 科学家 Andrej Karpathy 发布了一个仅用 1000 行代码即可在 CPU/fp32 上实现 GPT-2 训练的项目「llm.c」。GitHub 链接：，立即引发了机器学习社区的热烈讨论，项目的 Star 量不到七个小时就冲上了 2000。有网友表示，

2024年WAIC·云帆奖启航：擎启AGI时代，集结超越边界的探索者

2024 年 WAIC・云帆奖面向全球征选 AI 青年技术人才，欢迎点击「此链接」报名或提名。人工智能的研究范式和产业格局正在经历深刻而积极的转变。过去一年，大模型引发了一股席卷全球的智能浪潮，这不仅推动了 AI 技术在更广泛领域的应用，也激发了人类对人工智能深层次潜力的追寻和探索。在这场技术革新的洪流中，通用人工智能（AGI）正逐渐从幻想走进现实。我们正处于一个新征程的起点，这个阶段将以人类对通用智能的不懈追求为特征。迎接即将到来的新时代，让我们将目光投向那些充满激情、勇于探索的青年创新者。他们凭借卓越的智慧和无

杨笛一新作：社恐有救了，AI大模型一对一陪聊，帮i人变成e人

在社交活动中，大语言模型既可以是你的合作伙伴（partner），也可以成为你的导师（mentor）。在人类的社交活动中，为了更有效地在工作和生活中与他人沟通，需要一定的社交技能，比如解决冲突。然而，社交技能的练习环境对于大多数人来说通常是遥不可及的。特别是由专家训练这些技能时，往往耗时、投入高且可用性有限。现有的练习和反馈机制很大程度上依赖专家监督，使训练难以扩展。此外，经过专业培训的教练也缺乏，而大多数可以提供定制化反馈的教练无法帮助大量有需要的人。近日，在由斯坦福助理教授杨笛一为共同一作的论文《Social S

CVPR 2024 | 分割一切模型SAM泛化能力差？域适应策略给解决了

第一个针对「Segment Anything」大模型的域适应策略来了！相关论文已被CVPR 2024 接收。引言大语言模型（LLMs）的成功激发了计算机视觉领域探索分割基础模型的兴趣。这些基础分割模型通常通过 Prompt Engineer 来进行 zero/few 图像分割。其中，Segment Anything Model（SAM）是最先进的图像分割基础模型。图 SAM 在多个下游任务上表现不佳但是最近的研究表明，SAM 在多种下游任务中并非具有很强的

小米 Redmi Turbo 3 手机支持 AI 隔空手势与 AI 魔法消除 Pro

感谢小米 Redmi Turbo 3 手机将于 4 月 10 日 19 点发布，搭载高通骁龙 8s Gen 3 芯片。今日，小米官方对这款新机的 AI 功能进行预热。据介绍，Redmi Turbo 3 支持 AI 隔空手势，基于高通骁龙 8s Gen 3 芯片的旗舰 AI 技术，搭配全新升级的 AON 前置摄像头实现 24 小时智能感知，实时响应用户操作。小米宣传其为“同档绝无仅有的 AI 实力”。根据网上流传的设置界面信息，隔空手势 Beta 版需要手在距离摄像头 15~40 厘米处稍作停留，待屏幕上方出现手型

马斯克预测 AI 在两年内能超越最聪明的人类

感谢特斯拉 CEO 埃隆・马斯克（Elon Musk）周一预测，AI 在明年或 2026 年就能超越最聪明的人类。马斯克当地时间周一在社交媒体平台 X（以前称为推特）语音空间上接受了挪威主权财富基金首席执行官 Nicolai Tangen 的采访。当被问及 AGI（通用人工智能）的发展时间表时，马斯克表示，如果你将 AGI 定义为比最聪明的人更聪明，我想可能是明年，或者两年内。AGI 为 Artificial General Intelligence 的首字母缩写，意为人工通用智能。通用人工智能是一个人工智能理论研

英特尔展示多模块芯片预热 Vision 2024 活动，预计为 Gaudi 3 人工智能加速器

英特尔官方账户近日在 X 平台晒出一段包含“至少十个”模块的复合芯片近照短视频，为北京时间今日 23:30 开幕的 Vision 2024 活动进行预热。根据该动态下方消息人士 Bionic_Squash 和 Raichu 的回复，以及同IT之家以往报道中概念图的对比，图中芯片基本确认为英特尔 Gaudi 3 人工智能加速器。▲ 此前报道中出现的 Gaudi 3 概念图视频显示，Gaudi 3 芯片整体包含 10 个主要模块，包含 2 个用短边相连的计算模块和 8 个内存堆栈（HBM 模块）。英特尔此前表示 Gau

特斯联完成20亿元D轮融资，推领域大模型，促AGI落地

今日，人工智能物联网（AIoT）企业特斯联宣布完成 D 轮 20 亿人民币融资交割。本轮融资由国际著名投资机构 AL Capital 与国内产业基金阳明股权投资基金共同领投，国家发改委旗下投资平台、福田资本、金地集团、重科控股、数字重庆、南昌政府平台公司、徐州产业基金、北科建集团、光大控股、商汤科技等新老股东一同跟投。据介绍，所募资金将用于完善具有多模态能力的领域大模型在园区、企业、经济、能源等多场景的应用，打造高灵活度、高性能的智算基础设施，构建技术壁垒，进一步在人工智能物联网领域的国际竞争格局中形成产业化、集群

仅次于 Meta，马斯克透露特斯拉囤积的英伟达 H100 芯片数量

埃隆・马斯克麾下的特斯拉和其神秘的以人工智能为核心的公司 xAI，储备了大量的英伟达 H100 系列芯片。特斯拉意欲借此攻克自动驾驶的终极难题 ——L5 级自动驾驶，而 xAI 则肩负着实现马斯克的“终极真相人工智能”愿景。X 平台用户“The Technology Brother”最近发布消息称，Meta 公司已经囤积了全球最多的 H100 GPU，数量达到惊人的 35 万块。然而，马斯克对该排行榜将特斯拉和 xAI 的排名边缘化表示不满（1 万颗），并指出“如果计算正确，特斯拉应该是第二名，xAI 将是第三名”

第二波！2024年4月精选实用设计工具合集

大家好，这是 2024 年 4 月的第 2 波干货合集！这一期干货合集当中，包含了 3 款 AI 工具，分别是生成网页的配色和字体排版样式的 AI 工具，专门生成产品包装设计的 AI 工具，生成 UI 界面的 AI 工具，显而易见都是好东西。另外还推荐了 3 个各有偏向的资源和设计推荐网站，它们都搜集整理了大量有用的 AI 工具和设计资源以及优秀设计。当然，在此之前记得看看往期干货中有没有你感兴趣的素材：下面我们具体看看这一期的干货： 1、基于 AI 的配色方案生成工具 UI/UX 设计师和前端的在线工具，它

实战案例！如何用 ComfyUI 给模特换服装？

一、前言当你从优设这么多高含金量的内容里面找到这我这篇，我相信你肯定不是单纯的为了工作，很好！技术的迭代其核心驱动一定是兴趣，而不仅仅是为了去打工！在工作之余，给你身边的小姐姐，小哥哥们提供适当的情绪价值，回报一定会超乎你的想象。当然，今天分享的，纯粹是技术实现路径，审美这块，我相信你肯定比我强。（在多年的甲方教育下，审美已经不存在了）闲话就说到这里，开整！二、模特换服装和场景 1. 不一样的摄影需求为什么要做这个事？在学习开始之前，整明白这个事，可以很好的帮你做好心理建设，拉高你的预期，这样在遇到

斯坦福团队新作：喊话就能指导机器人，任务成功率暴增，网友：特斯拉搞快点

斯坦福的 ALOHA 家务机器人团队，发布了最新研究成果 ——项目名为 Yell At Your Robot（简称 YAY），有了它，机器人的“翻车”动作，只要喊句话就能纠正了！而且机器人可以随着人类的喊话动态提升动作水平、即时调整策略，并根据反馈持续自我改进。比如在这个场景中，机器人没能完成系统设定的“把海绵放入袋子”的任务。这时研究者直接朝它喊话，“用海绵把袋子撑得再开一些”，之后就一下子成功了。而且，这些纠正的指令还会被系统记录下来，成为训练数据，用于进一步提高机器人的后续表现。有网友看了说，既然已经能朝着机

消息称三星与韩国互联网巨头 NAVER 启动 Mach-2 人工智能芯片联合研发

感谢据韩媒 ETNews 报道，三星电子与韩国互联网巨头 NAVER 双方已启动人工智能芯片 Mach-2 的联合研发。消息人士透露，双方正在讨论 Mach-2 芯片开发设计的重点。该芯片将由 NAVER 设计核心软件，三星电子则负责芯片的设计和生产。三星电子与 NAVER 于 2022 年达成研发合作协议，为超大规模人工智能模型（如 NAVER 的 HyperCLOVA X 模型）开发定制半导体解决方案，最近引发关注的 Mach-1 推理加速芯片就是双方合作的成果。开发双方宣称，Mach-1 采用了独特设计，在能