资讯列表

谷歌推出 Gemini 1.5 Pro 公共预览版,现已支持处理音频

谷歌之前在 Google Next 大会上宣布将首次通过其 AI 应用平台 Vertex AI 向公众开放 Gemini 1.5 Pro。谷歌现已推出 Gemini 1.5 Pro 公共预览版,并借此为其赋予了“耳朵”,从而帮助用户处理音频内容,例如可以直接上传一份音频文件让它来分析,或者上传一份财报电话会议录音或视频来让它总结。据称,这个 Gemini 系列中定位“中量级”模型的版本在性能上已经超越了自家更大的模型 ——Gemini Ultra。谷歌称,Gemini 1.5 Pro 可以理解复杂的指令,并且无需对

AI在用| 万万没想到,科技论文还能这么读

机器之能报道编辑:Cardinal以大模型、AIGC为代表的人工智能浪潮已经在悄然改变着我们生活及工作方式,但绝大部分人依然不知道该如何使用。因此,我们推出了「AI在用」专栏,通过直观、有趣且简洁的人工智能使用案例,来具体介绍AI使用方法,并激发大家思考。   我们也欢迎读者投稿亲自实践的创新型用例。Claude 3 具有非常大的内存( 200k 上下文窗口)和很强的调用准确性,它的上下文能力也因此成为最受欢迎、应用最广的技能。我们介绍过如何利用这种能力,没时间收听播客也能获取核心内容。今天,我们再介绍一个新技能,

Nat. Mach. Intell.|设计超高效疫苗,普林斯顿团队开发首个解码mRNA序列大模型

图来自网络编辑 | ScienceAI普林斯顿王梦迪团队迎来了一项具有划时代意义的突破,该团队开发了世界首个解码mRNA非翻译区域序列的大模型,用于准确预测从mRNA到蛋白质的转录功能,及设计新序列用于mRNA疫苗。该研究论文的题目是「A 5’ UTR Language Model for Decoding Untranslated Regions of mRNA and Function Predictions」,已被《Nature Machine Intelligence》接收。这篇论文意味着大语言模型可以用于

不牺牲算法,不挑剔芯片,这个来自中科院的团队正在加速国产AI芯片破局

不降低大模型算法精度,还能把芯片的算力利用效率提升 2~10 倍,这就是编译器的魅力。在《沙丘》构建的未来世界里,「得香料者得天下」。但在生成式 AI 席卷的智能世界里,得 GPU 者得天下。前段时间,外媒 The Information 曝出了一则重磅消息:微软和 OpenAI 正在规划一个雄心勃勃的数据中心项目 —— 建造一台名为「星际之门」的 AI 超级计算机。这台计算机将配备数百万个专用服务器芯片,是目前一些最大数据中心的 100 倍。当然,这个计划是相当烧钱的,成本可能高达 1000 亿美元,令其他公司望

联发科推出生成式 AI 服务平台“达哥”,支持“最强繁体中文大模型”MR BreeXe

感谢据联发科官方消息,在今日举行的生成式 AI 论坛期间,联发科生成式 AI 服务平台 MediaTek DaVinci 正式推出,亦称“联发科技达哥”,目前已有超过 40 家厂商加入其生态系统。据悉,该工具最初为集团内部生成式 AI 工具,被广泛应用于软件开发的需求分析和规格设计、人资的自动媒合、财务的报销流程、法务的专利翻译和合约诉讼等,集团渗透率达到 96%。同时,联发创新基地还发布了该平台最新的繁体中文大型语言模型 MediaTek Research BreeXe(IT之家下文简称 MR BreeXe)。 

纯C语言手搓GPT-2,前OpenAI、特斯拉高管新项目火了

「Real men program in C.」众所周知,大语言模型还在快速发展,应该有很多可以优化的地方。我用纯 C 语言来写,是不是能优化一大截?也许很多人开过这样的脑洞,现在有大佬实现了。今天凌晨,前特斯拉 Autopilot 负责人、OpenAI 科学家 Andrej Karpathy 发布了一个仅用 1000 行代码即可在 CPU/fp32 上实现 GPT-2 训练的项目「llm.c」。GitHub 链接:,立即引发了机器学习社区的热烈讨论,项目的 Star 量不到七个小时就冲上了 2000。有网友表示,

2024年WAIC·云帆奖启航:擎启AGI时代,集结超越边界的探索者

2024 年 WAIC・云帆奖面向全球征选 AI 青年技术人才,欢迎点击「此链接」报名或提名。人工智能的研究范式和产业格局正在经历深刻而积极的转变。过去一年,大模型引发了一股席卷全球的智能浪潮,这不仅推动了 AI 技术在更广泛领域的应用,也激发了人类对人工智能深层次潜力的追寻和探索。在这场技术革新的洪流中,通用人工智能(AGI)正逐渐从幻想走进现实。我们正处于一个新征程的起点,这个阶段将以人类对通用智能的不懈追求为特征。迎接即将到来的新时代,让我们将目光投向那些充满激情、勇于探索的青年创新者。他们凭借卓越的智慧和无

杨笛一新作:社恐有救了,AI大模型一对一陪聊,帮i人变成e人

在社交活动中,大语言模型既可以是你的合作伙伴(partner),也可以成为你的导师(mentor)。在人类的社交活动中,为了更有效地在工作和生活中与他人沟通,需要一定的社交技能,比如解决冲突。然而,社交技能的练习环境对于大多数人来说通常是遥不可及的。特别是由专家训练这些技能时,往往耗时、投入高且可用性有限。现有的练习和反馈机制很大程度上依赖专家监督,使训练难以扩展。此外,经过专业培训的教练也缺乏,而大多数可以提供定制化反馈的教练无法帮助大量有需要的人。近日,在由斯坦福助理教授杨笛一为共同一作的论文《Social S

CVPR 2024 | 分割一切模型SAM泛化能力差?域适应策略给解决了

第一个针对「Segment Anything」大模型的域适应策略来了!相关论文已被CVPR 2024 接收。引言大语言模型(LLMs)的成功激发了计算机视觉领域探索分割基础模型的兴趣。这些基础分割模型通常通过 Prompt Engineer 来进行 zero/few 图像分割。其中,Segment Anything Model(SAM)是最先进的图像分割基础模型。                             图  SAM 在多个下游任务上表现不佳但是最近的研究表明,SAM 在多种下游任务中并非具有很强的

小米 Redmi Turbo 3 手机支持 AI 隔空手势与 AI 魔法消除 Pro

感谢小米 Redmi Turbo 3 手机将于 4 月 10 日 19 点发布,搭载高通骁龙 8s Gen 3 芯片。今日,小米官方对这款新机的 AI 功能进行预热。据介绍,Redmi Turbo 3 支持 AI 隔空手势,基于高通骁龙 8s Gen 3 芯片的旗舰 AI 技术,搭配全新升级的 AON 前置摄像头 实现 24 小时智能感知,实时响应用户操作。小米宣传其为“同档绝无仅有的 AI 实力”。根据网上流传的设置界面信息,隔空手势 Beta 版需要手在距离摄像头 15~40 厘米处稍作停留,待屏幕上方出现手型

马斯克预测 AI 在两年内能超越最聪明的人类

感谢特斯拉 CEO 埃隆・马斯克(Elon Musk)周一预测,AI 在明年或 2026 年就能超越最聪明的人类。马斯克当地时间周一在社交媒体平台 X(以前称为推特)语音空间上接受了挪威主权财富基金首席执行官 Nicolai Tangen 的采访。当被问及 AGI(通用人工智能)的发展时间表时,马斯克表示,如果你将 AGI 定义为比最聪明的人更聪明,我想可能是明年,或者两年内。AGI 为 Artificial General Intelligence 的首字母缩写,意为人工通用智能。通用人工智能是一个人工智能理论研

英特尔展示多模块芯片预热 Vision 2024 活动,预计为 Gaudi 3 人工智能加速器

英特尔官方账户近日在 X 平台晒出一段包含“至少十个”模块的复合芯片近照短视频,为北京时间今日 23:30 开幕的 Vision 2024 活动进行预热。根据该动态下方消息人士 Bionic_Squash 和 Raichu 的回复,以及同IT之家以往报道中概念图的对比,图中芯片基本确认为英特尔 Gaudi 3 人工智能加速器。▲ 此前报道中出现的 Gaudi 3 概念图视频显示,Gaudi 3 芯片整体包含 10 个主要模块,包含 2 个用短边相连的计算模块和 8 个内存堆栈(HBM 模块)。英特尔此前表示 Gau

特斯联完成20亿元D轮融资,推领域大模型,促AGI落地

今日,人工智能物联网(AIoT)企业特斯联宣布完成 D 轮 20 亿人民币融资交割。本轮融资由国际著名投资机构 AL Capital 与国内产业基金阳明股权投资基金共同领投,国家发改委旗下投资平台、福田资本、金地集团、重科控股、数字重庆、南昌政府平台公司、徐州产业基金、北科建集团、光大控股、商汤科技等新老股东一同跟投。据介绍,所募资金将用于完善具有多模态能力的领域大模型在园区、企业、经济、能源等多场景的应用,打造高灵活度、高性能的智算基础设施,构建技术壁垒,进一步在人工智能物联网领域的国际竞争格局中形成产业化、集群

仅次于 Meta,马斯克透露特斯拉囤积的英伟达 H100 芯片数量

埃隆・马斯克麾下的特斯拉和其神秘的以人工智能为核心的公司 xAI,储备了大量的英伟达 H100 系列芯片。特斯拉意欲借此攻克自动驾驶的终极难题 ——L5 级自动驾驶,而 xAI 则肩负着实现马斯克的“终极真相人工智能”愿景。X 平台用户“The Technology Brother”最近发布消息称,Meta 公司已经囤积了全球最多的 H100 GPU,数量达到惊人的 35 万块。然而,马斯克对该排行榜将特斯拉和 xAI 的排名边缘化表示不满(1 万颗),并指出“如果计算正确,特斯拉应该是第二名,xAI 将是第三名”

第二波!2024年4月精选实用设计工具合集

大家好,这是 2024 年 4 月的第 2 波干货合集!这一期干货合集当中,包含了 3 款 AI 工具,分别是生成网页的配色和字体排版样式的 AI 工具,专门生成产品包装设计的 AI 工具,生成 UI 界面的 AI 工具,显而易见都是好东西。另外还推荐了 3 个各有偏向的资源和设计推荐网站,它们都搜集整理了大量有用的 AI 工具和设计资源以及优秀设计。 当然,在此之前记得看看往期干货中有没有你感兴趣的素材:下面我们具体看看这一期的干货: 1、 基于 AI 的配色方案生成工具 UI/UX 设计师和前端的在线工具,它

实战案例!如何用 ComfyUI 给模特换服装?

一、前言 当你从优设这么多高含金量的内容里面找到这我这篇,我相信你肯定不是单纯的为了工作,很好! 技术的迭代其核心驱动一定是兴趣,而不仅仅是为了去打工! 在工作之余,给你身边的小姐姐,小哥哥们提供适当的情绪价值,回报一定会超乎你的想象。 当然,今天分享的,纯粹是技术实现路径,审美这块,我相信你肯定比我强。(在多年的甲方教育下,审美已经不存在了) 闲话就说到这里,开整!二、模特换服装和场景 1. 不一样的摄影需求 为什么要做这个事? 在学习开始之前,整明白这个事,可以很好的帮你做好心理建设,拉高你的预期, 这样在遇到

斯坦福团队新作:喊话就能指导机器人,任务成功率暴增,网友:特斯拉搞快点

斯坦福的 ALOHA 家务机器人团队,发布了最新研究成果 ——项目名为 Yell At Your Robot(简称 YAY),有了它,机器人的“翻车”动作,只要喊句话就能纠正了!而且机器人可以随着人类的喊话动态提升动作水平、即时调整策略,并根据反馈持续自我改进。比如在这个场景中,机器人没能完成系统设定的“把海绵放入袋子”的任务。这时研究者直接朝它喊话,“用海绵把袋子撑得再开一些”,之后就一下子成功了。而且,这些纠正的指令还会被系统记录下来,成为训练数据,用于进一步提高机器人的后续表现。有网友看了说,既然已经能朝着机

消息称三星与韩国互联网巨头 NAVER 启动 Mach-2 人工智能芯片联合研发

感谢据韩媒 ETNews 报道,三星电子与韩国互联网巨头 NAVER 双方已启动人工智能芯片 Mach-2 的联合研发。消息人士透露,双方正在讨论 Mach-2 芯片开发设计的重点。该芯片将由 NAVER 设计核心软件,三星电子则负责芯片的设计和生产。三星电子与 NAVER 于 2022 年达成研发合作协议,为超大规模人工智能模型(如 NAVER 的 HyperCLOVA X 模型)开发定制半导体解决方案,最近引发关注的 Mach-1 推理加速芯片就是双方合作的成果。开发双方宣称,Mach-1 采用了独特设计,在能