应用

GitHub Copilot 进驻 Windows Terminal 和苹果 Xcode,助力开发者效率提升

在 GitHub Universe 大会上,GitHub 宣布了备受期待的 GitHub Copilot 重大更新,该智能代码助手将登陆 Windows Terminal 和 Xcode 开发环境。 首先,GitHub Copilot 将登陆 Windows Terminal。 通过与 Windows Terminal Canary 版本中的终端聊天功能结合,开发者可以直接在终端内获得来自 Copilot 的命令建议和解释。

消息称 OpenAI 正与博通、台积电联手,共同打造自研芯片

感谢北京时间今天凌晨,据路透社援引知情人士消息称,OpenAI 正携手 Broadcom 和台积电开发首款自研 AI 芯片,并在英伟达芯片的基础上增添 AMD 芯片,以应对急剧扩张的基础设施需求。 成长势头正猛的 OpenAI 是 ChatGPT 背后的公司,其正在多方探索多样化芯片供应渠道,降低成本,曾考虑自行生产,并为一项建造“晶圆厂”网络的高昂计划筹资,全面掌控芯片制造。 不过,由于该计划耗资巨大且时间漫长,OpenAI 已暂时搁置建厂计划,转向内部设计芯片。

谷歌 CEO 桑达尔・皮查伊:努力在明年推出具有可视化功能的 AI 助理

北京时间今天凌晨,谷歌 CEO 桑达尔・皮查伊在公司第三季度财报电话会议上透露了“Project Astra”计划的最新进展。 他表示,谷歌正在构建能够识别和推理用户周围环境的 AI 体验,“‘Project Astra’代表了这种未来的初步探索。 我们正力争在 2025 年尽早推出类似体验。

养猪、插秧、搬货……这才是机器人该干的活儿

AI好好用报道编辑:杨文开心的活儿还是留给人类吧。 近两年,AI 发展得如火如荼,不少人却在抱怨:AI 真不是个好东西。 理由很简单。

探秘全球最大 AI 集群 xAI Colossus:122 天建成,10 万张英伟达 H100 构筑马斯克 AI 愿景

科技媒体 servethehome 昨日(10 月 28 日)发布博文,应 xAI 公司邀请,参观了 Colossus 全球最大 AI 训练集群。 AI在线曾于今年 9 月报道,xAI 在 Supermicro 的帮助下,在短短 122 天时间内搭建 10 万张英伟达 H100,而该公司计划未来将再翻倍增加 10 万张 GPU,其中 5 万张为更先进的 H200。 xAI Colossus 配备了英伟达 HGX H100 服务器,每台服务器内含 8 张 H100 GPU,所有服务器都在 Supermicro 的 4U 水冷系统中运行,确保高效散热。

全国首批人形机器人具身智能标准发布:按下肢运动、上肢作业等分 4 个等级

据浦东发布消息,人形机器人及具身智能创新论坛昨日在上海召开,国家地方共建人形机器人创新中心联合行业内头部企业和机构,共同发布全国首批人形机器人具身智能标准 ——《人形机器人分类分级应用指南》《具身智能智能化等级分级指南》。 ▲ 图源浦东发布公众号《人形机器人分类分级应用指南》定义了人形机器人通用、结构、智能相关的术语名词,从结构外观、移动方式、智能模型等方面进行指导分类,按照具身智能、下肢运动、上肢作业、应用环境等作为分级要素,将人形机器人划分为 L1-L4 四个技术等级(详细标准暂未公开,下同)。 《具身智能智能化等级分级指南》规定了具身智能技术领域的智能化等级划分依据,采用系统功能性、自主性、泛化性的分级原则,按照感知、认知、决策、自主等核心能力作为分级要素,将智能化等级从基础到高级智能化水平划分为 G1-G5 五个阶段。

智源推出全能视觉生成模型 OmniGen:支持文生图、图像编辑等

北京智源人工智能研究院(BAAI)推出了新的扩散模型架构 OmniGen,这是一种用于统一图像生成的多模态模型。 ▲ 文本生成图像,编辑生成图像的部分元素,根据生成图像的人体姿态生成重绘图像,从另一图像中提取所需对象与新图像融合官方表示,OmniGen 具有以下特点:统一性:OmniGen 天然地支持各种图像生成任务,例如文生图、图像编辑、主题驱动生成和视觉条件生成等。 此外,OmniGen 可以处理经典的计算机视觉任务,将其转换为图像生成任务。

Anthropic挖走DeepMind强化学习大牛、AlphaGo核心作者Julian Schrittwieser

从 AlphaGo、AlphaZero 、MuZero 到 AlphaCode、AlphaTensor,再到最近的 Gemini 和 AlphaProof,Julian Schrittwieser 的工作成果似乎比他的名字更广为人知。 今天的 AI 社区,再次被一则大佬转会消息吸引了目光。 在谷歌工作十年后,大名鼎鼎的谷歌 DeepMind Alpha 系列核心作者 Julian Schrittwieser,宣布加入 Anthropic。

丹麦首台AI超级计算机,NVIDIA技术加持,服务于量子计算、清洁能源、生物技术等领域

编辑 | 萝卜皮2024 年 10 月 23 日 NVIDIA 创始人兼首席执行官黄仁勋携手丹麦国王启动该国最大 AI 超级计算机,旨在实现量子计算、清洁能源、生物技术等领域的突破,服务丹麦社会乃至全球。 丹麦首台 AI 超级计算机以丹麦神话中的女神命名为 Gefion。 Gefion 由丹麦人工智能创新中心 (DCAI) 运营,该公司由全球最富有的慈善基金会 Novo Nordisk 基金会和丹麦出口与投资基金资助成立。

神秘模型“小熊猫”一夜刷屏:排名超 Flux、Midjourney

一夜之间,名为“red_panda” (小熊猫)的神秘文生图模型狠狠火了! ! 登顶文生图竞技场,直接将 Flux、Midjourney 等一众顶尖模型踩在脚下 ——其 ELO 得分比 Flux 1.1 Pro 高出 100 多,胜率高达 79%,每 7 秒就能生成一张图像。

古早费曼论文手写公式也能转LaTeX,还能看懂梗图,马斯克Grok新功能上线就火了

Grok 大模型终于能看懂图像了。 设想一下,如果我们能够将所有 LaTeX 时代之前的文本资料输入到先进的大型语言模型(LLM)中,并从中获得格式规范的 LaTeX 文档库,这无疑将极大地推动科学文献的数字化进程和标准化工作。 对于科研工作者而言,这不仅仅是技术层面的飞跃,它更标志着知识管理和信息传播方式的一次重大变革。

新扩散模型OmniGen一统图像生成,架构还高度简化、易用

大型语言模型(LLM)的出现统一了语言生成任务,并彻底改变了人机交互。 然而,在图像生成领域,能够在单一框架内处理各种任务的统一模型在很大程度上仍未得到探索。 近日,智源推出了新的扩散模型架构 OmniGen,一种新的用于统一图像生成的多模态模型。

强化学习训练一两个小时,100%自主完成任务:机器人ChatGPT时刻真来了?

把平均成功率从 50% 拉到了 100%。 最近,AI 的进步有目共睹,现在这些进步已经开始传递到机器人领域。 强大的 AI 技术也能帮助机器人更好地理解其所处的物理世界并采取更合理的行动。

权威AI开源标准1.0版发布:Llama也不算开源

大模型开源的口号,不是随便说说的。 该来的终于来了。 本周,人工智能领域迎来了对于「开源」的官方定义。

国庆期间被 AI 雷军“骂了 7 天”,雷军本人呼吁网友不要再玩

感谢在今年国庆假期期间,一些网友利用 AI 技术克隆雷军的声音,借此吐槽不文明行为或表达对他人的不满,有网友戏称“被 AI 雷军追着骂了整个假期”。 对此,雷军本人今日发布视频回应称,的确让自己挺困扰,也挺不舒服。 雷军表示希望大家不要再玩了,觉得这个事情不太好,不过他还是觉得 AI 是很好的技术,也非常实用。

华为云董理斌:解难题做难事,AI重塑千行万业

10 月 28 日,新浪新闻・2024 探索大会在北京召开,邀请专家学者、行业领袖,以及数字技术领域的探索者和从业者们,就新质生产力赋能产业、企业数字化转型、数字生态构建等热点话题展开深入探讨。 华为云 Marketing 部部长董理斌发表题为 “解难题做难事,AI 重塑千行万业” 的主题演讲,分享华为云在 AI for Science 领域的最新进展,以及盘古大模型、昇腾 AI 云服务等创新技术。 华为云 Marketing 部部长董理斌发表主题演讲人工智能正在改变我们进行科学研究的方式,增强人类探索以前难以解决的问题的能力。

微软开源 OmniParser 纯视觉 GUI 智能体:让 GPT-4V 秒懂屏幕截图,可操控手机 / 电脑

科技媒体 marktechpost 于 10 月 24 日发布博文,报道称微软公司宣布开源 OmniParser,是一款解析和识别屏幕上可交互图标的 AI 工具。 项目背景传统的自动化方法通常依赖于解析 HTML 或视图层次结构,从而限制了其在非网络环境中的适用性。 而包括 GPT-4V 在内的现有的视觉语言模型(VLMs),并不擅长解读复杂 GUI 元素,导致动作定位不准确。

消息称 Meta 正开发自家 AI 搜索引擎:追赶 OpenAI,降低对微软、谷歌的依赖

感谢科技媒体 The Information 昨日(10 月 28 日)发布博文,报道称 Meta 公司一方面为减少对微软、谷歌的依赖,另一方面追赶 OpenAI 在 AI 领域的发展,正开发一款 AI 搜索引擎。 AI在线援引该媒体报道,内置于 Instagram 和 Facebook 的 Meta AI 机器人目前调用谷歌公司的 Google 和微软 Bing 搜索引擎,来回答用户关于近期新闻和事件的问题。 而消息称 Meta 公司早在 8 个月前就组建了专门的团队,通过网络爬虫收集了大数量网页数据,并建立了一个信息数据库。