AI在线 AI在线

应用

全球首次,国星宇航完成卫星在轨运行 AI 大模型技术验证

感谢国星宇航今日宣布完成卫星在轨运行 AI 大模型技术验证,对国星宇航 AI 大模型在轨运行的空间适应性、算力卫星平台可靠性以及高性能算力载荷在轨有效算力进行了验证。时间节点:9 月 24 日 10 时 31 分,国星宇航“一箭三星”在山东海阳成功发射。9 月 25 日 20 时 46 分,试验团队通过地面站以遥控指令形式上注 AI 任务至卫星;9 月 25 日 21 时 11 分,卫星在大西洋北部上空通过星载高性能算力载荷成功启动运行 AI 大模型,AI 大模型太空在轨运行过程及结果通过卫星自带的在轨可视化存证系
10/6/2024 9:19:17 PM
浩渺

安卓版谷歌 Gemini Live 将支持 40 多种语言,提供 AI 语音聊天功能

谷歌公司于 10 月 1 日在 X 平台发布推文,宣布 Gemini 应用现面向所有安卓用户开放 Gemini Live 功能。谷歌官方称,Gemini Live 将支持 40 多种语言,首先推出法语、德语、葡萄牙语、印地语和西班牙语,之后还会推出更多语言。谷歌 Gemini Live 将支持在同一设备上使用最多两种语言进行对话,用户如要使用 Gemini Live,设置中的第一语言必须是以下受支持的语言之一:德语(比利时)德语(德国)德语(瑞士)德语(奥地利)英语(澳大利亚)英语(印度)英语(英国)英语(美国)西
10/6/2024 6:18:28 PM
归泷(实习)

告别CUDA无需Triton!Mirage零门槛生成PyTorch算子,人均GPU编程大师?

AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected][email protected]近日,来自 CMU 的 Catalyst Group 团队发布了一款 PyTorch 算子编译器 Mirage,用户无需编写任何 CUDA 和 Triton 代码就可以自动生成 GPU 内
10/6/2024 4:01:00 PM
机器之心

西班牙马德里动物园为大熊猫配备“AI 保育员”:能用英语、西语答疑,还能不断学习

感谢据央视新闻今日报道,西班牙马德里动物园为两只大熊猫“金喜”“茱萸”配备了一个“AI 保育员”—— 伊雷尼娅,其由网络安全、大数据等方面专家组成的团队创建,以虚拟人类的形象出现在马德里动物园大熊猫馆旁的大屏幕上。AI在线获悉,功能方面,伊雷尼娅能够为游客们提供实时信息并展开互动,且可以以“熊猫养育领域专家”的身份,用英语、西班牙语来回答游客的问题,展示视频和图片。值得一提的是,AI 使伊雷尼娅具有不断学习的能力,其知识库未来还将持续扩大,涵盖园内其余动物,有望使用更多种语言回答问题。马德里动物园营销总监塞尔吉奥・
10/6/2024 3:42:27 PM
清源

最新 AI 生图模型 Flux1.1 隐藏玩法,添加单反相机文件名获得超写实图像

最新 AI 文生图模型 Flux1.1,一夜刷屏。只需一个简单技巧,就能去除图中的“AI 味”,无论人物还是风景都能达到照片级效果。评论区网友的反应 be like:我分不清,真的分不清啊。这个技巧用起来也非常简单,在提示词中模仿单反相机的文件命名格式即可。比如“CR2”就是佳能相机使用的原始图像文件格式,输入“IMG” 随机编号 “.CR2”,再加指定的内容,就能获得一张写实图像了。后面也陆续有尝试过的网友反馈,换成索尼相机的“ARW”、尼康相机的“NEF”,甚至苹果的“HEIC”格式,都能获得不错的结果。以
10/6/2024 11:55:45 AM
汪淼

聊天机器人帮你“深入了解”约会对象,Grindr 将推出“AI 僚机”功能

据《华尔街日报》北京时间今天报道,约会平台 Grindr 宣布推出专为用户设计的 AI 助手,预计在 2027 年前后完全上线,届时可为 1400 万名用户提供服务。该 AI 助手可用于跟踪用户与心仪对象的对话,并为其提供适合的长期伴侣、为约会地点提供建议。未来,该助手还将具备更多“AI 智能体”的功能,譬如预定餐厅、与另一个“AI 智能体”进行约会。具体来看,当两名用户匹配之后,用户各自的 AI 助手可以互相交流,以便在实际约会前对彼此有更深入的了解。Grindr 的首席执行官乔治・阿利森表示,机器人之间的对话不
10/6/2024 9:04:34 AM
清源

软银 CEO 孙正义:将重视开发可读取大量学习数据的高性能大型 AI

据共同社报道,软银集团董事长兼 CEO 孙正义于 3 日在公司活动中发表演讲,就生成式 AI 提出了“在竞争中,只有最优秀的才有价值”的观点。孙正义表示,将重视开发能够读取大量学习数据的高性能大型 AI。软银将 AI 作为业务战略的核心,通过旗下的“软银愿景基金”等向相关企业投资。他还提到了日本本土企业正在研发的轻量型生成式 AI(可用于抑制数据和电力消费量),将其评价为“美丽日本式的努力,但仅是小成功”。孙正义提到了 OpenAI 于 9 月发布的最新模型(AI在线注:OpenAI 首款具备“推理”能力的模型 o
10/6/2024 8:12:48 AM
清源

Meta又给OpenAI一记重击,视频生成Movie Gen震撼登场,甚至可以配音、编辑

视频生成领域真是越来越卷且越来越迈向实用性!在 OpenAI Sora 难产的时候,Meta 首次公开展示了自家的「用于媒体的突破性生成式 AI 研究」:Meta Movie Gen。Meta 在相应博客中使用了「premiere」一词,也就是初次展示,因此手痒的用户可能还得再等上一段时间。Meta 表示:「无论是希望在好莱坞大展身手的电影制作人,还是爱好为观众制作视频的创作者,我们相信每个人都应该有机会使用有助于提高创造力的工具。」根据 Meta 的描述,Movie Gen 的功能包括:文本生成视频和音频、编辑已
10/5/2024 3:20:00 PM
机器之心

Claude AI 被曝正研发新功能,突破 20 万 tokens 文件处理上限

科技媒体 testingcatalog 今天(10 月 5 日)发布博文,报道称 Anthropic 公司扩展了 Claude 功能,支持用户处理上下文窗口超过 20 万 tokens 的文件。AI在线注,Claude 当前在处理用户上传、超出限制的文件后,会跳出以下错误,显示当前文件的字符数量超过了 Claude 能处理的上限。不过 Anthropic 正在研发新的功能,通过分块提取内容与其进行交互,从而支持用户上传超过处理上限的文件。图源:testingcatalog这项改进意味着 Claude 扩展了处理文件
10/5/2024 3:16:01 PM
故渊

号称击败Claude 3.5 Sonnet,媲美GPT-4o,开源多模态模型Molmo挑战Scaling law

Molmo,开源多模态模型正在发力!虽然大家一直在期待谷歌、OpenAI 等等拥有无限资金储备和顶尖人才的大厂做出新的 Sota 模型。不过,一家默默耕耘的创业公司 Ai2 发布了一款多模态人工智能模型 Molmo。在下面展示的视频中,我们可以看到 Molmo 就像钢铁侠的「贾维斯」一样万能。想卖自行车,咨询一下 Molmo 的建议,仅靠一张照片,Molmo 就能把自行车的颜色、品牌和二手售价搞清楚,并且帮你写出一句顺口的广告语。它也可以从虚拟世界帮你解决现实世界的问题,说一句:「Molmo,帮我买杯星巴克的南瓜拿
10/5/2024 3:05:00 PM
机器之心

氛围感拉满:微软新专利探索 Copilot AI 应用,匹配视频等生成音乐

科技媒体 Windows Report 昨日(10 月 4 日)发布博文,报道称微软公司获得了一项新的专利,构想 Copilot 在未来能辅助用户创建和视频、文本、PowerPoint 等匹配的音乐或者背景音乐。AI在线注:微软该专利名为《Artificial intelligence model for composing audio scores》,主要探讨了基于输入内容,来创建音乐的方法。该专利主要概述了以下步骤:收集数据:收集大量的训练数据,这些数据包括许多包含视频和音频组件的视听数据集。分析提取:分析数据
10/5/2024 2:32:54 PM
故渊

谷歌最便宜 AI 模型 Gemini 1.5 Flash 8B 将商用:腰斩击穿价 0.15 美元买百万 tokens 输出

科技媒体 NeoWin 昨日(10 月 4 日)发布博文,报道称谷歌公司即将商用 Gemini 1.5 Flash 8B 模型,成为谷歌公司最便宜的 AI 模型。AI在线曾于今年 8 月报道,谷歌公司推出 3 款 Gemini 实验性模型,其中 Gemini 1.5 Flash 8B 是 Gemini 1.5 Flash 的更小尺寸模型,拥有 80 亿参数,专为多模态任务而设计,包括大容量任务和长文本摘要任务。相比较原版 Gemini 1.5 Flash,Gemini 1.5 Flash 8B 延迟更低,特别适合聊
10/5/2024 12:40:26 PM
故渊

Meta 发布 AI 视频生成器 Movie Gen:可自动生成含声音的高清视频

Meta 公司今天宣布了一款新的 AI 视频生成器 Movie Gen,该工具能够生成带有声音的高清视频。几个月前,其竞争对手 OpenAI 也推出了其文本转视频模型 Sora。输入文本 Movie Gen 就能自动生成视频,还可以编辑现有的视频或静止图像。据《纽约时报》报道,添加到视频中的音频也是 AI 生成的,通过环境噪音、音效和背景音乐与视频相匹配,视频支持不同的纵横比。Meta 表示,Movie Gen 还可以利用图像作为基础素材来生成特定的视频内容,或更改现有视频中的元素。Movie Gen 还可以用于编
10/4/2024 11:20:58 PM
远洋

AI 赋能游戏开发:Valve 工程师借助 ChatGPT 改进《Deadlock》匹配算法

感谢Valve 工程师 Fletcher Dunn 昨日在社交媒体上分享了他使用 ChatGPT 改进《Deadlock》匹配算法的经历。他表示,ChatGPT 就像一个高级搜索引擎,能够帮助他找到所需的解决方案。Dunn 在《Deadlock》的测试阶段向 ChatGPT 提出了改进匹配算法的需求,ChatGPT 建议他使用匈牙利算法。Dunn 采纳了这个建议,并表示他对 ChatGPT 的强大功能感到惊讶。Dunn 认为,ChatGPT 的强大之处在于能够理解自然语言并提供相关信息。即使在专业领域如游戏开发,C
10/4/2024 6:40:36 PM
远洋

最强文生图 AI 模型 Flux 再进化:出图速度快 6 倍,Elo 评分冲上 1153 傲视群雄

科技媒体 The Decoder 昨日(10 月 3 日)发布博文,报道称 Black Forest Labs 最新推出了 Flux 1.1 Pro,并以 Beta 版的形式推出 BFL API。黑森林实验室(Black Forest Labs)是一家位于德国的初创公司,专注于开发最先进的生成性人工智能模型。Flux 简介Flux 在 AI 文生图领域有着“最强”称号,在多个方面有着卓越表现:生成质量:Flux 在图像生成的质量上表现出色,能够处理多种风格,包括二次元、人像、写实和风景等。用户反馈显示,其生成的图像
10/4/2024 4:09:57 PM
故渊

突发!Sora负责人Tim Brooks离职,还是被谷歌抢走的

最近这些天,OpenAI 很好地诠释了什么是福祸相依。一方面,该公司的高层动荡不停,重要成员纷纷离职;另一方面,它又成功赢得了投资者的青睐,在 1570 亿美元估值的基础上融了一笔 66 亿美元的巨款。今天的情况同样如此,OpenAI 刚刚发布 canvas 后不久,又痛失一员大将:Sora 团队负责人 Tim Brooks 跑了,还加入了竞争对手谷歌 DeepMind。消息公布后,DeepMind 联合创始人 Demis Hassabis 第一时间出来迎接,并称很期待与他一起「将久未实现的创造世界模拟器的梦想变成
10/4/2024 4:06:00 PM
机器之心

刚刚,OpenAI重磅发布交互界面canvas,让ChatGPT成为写作和编程利器

OpenAI 刚刚融资,就迫不及待开始证明自己了。今日凌晨,OpenAI 宣布推出类似 Anthropic 的 Artifacts 的应用 canvas,并称「这是一种使用 ChatGPT 写作和编程的新方式」。在 Claude 中试过 Artifacts 的朋友都知道,这能极大提升 LLM 输出结果的表现力,其支持输出文本文件、代码、网页、SVG 等等。此前风靡一时的「汉语新解」便是基于 Claude 的 Artifacts 功能。但让 ChatGPT 用户感到遗憾的是,Artifacts 上线三个多月了,Ope
10/4/2024 4:04:00 PM
机器之心

Noam Brown早已预示o1强大推理能力,演讲深度解析AI推理研究脉络

不久之前,OpenAI 发布了 o1 系列模型,其强大的推理能力让我们看见了 AI 发展的新可能。近日,OpenAI 著名研究科学家 Noam Brown 一份 5 月的演讲上线网络,或可揭示 o1 背后的研究发展脉络。在这个题为「关于 AI 规划力量的寓言:从扑克到外交」的演讲中, Brown 介绍了扑克、围棋和外交等游戏领域的研究突破,并尤其强调了搜索/规划算法在这些成就中的关键作用。之后,他也指出了搜索/规划研究在改进机器学习模型方面的潜在未来。Noam Brown,如果你还不熟悉这个名字:他是 OpenAI
10/4/2024 4:00:00 PM
机器之心