应用
全球首次,国星宇航完成卫星在轨运行 AI 大模型技术验证
感谢国星宇航今日宣布完成卫星在轨运行 AI 大模型技术验证,对国星宇航 AI 大模型在轨运行的空间适应性、算力卫星平台可靠性以及高性能算力载荷在轨有效算力进行了验证。时间节点:9 月 24 日 10 时 31 分,国星宇航“一箭三星”在山东海阳成功发射。9 月 25 日 20 时 46 分,试验团队通过地面站以遥控指令形式上注 AI 任务至卫星;9 月 25 日 21 时 11 分,卫星在大西洋北部上空通过星载高性能算力载荷成功启动运行 AI 大模型,AI 大模型太空在轨运行过程及结果通过卫星自带的在轨可视化存证系
10/6/2024 9:19:17 PM
浩渺
安卓版谷歌 Gemini Live 将支持 40 多种语言,提供 AI 语音聊天功能
谷歌公司于 10 月 1 日在 X 平台发布推文,宣布 Gemini 应用现面向所有安卓用户开放 Gemini Live 功能。谷歌官方称,Gemini Live 将支持 40 多种语言,首先推出法语、德语、葡萄牙语、印地语和西班牙语,之后还会推出更多语言。谷歌 Gemini Live 将支持在同一设备上使用最多两种语言进行对话,用户如要使用 Gemini Live,设置中的第一语言必须是以下受支持的语言之一:德语(比利时)德语(德国)德语(瑞士)德语(奥地利)英语(澳大利亚)英语(印度)英语(英国)英语(美国)西
10/6/2024 6:18:28 PM
归泷(实习)
告别CUDA无需Triton!Mirage零门槛生成PyTorch算子,人均GPU编程大师?
AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected];[email protected]近日,来自 CMU 的 Catalyst Group 团队发布了一款 PyTorch 算子编译器 Mirage,用户无需编写任何 CUDA 和 Triton 代码就可以自动生成 GPU 内
10/6/2024 4:01:00 PM
机器之心
西班牙马德里动物园为大熊猫配备“AI 保育员”:能用英语、西语答疑,还能不断学习
感谢据央视新闻今日报道,西班牙马德里动物园为两只大熊猫“金喜”“茱萸”配备了一个“AI 保育员”—— 伊雷尼娅,其由网络安全、大数据等方面专家组成的团队创建,以虚拟人类的形象出现在马德里动物园大熊猫馆旁的大屏幕上。AI在线获悉,功能方面,伊雷尼娅能够为游客们提供实时信息并展开互动,且可以以“熊猫养育领域专家”的身份,用英语、西班牙语来回答游客的问题,展示视频和图片。值得一提的是,AI 使伊雷尼娅具有不断学习的能力,其知识库未来还将持续扩大,涵盖园内其余动物,有望使用更多种语言回答问题。马德里动物园营销总监塞尔吉奥・
10/6/2024 3:42:27 PM
清源
最新 AI 生图模型 Flux1.1 隐藏玩法,添加单反相机文件名获得超写实图像
最新 AI 文生图模型 Flux1.1,一夜刷屏。只需一个简单技巧,就能去除图中的“AI 味”,无论人物还是风景都能达到照片级效果。评论区网友的反应 be like:我分不清,真的分不清啊。这个技巧用起来也非常简单,在提示词中模仿单反相机的文件命名格式即可。比如“CR2”就是佳能相机使用的原始图像文件格式,输入“IMG” 随机编号 “.CR2”,再加指定的内容,就能获得一张写实图像了。后面也陆续有尝试过的网友反馈,换成索尼相机的“ARW”、尼康相机的“NEF”,甚至苹果的“HEIC”格式,都能获得不错的结果。以
10/6/2024 11:55:45 AM
汪淼
聊天机器人帮你“深入了解”约会对象,Grindr 将推出“AI 僚机”功能
据《华尔街日报》北京时间今天报道,约会平台 Grindr 宣布推出专为用户设计的 AI 助手,预计在 2027 年前后完全上线,届时可为 1400 万名用户提供服务。该 AI 助手可用于跟踪用户与心仪对象的对话,并为其提供适合的长期伴侣、为约会地点提供建议。未来,该助手还将具备更多“AI 智能体”的功能,譬如预定餐厅、与另一个“AI 智能体”进行约会。具体来看,当两名用户匹配之后,用户各自的 AI 助手可以互相交流,以便在实际约会前对彼此有更深入的了解。Grindr 的首席执行官乔治・阿利森表示,机器人之间的对话不
10/6/2024 9:04:34 AM
清源
软银 CEO 孙正义:将重视开发可读取大量学习数据的高性能大型 AI
据共同社报道,软银集团董事长兼 CEO 孙正义于 3 日在公司活动中发表演讲,就生成式 AI 提出了“在竞争中,只有最优秀的才有价值”的观点。孙正义表示,将重视开发能够读取大量学习数据的高性能大型 AI。软银将 AI 作为业务战略的核心,通过旗下的“软银愿景基金”等向相关企业投资。他还提到了日本本土企业正在研发的轻量型生成式 AI(可用于抑制数据和电力消费量),将其评价为“美丽日本式的努力,但仅是小成功”。孙正义提到了 OpenAI 于 9 月发布的最新模型(AI在线注:OpenAI 首款具备“推理”能力的模型 o
10/6/2024 8:12:48 AM
清源
Meta又给OpenAI一记重击,视频生成Movie Gen震撼登场,甚至可以配音、编辑
视频生成领域真是越来越卷且越来越迈向实用性!在 OpenAI Sora 难产的时候,Meta 首次公开展示了自家的「用于媒体的突破性生成式 AI 研究」:Meta Movie Gen。Meta 在相应博客中使用了「premiere」一词,也就是初次展示,因此手痒的用户可能还得再等上一段时间。Meta 表示:「无论是希望在好莱坞大展身手的电影制作人,还是爱好为观众制作视频的创作者,我们相信每个人都应该有机会使用有助于提高创造力的工具。」根据 Meta 的描述,Movie Gen 的功能包括:文本生成视频和音频、编辑已
10/5/2024 3:20:00 PM
机器之心
Claude AI 被曝正研发新功能,突破 20 万 tokens 文件处理上限
科技媒体 testingcatalog 今天(10 月 5 日)发布博文,报道称 Anthropic 公司扩展了 Claude 功能,支持用户处理上下文窗口超过 20 万 tokens 的文件。AI在线注,Claude 当前在处理用户上传、超出限制的文件后,会跳出以下错误,显示当前文件的字符数量超过了 Claude 能处理的上限。不过 Anthropic 正在研发新的功能,通过分块提取内容与其进行交互,从而支持用户上传超过处理上限的文件。图源:testingcatalog这项改进意味着 Claude 扩展了处理文件
10/5/2024 3:16:01 PM
故渊
号称击败Claude 3.5 Sonnet,媲美GPT-4o,开源多模态模型Molmo挑战Scaling law
Molmo,开源多模态模型正在发力!虽然大家一直在期待谷歌、OpenAI 等等拥有无限资金储备和顶尖人才的大厂做出新的 Sota 模型。不过,一家默默耕耘的创业公司 Ai2 发布了一款多模态人工智能模型 Molmo。在下面展示的视频中,我们可以看到 Molmo 就像钢铁侠的「贾维斯」一样万能。想卖自行车,咨询一下 Molmo 的建议,仅靠一张照片,Molmo 就能把自行车的颜色、品牌和二手售价搞清楚,并且帮你写出一句顺口的广告语。它也可以从虚拟世界帮你解决现实世界的问题,说一句:「Molmo,帮我买杯星巴克的南瓜拿
10/5/2024 3:05:00 PM
机器之心
氛围感拉满:微软新专利探索 Copilot AI 应用,匹配视频等生成音乐
科技媒体 Windows Report 昨日(10 月 4 日)发布博文,报道称微软公司获得了一项新的专利,构想 Copilot 在未来能辅助用户创建和视频、文本、PowerPoint 等匹配的音乐或者背景音乐。AI在线注:微软该专利名为《Artificial intelligence model for composing audio scores》,主要探讨了基于输入内容,来创建音乐的方法。该专利主要概述了以下步骤:收集数据:收集大量的训练数据,这些数据包括许多包含视频和音频组件的视听数据集。分析提取:分析数据
10/5/2024 2:32:54 PM
故渊
谷歌最便宜 AI 模型 Gemini 1.5 Flash 8B 将商用:腰斩击穿价 0.15 美元买百万 tokens 输出
科技媒体 NeoWin 昨日(10 月 4 日)发布博文,报道称谷歌公司即将商用 Gemini 1.5 Flash 8B 模型,成为谷歌公司最便宜的 AI 模型。AI在线曾于今年 8 月报道,谷歌公司推出 3 款 Gemini 实验性模型,其中 Gemini 1.5 Flash 8B 是 Gemini 1.5 Flash 的更小尺寸模型,拥有 80 亿参数,专为多模态任务而设计,包括大容量任务和长文本摘要任务。相比较原版 Gemini 1.5 Flash,Gemini 1.5 Flash 8B 延迟更低,特别适合聊
10/5/2024 12:40:26 PM
故渊
Meta 发布 AI 视频生成器 Movie Gen:可自动生成含声音的高清视频
Meta 公司今天宣布了一款新的 AI 视频生成器 Movie Gen,该工具能够生成带有声音的高清视频。几个月前,其竞争对手 OpenAI 也推出了其文本转视频模型 Sora。输入文本 Movie Gen 就能自动生成视频,还可以编辑现有的视频或静止图像。据《纽约时报》报道,添加到视频中的音频也是 AI 生成的,通过环境噪音、音效和背景音乐与视频相匹配,视频支持不同的纵横比。Meta 表示,Movie Gen 还可以利用图像作为基础素材来生成特定的视频内容,或更改现有视频中的元素。Movie Gen 还可以用于编
10/4/2024 11:20:58 PM
远洋
AI 赋能游戏开发:Valve 工程师借助 ChatGPT 改进《Deadlock》匹配算法
感谢Valve 工程师 Fletcher Dunn 昨日在社交媒体上分享了他使用 ChatGPT 改进《Deadlock》匹配算法的经历。他表示,ChatGPT 就像一个高级搜索引擎,能够帮助他找到所需的解决方案。Dunn 在《Deadlock》的测试阶段向 ChatGPT 提出了改进匹配算法的需求,ChatGPT 建议他使用匈牙利算法。Dunn 采纳了这个建议,并表示他对 ChatGPT 的强大功能感到惊讶。Dunn 认为,ChatGPT 的强大之处在于能够理解自然语言并提供相关信息。即使在专业领域如游戏开发,C
10/4/2024 6:40:36 PM
远洋
最强文生图 AI 模型 Flux 再进化:出图速度快 6 倍,Elo 评分冲上 1153 傲视群雄
科技媒体 The Decoder 昨日(10 月 3 日)发布博文,报道称 Black Forest Labs 最新推出了 Flux 1.1 Pro,并以 Beta 版的形式推出 BFL API。黑森林实验室(Black Forest Labs)是一家位于德国的初创公司,专注于开发最先进的生成性人工智能模型。Flux 简介Flux 在 AI 文生图领域有着“最强”称号,在多个方面有着卓越表现:生成质量:Flux 在图像生成的质量上表现出色,能够处理多种风格,包括二次元、人像、写实和风景等。用户反馈显示,其生成的图像
10/4/2024 4:09:57 PM
故渊
突发!Sora负责人Tim Brooks离职,还是被谷歌抢走的
最近这些天,OpenAI 很好地诠释了什么是福祸相依。一方面,该公司的高层动荡不停,重要成员纷纷离职;另一方面,它又成功赢得了投资者的青睐,在 1570 亿美元估值的基础上融了一笔 66 亿美元的巨款。今天的情况同样如此,OpenAI 刚刚发布 canvas 后不久,又痛失一员大将:Sora 团队负责人 Tim Brooks 跑了,还加入了竞争对手谷歌 DeepMind。消息公布后,DeepMind 联合创始人 Demis Hassabis 第一时间出来迎接,并称很期待与他一起「将久未实现的创造世界模拟器的梦想变成
10/4/2024 4:06:00 PM
机器之心
刚刚,OpenAI重磅发布交互界面canvas,让ChatGPT成为写作和编程利器
OpenAI 刚刚融资,就迫不及待开始证明自己了。今日凌晨,OpenAI 宣布推出类似 Anthropic 的 Artifacts 的应用 canvas,并称「这是一种使用 ChatGPT 写作和编程的新方式」。在 Claude 中试过 Artifacts 的朋友都知道,这能极大提升 LLM 输出结果的表现力,其支持输出文本文件、代码、网页、SVG 等等。此前风靡一时的「汉语新解」便是基于 Claude 的 Artifacts 功能。但让 ChatGPT 用户感到遗憾的是,Artifacts 上线三个多月了,Ope
10/4/2024 4:04:00 PM
机器之心
Noam Brown早已预示o1强大推理能力,演讲深度解析AI推理研究脉络
不久之前,OpenAI 发布了 o1 系列模型,其强大的推理能力让我们看见了 AI 发展的新可能。近日,OpenAI 著名研究科学家 Noam Brown 一份 5 月的演讲上线网络,或可揭示 o1 背后的研究发展脉络。在这个题为「关于 AI 规划力量的寓言:从扑克到外交」的演讲中, Brown 介绍了扑克、围棋和外交等游戏领域的研究突破,并尤其强调了搜索/规划算法在这些成就中的关键作用。之后,他也指出了搜索/规划研究在改进机器学习模型方面的潜在未来。Noam Brown,如果你还不熟悉这个名字:他是 OpenAI
10/4/2024 4:00:00 PM
机器之心
资讯热榜
标签云
人工智能
OpenAI
AIGC
AI
ChatGPT
AI绘画
DeepSeek
数据
机器人
模型
谷歌
大模型
Midjourney
智能
开源
用户
学习
GPT
微软
Meta
AI创作
图像
技术
论文
Stable Diffusion
Gemini
马斯克
算法
蛋白质
生成式
芯片
代码
英伟达
神经网络
腾讯
计算
研究
Anthropic
Sora
3D
AI for Science
AI设计
机器学习
GPU
AI视频
开发者
场景
华为
预测
人形机器人
百度
伟达
苹果
Transformer
深度学习
xAI
模态
字节跳动
大语言模型
Claude
搜索
驾驶
神器推荐
文本
具身智能
Copilot
LLaMA
算力
安全
视觉
视频生成
干货合集
应用
大型语言模型
科技
亚马逊
训练
特斯拉
AGI
DeepMind