资讯列表
Meta 联合纽约大学和华盛顿大学提出MetaCLIP,带你揭开CLIP的高质量数据之谜。
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected];[email protected]。自2021年诞生,CLIP已在计算机视觉识别系统和生成模型上得到了广泛的应用和巨大的成功。我们相信CLIP的创新和成功来自其高质量数据(WIT400M),而非模型或者损失函数本身。虽然3
挑战谷歌巨头地位?消息称 OpenAI 于 5 月 9 日发布 ChatGPT 版搜索引擎
谷歌 Gemini 和微软 Copilot 之间的 AI 大战继续升级,最新消息称 OpenAI 有望今年 5 月 9 日推出基于 ChatGPT 的全新搜索产品,进一步挑战谷歌的传统搜索巨头地位。Reddit 网友近日发帖,表示 search.chatgpt.com 域名和相关的 SSL 证书已经被创建,网友 @nonmayorpete 发布推文称该域名将于 5 月 9 日上线。IT之家现在访问该域名,跳出的结果是“Not found”信息,而不是 404 或者域名错误,进一步间接证明了上述猜测。OpenAI 首
“放飞吧”新品发布会临近,消息称苹果 CEO 库克将同时预告全新 AI 功能
感谢《华盛顿邮报》今晚报道称,为重振消费者热情,苹果 CEO 库克预计下周预告新的人工智能功能,并于 6 月的全球开发者大会上公布。具体来看,库克将在下周的“放飞吧”(Let Loose)活动中对 AI 功能进行预热。根据官方消息,苹果将于 5 月 7 日晚上 10 点举办这场特别活动。从海报来看,此次活动预计将重点关注新一代 iPad 硬件和配件,例如大家期待已久的 iPad Pro 和 Apple Pencil 等。苹果 WWDC 大会将于 2024 年 6 月 11 日至 15 日举行。业界猜测,苹果届时可能
打破「非此即彼」,平衡 AI 与物理,中国科学院提出建立可学习的气候模型
平衡 AI-物理模型示意图。编辑 | X人工智能(AI)迅速发展,大模型正在重新定义我们理解和应对气候挑战的方式。AI 模型已经席卷了大气科学的各个领域。今年年初,中国科学院大气物理研究所黄刚研究员团队将物理与 AI 融合,提升了数值模式的降水预报技巧。近日,黄刚团队联合中国科学院大学、青岛海洋科学与技术国家实验室、同济大学和首尔国立大学在《Advances in Atmospheric Sciences》上,发表了题为「Toward a Learnable Climate Model in the Artific
AIGC实战案例!教你一键生成毛绒绒的图标
一键生成毛绒绒 ICON 工作流来啦!只需要输入对应的 logo 和颜色提示词,即可生成毛绒绒效果的 ICON 图标!
ㅤ
「注意事项」:
基本上所有参数都设置好,不需要大幅更改,如果觉得效果不够理想,可以从 lora 权重下手修改看看。如果图标拥有三种颜色或以上的时候,则需要各自生成一张图,再到 PS 做融合处理。
姗姗来迟:Claude 推出苹果 iOS 版 App,最新模型号称超越 GPT-4
人工智能创业公司 Anthropic 今日首次推出了旗下大模型产品 Claude 的移动端 App,目前仅有 iOS 版。而且相比于 ChatGPT、Gemini 等竞争对手,Claude 的进度显得慢了好几拍。Anthropic 公司的产品经理斯科特・怀特(Scott White)说,许多用户一直通过移动设备访问 Claude 模型,促使 Anthropic 公司推出了 Claude.ai 的应用版本。据介绍,该应用除了提供聊天机器人等基础功能之外,还支持上传照片、分析图像。在此之前,Claude 只能通过网站或
Chrome 浏览器桌面版地址栏整合自家聊天机器人:@Gemini 即可召唤
谷歌 Chrome 浏览器今日早些时候在 X(推特)宣布,其桌面版地址栏现已整合 Gemini 聊天机器人,用户可以通过简单、便捷的方式将 Gemini 召唤出来:在地址栏中输入“@”,然后选择“与 Gemini 聊天”,输入自定的提示词即可获取 Gemini 的回复。不久之前,该功能仍在 Canary 版本中进行测试。经IT之家此次实测,当 Chrome 更新至 124.0.6367.119(正式版本)之后,即可体验。Gemini 是谷歌 Deepmind 最新、最强大的 AI 模型。它原生支持多模态,具备跨模态
ChatGPT 新增临时聊天功能,对话不留痕
OpenAI 近日连续发布更新,为 ChatGPT 免费和 Plus 用户带来更多数据控制功能。此次更新赋予用户更多对话历史记录的管理权限,并新增了“临时聊天”功能。此前,选择不贡献对话数据以训练模型的用户无法访问自己的聊天历史记录。最新更新取消了这一限制,无论用户是否选择贡献数据,现在都可以访问聊天历史,回顾过去与 ChatGPT 的互动。OpenAI 同时保证,用户此前做出的不贡献数据的选择依然有效。本次更新目前已在 ChatGPT 网页版上线,移动端版本即将推出。IT之家注意到,为满足用户对隐私的进一步需求,
英伟达 ChatRTX 聊天机器人迎 0.3 版本更新:新增照片搜索、AI 语音识别等功能
英伟达旗下聊天机器人 ChatRTX 今日发布了 0.3 版本更新,带来了包括照片搜索、AI 驱动的语音识别等一系列新增功能。同时,ChatRTX 扩充了自身支持的大语言模型种类,例如谷歌新推出的本地模型 Gemma、ChatGLM3-6B 等。与此同时,由于借鉴了 OpenAI 旗下 CLIP 工具的技术(IT之家注:该技术可识别在图像集合中“所见”的内容),ChatRTX 现在能够对图片进行搜索;而得益于对 AI 语音识别系统 Whisper 的支持,ChatRTX 现在可以理解用户口头说出的语音指令。据介绍,
面壁新模型:早于Llama3、比肩 Llama3、推理超越 Llama3!
图注:面壁Eurux-8x22B 模型在 LeetCode 和 TheoremQA这两个具有挑战性的基准测试中,刷新开源大模型推理性能 SOTA。 图注:面壁Eurux-8x22B 模型综合性能比肩 LlaMa3-70B,超越开源模型 WizardLM-2-8x22b, Mistral-8x22b-Instruct,DeepSeek-67b,以及闭源模型 GPT-3.5-turbo。 Eurux-8x22B 由 Mistral-8x22B对齐而来。
口袋 AI 设备 Rabbit R1 本质上只是“套壳”安卓?官方否认
当地时间 30 日,外媒 Android Authority 的记者 Mishaal Rahman 声称,此前在 CES 2024 上引起各界关注的口袋 AI 设备 Rabbit R1 实质上只是“套壳”安卓 App。该报道引述一名姓名未公开的爆料者的说法,经过实测发现,据称是“Rabbit R1 内置启动器”的应用可被安装到 Pixel 6a 智能手机上,手机上的音量加键可以与 Rabbit R1 的功能键相对应,用户也可以直接通过设置向导创建账号、与 AI 助手对话。不过,由于 Rabbit R1 的显示屏远小
参数量不到10亿的OctopusV3,如何媲美GPT-4V和GPT-4?
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected];[email protected]。
余承东卸任华为终端BG CEO,何刚将接任
据多家媒体报道,华为于 4 月 30 日下午内部发布人事调整文件,宣布余承东将卸任华为终端 BG CEO 一职。余承东将仍保留终端 BG 董事长职位。原华为终端 BG、首席运营官何刚将接任华为终端 BG CEO。据透露,除了上述人事变动调整外,该文件并无更多信息。关于这次重大人事变动的背景和余承东卸任终端 BG CEO 之后新的业务重心,也未有进一步的说明。有消息源表示,此次调整属于常规的业务架构调整,可让余承东有更多精力为消费者打造精品。余承东出生于 1969 年,本科毕业于西北工业大学自动控制系,硕士毕业于清华
未经许可重复使用原创文章训练模型,OpenAI 遭美国 8 家报纸出版商起诉
感谢据 CNBC 报道,当地时间 4 月 30 日,8 家美国报纸出版商在纽约的一家联邦法院对微软、OpenAI 提起诉讼,声称后者未经许可在生成式 AI 产品中重复使用这些出版商创作的文章,还将信息的不准确性归咎于出版商本身。图源 Pixabay根据 8 家出版商向美国纽约南区地方法院提交的诉状,ChatGPT 一直在“未经许可、未付款”的情况下,盗用了出版商数百万篇受版权保护的文章。IT之家查询发现,参与诉讼的出版商包括《纽约每日新闻》《芝加哥论坛报》《奥兰多哨兵报》《佛罗里达太阳哨兵报》《圣何塞水星报》《丹佛
爆款生成式AI硬件,销量突破10万台,拆完一看只是安卓app?
「Rabbit R1,它本质上是安卓系统上面做了个 Launcher 程序,破解后在手机上就能运行。」通过破解,Rahman 设法在 Pixel 6a 手机上启动并运行了 R1 的应用程序。本周二,美国记者 Mishaal Rahman 曝光了知名生成式 AI 硬件 Rabbit R1 的细节,立即引来了科技圈的关注。几个月前,Humane、Rabbit 两家初创公司陆续推出他们的人工智能设备 ——Ai Pin 和 Rabbit R1。最初,一些人认为这些设备将开创可穿戴人工智能的新时代。然而,几个月过去了,对于这
美国酝酿 AI「登月计划」,陶哲轩领衔 62 页报告重磅发布
【新智元导读】就在刚刚,陶哲轩领衔的一份 62 页报告出炉了,总结和预测了 AI 对半导体、超导体、宇宙基础物理学、生命科学等领域带来的巨大改变。如果这些预测在几十年后能够实现,美国酝酿的 AI「登月计划」就将成真。就在刚刚,陶哲轩领衔的一份 AI 技术对全球研究潜在影响的技术报告发布了。这份报告长达 62 页,总结了 AI 对材料、半导体设计、气候、物理、生命科学等领域已经做出的改变,以及预测它们在未来可能由 AI 产生的改变。报告地址: AI 工具已经改变的科学领域的小插曲,陶哲轩等人还发出了三个呼吁 ——1.
AI 预测蝴蝶效应?谷歌最新天气预报模型 SEEDS 登 Science 子刊
新智元报道 编辑:Mindy【新智元导读】天气本质上是随机的,为了量化不确定性,传统方法通常需要高昂的成本来物理模拟大量预测。谷歌最新研究登 Science 子刊,用生成式 AI 模型高效生成规模化的天气预报集合,为天气和气候科学开辟了新的机会。1972 年 12 月,在美国华盛顿特区举行的美国科学促进会年会上,麻省理工学院气象学教授埃德・洛伦兹发表了题为「巴西一只蝴蝶的扇动是否会在得克萨斯引发龙卷风?」的演讲,这贡献了「蝴蝶效应」这一术语。在他 1963 年的一篇论文中,他发现在时间积分与数值天气预测模型里,即
最新中文大模型测评:百川智能 Baichuan 3 国内第一
感谢IT之家从百川大模型官方公众号获悉,今日国内大模型评测机构 SuperCLUE 发布了《中文大模型基准测评 2024 年度 4 月报告》,报告选取国内外具有代表性的 32 个大模型 4 月份的版本,通过多维度综合性测评,对国内外大模型发展现状进行观察与思考。报告显示,百川智能的 Baichuan 3 在国内大模型中排名第一,智谱 GLM-4、通义千问 2.1、文心一言 4.0、Moonshot (Kimi) 等大模型位列其后。从全球范围来看,国外同行的 GPT-4、Claude3 得分更胜一筹。SuperCLU