资讯列表
谷歌工程师批评 OpenAI,称其延缓 AGI 研究进展
TradingView 报道称,谷歌软件工程师弗朗索瓦・肖莱(François Chollet)在播客与主持人 Dwarkesh Patel 对话时,表达了他对 AGI(通用人工智能,Artificial General Intelligence)研究现状的担忧。肖莱表示,几年前所有最先进的研究成果都是公开分享和发表的,但现在情况已经不再如此。他将这一变化归因于 OpenAI 的影响,指责他们导致了“前沿研究出版的完全关闭”(complete closing down of frontier research pu
拿下 6 亿欧元融资,“OpenAI 欧洲对手”Mistral 估值飙升至近 60 亿欧元
据《金融时报》北京时间今日凌晨报道,总部位于巴黎的 AI 初创公司 Mistral AI 现已筹集到 6 亿欧元的资金,估值接近 60 亿欧元(IT之家备注:当前约 468 亿元人民币)。该公司由微软、英伟达提供支持,成立至今刚满一年,被视作 OpenAI 的“潜在挑战者”。自(去年)12 月以来,对该公司的投资使其估值翻了三倍。Mistral 的首席执行官 Arthur Mensch 在接受采访时表示:“从创业之初,我们就被告知…… 这是一个永远不会被颠覆的市场。但我们证明事实并非如此,我们有效地颠覆了 Open
探索大脑中语言理解机制,香港理工大学研究登Science子刊
编辑 | 萝卜皮当前的大型语言模型 (LLMs) 依赖单词预测作为其骨干预训练任务。尽管单词预测是语言处理的重要机制,但人类语言理解发生在多个层面,涉及单词和句子的整合以实现对话语的充分理解。香港理工大学的研究人员通过使用下一句预测(Next Sentence Prediction,NSP)任务对语言理解进行建模,从而研究话语级理解的机制。该团队表明,NSP 预训练增强了模型与大脑数据的一致性,尤其是在右半球和多需求网络中,突出了非经典语言区域对高级语言理解的贡献。NSP 可以使模型更好地捕捉人类理解性能并更好地编
22个任务超越SOTA,43个任务媲美SOTA,Google推出医学治疗通用大模型
编辑 | 萝卜皮医生和科学家如果想开发一种新的疗法,这将是一个漫长且昂贵的任务,需要满足许多不同的标准,而能够加快这一过程的人工智能模型将是无价之宝。然而,目前大多数人工智能方法只能解决一组定义狭窄的任务,通常局限于特定领域。为了弥补这一差距,Google 团队提出了 Tx-LLM,这是一种通用大型语言模型(LLM),由 PaLM-2 微调而成,可编码有关各种治疗方式的知识。仅使用一组权重,Tx-LLM 可同时处理与自由文本交织的各种化学或生物实体(小分子、蛋白质、核酸、细胞系、疾病)信息,使其能够预测广泛的相关属
苹果牌“AI”官方详解:Apple Intelligence 本地 30 亿参数模型,云端基于苹果芯片服务器
感谢苹果在昨日的 WWDC24 上重磅公布了 Apple Intelligence(苹果智能),将为 iPhone、Mac 等设备引入一系列 AI 功能。随后,苹果机器学习官网公布了 Apple Intelligence 的详细信息。据苹果官方介绍,Apple Intelligence 拥有两个基础模型:本地模型:设备上约 30 亿参数的语言模型,测试得分高于诸多 70 亿参数的开源模型(Mistral-7B 或 Gemma-7B);云上模型:可通过私有云计算并在 Apple 芯片服务器上运行的更大云端语言模型。苹
字节跳动相关人士回应“研发 AI 手机”:实为基于手机的大模型软件解决方案
据新浪科技,近日有媒体报道称字节跳动“已于两个月前秘密启动”AI 手机研发项目 。针对以上信息,字节跳动相关人士称:信息不实,实际上是在探索基于手机的大模型软件解决方案,提供给手机厂商参考使用。目前并没有自己做手机并销售的计划。IT之家查询获悉,该消息最初来源“AR 圈”6 月 10 日发布的推文,其声称该项目核心团队主要由两部分人员构成:一部分来自 2019 年字节收购的锤子手机研发团队,另一部分则来自 2021 年收购的 PICO VR 研发团队。另据 Sensor Tower5 月公布的数据,截至今年 4 月
手机流畅运行 470 亿大模型:上交大发布 LLM 手机推理框架 PowerInfer-2,提速 29 倍
苹果一出手,在手机等移动设备上部署大模型不可避免地成为行业关注焦点。然而,目前在移动设备上运行的模型相对较小(苹果的是 3B,谷歌的是 2B),并且消耗大量内存,这在很大程度上限制了其应用场景。即使是苹果,目前也需要与 OpenAI 合作,通过将云端 GPT-4o 大模型嵌入到操作系统中来提供能力更强的服务。这样一来,苹果的混合方案引起了非常多关于数据隐私的讨论和争议,甚至马斯克都下场讨论。如果苹果在操作系统层面集成 OpenAI,那么苹果设备将被禁止在我的公司使用。这是不可接受的安全违规行为。既然终端侧本地部署大
院士领衔、百余位专家到场、数十家产业链企业齐聚!2024中国人形机器人开发者大会暨第三届张江机器人全球生态峰会在张江科学会堂举办
6月6日,2024中国人形机器人开发者大会暨第三届张江机器人全球生态峰会(以下简称“峰会”)在张江科学会堂举行。峰会由上海市经济和信息化委员会、浦东新区人民政府指导,国家地方共建人形机器人创新中心、上海张江(集团)有限公司主办。作为业内首个以人形机器人与具身智能开发者为核心的活动,现场有具身智能领域享有盛誉的院士专家、杰出领袖、创新创客以及企业精英与超2000名参会的开发者齐聚一堂,共览行业阶段性成果,共话全球行业前沿技术。更有30余家人形机器人产业链上下游企业展示最新成果,惹人瞩目。2024中国人形机器人开发者大
消息称 OpenAI 阿尔特曼和三星李在镕首次单独会面,讨论合作 AI 芯片
感谢据《韩国时报》援引知情人士消息,OpenAI CEO 山姆・阿尔特曼近日会见了正在美国出差的三星集团会长李在镕。与此同时,OpenAI 刚刚与苹果签署了合作伙伴关系。报道称,阿尔特曼和李在镕于上周末在硅谷进行了会面,这是双方第一次单独见面。阿尔特曼曾在今年 1 月访问了韩国,并参观了三星电子的半导体工厂。报道提到,双方讨论了人工智能(AI)芯片的合作问题。阿尔特曼正在推动开发自己的 AI 芯片,以减少对英伟达的依赖。三星电子则是具有制造能力的第一大存储半导体公司,被认为是一个强大的关键合作伙伴。如果消息属实,此
英国格拉斯哥大学哲学研究人员谈“AI 幻觉”:用“胡说八道”来形容更准确
长期以来,人们常常把大语言模型提供的看似合理但错漏百出的答案称作“AI 幻觉(AI hallucinations)”。然而,来自英国格拉斯哥大学的三名哲学研究人员近期提出了不同的看法 ——“AI 幻觉”这样的描述并不准确。当地时间 6 月 8 日,《伦理与信息技术》杂志刊登了三名研究人员的论文。这篇论文指出,聊天机器人“胡编乱造”回答的行为不应被称为“幻觉”,用“胡说八道(bullshitting)”一词来描述才更准确。研究人员指出,学习过心理学或使用过迷幻类药物的人都知道,“幻觉”通常被定义为看到、感知到不存在的
青岛:力争到 2026 年全市算力总规模达 12EFLOPS,存储总量达 10EB
青岛市人民政府办公厅 6 月 7 日印发了《青岛市海洋人工智能大模型产业集聚区建设实施方案(2024—2026 年)》。IT之家汇总《方案》所提出的目标如下:到 2026 年,海洋人工智能大模型产业基础更加坚实、规模持续扩大、生态加速形成、赋能海洋产业转型升级更加明显,国内外首创性、引领性、示范性作用进一步加强,打造世界级海洋人工智能大模型产业集聚区。建设科技创新策源地,构建包含“瀚海星云”大模型在内的基础大模型矩阵、以“问海”大模型和港口大模型为代表的 N 个行业大模型和 X 个重点应用场景的“1 N X”海洋人
大幅缩短研发时间,科学家利用 AI 造出世界最强铁基超导磁体
英国和日本科学家利用人工智能(AI)技术,成功制造出世界上最强的铁基超导磁体,相关论文发表于《亚洲材料》杂志。IT之家附论文链接:点此进入超导磁体可在不需要大量电力的情况下提供强而稳定的磁场。目前此类磁体中使用的超导体主要是超导铌锡合金线这类大线圈。由于磁体需要适应线圈的大小,因而限制了其应用范围。▲ 铁基超导磁体英国伦敦国王学院研究人员表示,他们使用 BOXVIA 机器学习系统,开发出了一个框架,能更快速地在实验室中设计出超导磁体。▲ 设计概念示意图他们通过改变制造过程中的热量和时间等与超导磁体性能有关的参数,
效率翻倍!6 款不容错过的免费 AI 神器(六)
大家好,我是花生~
今天继续我们的 AI 效率神器推荐第 23 期,内容包括免费的文本转语音工具、AI 写真 / AI 音乐生成工具等。
上期回顾:一、AI 音乐生成模型 Stable Audio Open
在线试玩:
ComfyUI 插件:
之前为大家推荐过 AI 音乐生成工具 Stable Audio,可以通过文本生成时长 3 分钟的高质量音乐。最近 Stability AI 宣布开源 Stable Audio Open 音乐生成模型(授权类型:不可商用),可以通过文本生成鼓点、乐器旋律、环境声音和配音,单
如何用AIGC打造品牌IP?报价6位数的实战项目复盘来了!
大家好,好久不见!随着 AIGC 技术近期的迅猛发展,我们在过去的半年里深入探索了其在商业领域的多元应用。今天,我非常兴奋地与大家分享一个案例——我们最近为一家顶尖食品企业全方位打造的品牌IP。希望通过这次分享,能够启发并助力大家在AIGC领域取得更多成就。
往期推荐:一、作为视觉设计师,如何有效应对品牌升级需求
在过去,我认为品牌设计遵循着一套固定的流程:从市场调研到策略制定,再到视觉呈现。我们经常讨论和分享品牌升级的各种策略和见解。在这个专业领域中,很多人(包括我自己)曾认为掌握一套成熟的方法论和积累商业案例是
AI“幻觉”难解:谷歌搜索仍推荐用户往披萨里加胶水
还记得谷歌的人工智能搜索结果告诉用户往披萨里加胶水的那件事吗?当时国外网红凯蒂・诺托普洛斯 (Katie Notopoulos) 还真做了一个“胶水披萨”并吃掉了它,这件事在网上引起了热议。不过现在出现了一个问题:谷歌的人工智能正在学习这些网络热梗。诚然,人们很少会查询“往披萨里加多少胶水”这种问题,但考虑到最近“胶水披萨”的热度,也并非完全不可能。安全研究员科林・麦克米伦 (Colin McMillen) 发现,如果你询问谷歌应该往披萨里加多少胶水,并不会得到正确的答案 —— 那就是绝对不要加胶水。相反,谷歌会引
苹果高管:正努力将“Apple Intelligence”引入中国市场
苹果在 WWDC 2024 上发布了备受瞩目的 iOS 18 和 macOS 15 系统,其中一项重要的新功能是“Apple Intelligence”—— 一套基于人工智能的工具集。该功能将于今年晚些时候正式上线,苹果软件工程主管 Craig Federighi 在接受 Fast Company 采访时透露了一些关于 Apple Intelligence 的未来发展计划。“Apple Intelligence”将赋予用户一系列实用的人工智能辅助功能,例如帮助用户改写文本、总结信息、生成图像甚至表情符号。此外,得益
保姆级教程!如何用Midjourney快速生成版画人像Logo?
这篇教程主要是教你用垫图法来生成一个版画风格的人像 Logo—iw 参数(控制垫图权重)
数值一半是 0.5-1-1.5-2 数值越小与垫图越相似
—quality 参数(控制图片质量)
默认值是 1 最高为 5 越低细节越低
在使用 midjourney 辅助设计这款人物标志的过程中,需要不断优化提示词,才能得到满意的处理。
垫图在此次学习中非常关键,图片的后期矢量化处理主要在简化人物的细节和整合色彩,才能做到更符合商业视觉化的要求。
最后,最近用能接受 MJ 素材图的商业需求变多了,成功变现了几个案子赚到钱就更
俄罗斯科技巨头 Yandex 宣布开源“YaFSDP”大语言模型训练工具:大幅提升 GPU 利用率,对 Llama 3 可实现 26% 加速
俄罗斯科技巨头 Yandex 推出了一款开源的大语言模型训练工具 ——YaFSDP,号称与现有工具相比速度最高可提升 26%。据介绍,YaFSDP 在训练速度方面优于传统的 FSDP 方法,尤其适用于大型模型。在预训练 LLM 方面,YaFSDP 速度提高了 20%,并且在高内存压力条件下表现更佳。例如,YaFSDP 对具有 700 亿参数的 Llama 2 可以实现 21% 的效率提升,对具有同级参数的 Llama 3 也实现 了 26% 的效率提升。IT之家附官方数据一览:模型gpu-countseq-lenn