应用
为什么要纯C语言手搓GPT-2,Karpathy回应网友质疑
Karpathy:for fun.几天前,前特斯拉 Autopilot 负责人、OpenAI 科学家 Andrej Karpathy 发布了一个仅用 1000 行代码即可在 CPU/fp32 上实现 GPT-2 训练的项目「llm.c」。llm.c 旨在让大模型(LM)训练变得简单 —— 使用纯 C 语言 / CUDA,不需要 245MB 的 PyTorch 或 107MB 的 cPython。例如,训练 GPT-2(CPU、fp32)仅需要单个文件中的大约 1000 行干净代码(clean code),可以立即编
Meta宣布全新训推一体加速器:完全集成PyTorch 2,性能3倍提升
Meta 疯狂砸入数十亿美元,一部分招揽人才,一部分造芯片。Meta 正在不遗余力地想要在生成式 AI 领域赶上竞争对手,目标是投入数十亿美元用于 AI 研究。这些巨资一部分用于招募 AI 研究员。但更大的一部分用于开发硬件,特别是用于运行和训练 Meta AI 模型的芯片。在英特尔宣布其最新人工智能加速器硬件的第二天,Meta 便迅速公布了关于芯片研发的最新成果:下一代 MTIA(Meta Training and Inference Accelerator),其中 MTIA 是专为 Meta AI 工作负载而设
XAI有什么用?探索LLM时代利用可解释性的10种策略
你是否也好奇,在大模型时代,可解释性人工智能技术(XAI)有怎样的使用价值?近日,来自佐治亚大学、新泽西理工学院、弗吉尼亚大学、维克森林大学、和腾讯 AI Lab 的研究者联合发布了解释性技术在大语言模型(LLM)上的可用性综述,提出了 「Usable XAI」 的概念,并探讨了 10 种在大模型时代提高 XAI 实际应用价值的策略。论文题目:Usable XAI: 10 Strategies Towards Exploiting Explainability in the LLM Era论文链接:::(1)如何利
OpenAI CEO 阿尔特曼想要建立一个全球 AI 联盟,加快人工智能发展
OpenAI CEO 阿尔特曼本周在阿联酋会见了投资者和政府官员,据彭博社报道,阿尔特曼一直致力于在政府和行业领导者之间建立一个全球 AI 联盟,用来增加开发人工智能技术所需的芯片、能源和数据中心容量的供应,更多的基础设施投资,促进人工智能的发展。阿尔特曼与投资者和政府官员讨论私营部门如何与各国合作,他还与一些西方国家的官员进行了交谈,并将于本周晚些时候在华盛顿举行会议。阿尔特曼尝试用这种办法解决芯片和其他关键基础设施供应落后的问题,他一直在努力从全球投资者那里筹集数十亿美元,利用这些资金建立一个制造半导体的工厂网
蚂蚁集团 CodeFuse 推出“图生代码”功能,支持产品设计图一键生成代码
感谢蚂蚁集团自研的智能研发平台 CodeFuse 推出“图生代码”新功能,支持开发人员用产品设计图一键生成代码,大幅提升前端页面的开发效率,目前相关功能正在内测。据悉,蚂蚁集团正在内部全面推行 AI 编程,使用 CodeFuse 支持日常研发工作的工程师达到 50% 以上,这些工程师提交的代码中 10% 由 AI 生成。目前,在蚂蚁内部,每周已有超五成程序员在日常研发中使用 CodeFuse。CodeFuse 生成的代码整体采纳率为 30%,在生成单元测试场景采纳率可以达到 50%。据IT之家了解,此次发布的“图生
每年节省 2000 多万美元,美国得州率先利用 AI 阅卷给学生评分
感谢得克萨斯州成为美国首个公开采用人工智能阅卷评分的州。得州近日宣布学术准备评估(STAAR)考试中笔试部分将使用“自动评分引擎”给学生打分。IT之家注:STAAR 是在每学年结束时,美国得州针对 3 至 12 年级公立学校学生,评估其能力的考试。STAAR 考试基于得州课程标准,涵盖包括阅读,写作,数学,科学和社会学在内的核心科目。美国得州于 2023 年开始推进 STAAR 考试改革,修订后的考试减少了选择题,开放式问题数量是此前的 7 倍。TEA 学生评估主管 Jose Rios 表示未来的考试尽可能推行开放
创维创始人黄宏生谈电视开机率低:AI 将让人们回归电视
创维集团近日在海南博鳌举办了规模超过 1500 人的“创维集团 2024 年全品类客户大会”,提出了“下一站,1000 亿”的宏伟口号。图源 Pexels今年是创维集团成立 36 周年,去年创维集团实现了 690.3 亿元的营业额,股权持有人应占溢利达到 10.69 亿元。据每日经济新闻报道,创维集团创始人黄宏生在 4 月 8 日的媒体采访中表达了他的期望:希望在 2025 年实现千亿元的营收目标。回顾历史,1988 年黄宏生在深圳华强北路开启了他的创业之旅,创立了创维品牌。凭借在彩电业的成功,他也被誉为“彩电大王
史上首位阿贝尔奖、图灵奖双得主!2023图灵奖授予随机性大佬Avi Wigderson
这位多产的研究者发现了随机性和计算之间的深刻联系,其贡献影响了密码学、复杂性等多个领域的研究。今年的图灵奖,比往年来的要晚一些。北京时间 4 月10日晚,计算机协会ACM宣布将2023图灵奖授予普林斯顿高等研究院数学家和顶级理论计算机科学家阿维·威格森(Avi Wigderson),以表彰他对计算理论的基础性贡献,包括塑造对计算中随机性作用的理解,以及数十年来在理论计算机科学领域的卓越领导力。Wigderson为普林斯顿高等研究院数学学院的Herbert H. Maass教授,在计算复杂性理论、算法和优化、随机性和
最高 7.25 美元 / 分钟,Adobe 购买视频构建 AI 模型与 Sora 竞争
感谢Adobe 公司已开始采购视频,用来构建其 AI 驱动的文本到视频生成器,在 OpenAI 展示类似技术(Sora)后,Adobe 试图赶上竞争对手。这家软件公司正在向其摄影师和艺术家网络提供每份 120 美元(IT之家备注:当前约 870 元人民币)的报酬,Adobe 要求他们提交人们从事日常活动(如行走)或表达各种情绪(包括喜悦和愤怒)的视频。该公司表示,这样做是为了给人工智能训练收集资料。Adobe 要求提供 100 多个参与动作和表达情感的人的短片,以及脚、手或眼睛的简单解剖镜头。该公司还希望获得人们“
英伟达 H100 AI GPU 短缺缓解,交货时间从 3-4 个月降至 2-3 个月
曾几何时,英伟达用于人工智能计算的 H100 GPU 供不应求。然而据 Digitimes 报道,台积电的台湾地区总经理 Terence Liao 表示,过去几个月英伟达 H100 的交货等待时间已经大幅缩短,从最初的 3-4 个月降至目前的 2-3 个月(8-12 周)。服务器代工厂商也透露,相比 2023 年几乎无法买到英伟达 H100 的情况,目前供应瓶颈正在逐步缓解。尽管交货等待时间有所缩短,Terence Liao 表示,对于人工智能硬件的需求仍然非常旺盛。即使价格昂贵,用于人工智能的服务器采购也正在取代
1760 亿参数、大小 281GB,Mixtral 8x22B 开源模型登场:可 Torrent 下载
感谢Mistral AI 公司近日推出了 Mixtral 8x22B 开源模型,共有 1760 亿个参数,Context 长度(上下文文本)为 6.5 万个 token,可以通过 Torrent 下载。Mistral AI 公司自成立以来一直备受外界关注,“6 人团队,7 页 PPT,8 亿融资”不断缔造传奇,而且在得到微软的投资之后更是进入发展快车道。该公司今天发布的 Mixtral 8x22B 是个开源模型,官方目前放出了 Torrent 种子链接,文件大小为 281GB。用户可以通过磁性链接直接下载,或者通过
IP Adapter Plus 插件手把手教程!用法更简单,可分别控制风格与构图
大家好,这里是和你们一起探索 AI 的花生~
IP Adapter 是 SD 生态中一个非常强大的风格迁移插件,可以将一张图像的风格复制到新生成的图像中,有效提升我们的出图效率,目前在设计领域有广泛应用。
相关推荐:最近,ComfyUI IP Adapter Plus 的作者 @cubiq 重写了插件代码,对整体进行了升级更新。新插件在节点搭建和模型上读取上比之前更简单方便,并且支持的功能也更丰富了。而最让人惊喜的一点是 IP Adapter Plus 支持分别进行风格迁移、构图迁移和二者的联合使用,可以让我们更准
Meta 发布新一代 AI 训练与推理芯片,性能为初代芯片三倍
Meta Platforms 当地时间 10 日发布了其训练与推理加速器项目(MTIA)的最新版本,MTIA 是 Meta 专门为 AI 工作负载设计的定制芯片系列。据介绍,此次发布的新一代 MTIA 与第一代 MTIA 相比,显著改进了性能,并有助于强化内容排名和推荐广告模型。其架构从根本上侧重于提供计算、内存带宽和内存容量的适当平衡。该芯片还可帮助提高训练效率,使推理(即实际推理任务)变得更容易。Meta 在其官方博客文章中表示,“实现我们对定制芯片的雄心壮志,意味着我们不仅要投资于计算芯片,还要投资于内存带宽
UL Procyon AI 图像生成基准测试现已适配兼容苹果 macOS 系统
测试认证机构、3DMark 开发方 UL Solution 宣布旗下 UL Procyon AI 图像生成基准测试现已兼容苹果 macOS 操作系统。该 AI 图像生成基准测试于上月推出,是 UL Procyon 专业基准测试套件的一部分。其基于 Stable Diffusion AI 模型(包含 1.5 和 XL 两种版本),能在所有支持的硬件上得到公平且可比较的结果。UL Procyon AI 图像生成基准测试通过强大的推理负载测量专用 AI 处理硬件的性能,首发时适配支持英伟达 TensorRT、英特尔 Op
腾讯音乐与长城汽车开启战略合作,聚焦智能座舱 AI 音频技术
感谢腾讯音乐娱乐集团(TME)与长城汽车 4 月 9 日举办研讨会,并宣布正式开启战略合作。腾讯音乐为长城汽车颁发了“AI 座舱先锋合作伙伴”证书,双方将聚焦智能座舱中的 AI 音频技术展开合作,并通过 TME 旗下产品实现,共同打造座舱娱乐的创新体验。此次合作将充分利用腾讯音乐在音频领域的技术优势和长城汽车在智能座舱领域的研发实力,共同推动智能座舱 AI 音频技术的发展。腾讯音乐娱乐集团提供在线音乐和以音乐为核心的社交娱乐两大服务。腾讯音乐娱乐在中国有着广泛的用户基础,拥有目前国内市场知名的四大移动音乐产品:QQ
微软宣布 4400 亿日元历史最大在日单笔投资,并为三百万人提供 AI 技能培训
感谢微软今日宣布未来两年在日投资 4400 亿日元(IT之家备注:当前约 209.88 亿元人民币),加强当地的 AI 和云基础设施建设。这笔资金是微软历史上最大的在日单笔投资,使得微软对日本算力基础设施的投资承诺翻倍。这些投资将大幅提升微软在日的基础设施处理能力,为日本提供最先进的 AI GPU 算力资源,推动日本企业的 AI 运用和数字转型。微软还承诺在未来 3 年向包括临时工在内的 300 万日本人提供 AI 技能培训。该培训计划将面向开发人员、学生、各类企业和组织员工开放。微软亚洲研究院将在东京建立新的研究
7B超越百亿级,北大开源aiXcoder-7B最强代码大模型,企业部署最佳选择
对代码大模型而言,比能做编程题更重要的,是看是能不能适用于企业级项目开发,是看在实际软件开发场景中用得顺不顺手、成本高不高、能否精准契合业务需求,后者才是开发者关心的硬实力。当下,大语言模型集成至编程领域、完成代码生成与补全任务成为重要趋势。业界已经出现了一批引人瞩目的代码大模型,比如 OpenAI 的 CodeX、谷歌 DeepMind 的 AlphaCode、HuggingFace 的 StarCoder,帮助程序员更迅捷、更准确、更高质量地完成编码任务,大幅提升效率。有这样一支研发团队,在 10 年前便开始了
94岁诺奖得主希格斯去世,曾预言「上帝粒子」的存在
一位用诗意的语言揭示宇宙秘密的人。一位 94 岁伟大科学家的逝世,引发了人们广泛的哀思。4 月 10 日消息,诺贝尔物理学奖得主、著名物理学家彼得・希格斯(Peter Higgs)于周一去世,享年 94 岁。希格斯因提出希格斯玻色子也被称为「上帝粒子」而闻名。根据爱丁堡大学的一份声明我们得知(彼得・希格斯是该校的荣誉退休教授),希格斯经历短暂的生病后,于 4 月 8 日星期一在家中安静的离开。对于老爷子的去世,爱丁堡大学校长 Peter Mathieson 沉重的表示:「彼得・希格斯是一位杰出的科学家 —— 一位真