相关人士回应字节大模型遭实习生攻击:破坏训练属实,损失金额及处理方式被夸大

据“证券时报・e 公司”报道,接近字节跳动的人士今日就“字节大模型遭实习生攻击”一事表示,确有实习生破坏 AI 模型训练,但损失金额和处理方式被夸大。AI在线附前情提要:近期流传消息称,今年 6 月,某高校博士在字节跳动商业化技术团队实习,因对团队资源分配不满,使用攻击代码破坏团队的模型训练任务。截至目前,官方未进行回应。

据“证券时报・e 公司”报道,接近字节跳动的人士今日就“字节大模型遭实习生攻击”一事表示,确有实习生破坏 AI 模型训练,但损失金额和处理方式被夸大

AI在线附前情提要:

近期流传消息称,今年 6 月,某高校博士在字节跳动商业化技术团队实习,因对团队资源分配不满,使用攻击代码破坏团队的模型训练任务。截至目前,官方未进行回应。

传闻显示,该田姓实习生利用了 HF(huggingface)的漏洞,在公司的共享模型里写入破坏代码,导致模型的训练效果忽高忽低,无法产生预期的训练效果,而且 AML 团队无法核查原因。但传闻曝出之后,该实习生还在某微信群里辟谣称,自己发完论文后就从字节跳动离职,这个当口有另一个人钻漏洞改模型代码,把锅扣到自己头上。

知情人士称,字节跳动内部已经调查明确此事为田姓实习生所为。目前,该实习生已被辞退,字节跳动同时把此事同步给阳光诚信联盟和企业反舞弊联盟,以及该实习生所在的学校。但这名实习生被辞退后到处“辟谣”甩锅,称是其他人所为。

相关资讯

字节跳动豆包大模型掀起价格战:主力模型比行业低 99.3%,日均处理千亿级 Tokens

今日,字节跳动豆包大模型正式发布,宣布大模型价格进入“厘时代”。字节跳动火山引擎总裁谭待介绍称:经过一年时间的迭代和市场验证,豆包大模型正成为国内使用量最大、应用场景最丰富的大模型之一,目前日均处理 1200 亿 Tokens 文本,生成 3000 万张图片。“大的使用量,才能打磨出好模型,也能大幅降低模型推理的单位成本。豆包主力模型在企业市场的定价只有 0.0008 元 / 千 Tokens,0.8 厘就能处理 1500 多个汉字,比行业便宜 99.3%。”▲ 火山引擎总裁谭待公布豆包大模型定价,图源:字节跳动I

消息称字节将于 7 月 19 日首次大范围公布文生图 / 视频等 AI 模型进展

钛媒体 AGI 报道称,字节跳动团队将会在 7 月 19 日(本周五)首次大范围公布文生图、类 sora 新视频等全新人工智能(AI)模型技术进展,尤其在长视频、高动态方向上具备创新技术,或将直接对标 Sora 效果。消息人士表示,字节跳动内部将 AI 大模型设为集团 P0 最高级别的方向。此外抖音、剪映等内部多个团队也在研发 AI 视频模型应用,预计将在近期公布。字节跳动将在新加坡举办关于世界模型(World Models)探索的 AI 技术菁英论坛(ByteDance AI Luminary Talks)活动,

消息称字节跳动计划使用华为芯片训练新的 AI 模型

北京时间今天下午,据路透社援引三名知情人士消息称,字节跳动计划为 TikTok 开发一种新的 AI 模型,主要使用来自华为的芯片进行训练。报道称,字节跳动现已将目光转向中国国内 AI 芯片供应商,同时也加快自主研发的步伐。在这场 AI 竞赛中,字节跳动的下一步动作是使用华为昇腾 910B 芯片来训练 AI 大模型。第四位知情人士也称,字节跳动计划建设一个新的 AI 模型,但“不能透露”是否会使用华为芯片。前述三位知情人士表示,字节跳动已经开始使用昇腾 910B 芯片,主要用于计算密集度较低的推理任务,即利用预先训练