AI在线 AI在线

相关人士回应字节大模型遭实习生攻击:破坏训练属实,损失金额及处理方式被夸大

作者:清源
2024-10-19 12:47
据“证券时报・e 公司”报道,接近字节跳动的人士今日就“字节大模型遭实习生攻击”一事表示,确有实习生破坏 AI 模型训练,但损失金额和处理方式被夸大。AI在线附前情提要:近期流传消息称,今年 6 月,某高校博士在字节跳动商业化技术团队实习,因对团队资源分配不满,使用攻击代码破坏团队的模型训练任务。截至目前,官方未进行回应。

据“证券时报・e 公司”报道,接近字节跳动的人士今日就“字节大模型遭实习生攻击”一事表示,确有实习生破坏 AI 模型训练,但损失金额和处理方式被夸大

AI在线附前情提要:

近期流传消息称,今年 6 月,某高校博士在字节跳动商业化技术团队实习,因对团队资源分配不满,使用攻击代码破坏团队的模型训练任务。截至目前,官方未进行回应。

传闻显示,该田姓实习生利用了 HF(huggingface)的漏洞,在公司的共享模型里写入破坏代码,导致模型的训练效果忽高忽低,无法产生预期的训练效果,而且 AML 团队无法核查原因。但传闻曝出之后,该实习生还在某微信群里辟谣称,自己发完论文后就从字节跳动离职,这个当口有另一个人钻漏洞改模型代码,把锅扣到自己头上。

知情人士称,字节跳动内部已经调查明确此事为田姓实习生所为。目前,该实习生已被辞退,字节跳动同时把此事同步给阳光诚信联盟和企业反舞弊联盟,以及该实习生所在的学校。但这名实习生被辞退后到处“辟谣”甩锅,称是其他人所为。

相关标签:

相关资讯

字节跳动豆包大模型掀起价格战:主力模型比行业低 99.3%,日均处理千亿级 Tokens

今日,字节跳动豆包大模型正式发布,宣布大模型价格进入“厘时代”。字节跳动火山引擎总裁谭待介绍称:经过一年时间的迭代和市场验证,豆包大模型正成为国内使用量最大、应用场景最丰富的大模型之一,目前日均处理 1200 亿 Tokens 文本,生成 3000 万张图片。“大的使用量,才能打磨出好模型,也能大幅降低模型推理的单位成本。豆包主力模型在企业市场的定价只有 0.0008 元 / 千 Tokens,0.8 厘就能处理 1500 多个汉字,比行业便宜 99.3%。”▲ 火山引擎总裁谭待公布豆包大模型定价,图源:字节跳动I
5/15/2024 10:46:06 AM
问舟

消息称字节将于 7 月 19 日首次大范围公布文生图 / 视频等 AI 模型进展

钛媒体 AGI 报道称,字节跳动团队将会在 7 月 19 日(本周五)首次大范围公布文生图、类 sora 新视频等全新人工智能(AI)模型技术进展,尤其在长视频、高动态方向上具备创新技术,或将直接对标 Sora 效果。消息人士表示,字节跳动内部将 AI 大模型设为集团 P0 最高级别的方向。此外抖音、剪映等内部多个团队也在研发 AI 视频模型应用,预计将在近期公布。字节跳动将在新加坡举办关于世界模型(World Models)探索的 AI 技术菁英论坛(ByteDance AI Luminary Talks)活动,
7/17/2024 10:48:46 AM
沛霖(实习)

消息称字节跳动计划使用华为芯片训练新的 AI 模型

北京时间今天下午,据路透社援引三名知情人士消息称,字节跳动计划为 TikTok 开发一种新的 AI 模型,主要使用来自华为的芯片进行训练。报道称,字节跳动现已将目光转向中国国内 AI 芯片供应商,同时也加快自主研发的步伐。在这场 AI 竞赛中,字节跳动的下一步动作是使用华为昇腾 910B 芯片来训练 AI 大模型。第四位知情人士也称,字节跳动计划建设一个新的 AI 模型,但“不能透露”是否会使用华为芯片。前述三位知情人士表示,字节跳动已经开始使用昇腾 910B 芯片,主要用于计算密集度较低的推理任务,即利用预先训练
9/30/2024 4:57:44 PM
清源