字节跳动 P0 级事故:实习生删除 GB 以下所有模型,直接上了今日头条......
点击关注公众号,回复“1024”获取2TB学习资源!
大家好,我是民工哥。
曾经我招过一个实习生,他曾经干过一件让我感到匪夷所思的事:
我当时忙,让他把服务器重启,他直接来了个电源重启。
最近脉脉上有网友爆料,字节跳动一位实习生删除了公司所有轻量级别的机器学习模型。
什么是lite模型?
该楼主表示,lite模型就是公司内几乎所有GB大小以下的机器学习模型,且全部被删除了,实习生直接删除的是父目录且加了 skip trash (删除文件时临时禁用回收)操作,导致被删除模型无法被恢复。
当晚全公司通报,直接被列入 P0 事故等级(严重事故):
据楼层讨论,光是处理问题的群就进了接近三百人,其殃及业务之广可想而知:
大家都在讨论这位实习生的去留,我们搜了一下,据说,“只要不是主观故意的”就不会被开除:
所以说一定要稳住别慌,问题不大。
网友热议
有网友表示这是实习生给你们这帮人出了一道hard题,不过没有标准答案,考验你们解题能力的时候到了。
还有网友表示实习生不能有权限操作这么重要的东西,这锅80%应该判给管理者,实习生反倒是暴露了问题,换个角度来看,实习生立功了。
我们知道,字节跳动最出名的文化之一,就是扁平化管理。实习生与正式员工有同样的文档权限,这也是字节能够在与BAT等大厂竞争中保持灵活高效的秘诀,从这个角度上来说,说实习生立功倒也不能算错。
而别的对手就权限不一了。
到底删除了多少模型?
根据字节网友后来发到网上的疑似截图显示,被删除的只是:“Lagrange Lite 全量 Batch模型的备份”,且显示为「被误删」。
又有字节的工程师网友表示删除的都是离线数据,影响不大。
该楼主好像对此事非常热衷,全程在线跟帖,表示“确实影响不大但是麻烦,重新训练模型和延迟上线理论上都会对指标有负向只是不那么明显了”。
实习生“立大功”
2018年据英国《金融时报》报道,谷歌内部一位实习生无意中犯下一个“小”错误,导致一则没有意义的广告投放到“大量”网页和应用中,持续了大约为45分钟,相关费用和清理成本达到1000万美元,真可谓小手一抖,千万元没有。
字节 AI
字节都有什么出名的机器学习产品?
字节跳动最早是以今日头条来闯荡江湖,在今日头条以及后来的抖音和火山等产品上肯定用到了不少机器学习推荐算法,这就先不提了。
此外,在抖音这款“有毒”的产品上,也时不时见到各种运用 AI 算法来做人脸变化的技术应用,比如最近的在抖音上比较火的重返3岁的AI特效等等。
据 AI科技评论 所知,字节还开源过一个名为LightSeq的序列推理引擎,它对以 Transformer 为基础的序列特征提取器(Encoder)和自回归的序列解码器(Decoder)做了深度优化,早在 2019 年 12 月就已经开源,应用在了包括火山翻译等众多业务和场景。
据了解,这应该是业界第一款完整支持 Transformer、GPT 等多种模型高速推理的开源引擎。
LightSeq 可以应用于机器翻译、自动问答、智能写作、对话回复生成等众多文本生成场景,大大提高线上模型推理速度,改善用户的使用体验。
相比于目前其他开源序列推理引擎,LightSeq具有如下几点优势:
高性能;
支持模型功能多;
简单易用,无缝衔接Tensorflow、PyTorch等深度学习框架。
据 AI科技评论 所知,字节跳动AI Lab最近计划要开源「新版训练加速引擎」,可以让模型训练加速3倍以上。
最后,据这次的误删除事件来看,1GB 的模型其实不算大,大概只有几亿的参数量级,反观现在 AI 江湖动则千亿万亿起步的模型,1GB以下的模型真的不算大,算不上是决定性的模型。
或许此次事件对字节只是一件不痛不痒的小事,字节的高层或许压根不知道此事,毕竟这又不是删库跑路。
虽说如此,但程序里的bug是个玄学,有时哪怕某个小bug产生的影响往往也是难以预料的,有时会牵一发而动全身,若是赶巧也可能影响整个产品线。
来源:codingsky.com/news/2021-06-24/114315.html
如果本文对你有帮助的话,欢迎点赞&在看&转发,这对我继续分享&创作优质文章非常重要。感谢
字节跳动 P0 级事故:实习生删除 GB 以下所有模型,直接上了今日头条......相关推荐
- 字节跳动P0级事故:实习生删除GB以下所有模型,直接上了今日头条......
今日推荐 推荐一个 Java 接口快速开发框架干掉Random:这个类已经成为获取随机数的王者Docker + Intellij IDEA,提升 10 倍生产力!笑出腹肌的注释,都是被代码耽误的诗人! ...
- 字节跳动P0级事故:实习生删除GB以下所有模型,差点没上头条......
源 / AI科技评论 文/ 陈大鑫.陈彩娴 昨晚脉脉上有网友爆料,字节跳动一位实习生删除了公司所有轻量级别的机器学习模型! 什么是lite模型? 该楼主表示,lite模型就是公司内几乎所 ...
- 一次生产环境P0级事故,整个项目组被扣了绩效......
大家好,我是不才陈某~ 上周知识星球中的一位球友分享了他的一个 P0事故,本文来自于他的真实案例的回忆总结! 陈某的知识星球开通了,一个相互学习交流的私密技术圈子,已经有 150+ 位球友加入,陈某会 ...
- 一次生产环境P0级事故分析
事件背景 作者所在的公司核心业务是做政府信息化软件的,就是为政府部门开发信息化系统.其中有一款信息化软件是客户每天需要使用的,并且他们面向的客户就是老百姓. 某年某月,某地区信息化系统,周末升 ...
- 提前泄露小米10至尊版,博主赔偿100万;传字节跳动实习生删除GB以下所有机器学习模型;快手宣布7月将取消大小周|极客头条
「极客头条」-- 技术人员的新闻圈! CSDN 的读者朋友们早上好哇,「极客头条」来啦,快来看今天都有哪些值得我们技术人关注的重要新闻吧. 整理 | 梦依丹 出品 | CSDN(ID:CSDNnews ...
- 腾讯“鹅城”开建,斥资370亿;提前泄露小米新机博主被判赔偿100万;传字节跳动实习生删除GB以下所有机器学习模型 | EA周报...
EA周报 2021年6月25日 每个星期7分钟,元宝带你喝一杯IT人的浓缩咖啡,了解天下事.掌握IT核心技术. 周报看点 1.因提前泄露小米10 至尊版 博主赔偿 100 万美金 2.网传字节跳动实习 ...
- 字节跳动亿级DAU客户端发布实践
本文是字节跳动发布工程团队的高磊讲师在2021 GOPS 全球运维大会中「字节跳动亿级DAU客户端发布最佳实践」的分享全文. 首先做一下自我介绍:我是字节跳动发布工程团队的工程师高磊.从事软件开发工作 ...
- 被字节跳动T4级大佬鄙视了:让你10倍提升认知效率,就这3个方法!
来源| 技术领导力(ID:jishulingdaoli) 国庆长假前,老K跟一位字节跳动T4级的大佬吃饭,聊到技术人如何快速提升认知的问题.我说,很简单啊,努力到无能为力,拼搏到感动自己......话 ...
- 网传字节跳动实习生删除GB以下所有机器学习模型,差点没上头条
点击上方"AI遇见机器学习",选择"星标"公众号 重磅干货,第一时间送达 作者 | 陈大鑫.陈彩娴 来源 | AI科技评论 昨晚脉脉上有网友爆料,字节跳动一位实 ...
最新文章
- 学Linux的你还在为正则表达式而挠头?
- Glassfish3 asadmin 常用命令
- Java黑皮书课后题第10章:*10.26(计算器)修改程序清单7-9,接收一个字符串表达式,其中操作符和操作数由0到多个空格隔开
- 图像像素灰度内插(Matlab实现)
- 方立勋_30天掌握JavaWeb_Session
- java seekbar_SeekBar的基本使用方法
- Android camera开发(11)---Camera软件架构
- 计生专干招聘计算机,请求解决招聘计生专干待遇
- 计算机基础知识经典问答题,计算机基础知识问答题和答案一.doc
- 简化预测集合的永磁同步电机的无差拍预测转矩控制系统Simulink仿真
- syswow64删除文件_win7系统Syswow64文件夹有什么作用?
- C#利用控件拖拽技术制作拼图游戏
- 计算机产品选型与配置,高校校园网设备的选型和配置.DOC
- 参考文献格式详细解释和引用(常见)
- gan 总结 数据增强_深度学习中的数据增强(下)
- hardware - cortex-A15, cortex-A35,cortex-A53,cortex-A72
- Eric6与pyqt5学习笔记 6【实战2 window伪文本编辑器】【纯eric6操作】
- 谁有cmmi v2.0中文版本的下载地址,分享一下,谢谢
- 教你用msconfig命令设置开机启动项
- 2017年1月19日