关于深夜技术事故纪实录的若干问题回复

  • 时间:
  • 浏览:1

前一段时间写了一篇文章《夜半1点突发致命生产事故,人工多进程来破局!》,什么都有有一篇生产事故的记实文章,没想到在圈内流传甚广,其蕴含进程员对其中的细节很重疑惑,刚好国庆都非要和朋友再进一步探讨一下。

现在技术圈有有另一个不太好的问題图片,突然就看这麼 有另一个问題图片,当跳出 稍微热门有些的文章的后后,总会跳出 两级分化的问題图片,一拨人会反馈牛逼写得太好了,有后后另一拨人突然反馈又后后后后刚开始 吹牛逼了,各种无脑质疑。

我本人 认为有另一个问題图片实在也有太客观,一篇文章的跳出 什么都有有作者我本人 对于技术的阐述,难免有自身的局限,同样既然能写文章必然什么都有有会是瞎乱吹牛逼,那毕竟也有同事朋友都认识,上面非要在你这俩 行业混。

既然文章肯定具有它的局限性,可能性写出来读者都非要给出有些更好的建议,这麼 对于写文章的人也是四种 学习,我突然从读者的留言中学到了什么都有有知识,这是四种 正反馈。

现在的问題图片是什么都有有技术人把抬杠当作了四种 本事,用以展示我本人 的优越感,可能性能说到点子上也还好,关键是有的留言你一看就都非要发现,技术涵养太低了明显是不懂行的请况。

这篇文章发出来后,公众号的用户反馈还都非要,可能性朋友对我有个基本认识,在博客园和开源中国中,要素技术朋友质疑比较多的地方给予解释一下:

问題图片 1:“几百万商户、几千个代理商”,“上千多张表,关系极为复杂化”,“在生产环境找十台服务器”离米 也得是淘宝,京东你这俩 级别的电商网站也能有你这俩 规模了吧!

回复:淘宝、京东到底有几个商户我还真不太清楚,什么都有有不敢妄言,但请实在轻易低估一家排名靠前的第三方支付公司的数据量,可能性历史堆积、外放通道等各种原因分析,这点数据还是有的。

至于在生产环境找十台服务器,你这俩 操作应该是随随便便的有另一个中型互联网公司都能追到的,后后公司离米 用了 1000-1000 太服务器,从中找个10台也有啥问題图片。

问題图片2 :吹有哪些牛逼,难道贵公司是淘宝,拼多多?淘宝也就几百万商户,还日均 40 亿的交易量,用 Spring Cloud 几百个微服务撑不起这麼大的体量。

回复:淘宝也就几百万商户你这俩 数据准确吗?蕴含个体小微商户?

日均 40 亿的交易额在线下收单你这俩 行业这不算高,下面这张是网传收单机构2019年7月交易量排名截图,排名第 10 就可能性不止你这俩 交易量了。

用 Spring Cloud 几百个微服务撑不起这麼大的体量你这俩 问題图片,就明显是有另一个外行得非要再外行的问題图片了,你都非要姑且不说有几个成功案例了,就你这俩 评估土方式什么都有有低级的。

这麼说哪个技术都非要支持几个体量可能性非要支持几个体量,要评估你这俩 问題图片,非要看是有哪些样的团队在有哪些样的场景以有哪些样的土方式来使用次技术。技术四种 实在能决定能支撑多大体量,最重要的是看你为什么会么会用它。

问題图片3:我为什么会么会看这是数据库工程师的工作,为有哪些非要写进程迁移呢?

你这俩 看什么都有有技术小白了,从有另一个非常老的系统迁移到有另一个全部的新系统,这其中的业务变化、逻辑变化有几个?可能性能让 DBA 直接迁移句子,那你这俩 系统有多简单?

且不说你这俩 系统涉及尽千张表,后后老系统的架构和新系统的架构差别有多大, 最重要的是你这俩 新系统上面还跟了有另一个大数据平台,大数据平台非要根据新系统的 Binlog 日志,做相关数据的逻辑操作。

什么都有有从读者提问四种 来讲,就能看出根本不明白你这俩 难点在哪里。

问題图片4:为有哪些不建有另一个和中产 1:1 的环境来模拟测试呢?

一般请况下研发会有另一个环境来测试:

  • DEV 开发环境,研发人员开发完成自行测试环境。
  • SIT 集成测试环境,将我本人 项目上传到 sit 一般就进入测试部测试阶段了,整体集成测试。
  • UAT 客户集成测试环境,一般都非要做外部合作土方式者商对接的准生产环境,要尽可能性的和中产环境保持一致。
  • PRO 生产环境,你这俩 朋友都清楚,什么都有有真正项目要运行的环境。

读者说的1:1 环境,应该什么都有有非要 UAT 和 PRO 的环境尽可能性的保持一致,这是有另一个比较理想的请况,估计非要要素有钱的互联网公司都非要真正实现。

朋友做有另一个中型的互联网公司,每年在 IDC 上面的花费离米 在几千万,可能性要全部 1:1 的模拟生产环境,每年的花费离米 在10000万以上,中型互联网公司这麼说服老板去干这件事情。

问題图片5 :更别提都啥时代了还 servlet,从描述的技术方案和正确处理流程来看,基本属于作坊式的阶段,有另一个进程员写有另一个接口就能做日均几十亿交易的系统迁移了,呵呵。

使用 Servlet 有些也有过时,现在企业级开发90%的公司都使用的是 Spring MVC 吧,Spring MVC 什么都有有 Servlet 包装出来了,很过时吗?

至于属不属于作坊式的阶段我不反驳,流程上肯定是有欠缺的你这俩 我认可,但并也有有另一个进程员写有另一个接口做几十亿的系统迁移,可能性真的是这麼 那还非要留 20 号的人在这里干嘛。

这麼大级别的数据迁移肯定是有另一个系统性的工程,并也有1、有另一个进程员都非要负责的,有后后迁移进程的发起入口用 1、2 进程员负责足以,上面非要调用 N 个系统的接口配合来完成整体的工作。

问題图片6 :我实在你这俩 错误犯得很低级 日数据量达到几十亿次的应用 朋友说没考虑到数据量过大迁移耗时太长的问題图片?平时小项目写个定时器也有考虑会不多再执行时间过长原因分析,第一次还没执行完就执行第二次,朋友面对千亿的数据量朋友说这麼考虑你这俩 问題图片?

你这俩 问題图片蕴含有另一个错误,交易额是日几十亿而也有交易量几十亿次,订单量远远这麼到达你这俩 量级。数据迁移当然考虑了迁移时间,在整个项目迁移后后实在可能性进行过什么都有有次的小规模迁移了,并也有第一次迁移,你这俩 文章中也说明了,你这俩 提问者明显这麼就看就来喷了。

你这俩 迁移进程在干这次大活后后,实在可能性经历多次考验了,什么都有有从四种 程度上来讲这次出问題图片,轻视也是问題图片占据 的原因分析之一。

不但可能性多次使用,在正式迁移后后也安排进行了多次的验证,什么都有有做为管理者这麼和进程员一块儿深入排查要素细节,占据 要素管理失职。

另外有的读者说为有哪些不使用多进程,我强调一下整个迁移项目使用了多进程,有后后还也有仅仅有有另一个进程,什么都有有进程的最外层这麼使用多进程,也什么都有有朋友上面的正确处理方案。

实在还有什么都有有问題图片,这里不再一一提前大选,有的提问真的是太低级,感觉也有应该是有另一个进程员提出的问題图片。

不过还是有有些读者会对你这俩 大规模迁移有所了解,这其中涉及的细节朋友说实在不多,任何有另一个小的忽略也有可能性原因分析大的问題图片,你这俩 事情这麼土方式在文中一一举例出来。

不过我实在有一位读者的回复我比较认可:

有有哪些说风凉话的肯定这麼做过上千张表新老系统的迁移,还数据库上面件对接,呵呵

最后,还是那句话:保持技术人的那颗初心,一切以正确处理实际问題图片为主。