釘釘崩潰,非常正常的一件事,這不是第一次也不會(huì)是最后一次。
從官方的發(fā)表微博的內(nèi)容來(lái)看,說(shuō)明釘釘近期面臨著非常大的挑戰(zhàn),就是在線人數(shù)成倍增加,所需要的資源也是成倍增加,需要的運(yùn)維人員也要更多。所以咱們?cè)趦?nèi)容里面看到了扛著個(gè)字。背靠阿里這顆大樹(shù)(抗過(guò)了多次雙11以及為12306提供云服務(wù)),也會(huì)出現(xiàn)服務(wù)器崩潰這樣的情況,很多網(wǎng)友就表示不理解了。
實(shí)際上根據(jù)釘釘公布的數(shù)據(jù),從開(kāi)學(xué)至今,釘釘支持了全國(guó)超30個(gè)省份300多個(gè)城市的大中小學(xué)開(kāi)課,覆蓋超過(guò)5千萬(wàn)學(xué)生。得益于阿里云的技術(shù)支撐,釘釘連續(xù)擴(kuò)容了10萬(wàn)臺(tái)云服務(wù)器,在其他平臺(tái)接連出現(xiàn)了崩潰的情況下,成功抗住了一次又一次流量洪峰,成為老師學(xué)生使用最頻繁最流暢的在線學(xué)習(xí)平臺(tái)之一。
其他平臺(tái)崩潰,大家都能理解,為嘛釘釘崩潰了反響就這么大呢?1、釘釘是阿里巴巴旗下社交產(chǎn)品,阿里巴巴搞了這么多年社交,終于能有一款億級(jí)社交類產(chǎn)品,曾經(jīng)的來(lái)往在馬老師的代言下,都沒(méi)發(fā)展起來(lái)。如今,終于揚(yáng)眉吐氣了一把,備受關(guān)注。
2、釘釘一度被認(rèn)為是反人類的軟件,是老板用來(lái)管理員工的工具。很多職場(chǎng)人說(shuō),以前沒(méi)有釘釘是996,現(xiàn)在有了釘釘是7x24,非常擔(dān)心老板ding他。而且還要經(jīng)常通過(guò)釘釘打卡,很煩人。
3、指紋打卡機(jī)、門(mén)禁打卡被釘釘搞得很是無(wú)奈,感覺(jué)要退出歷史舞臺(tái)了。很多企業(yè)通過(guò)釘釘打卡,逐漸就不使用指紋和門(mén)禁打卡了。這樣一來(lái)這些行當(dāng)?shù)纳饩蜕倭撕芏唷?/p>
4、惹不起的學(xué)生,前段時(shí)間就因?yàn)獒斸斏险n這事搞了一波五星分期支付活動(dòng),現(xiàn)在服務(wù)器崩潰了,感覺(jué)突然如釋重負(fù)。
5、商場(chǎng)如戰(zhàn)場(chǎng)、同行業(yè)的競(jìng)爭(zhēng)對(duì)手們,都在等著行業(yè)巨頭鬧笑話。
6、很多看熱鬧的不嫌事大,反正阿里旗下產(chǎn)品出問(wèn)題了,我就吐槽。
其實(shí)我們公司也是用釘釘來(lái)進(jìn)行內(nèi)部交流,個(gè)人覺(jué)得釘釘還是挺不錯(cuò)的。釘釘定位主要用于工作,消息有標(biāo)記已讀和未讀,電話會(huì)議、視頻會(huì)議都很不錯(cuò),打卡什么的也方便,以前一定要到達(dá)刷卡機(jī)邊上物理觸屏,現(xiàn)在進(jìn)入園區(qū)范圍內(nèi)就可以自動(dòng)打卡了。文檔文件也是加密的,防在云上不占用本地的存儲(chǔ),這個(gè)非常不錯(cuò),還有其他的一些辦公協(xié)同、發(fā)票處理、審核機(jī)制等等,都是我們常用的。可以說(shuō),不管你怎么看釘釘,它已經(jīng)形成了自己的核心競(jìng)爭(zhēng)力,已成為很多企業(yè)必不可少的工具,
那么服務(wù)器為什么會(huì)崩潰呢?1、海量的訪問(wèn),服務(wù)器性能不夠,處理不了。
企業(yè)微信、釘釘、淘寶、12306、人民網(wǎng)的崩潰,大多都是屬于這種情況。
考慮到運(yùn)營(yíng)成本和硬件成本,很多服務(wù)器都是按需來(lái)堆硬件。
就像咱們自己使用的電腦或是手機(jī)一樣,開(kāi)啟太多的程序,或者運(yùn)行一些大型的軟件會(huì)導(dǎo)致計(jì)算機(jī)變慢或者卡頓,甚至讓系統(tǒng)卡死。
因?yàn)榉?wù)每個(gè)請(qǐng)求都是要吃內(nèi)存的,請(qǐng)求越多內(nèi)存用量越大,但內(nèi)存畢竟是有限的,可能是物理內(nèi)存確實(shí)用光了,也可能是系統(tǒng)或者中間層的限制。
2、設(shè)計(jì)上的局限性,比如數(shù)據(jù)庫(kù)類型、查詢檢索、會(huì)話機(jī)制等等。
有些系統(tǒng)設(shè)計(jì)上就不是為大負(fù)載高并發(fā)來(lái)做的。比如早年的mysql/myisam。初期都可以用,但一定數(shù)據(jù)庫(kù)大到一定程度,性能就會(huì)直線下降。雖然在這個(gè)階段還只是反應(yīng)慢,服務(wù)器沒(méi)有崩潰,但這種慢并非是線性增長(zhǎng)的,而是近似于指數(shù)那這樣增長(zhǎng)方式。比如1000個(gè)請(qǐng)求的時(shí)候每個(gè)請(qǐng)求1秒,2000個(gè)請(qǐng)求的時(shí)候每個(gè)1.5秒,3000個(gè)請(qǐng)求的時(shí)候每個(gè)5秒,到了10000個(gè)的時(shí)候就更長(zhǎng)了。
你可以理解為信息高速公路,車(chē)少的時(shí)候大家都能跑到規(guī)定速度,車(chē)輛增多就會(huì)形成阻塞,更嚴(yán)重的是即使堵車(chē)之后即使進(jìn)入的車(chē)流沒(méi)有繼續(xù)增加,因?yàn)槌龈咚俚能?chē)流越來(lái)越慢,堵車(chē)也會(huì)越來(lái)越嚴(yán)重,最后堵到所有人都堵死。
3、來(lái)自網(wǎng)絡(luò)的攻擊,曾經(jīng)最常見(jiàn)的就是DDOS攻擊了。
內(nèi)網(wǎng)DDOS攻擊以前很多公司使用的路由器或者交換機(jī)都是很普通的,一旦內(nèi)網(wǎng)某臺(tái)機(jī)器中病毒了,就會(huì)不斷發(fā)數(shù)據(jù),導(dǎo)致路由器交換機(jī)處理不過(guò)來(lái),引起整個(gè)網(wǎng)絡(luò)癱瘓。
外網(wǎng)DDOS攻擊也可以理解為,大量的請(qǐng)求得不到有效處理,讓服務(wù)器崩潰了,而這些請(qǐng)求都不是有效的,它就是一種遠(yuǎn)程會(huì)話,持續(xù)占用你服務(wù)器的內(nèi)存,導(dǎo)致服務(wù)器處理能力不夠,我們有時(shí)候會(huì)感覺(jué)重啟一下好了,但是過(guò)一段時(shí)間它又慢下來(lái)甚至崩潰了。
4、服務(wù)器程序配置有問(wèn)題。這種問(wèn)題一般在大公司很少見(jiàn)。
5、線程死鎖 ,由多線程帶來(lái)的性能改善是以可靠性為代價(jià)的,主要是因?yàn)檫@樣有可能產(chǎn)生線程死鎖。線程死鎖時(shí),第一個(gè)線程等待第二個(gè)線程釋放資源,而同時(shí)第二個(gè)線程又在等待第一個(gè)線程釋放資源。
6、磁盤(pán)已滿 ,導(dǎo)致系統(tǒng)無(wú)法正常運(yùn)行的最可能的原因是磁盤(pán)已滿。一個(gè)好的網(wǎng)絡(luò)管理員會(huì)密切關(guān)注磁盤(pán)的使用情況,隔一定的時(shí)間,就需要將磁盤(pán)上的一些負(fù)載轉(zhuǎn)存到備份存儲(chǔ)介質(zhì)中。
我們?cè)賮?lái)看看哪些互聯(lián)網(wǎng)大廠經(jīng)歷過(guò)服務(wù)器崩潰的情況。新浪微博,服務(wù)器崩潰,趙麗穎和馮紹峰在微博宣布結(jié)婚,各自曬出了結(jié)婚照,導(dǎo)致大量的吃瓜群眾涌入微博,微博服務(wù)器立馬就崩潰;鹿晗和關(guān)曉彤在微博上發(fā)布戀情之后,也崩潰過(guò)一次。
國(guó)際巨頭亞馬遜,作為全球最大的電商平臺(tái),在2017年2月,亞馬遜 S3 云存儲(chǔ)服務(wù)器出現(xiàn)故障,導(dǎo)致幾千個(gè)網(wǎng)頁(yè)打不開(kāi),時(shí)間持續(xù)了4個(gè)小時(shí),有網(wǎng)友稱這次癱瘓導(dǎo)致半個(gè)互聯(lián)網(wǎng)癱瘓。而原因就是一個(gè)工作人員在刪除子系統(tǒng)時(shí)不小心多加了一個(gè)字母,廣大網(wǎng)友調(diào)侃是不是要SHA了這個(gè)程序員祭天呢。。騰訊公司 2013年微信無(wú)法登錄,2017年微信小程序無(wú)法打開(kāi),無(wú)法支付等情況都是其服務(wù)器崩潰引起,今年企業(yè)微信也出現(xiàn)過(guò)崩潰情況。
阿里云,2015年多次崩潰,2016年10月份也出現(xiàn)過(guò)服務(wù)器無(wú)法訪問(wèn)的情況。2018年6月,阿里云出現(xiàn)大規(guī)模訪問(wèn)異常,圖片服務(wù)等產(chǎn)品無(wú)法正常使用,官網(wǎng)賬號(hào)也無(wú)法登陸。官方公布,該故障是因?yàn)檫\(yùn)維上的一個(gè)操作失誤。事后,阿里云表示,將敬畏每一行代碼,敬畏每一份托付。2019年3月份也出現(xiàn)過(guò)大規(guī)模的掉線。
運(yùn)營(yíng)商服務(wù)器崩潰。
可以說(shuō)目前還沒(méi)有哪家公司能夠徹底解決服務(wù)器崩潰的情況,大家只有對(duì)其進(jìn)行長(zhǎng)期維護(hù)達(dá)到少崩潰,以及達(dá)到崩潰后可以快速恢復(fù)。
最后總結(jié),服務(wù)器長(zhǎng)期穩(wěn)定運(yùn)行是服務(wù)提供商不斷追求的目標(biāo),而且這種積累不是一蹴而就的,隨著計(jì)算機(jī)科技不斷的進(jìn)步,服務(wù)商在軟硬件方面也會(huì)逐步更新迭代。