7萬商戶苦苦等待的微盟公告來了。
今日下午4點42分,據(jù)了解,微盟集團官方公眾號發(fā)布“刪庫”事件后的第二次業(yè)務(wù)進展公告,稱業(yè)務(wù)進展順利,目前新用戶所有服務(wù)可用,老用戶部分商家賬戶、權(quán)益數(shù)據(jù)等部分服務(wù)恢復(fù),但預(yù)計“2月28日晚上可以恢復(fù)七成左右數(shù)據(jù)”。
此時,距離微盟內(nèi)部人員賀某刪庫事發(fā)已經(jīng)是第五天,“28日24時恢復(fù)老用戶數(shù)據(jù)”的承諾,無法如期完成。
過去五天,業(yè)界關(guān)于微盟的討論主要聚焦在三點:
1.核心運維人員為什么要刪庫?
2.微盟技術(shù)架構(gòu)及管理上有哪些疏漏,何以讓一個運維人員把系統(tǒng)整癱,行業(yè)應(yīng)該吸取哪些教訓(xùn)?
3.經(jīng)歷6天144小時的服務(wù)暫停,給微盟影響多大、對商戶影響多大?
要回答以上三個問題,我們首先要復(fù)習(xí)一下微盟是一家什么樣的公司?
微盟,成立于2013年的SaaS服務(wù)商,2019年1月在香港主板上市,目前市值122.44億港幣,較25日的138.33億港幣縮水約16億,折合人民幣約14億元。2019年上半年,該企業(yè)總營收6.57億元人民幣。
其主要業(yè)務(wù)是在微信等平臺上為電商、零售、餐飲、本地生活、酒旅等企業(yè)搭建小程序,并為其提供精準營銷服務(wù),根據(jù)微盟提供的數(shù)據(jù),目前微盟已經(jīng)為超過300萬商戶提供這類服務(wù)。
這也意味著,在2月23日,微盟核心數(shù)據(jù)遭內(nèi)部員工刪除(以下簡稱“微盟事件”),其SaaS產(chǎn)品不可用之后,有7萬注冊商戶的線上商城、小程序門店等無法訪問。(查看鈦媒體此前文章《SaaS服務(wù)商微盟遭員工“刪庫跑路”,300萬商戶哭了......》)
“之前計劃通過公眾號在小程序商城上推接下來的一波活動,現(xiàn)在都被耽誤了。我們應(yīng)該會轉(zhuǎn)向其他平臺做這個活動了,比如天貓、京東、有贊等?!币晃皇褂梦⒚朔?wù)的糖巧商戶對鈦媒體表示。
受事件影響,微盟股價下跌,截止發(fā)稿,微盟市值較25日已經(jīng)縮水約27億港幣(約合人民幣24億元)。
截止28日4點微盟股價。較25日市值138.33億港幣,目前市值縮水約31億港幣(約合人民幣27億元)
微盟事件不是必然事件,卻是移動互聯(lián)網(wǎng)時代的產(chǎn)物。
在很多人認為SaaS市場會因為疫情而火爆的時候,微盟刪庫事件也讓大家更加認識到云上數(shù)據(jù)安全的問題更需要引起足夠的重視,因為只要上了云,數(shù)據(jù)一旦出問題,就相當(dāng)于銀行倒閉,就是傾家蕩產(chǎn)的風(fēng)險。
一次本可以避免的安全事故
輿論對犯罪嫌疑人賀某“刪除數(shù)據(jù)庫”的原因猜測不斷,直到有人將此事與甚至“微盟某高管傳言”聯(lián)系到一起,甚至引發(fā)了 SaaS 圈外人集體“吃瓜”——當(dāng)幾百萬商戶都在關(guān)心“我的網(wǎng)店還能不能恢復(fù)”時,讓原本一樁技術(shù)事故,最終朝向娛樂化發(fā)展。
27日下午,微盟創(chuàng)始人兼CEO孫濤勇發(fā)布長文回應(yīng),就內(nèi)部員工“刪庫”的原因向外界公開了一個模糊的官方定論。
關(guān)于刪庫原因,孫濤勇表示,“該員工春節(jié)期間一直沒有回家,由于疫情階段不能外出,只能一個人在房間獨處了30多天,加上本身經(jīng)濟上的困擾,就做出了這種舉動,事后他也說跟公司無任何仇恨,我想他是在選擇一種自己解脫的方式吧,這也是為什么事后沒跑路,也很快承認了犯罪事實?!?/p>
圖片來源@微盟CEO孫濤勇回應(yīng)
截止目前,這是微盟關(guān)于本次事故的全部回應(yīng);而上海公安官方尚未對該案件做出任何公開。
某互聯(lián)網(wǎng)創(chuàng)業(yè)公司 CTO 向鈦媒體記者評價微盟事件時稱,“看到事故出來,心里一緊?!?但該人士對鈦媒體表示,把一項嚴重的技術(shù)事故歸因于一個員工身上,“這不符合技術(shù)常識?!?/p>
一位從業(yè)超20年的IT咨詢公司高管也告訴鈦媒體,“徹底刪除”這件事,在計算機時代根本不存在,只存在“數(shù)據(jù)恢復(fù)起來的復(fù)雜程度不同”。
那么,到底誰要為數(shù)據(jù)安全事故背鍋?當(dāng)下,電商企業(yè)普遍上云需求迫切,我們到底該如何認識所謂的“刪庫”事件?
“穩(wěn)定”,是云服務(wù)廠商最重要的生命線
刪庫代碼其實只有短短的一行:“rm -rf/*”,但使用不當(dāng),造成的結(jié)果卻會天翻地覆。
例如2017年1月31日,全球第二大的開源代碼托管平臺GitLab內(nèi)部的一位系統(tǒng)管理員,在給數(shù)據(jù)庫做日常維護時,一時不慎運行了數(shù)據(jù)庫目錄刪除命令……結(jié)果是雖然幾經(jīng)搶救修復(fù),論壇上原本高達300GB的數(shù)據(jù)只保留下來 4.5G,直接導(dǎo)致當(dāng)時的GitLab被迫下線。
因此,SaaS平臺公司對于刪庫這種行為,是從技術(shù)和管理上都做了很多限制的。基于賀某能夠刪庫成功,且微盟需要“至少六天”來恢復(fù)數(shù)據(jù)這一結(jié)果,也引發(fā)了業(yè)內(nèi)討論。
明道云CEO任向暉通過個人公眾號發(fā)文稱,“大多數(shù)成熟 SaaS 企業(yè)都會建立科學(xué)的部署架構(gòu),內(nèi)部分工和運維規(guī)范。如果沒有這些規(guī)范存在,組織無法獲得任何第三方的質(zhì)量認證?!?/p>
任向暉在文章中,用“易懂的文字”來說明了真正的“規(guī)范”應(yīng)該做到三個方面:
1)高可用的架構(gòu)。
通過幾乎實時同步的主從服務(wù)關(guān)系(應(yīng)用和數(shù)據(jù)都可以實現(xiàn)),讓單一服務(wù)出現(xiàn)問題的時候可以瞬間切換到其他鏡像服務(wù)。這個架構(gòu)也可以用來均衡不同訪問路由的負載。
2)在異地增加冷備份。
這個冷備份雖然有一定的延時,但是可以起到關(guān)鍵的數(shù)據(jù)保全作用。為了足夠的安全,冷備份應(yīng)該不止一份。為防范服務(wù)商系統(tǒng)性故障,冷備份最好分布在不同的云主機服務(wù)商。明道云的數(shù)據(jù)備份分布在UCloud、阿里云和騰訊云三個服務(wù)商。雖然冷備份非常偶然地被使用,但SaaS公司都在支付這些冗余存儲的成本。
3)最關(guān)鍵的管理分權(quán)。
原則上,生產(chǎn)服務(wù)器的運維管理權(quán)只限于極少數(shù)人即可,因為研發(fā)團隊并不需要訪問真實的生產(chǎn)環(huán)境,他們在模擬的研發(fā)環(huán)境中調(diào)試即可。計算機安全體系允許將主機運維、數(shù)據(jù)庫管理和其他系統(tǒng)管理的權(quán)限全部分開,分別授予不同的人員,并且所有的訪問行為均會保存日志,就連日志數(shù)據(jù)也是可以分權(quán)管理的,這使得單個人破壞全部服務(wù)的可能性為0。微盟事件的主要原因肯定是疏忽在這個環(huán)節(jié)。
在通俗一些說,上述問題1與2屬于技術(shù)范疇,而問題3則屬于公司內(nèi)部管理問題。任何一環(huán)出現(xiàn)問題,都會增加SaaS平臺的數(shù)據(jù)風(fēng)險和安全風(fēng)險,而安全事件的根源,往往在于管理。
另一篇評論文章基于微盟事件聲稱,“99%的SaaS都有安全隱患”。但顯然,業(yè)內(nèi)人士大多并不認同這樣的說法。
對此說法,任向暉認為,“這是偷換了一般安全隱患和安全災(zāi)難的區(qū)別。計算機網(wǎng)絡(luò)和軟件的漏洞的確是常見的,但它們的破壞力非常有限,即使是嚴重的D0級(需要當(dāng)天立刻修復(fù))缺陷,也不至于造成完全的數(shù)據(jù)滅失后果。”
同樣向電商行業(yè)提供SaaS服務(wù)的有贊平臺,也在微盟事件后第一時間,收到了來自多家客戶、投資人方面的疑慮和咨詢。
CTO 崔玉松在接受鈦媒體(微信ID:taimeiti)采訪時說,“為了逼自己重視,2013年我們給自己列了第一信條‘系統(tǒng)穩(wěn)定高于一切’,2017年1我們推出‘有贊護航’計劃,如果出現(xiàn)微商城核心服務(wù)不可用,影響了客戶的生意,就按照不可用時間給予對應(yīng)102.4倍的補償。這是整個信息服務(wù)行業(yè)里沒有的最高規(guī)格的‘承諾’。我們有嚴格的訪問控制,做了角色分離、權(quán)限隔離,杜絕少數(shù)人就能進行高危操作,制定了嚴重宕機的處理預(yù)案?!?/p>
崔玉松也告訴鈦媒體(微信ID:taimeiti),有贊的CTO和CEO都沒有可能用一臺電腦、一套賬號密碼完成徹底刪庫動作。
在IaaS云的層面,有贊的主要的服務(wù)商有騰訊云、Ucloud兩個,而且在兩家平臺上相互備份。
“(我們的數(shù)據(jù))在每個服務(wù)商的不同的機房里有備份。退1萬步講,即使一個云服務(wù)商出現(xiàn)問題,我們在技術(shù)上都可以自動切換到另一個云服務(wù)上,并且從技術(shù)的角度、從數(shù)據(jù)的角度,我們可以在5分鐘之內(nèi)基本上恢復(fù)95%的流量?!?/p>
崔玉松對有贊平臺抗風(fēng)險能力的預(yù)估是,“遇到非常極限的災(zāi)難的時候,我們可能最長的時間——按我們現(xiàn)在預(yù)估——大概30分鐘可以完全恢復(fù)?!?/p>
管理問題是根源
對微盟事件的歸因,業(yè)界主流聲音是:沒有施行管理分權(quán)。
鈦媒體(微信ID:taimeiti)查閱公開資料發(fā)現(xiàn),微盟的確存在這種權(quán)限管理過松的可能。微盟 CTO 黃駿偉曾在一次公開分享中提到,微盟正處于高速成長期,微盟的技術(shù)團隊從最初的三四十人已經(jīng)擴充到了六七百人。
為了應(yīng)對研發(fā)管理的繁雜,讓技術(shù)研發(fā)跟上公司快速擴張的腳步,微盟施行了項目負責(zé)人制度。在這一制度下,每個項目匯總到一個負責(zé)人,并使得該負責(zé)人能夠調(diào)動盡量多的資源來協(xié)同他做事?!懊總€團隊事事都還要匯報到CTO這里,那無疑是非常低效的?!秉S駿偉說。
而身為核心人員的賀某,或許恰是某個項目具有高權(quán)限的負責(zé)人。
“刪庫”事件影響下,百萬級的平臺商戶均陷入了網(wǎng)店關(guān)閉、無法登陸和交易癱瘓的窘境,對于微盟提出的“6天才能恢復(fù)數(shù)據(jù)庫”,6天(甚至還不確定的周期),對于任何一家平臺商戶而言,損失慘重。
針對“至少6天”來完成數(shù)據(jù)恢復(fù)的公告,一種說法是,微盟沒有做數(shù)據(jù)雙活方案/異地備份,才導(dǎo)致刪除一個主庫之后,多天無法恢復(fù);也有人認為,微盟使用了便宜好用的MySQL,沒有用商業(yè)級別的Oracle或DB2。
更確切的消息,據(jù)《中國經(jīng)營報》報道,微盟的底層架構(gòu)采用的是混合云模式,部分自建部分上云,而微盟被刪的數(shù)據(jù)恰好是沒有上云的自建部分,這種做法會導(dǎo)致沒有上云部分的數(shù)據(jù)在被刪除之后無法及時恢復(fù)。
“如果在云上,云數(shù)據(jù)庫的備份功能能夠保證哪怕是刪了數(shù)據(jù),也能回滾到之前的某個時刻,把損失降到最低?!币晃辉朴嬎銟I(yè)內(nèi)人士表示。
截圖來源@知乎
針對這一問題,@騰訊云 在官方賬號中也對云數(shù)據(jù)庫這一問題進行了回復(fù)。騰訊云稱,”在微盟事件中,微盟使用的云數(shù)據(jù)庫在這次事故中沒有受到影響”。這一聲明或側(cè)面證實,事故中實際上出問題的是微盟本地化部署的數(shù)據(jù)。
當(dāng)下,混合云模式是云計算界較為青睞的資源部署模式。但鈦媒體(微信ID:taimeiti)呼吁,采用本地化部署以及混合部署的企業(yè),一定要做好本地部署數(shù)據(jù)的備份和防護,降低類似事故風(fēng)險。
有贊CTO崔玉松針對中小商家的經(jīng)營數(shù)據(jù)安全,提出了如下建議
1)要注意店鋪管理員的角色分離、權(quán)限隔離,定期查看后臺的操作日志;
2)需要高級管理員的驗證碼來做二次驗證的,一定要搞清楚員工在做什么重要操作;
3)通過API授權(quán)的方式,從有贊云調(diào)取店鋪數(shù)據(jù)到其他第三方應(yīng)用,應(yīng)注意調(diào)取的接口類型。和安卓手機權(quán)限一樣,多余的權(quán)限不要授予。
4)嚴格控制有表格數(shù)據(jù)導(dǎo)出權(quán)限的高級管理員的數(shù)量,密切監(jiān)控數(shù)據(jù)導(dǎo)出的用途。
5)離職員工要第一時間刪除管理員權(quán)限。
時間不等人
微盟研究院在2019年5月發(fā)布的《2018微信小程序行業(yè)應(yīng)用發(fā)展研究報告》顯示,超過一半的企業(yè)商戶對小程序保持高度關(guān)注,在已應(yīng)用微信公眾號(訂閱號/服務(wù)號)的商戶中,57.18%同時開通了小程序;另外,95%以上的商戶有意愿將企業(yè)未來的營銷推廣預(yù)算向小程序傾斜。
因此,受數(shù)據(jù)庫事件影響最大的是單一架構(gòu)在小程序上的商戶。
市場的火爆,事件對整個行業(yè)的震動,已經(jīng)無法讓大家冷靜面對商場沉浮。
微盟發(fā)布事故公告當(dāng)天,同屬SaaS平臺服務(wù)領(lǐng)域的有贊發(fā)布了“給微盟商家的江湖救急”計劃。公告中表示,有贊將為微盟商家提供2周免費開線上商城的服務(wù),幫助他們重建小程序和店鋪;但如果商家在次過程中想要長期使用有贊服務(wù),卻有顧慮到微盟軟件服務(wù)未到期,有贊可以適當(dāng)補貼對應(yīng)服務(wù)器來減少損失。
一位希望匿名的商戶告訴鈦媒體(微信ID:taimeiti),當(dāng)他對外發(fā)布了“商城不可訪問”的信息之后,立即收到多家 SaaS 平臺的溝通意愿,但具體信息不便透露。
這充分反映出,在小程序搭建、店鋪私域流量的運營這片處于行業(yè)上升期的市場,競爭慘烈。
中國小程序服務(wù)商不完全統(tǒng)計(由鈦媒體TMTBase制整理)
據(jù)媒體不完全統(tǒng)計,類似小程序服務(wù)商這樣的企業(yè)除了有贊、微盟兩家發(fā)展比較快之外,還有點點客,商派云、即速應(yīng)用、序多多等多家服務(wù)商也參與其中。
有媒體評論稱,假如微盟商戶在此次故障中試用了另外一家的服務(wù),那么對微盟最大的影響將是面臨客戶流失。
在疫情之外,又突發(fā)數(shù)據(jù)庫安全問題,SaaS行業(yè)在不到一個月時間內(nèi)黑天鵝事件頻發(fā)。受影響的幾萬家商戶們被迫面臨選擇:遷移還是等待?
事故已經(jīng)發(fā)生,而根據(jù)部分受影響商戶在社交媒體上的抱怨,事故后平臺方面的信息不公開、不對稱正在讓商戶與平臺之間產(chǎn)生“信任危機”。一部分商家已經(jīng)在考慮遷移問題。
而關(guān)于微盟在兩次公告中提及的“賠償問題”,一位跨境電商公司創(chuàng)業(yè)者、某平臺SaaS小程序商戶對鈦媒體表示,“賠償問題不是最重要的,商戶最在意的是‘信任問題’?!卑ㄔ摽缇畴娚躺虘粼趦?nèi)的一部分商家,已經(jīng)在著手準備向有贊等平臺遷移。
該商戶還認為,“安全問題是相對的,畢竟我們使用的是工具。除了風(fēng)險如何防范,我們更關(guān)心的是出現(xiàn)問題后平臺怎么能補救,有沒有能力預(yù)知可能的風(fēng)險?!痹撋虘敉嘎叮瑑赡昵霸谏暇€小程序的同時,自行購買了服務(wù)器對系統(tǒng)數(shù)據(jù)進行了備份。
“大商家”收到來自微盟恢復(fù)期到3月中旬的通知
一位做水產(chǎn)生意的微盟商戶向鈦媒體透露:“大商家都收到‘恢復(fù)期到3月中旬’的通知了,只有我們在傻等著,只看到官網(wǎng)公告,并沒有收到任何通知。”
在中小企業(yè)“上云”的主流趨勢之下,微盟事件的影響,已經(jīng)遠超我們的估計。
黑天鵝事件考驗了整個SaaS行業(yè)的抗風(fēng)險能力,而這些能力往往并不體現(xiàn)在股價上、銷售方案中,真正決定平臺競爭力的,是這些潛于水下但事關(guān)生死的能力——技術(shù)架構(gòu)是否完善、數(shù)據(jù)安全能否保障、企業(yè)管理是否良性,都是不能兒戲的平臺責(zé)任?!矩?zé)任編輯/孟亮】
來源:鈦媒體
IT時代網(wǎng)(關(guān)注微信公眾號ITtime2000,定時推送,互動有福利驚喜)所有原創(chuàng)文章版權(quán)所有,未經(jīng)授權(quán),轉(zhuǎn)載必究。
創(chuàng)客100創(chuàng)投基金成立于2015年,直通硅谷,專注于TMT領(lǐng)域早期項目投資。LP均來自政府、互聯(lián)網(wǎng)IT、傳媒知名企業(yè)和個人。創(chuàng)客100創(chuàng)投基金對IT、通信、互聯(lián)網(wǎng)、IP等有著自己獨特眼光和豐富的資源。決策快、投資快是創(chuàng)客100基金最顯著的特點。
小何
小何
小何
來自: 【人物】滴滴創(chuàng)始人程維回顧與Uber競爭:中國互聯(lián)網(wǎng)從來沒有輸過--IT時代網(wǎng)
小何
來自: 少年頭條對壘中年騰訊:解局兩代互聯(lián)網(wǎng)公司商業(yè)之戰(zhàn)--IT時代網(wǎng)