發(fā)布時間:2020-06-11
什么是全鏈路壓測:基于實際的生產(chǎn)業(yè)務(wù)場景、系統(tǒng)環(huán)境,模擬海量的用戶請求和數(shù)據(jù)對整個業(yè)務(wù)鏈進行壓力測試,并持續(xù)調(diào)優(yōu)的過程。
全鏈路壓測解決什么問題:針對業(yè)務(wù)場景越發(fā)復(fù)雜化、海量數(shù)據(jù)沖擊下整個業(yè)務(wù)系統(tǒng)鏈的可用性、服務(wù)能力的瓶頸,讓技術(shù)更好的服務(wù)業(yè)務(wù),創(chuàng)造更多的價值?!?/span>
面對的問題點以及解決方案
1、業(yè)務(wù)模型梳理
首先應(yīng)該明確的是:全鏈路壓測針對的是現(xiàn)代越來越復(fù)雜的業(yè)務(wù)場景和全鏈路的系統(tǒng)依賴。所以首先應(yīng)該將核心業(yè)務(wù)和非核心業(yè)務(wù)進行拆分,確認(rèn)流量高峰針對的是哪些業(yè)務(wù)場景和模塊,
針對性的進行擴容準(zhǔn)備,而不是為了解決海量流量沖擊而所有的系統(tǒng)服務(wù)集群擴容幾十倍,這樣會造成不必要的成本投入。
2、數(shù)據(jù)模型構(gòu)建
數(shù)據(jù)構(gòu)建和準(zhǔn)備,應(yīng)該考慮這幾點問題:
①、數(shù)據(jù)的真實性和可用性
可以從生產(chǎn)環(huán)境完全移植一份當(dāng)量的數(shù)據(jù)包,作為壓測的基礎(chǔ)數(shù)據(jù),然后基于基礎(chǔ)數(shù)據(jù),通過分析歷史數(shù)據(jù)增長趨勢,預(yù)估當(dāng)前可能的數(shù)據(jù)量;
②、數(shù)據(jù)脫敏
基于生產(chǎn)環(huán)境的全鏈路壓測,必須考慮的一點是不能產(chǎn)生臟數(shù)據(jù),以免對生產(chǎn)造成影響,影響用戶體驗等,因此在數(shù)據(jù)準(zhǔn)備時需要進行數(shù)據(jù)脫敏;
③、數(shù)據(jù)隔離
同樣,為了避免造成臟數(shù)據(jù)寫入,可以考慮通過壓測數(shù)據(jù)隔離處理,落入影子庫,mock對象等手段,來防止數(shù)據(jù)污染;
3、壓測工具選型
全鏈路壓測應(yīng)對的都是海量的用戶請求沖擊,可以使用分布式壓測的手段來進行用戶請求模擬,目前有很多的開源工具可以提供分布式壓測的方式,比如jmeter、Ngrinder、locust等。
也可以考慮澤眾出品的性能測試工具:PerformanceRunner。
考慮到壓測量較大的情況下回傳測試結(jié)果會對agent本身造成一定資源占用,可以考慮異步上傳,甚至事務(wù)補償機制?!?nbsp;
4、壓測環(huán)境搭建
全鏈路壓測都是基于生產(chǎn)環(huán)境,解決了業(yè)務(wù)模型和數(shù)據(jù)以及壓測工具選型開發(fā),就要考慮系統(tǒng)擴容和風(fēng)險規(guī)避了,比如壓測不能影響實際的生產(chǎn)業(yè)務(wù)運行,還有資源申請等。
重新搭建一套完全匹配生產(chǎn)環(huán)境的壓測環(huán)境,成本太高,且需求頻次較低,投入成本太大?!?nbsp;
5、系統(tǒng)容量規(guī)劃
前面提到了業(yè)務(wù)拆分和流量預(yù)估,在系統(tǒng)容量規(guī)劃階段,首先應(yīng)該對單個接口單個服務(wù)進行基準(zhǔn)測試,調(diào)整配置參數(shù),得到一個基準(zhǔn)線,然后進行分布式集群部署,通過nginx負(fù)載均衡。
至于擴容,要考慮到服務(wù)擴容和DB資源擴容,以及服務(wù)擴容帶來的遞減效應(yīng)。
至于大流量沖擊情況下,可以考慮隊列等待、容器鎖、長連接回調(diào)、事務(wù)降級等方式來解決。
6、測試集群部署
能做全鏈路壓測的業(yè)務(wù)系統(tǒng),基本都是分布式系統(tǒng)架構(gòu),服務(wù)集群部署和負(fù)載均衡,就是需要實現(xiàn)和考慮的技術(shù)點。
需要解決的問題有:
①、服務(wù)間通信問題
一般通信方式有兩種:同步和異步。
同步調(diào)用一致性強,但是要考慮性能和調(diào)用失敗的事務(wù)處理。
異步調(diào)用的話,可以降低服務(wù)間的耦合,提升性能體驗,但是一致性是需要解決的(分布式架構(gòu)有個CAP理論,感興趣的可以查詢相關(guān)資料看看)。
②、負(fù)載均衡問題
需要將大流量沖擊均勻的分發(fā)給集群上的每臺機器,目前比較優(yōu)秀的負(fù)載均衡服務(wù)器是nginx,但nginx的部署貌似也存在一些問題,我們公司之前就遇到過訂單重復(fù)問題。
③、容災(zāi)問題
需要確保的一點是:當(dāng)服務(wù)中的某臺或者某部分服務(wù)宕機,可以及時的進行服務(wù)轉(zhuǎn)發(fā),而不至于連鎖反應(yīng)下整個系統(tǒng)鏈路的服務(wù)掛掉?!?nbsp;
7、數(shù)據(jù)收集監(jiān)控
壓測數(shù)據(jù)收集,需要由agent機回送給Contorller機器,但數(shù)據(jù)量過大會占用一定的資源,可以考慮異步實現(xiàn)測試結(jié)果回送。
更多性能測試文章推薦:
電話咨詢,400-035-7887,安排專業(yè)技術(shù)售前給您解答(產(chǎn)品試用、技術(shù)交流、服務(wù)咨詢和商務(wù)報價)。
您的信息已成功提交!
我們的客服人員稍后會與您聯(lián)系