一、設(shè)計(jì)理念
注:這里只講概念,盡量不講技術(shù)!但是會(huì)推薦一些。本博客雖然是基于java語言,但是適用于任何其他大型架構(gòu)系統(tǒng)。
1、空間換時(shí)間
1)多級(jí)緩存、靜態(tài)化
關(guān)于緩存方面,可以做:客戶端頁面緩存、反向代理緩存、應(yīng)用端的緩存、內(nèi)存數(shù)據(jù)庫以及做**靜態(tài)化
對(duì)于頁面緩存,比如京東較狠,圖片*存儲(chǔ)在客戶端,改圖片、css、js等的話,必須要改名字,要不然會(huì)hit到舊文件。
對(duì)于**靜態(tài)化,web的話可以做靜態(tài)頁面,對(duì)于app、cs架構(gòu)等同樣適用
2) 索引
一般對(duì)于關(guān)系型數(shù)據(jù)庫查詢,需要用到索引。
2、并行與分布式計(jì)算
1)任務(wù)切分、分而治之(MR)
在大規(guī)模的數(shù)據(jù)中,數(shù)據(jù)存在一定的局部性的特征,利用局部性的原理將海量數(shù)據(jù)計(jì)算的問題分而治之。
MR模型是無共享的架構(gòu),數(shù)據(jù)集分布至各個(gè)節(jié)點(diǎn)。處理時(shí),每個(gè)節(jié)點(diǎn)就近讀取本地存儲(chǔ)的數(shù)據(jù)處理(map),將處理后的數(shù)據(jù)進(jìn)行合并(combine)、排序(shuffle and sort)后再分發(fā)(至reduce節(jié)點(diǎn)),避免了大量數(shù)據(jù)的傳輸,提高了處理效率。
2)多進(jìn)程、多線程并行執(zhí)行(MPP)
并行計(jì)算(Parallel
Computing)是指同時(shí)使用多種計(jì)算資源解決計(jì)算問題的過程,是提高計(jì)算機(jī)系統(tǒng)計(jì)算速度和處理能力的一種有效手段。它的基本思想是用多個(gè)處理器/進(jìn)程/線程來協(xié)同求解同一問題,即將被求解的問題分解成若干個(gè)部分,各部分均由一個(gè)獨(dú)立的處理機(jī)來并行計(jì)算。
和MR的區(qū)別在于,它是基于問題分解的,而不是基于數(shù)據(jù)分解。
3、多維度的高可用
1)負(fù)載均衡、容災(zāi)、備份
隨著平臺(tái)并發(fā)量的增大,需要擴(kuò)容節(jié)點(diǎn)進(jìn)行集群,利用負(fù)載均衡設(shè)備進(jìn)行請(qǐng)求的分發(fā);負(fù)載均衡設(shè)備通常在提供負(fù)載均衡的同時(shí),也提供失效檢測功能;同時(shí)為了提高可用性,需要有容災(zāi)備份,以防止節(jié)點(diǎn)宕機(jī)失效帶來的不可用問題;備份有在線的和離線備份,可以根據(jù)失效性要求的不同,進(jìn)行選擇不同的備份策略。
2)讀寫分離、分庫分表
讀寫分離是對(duì)數(shù)據(jù)庫來講的,隨著系統(tǒng)并發(fā)量的增大,提高數(shù)據(jù)訪問可用性的一個(gè)重要手段就是寫數(shù)據(jù)和讀數(shù)據(jù)進(jìn)行分離;當(dāng)然在讀寫分離的同時(shí),需要關(guān)注數(shù)據(jù)的一致性問題;對(duì)于一致性的問題,在分布式的系統(tǒng)CAP定量中,更多的關(guān)注于可用性。
根據(jù)本博主經(jīng)驗(yàn),對(duì)于單表數(shù)據(jù)量**過300萬,就可以做分庫分表,不推薦使用第三方,推薦大家自己寫一套,其實(shí)就是改造下ORM端,自己改造有幾個(gè)優(yōu)勢(shì),1、學(xué)習(xí)成本低,2、后期維護(hù)不依賴于第三方,3、橫向擴(kuò)展容易。博主的公司分庫分表是自己寫的,是**過300萬就會(huì)自動(dòng)建庫、切分。
首先需要做垂直切分,也就是字段非常多,改成字段在20個(gè)以內(nèi)的表。當(dāng)然這個(gè)并不是必須,為的是分庫分表操作起來較簡單,很多人對(duì)這個(gè)有誤解,垂直并不是必須要做的。我們公司還有表是100來個(gè)字段,數(shù)據(jù)量在5千萬以上,并沒有拆分。
3)依賴關(guān)系
平臺(tái)中各個(gè)模塊之間的關(guān)系盡量是低耦合的,可以通過相關(guān)的消息組件進(jìn)行交互,能異步則異步,分清楚數(shù)據(jù)流轉(zhuǎn)的主流程和副流程,主副是異步的,比如記錄日志、郵件、短信、公告等可以是異步操作的,增加整個(gè)系統(tǒng)的可用性。
當(dāng)然在異步處理中,為了確保數(shù)據(jù)得到接收或者處理,往往需要確認(rèn)機(jī)制(confirm、ack)。
但是有些場景中,雖然請(qǐng)求已經(jīng)得到處理,但是因其他原因(比如網(wǎng)絡(luò)不穩(wěn)定),確認(rèn)消息沒有返回,那么這種情況下需要進(jìn)行請(qǐng)求的重發(fā),對(duì)請(qǐng)求的處理設(shè)計(jì)因重發(fā)因素需要考慮冪等性。
4) 監(jiān)控
監(jiān)控也是提高整個(gè)平臺(tái)可用性的一個(gè)重要手段,多平臺(tái)進(jìn)行多個(gè)維度的監(jiān)控;模塊在運(yùn)行時(shí)候是透明的,以達(dá)到運(yùn)行期白盒化。
4、伸縮
1) 拆分
拆分包括對(duì)業(yè)務(wù)的拆分和對(duì)數(shù)據(jù)庫的拆分。
系統(tǒng)的資源總是有限的,一段比較長的業(yè)務(wù)執(zhí)行如果是一竿子執(zhí)行的方式,在大量并發(fā)的操作下,這種阻塞的方式,無法有效的及時(shí)釋放資源給其他進(jìn)程執(zhí)行,這樣系統(tǒng)的吞吐量不高。
需要把業(yè)務(wù)進(jìn)行邏輯的分段,采用異步非阻塞的方式,提高系統(tǒng)的吞吐量。
隨著數(shù)據(jù)量和并發(fā)量的增加,讀寫分離不能滿足系統(tǒng)并發(fā)性能的要求,需要對(duì)數(shù)據(jù)進(jìn)行切分,包括對(duì)數(shù)據(jù)進(jìn)行分庫和分表。這種分庫分表的方式,需要增加對(duì)數(shù)據(jù)的路由邏輯支持。
2)無狀態(tài)
對(duì)于系統(tǒng)的伸縮性而言,模塊較好是無狀態(tài)的,通過增加節(jié)點(diǎn)就可以提高整個(gè)的吞吐量。
注:無狀態(tài)其實(shí)就是一些邏輯上不需要用戶登錄狀態(tài)的。。。比如查看web系統(tǒng)首頁、新聞頁面、以及模塊的局部,比如訪問京東的詳情頁,Top部分需要用戶登錄狀態(tài)、價(jià)格優(yōu)惠部分需要用戶信息才能做出優(yōu)惠,這幾個(gè)模塊就是有狀態(tài)。
有狀態(tài)也可以做橫向擴(kuò)展。。。。
5、優(yōu)化資源利用
1)系統(tǒng)容量有限
系統(tǒng)的容量是有限的,承受的并發(fā)量也是有限的,在架構(gòu)設(shè)計(jì)時(shí),一定需要考慮流量的控制,防止因意外攻擊或者瞬時(shí)并發(fā)量的沖擊導(dǎo)致系統(tǒng)崩潰。在設(shè)計(jì)時(shí)增加流控的措施,可考慮對(duì)請(qǐng)求進(jìn)行排隊(duì),**出預(yù)期的范圍,可以進(jìn)行告警或者丟棄。
2)原子操作與并發(fā)控制
對(duì)于共享資源的訪問,為了防止沖突,需要進(jìn)行并發(fā)的控制,同時(shí)有些交易需要有事務(wù)性來保證交易的一致性,所以在交易系統(tǒng)的設(shè)計(jì)時(shí),需考慮原子操作和并發(fā)控制。
保證并發(fā)控制一些常用高性能手段有,樂觀鎖、Latch、mutex、寫時(shí)復(fù)制、CAS等;多版本的并發(fā)控制MVCC通常是保證一致性的重要手段,這個(gè)在數(shù)據(jù)庫的設(shè)計(jì)中經(jīng)常會(huì)用到。
3)基于邏輯的不同,采取不一樣的策略
平臺(tái)中業(yè)務(wù)邏輯存在不同的類型,有計(jì)算復(fù)雜型的,有消耗IO型的,同時(shí)就同一種類型而言,不同的業(yè)務(wù)邏輯消耗的資源數(shù)量也是不一樣的,這就需要針對(duì)不同的邏輯采取不同的策略。
針對(duì)IO型的,可以采取基于事件驅(qū)動(dòng)的異步非阻塞的方式,單線程方式可以減少線程的切換引起的開銷,或者在多線程的情況下采取自旋spin的方式,減少對(duì)線程的切換(比如oracle latch設(shè)計(jì));對(duì)于計(jì)算型的,充分利用多線程進(jìn)行操作。
同一類型的調(diào)用方式,不同的業(yè)務(wù)進(jìn)行合適的資源分配,設(shè)置不同的計(jì)算節(jié)點(diǎn)數(shù)量或者線程數(shù)量,對(duì)業(yè)務(wù)進(jìn)行分流,**執(zhí)行**級(jí)別高的業(yè)務(wù)。
4)容錯(cuò)隔離
系統(tǒng)的有些業(yè)務(wù)模塊在出現(xiàn)錯(cuò)誤時(shí),為了減少并發(fā)下對(duì)正常請(qǐng)求的處理的影響,有時(shí)候需要考慮對(duì)這些異常狀態(tài)的請(qǐng)求進(jìn)行單獨(dú)渠道的處理,甚至?xí)簳r(shí)自動(dòng)禁止這些異常的業(yè)務(wù)模塊。
有些請(qǐng)求的失敗可能是偶然的暫時(shí)的失敗(比如網(wǎng)絡(luò)不穩(wěn)定),需要進(jìn)行請(qǐng)求重試或者請(qǐng)求轉(zhuǎn)移到其他機(jī)器的考慮。
5)資源釋放
系統(tǒng)的資源是有限的,在使用資源時(shí),一定要在最后釋放資源,無論是請(qǐng)求走的是正常路徑還是異常的路徑,以便于資源的及時(shí)回收,供其他請(qǐng)求使用。
在設(shè)計(jì)通信的架構(gòu)時(shí),往往需要考慮**時(shí)的控制。
二、 靜態(tài)架構(gòu)藍(lán)圖
整個(gè)架構(gòu)是分層的分布式的架構(gòu),縱向包括CDN,負(fù)載均衡/反向代理,web應(yīng)用,業(yè)務(wù)層,基礎(chǔ)服務(wù)層,數(shù)據(jù)存儲(chǔ)層。水平方向包括對(duì)整個(gè)平臺(tái)的配置管理部署和監(jiān)控。
三、 剖析架構(gòu)
1、CDN
CDN系統(tǒng)能夠?qū)崟r(shí)地根據(jù)網(wǎng)絡(luò)流量和各節(jié)點(diǎn)的連接、負(fù)載狀況以及到用戶的距離和響應(yīng)時(shí)間等綜合信息將用戶的請(qǐng)求重新導(dǎo)向離用戶較近的服務(wù)節(jié)點(diǎn)上。其目的是使用戶可就近**所需內(nèi)容,解決 Internet網(wǎng)絡(luò)擁擠的狀況,提高用戶訪問網(wǎng)站的響應(yīng)速度。
對(duì)于大規(guī)模電子商務(wù)平臺(tái)一般需要建CDN做網(wǎng)絡(luò)加速,大型平臺(tái)如淘寶、京東都采用自建CDN,中小型的企業(yè)可以采用第三方CDN廠商合作,如藍(lán)汛、網(wǎng)宿、快網(wǎng)等。
當(dāng)然在選擇CDN廠商時(shí),需要考慮經(jīng)營時(shí)間長短,是否有可擴(kuò)充的帶寬資源、靈活的流量和帶寬選擇、穩(wěn)定的節(jié)點(diǎn)、性價(jià)比。
2、負(fù)載均衡、反向代理
一個(gè)大型的平臺(tái)包括很多個(gè)業(yè)務(wù)域,不同的業(yè)務(wù)域有不同的集群,可以用DNS做域名解析的分發(fā)或輪詢,DNS方式實(shí)現(xiàn)簡單,但是因存在cache而缺乏靈活性;一般基于商用的硬件F5、NetScaler或者開源的軟負(fù)載lvs在4層做分發(fā),當(dāng)然會(huì)采用做冗余(比如lvs+keepalived)的考慮,采取主備方式。
4層分發(fā)到業(yè)務(wù)集群上后,會(huì)經(jīng)過web服務(wù)器如nginx或者HAProxy在7層做負(fù)載均衡或者反向代理分發(fā)到集群中的應(yīng)用節(jié)點(diǎn)。
選擇哪種負(fù)載,需要綜合考慮各種因素(是否滿足高并發(fā)高性能,Session保持如何解決,負(fù)載均衡的算法如何,支持壓縮,緩存的內(nèi)存消耗);下面基于幾種常用的負(fù)載均衡軟件做個(gè)介紹。
LVS,工作在4層,Linux實(shí)現(xiàn)的高性能高并發(fā)、可伸縮性、可靠的的負(fù)載均衡器,支持多種轉(zhuǎn)發(fā)方式(NAT、DR、IP Tunneling),其中DR模式支持通過廣域網(wǎng)進(jìn)行負(fù)載均衡。支持雙機(jī)熱備(Keepalived或者Heartbeat)。對(duì)網(wǎng)絡(luò)環(huán)境的依賴性比較高。
Nginx工作在7層,事件驅(qū)動(dòng)的、異步非阻塞的架構(gòu)、支持多進(jìn)程的高并發(fā)的負(fù)載均衡器/反向代理軟件??梢葬槍?duì)域名、目錄結(jié)構(gòu)、正則規(guī)則針對(duì)http做一些分流。通過端口檢測到服務(wù)器內(nèi)部的故障,比如根據(jù)服務(wù)器處理網(wǎng)頁返回的狀態(tài)碼、**時(shí)等等,并且會(huì)把返回錯(cuò)誤的請(qǐng)求重新提交到另一個(gè)節(jié)點(diǎn),不過其中缺點(diǎn)就是不支持url來檢測。對(duì)于session sticky,可以基于ip hash的算法來實(shí)現(xiàn),通過基于cookie的擴(kuò)展nginx-sticky-module支持session
sticky。
HAProxy支持4層和7層做負(fù)載均衡,支持session的會(huì)話保持,cookie的引導(dǎo);支持后端url方式的檢測;負(fù)載均衡的算法比較豐富,有RR、權(quán)重等。
對(duì)于圖片,需要有單獨(dú)的域名,獨(dú)立或者分布式的圖片服務(wù)器或者如mogileFS,可以圖片服務(wù)器之上加varnish做圖片緩存。
3、App接入
應(yīng)用層運(yùn)行在jboss或者tomcat容器中,代表獨(dú)立的系統(tǒng),比如**購物、用戶自主服務(wù)、后端系統(tǒng)等
協(xié)議接口,HTTP、JSON
可以采用servlet3.0,異步化servlet,提高整個(gè)系統(tǒng)的吞吐量
http請(qǐng)求經(jīng)過Nginx,通過負(fù)載均衡算法分到到App的某一節(jié)點(diǎn),這一層層擴(kuò)容起來比較簡單。
除了利用cookie保存少量用戶部分信息外(cookie一般不能**過4K的大小),對(duì)于App接入層,保存有用戶相關(guān)的session數(shù)據(jù),但是有些反向代理或者負(fù)載均衡不支持對(duì)session sticky支持不是很好或者對(duì)接入的可用性要求比較高(app接入節(jié)點(diǎn)宕機(jī),session隨之丟失),這就需要考慮session的集中式存儲(chǔ),使得App接入層無狀態(tài)化,同時(shí)系統(tǒng)用戶變多的時(shí)候,就可以通過增加更多的應(yīng)用節(jié)點(diǎn)來達(dá)到水平擴(kuò)展的目的。
Session的集中式存儲(chǔ),需要滿足以下幾點(diǎn)要求:
a、高效的通訊協(xié)議
b、session的分布式緩存,支持節(jié)點(diǎn)的伸縮,數(shù)據(jù)的冗余備份以及數(shù)據(jù)的遷移
c、session過期的管理
4、業(yè)務(wù)服務(wù)
代表某一領(lǐng)域的業(yè)務(wù)提供的服務(wù),對(duì)于電商而言,領(lǐng)域有用戶、商品、訂單、紅包、支付業(yè)務(wù)等等,不同的領(lǐng)域提供不同的服務(wù),
這些不同的領(lǐng)域構(gòu)成一個(gè)個(gè)模塊,良好的模塊劃分和接口設(shè)計(jì)非常重要,一般是參考高內(nèi)聚、接口收斂的原則,
這樣可以提高整個(gè)系統(tǒng)的可用性。當(dāng)然可以根據(jù)應(yīng)用規(guī)模的大小,模塊可以部署在一起,對(duì)于大規(guī)模的應(yīng)用,一般是獨(dú)立部署的。
高并發(fā):
業(yè)務(wù)層對(duì)外協(xié)議以NIO的RPC方式暴露,可以采用比較成熟的NIO通訊框架,如netty、mina
可用性:
為了提高模塊服務(wù)的可用性,一個(gè)模塊部署在多個(gè)節(jié)點(diǎn)做冗余,并自動(dòng)進(jìn)行負(fù)載轉(zhuǎn)發(fā)和失效轉(zhuǎn)移;
較初可以利用VIP+heartbeat方式,目前系統(tǒng)有一個(gè)單獨(dú)的組件HA,利用zookeeper實(shí)現(xiàn)(比原來方案的優(yōu)點(diǎn))
一致性、事務(wù):
對(duì)于分布式系統(tǒng)的一致性,盡量滿足可用性,一致性可以通過校對(duì)來達(dá)到較終一致的狀態(tài)。
5、基礎(chǔ)服務(wù)中間件
1) 通信組件
通信組件用于業(yè)務(wù)系統(tǒng)內(nèi)部服務(wù)之間的調(diào)用,在大并發(fā)的電商平臺(tái)中,需要滿足高并發(fā)高吞吐量的要求。
整個(gè)通信組件包括客戶端和服務(wù)端兩部分。
客戶端和服務(wù)器端維護(hù)的是長連接,可以減少每次請(qǐng)求建立連接的開銷,在客戶端對(duì)于每個(gè)服務(wù)器定義一個(gè)連接池,初始化連接后,可以并發(fā)連接服務(wù)端進(jìn)行rpc操作,連接池中的長連接需要心跳維護(hù),設(shè)置請(qǐng)求**時(shí)時(shí)間。
對(duì)于長連接的維護(hù)過程可以分兩個(gè)階段,一個(gè)是發(fā)送請(qǐng)求過程,另外一個(gè)是接收響應(yīng)過程。在發(fā)送請(qǐng)求過程中,若發(fā)生IOException,則把該連接標(biāo)記失效。接收響應(yīng)時(shí),服務(wù)端返回SocketTimeoutException,如果設(shè)置了**時(shí)時(shí)間,那么就直接返回異常,清除當(dāng)前連接中那些**時(shí)的請(qǐng)求。否則繼續(xù)發(fā)送心跳包(因?yàn)榭赡苁莵G包,**過pingInterval間隔時(shí)間就發(fā)送ping操作),若ping不通(發(fā)送IOException),則說明當(dāng)前連接是有問題的,那么就把當(dāng)前連接標(biāo)記成已經(jīng)失效;若ping通,則說明當(dāng)前連接是可靠的,繼續(xù)進(jìn)行讀操作。失效的連接會(huì)從連接池中清除掉。
每個(gè)連接對(duì)于接收響應(yīng)來說都以單獨(dú)的線程運(yùn)行,客戶端可以通過同步(wait,notify)方式或者異步進(jìn)行rpc調(diào)用,
序列化采用較高效的hession序列化方式。
服務(wù)端采用事件驅(qū)動(dòng)的NIO的MINA框架,支撐高并發(fā)高吞吐量的請(qǐng)求。
2) 路由Router
在大多數(shù)的數(shù)據(jù)庫切分解決方案中,為了提高數(shù)據(jù)庫的吞吐量,首先是對(duì)不同的表進(jìn)行垂直切分到不同的數(shù)據(jù)庫中,
然后當(dāng)數(shù)據(jù)庫中一個(gè)表**過一定大小時(shí),需要對(duì)該表進(jìn)行水平切分,這里也是一樣,這里以用戶表為例;
對(duì)于訪問數(shù)據(jù)庫客戶端來講,需要根據(jù)用戶的ID,定位到需要訪問的數(shù)據(jù);
數(shù)據(jù)切分算法,
根據(jù)用戶的ID做hash操作,一致性Hash,這種方式存在失效數(shù)據(jù)的遷移問題,遷移時(shí)間內(nèi)服務(wù)不可用
維護(hù)路由表,路由表中存儲(chǔ)用戶和sharding的映射關(guān)系,sharding分為leader和replica,分別負(fù)責(zé)寫和讀
這樣每個(gè)biz客戶端都需要保持所有sharding的連接池,這樣有個(gè)缺點(diǎn)是會(huì)產(chǎn)生全連接的問題;
一種解決方法是sharding的切分提到業(yè)務(wù)服務(wù)層進(jìn)行,每個(gè)業(yè)務(wù)節(jié)點(diǎn)只維護(hù)一個(gè)shard的連接即可。
路由組件的實(shí)現(xiàn)是這樣的(可用性、高性能、高并發(fā))
基于性能方面的考慮,采用mongodb中維護(hù)用戶id和shard的關(guān)系,為了保證可用性,搭建replicatset集群。
biz的sharding和數(shù)據(jù)庫的sharding是一一對(duì)應(yīng)的,只訪問一個(gè)數(shù)據(jù)庫sharding.
biz業(yè)務(wù)注冊(cè)節(jié)點(diǎn)到zookeeper上/bizs/shard/下。
router監(jiān)聽zookeeper上/bizs/下節(jié)點(diǎn)狀態(tài),緩存在線biz在router中。
client請(qǐng)求router獲取biz時(shí),router首先從mongodb中獲取用戶對(duì)應(yīng)的shard,router根據(jù)緩存的內(nèi)容通過RR算法獲取biz節(jié)點(diǎn)。
為了解決router的可用性和并發(fā)吞吐量問題,對(duì)router進(jìn)行冗余,同時(shí)client監(jiān)聽zookeeper的/routers節(jié)點(diǎn)并緩存在線router節(jié)點(diǎn)列表。
3) HA
傳統(tǒng)實(shí)現(xiàn)HA的做法一般是采用虛擬IP漂移,結(jié)合Heartbeat、keepalived等實(shí)現(xiàn)HA,
Keepalived使用vrrp方式進(jìn)行數(shù)據(jù)包的轉(zhuǎn)發(fā),提供4層的負(fù)載均衡,通過檢測vrrp數(shù)據(jù)包來切換,做冗余熱備較加適合與LVS搭配。Linux Heartbeat是基于網(wǎng)絡(luò)或者主機(jī)的服務(wù)的高可用,HAProxy或者Nginx可以基于7層進(jìn)行數(shù)據(jù)包的轉(zhuǎn)發(fā),因此Heatbeat較加適合做HAProxy、Nginx,包括業(yè)務(wù)的高可用。
在分布式的集群中,可以用zookeeper做分布式的協(xié)調(diào),實(shí)現(xiàn)集群的列表維護(hù)和失效通知,客戶端可以選擇hash算法或者roudrobin實(shí)現(xiàn)負(fù)載均衡;對(duì)于master-master模式、master-slave模式,可以通過zookeeper分布式鎖的機(jī)制來支持。
4)消息Message
對(duì)于平臺(tái)各個(gè)系統(tǒng)之間的異步交互,是通過MQ組件進(jìn)行的。
在設(shè)計(jì)消息服務(wù)組件時(shí),需要考慮消息一致性、持久化、可用性、以及完善的監(jiān)控體系。
業(yè)界開源的消息中間件主要RabbitMQ、kafka有兩種,
RabbitMQ,遵循AMQP協(xié)議,由內(nèi)在高并發(fā)的erlanng語言開發(fā);kafka是Linkedin于2010年12月份開源的消息發(fā)布訂閱系統(tǒng),它主要用于處理活躍的流式數(shù)據(jù),大數(shù)據(jù)量的數(shù)據(jù)處理上。
對(duì)消息一致性要求比較高的場合需要有應(yīng)答確認(rèn)機(jī)制,包括生產(chǎn)消息和消費(fèi)消息的過程;不過因網(wǎng)絡(luò)等原理導(dǎo)致的應(yīng)答缺失,可能會(huì)導(dǎo)致消息的重復(fù),這個(gè)可以在業(yè)務(wù)層次根據(jù)冪等性進(jìn)行判斷過濾;RabbitMQ采用的是這種方式。還有一種機(jī)制是消費(fèi)端從broker拉取消息時(shí)帶上LSN號(hào),從broker中某個(gè)LSN點(diǎn)批量拉取消息,這樣無須應(yīng)答機(jī)制,kafka分布式消息中間件就是這種方式。
消息的在broker中的存儲(chǔ),根據(jù)消息的可靠性的要求以及性能方面的綜合衡量,可以在內(nèi)存中,可以持久化到存儲(chǔ)上。
對(duì)于可用性和高吞吐量的要求,集群和主備模式都可以在實(shí)際的場景應(yīng)用的到。RabbitMQ解決方案中有普通的集群和可用性較高的mirror queue方式。 kafka采用zookeeper對(duì)集群中的broker、consumer進(jìn)行管理,可以注冊(cè)topic到zookeeper上;通過zookeeper的協(xié)調(diào)機(jī)制,producer保存對(duì)應(yīng)topic的broker信息,可以隨機(jī)或者輪詢發(fā)送到broker上;并且producer可以基于語義*分片,消息發(fā)送到broker的某分片上。
總體來講,RabbitMQ用在實(shí)時(shí)的對(duì)可靠性要求比較高的消息傳遞上。kafka主要用于處理活躍的流式數(shù)據(jù),大數(shù)據(jù)量的數(shù)據(jù)處理上。
5)Cache&Buffer
Cache系統(tǒng)
在一些高并發(fā)高性能的場景中,使用cache可以減少對(duì)后端系統(tǒng)的負(fù)載,承擔(dān)可大部分讀的壓力,可以大大提高系統(tǒng)的吞吐量,比如通常在數(shù)據(jù)庫存儲(chǔ)之前增加cache緩存。
但是引入cache架構(gòu)不可避免的帶來一些問題,cache命中率的問題, cache失效引起的抖動(dòng),cache和存儲(chǔ)的一致性。
Cache中的數(shù)據(jù)相對(duì)于存儲(chǔ)來講,畢竟是有限的,比較理想的情況是存儲(chǔ)系統(tǒng)的熱點(diǎn)數(shù)據(jù),這里可以用一些常見的算法LRU等等淘汰老的數(shù)據(jù);隨著系統(tǒng)規(guī)模的增加,單個(gè)節(jié)點(diǎn)cache不能滿足要求,就需要搭建分布式Cache;為了解決單個(gè)節(jié)點(diǎn)失效引起的抖動(dòng) ,分布式cache一般采用一致性hash的解決方案,大大減少因單個(gè)節(jié)點(diǎn)失效引起的抖動(dòng)范圍;而對(duì)于可用性要求比較高的場景,每個(gè)節(jié)點(diǎn)都是需要有備份的。數(shù)據(jù)在cache和存儲(chǔ)上都存有同一份備份,必然有一致性的問題,一致性比較強(qiáng)的,在較新數(shù)據(jù)庫的同時(shí),較新數(shù)據(jù)庫cache。對(duì)于一致性要求不高的,可以去設(shè)置緩存失效時(shí)間的策略。
Memcached作為高速的分布式緩存服務(wù)器,協(xié)議比較簡單,基于libevent的事件處理機(jī)制。
Cache系統(tǒng)在平臺(tái)中用在router系統(tǒng)的客戶端中,熱點(diǎn)的數(shù)據(jù)會(huì)緩存在客戶端,當(dāng)數(shù)據(jù)訪問失效時(shí),才去訪問router系統(tǒng)。
當(dāng)然目前更多的利用內(nèi)存型的數(shù)據(jù)庫做cache,比如redis、mongodb;redis比memcache有豐富的數(shù)據(jù)操作的API;redis和mongodb都對(duì)數(shù)據(jù)進(jìn)行了持久化,而memcache沒有這個(gè)功能,因此memcache較加適合在關(guān)系型數(shù)據(jù)庫之上的數(shù)據(jù)的緩存。
強(qiáng)一致的數(shù)據(jù)訪問
MVCC
HBase的一致性數(shù)據(jù)訪問是通過MVCC來實(shí)現(xiàn)的。
HBase在寫數(shù)據(jù)的過程中,需要經(jīng)過好幾個(gè)階段,寫HLog,寫memstore,較新MVCC;
只有較新了MVCC,才算真正memstore寫成功,其中事務(wù)的隔離需要有mvcc的來控制,比如讀數(shù)據(jù)不可以獲取別的線程還未提交的數(shù)據(jù)。
高可靠
HBase的數(shù)據(jù)存儲(chǔ)基于HDFS,提供了冗余機(jī)制。
Region節(jié)點(diǎn)的宕機(jī),對(duì)于內(nèi)存中的數(shù)據(jù)還未flush到文件中,提供了可靠的恢復(fù)機(jī)制。
可伸縮,自動(dòng)切分,遷移
通過Zookeeper定位目標(biāo)Region Server,最后定位Region。
Region Server擴(kuò)容,通過將自身發(fā)布到Master,Master均勻分布。
可用性
存在單點(diǎn)故障,Region Server宕機(jī)后,短時(shí)間內(nèi)該server維護(hù)的region無法訪問,等待failover生效。
通過Master維護(hù)各Region Server健康狀況和Region分布。
多個(gè)Master,Master宕機(jī)有zookeeper的paxos投票機(jī)制選取下一任Master。Master就算全宕機(jī),也不影響Region讀寫。Master僅充當(dāng)一個(gè)自動(dòng)運(yùn)維角色。
HDFS為分布式存儲(chǔ)引擎,一備三,高可靠,0數(shù)據(jù)丟失。
HDFS的namenode是一個(gè)SPOF。
為避**個(gè)region訪問過于頻繁,單機(jī)壓力過大,提供了split機(jī)制
HBase的寫入是LSM-TREE的架構(gòu)方式,隨著數(shù)據(jù)的append,HFile越來越多,HBase提供了HFile文件進(jìn)行compact,對(duì)過期數(shù)據(jù)進(jìn)行清除,提高查詢的性能。
Schema free
HBase沒有像關(guān)系型數(shù)據(jù)庫那樣的嚴(yán)格的schema,可以自由的增加和刪除schema中的字段。
HBase分布式數(shù)據(jù)庫,對(duì)于二級(jí)索引支持的不太好,目前只支持在rowkey上的索引,所以rowkey的設(shè)計(jì)對(duì)于查詢的性能來講非常關(guān)鍵。
7、管理與部署配置
統(tǒng)一的配置庫
部署平臺(tái)
8、監(jiān)控、統(tǒng)計(jì)、日志
大型分布式系統(tǒng)涉及各種設(shè)備,比如網(wǎng)絡(luò)交換機(jī),普通PC機(jī),各種型號(hào)的網(wǎng)卡,硬盤,內(nèi)存等等,還有應(yīng)用業(yè)務(wù)層次的監(jiān)控,數(shù)量非常多的時(shí)候,出現(xiàn)錯(cuò)誤的概率也會(huì)變大,并且有些監(jiān)控的時(shí)效性要求比較高,有些達(dá)到秒級(jí)別;在大量的數(shù)據(jù)流中需要過濾異常的數(shù)據(jù),有時(shí)候也對(duì)數(shù)據(jù)會(huì)進(jìn)行上下文相關(guān)的復(fù)雜計(jì)算,進(jìn)而決定是否需要告警。因此監(jiān)控平臺(tái)的性能、吞吐量、已經(jīng)可用性就比較重要,需要規(guī)劃統(tǒng)一的一體化的監(jiān)控平臺(tái)對(duì)系統(tǒng)進(jìn)行各個(gè)層次的監(jiān)控。
平臺(tái)的數(shù)據(jù)分類
應(yīng)用業(yè)務(wù)級(jí)別:應(yīng)用事件、業(yè)務(wù)日志、審計(jì)日志、請(qǐng)求日志、異常、請(qǐng)求業(yè)務(wù)metrics、性能度量
系統(tǒng)級(jí)別:CPU、內(nèi)存、網(wǎng)絡(luò)、IO
時(shí)效性要求
閥值,告警:
實(shí)時(shí)計(jì)算:
近實(shí)時(shí)分鐘計(jì)算
按小時(shí)、天的離線分析
實(shí)時(shí)查詢
架構(gòu)
節(jié)點(diǎn)中Agent代理可以接收日志、應(yīng)用的事件以及通過探針的方式采集數(shù)據(jù),agent采集數(shù)據(jù)的一個(gè)原則是和業(yè)務(wù)應(yīng)用的流程是異步隔離的,不影響交易流程。
數(shù)據(jù)統(tǒng)一通過collector集群進(jìn)行收集,按照數(shù)據(jù)的不同類型分發(fā)到不同的計(jì)算集群進(jìn)行處理;有些數(shù)據(jù)時(shí)效性不是那么高,比如按小時(shí)進(jìn)行統(tǒng)計(jì),放入hadoop集群;有些數(shù)據(jù)是請(qǐng)求流轉(zhuǎn)的跟蹤數(shù)據(jù),需要可以查詢的,那么就可以放入solr集群進(jìn)行索引;有些數(shù)據(jù)需要進(jìn)行實(shí)時(shí)計(jì)算的進(jìn)而告警的,需要放到storm集群中進(jìn)行處理。
數(shù)據(jù)經(jīng)過計(jì)算集群處理后,結(jié)果存儲(chǔ)到Mysql或者HBase中。
監(jiān)控的web應(yīng)用可以把監(jiān)控的實(shí)時(shí)結(jié)果推送到瀏覽器中,也可以提供API供結(jié)果的展現(xiàn)和搜索。
無錫紅豬網(wǎng)絡(luò)科技有限公司專注于java,b2b2c,多用戶商城等
詞條
詞條說明
java電商 商城 微商城 b2b2c多商戶電商 二次開發(fā)源碼PC版+wap版
系統(tǒng)具有統(tǒng)一后臺(tái)管理、部署文檔、操作文檔、開發(fā)文檔、數(shù)據(jù)庫腳本、數(shù)據(jù)字典、開發(fā)快速上手說明等文檔。代碼在Action類中注釋清晰,Service層和Dao層面向接口的開發(fā)技術(shù)簡單易學(xué),使您能夠快速上手開發(fā)。系統(tǒng)支持的支付方式:系統(tǒng)支持的支付方式:平臺(tái)統(tǒng)一支付(收款到平臺(tái)賬戶,賣家申請(qǐng)?zhí)岈F(xiàn)后財(cái)務(wù)打款給賣家)和店鋪支付(直接收款到賣家自己的賬戶)系統(tǒng)支持的在線支付方式:PC端(見PayTools.ja
較近公司要開發(fā)商城,讓我多方咨詢,最后看了很多,要不就是代碼、表字段注釋不全,要不就是bug多,要么就是文檔缺少,最后決定自己開發(fā)一套商城。下面是開發(fā)的一些心得體會(huì),權(quán)且記錄下來,給自己做個(gè)記錄把。之**直都是在從事電商相關(guān)和互聯(lián)網(wǎng)金融開發(fā),處理過億級(jí)數(shù)據(jù)量,所以被目前這家公司看重。由于Java是開源的,較近幾年Hadoop等開源產(chǎn)品越來越成熟,而且是基于Java的,所以較終選擇Java最后后臺(tái)開
java 商城系統(tǒng)架構(gòu)之*四篇:構(gòu)建高并發(fā)高可用的電商平臺(tái)架構(gòu)實(shí)踐
一、設(shè)計(jì)理念注:這里只講概念,盡量不講技術(shù)!但是會(huì)推薦一些。本博客雖然是基于java語言,但是適用于任何其他大型架構(gòu)系統(tǒng)。1、空間換時(shí)間1)多級(jí)緩存、靜態(tài)化關(guān)于緩存方面,可以做:客戶端頁面緩存、反向代理緩存、應(yīng)用端的緩存、內(nèi)存數(shù)據(jù)庫以及做**靜態(tài)化對(duì)于頁面緩存,比如京東較狠,圖片*存儲(chǔ)在客戶端,改圖片、css、js等的話,必須要改名字,要不然會(huì)hit到舊文件。對(duì)于**靜態(tài)化,web的話可以做靜態(tài)
java電商 商城 微商城 b2b2c多商戶電商 二次開發(fā)源碼PC版+wap版
系統(tǒng)具有統(tǒng)一后臺(tái)管理、部署文檔、操作文檔、開發(fā)文檔、數(shù)據(jù)庫腳本、數(shù)據(jù)字典、開發(fā)快速上手說明等文檔。代碼在Action類中注釋清晰,Service層和Dao層面向接口的開發(fā)技術(shù)簡單易學(xué),使您能夠快速上手開發(fā)。系統(tǒng)支持的支付方式:系統(tǒng)支持的支付方式:平臺(tái)統(tǒng)一支付(收款到平臺(tái)賬戶,賣家申請(qǐng)?zhí)岈F(xiàn)后財(cái)務(wù)打款給賣家)和店鋪支付(直接收款到賣家自己的賬戶)系統(tǒng)支持的在線支付方式:PC端(見PayTools.ja
聯(lián)系人: 周慶達(dá)
電 話:
手 機(jī): 17503009512
微 信: 17503009512
地 址: 江蘇無錫濱湖區(qū)222號(hào)
郵 編: 123123
網(wǎng) 址: redpigmall.b2b168.com
聯(lián)系人: 周慶達(dá)
手 機(jī): 17503009512
電 話:
地 址: 江蘇無錫濱湖區(qū)222號(hào)
郵 編: 123123
網(wǎng) 址: redpigmall.b2b168.com
食檢實(shí)驗(yàn)室信息化LIMS系統(tǒng)
¥300000.00
¥1386.00
嘉科科技PCB板行業(yè)質(zhì)量追溯系統(tǒng)定制開發(fā)
¥300000.00
¥10000.00