單主服務器,多從服務器。
對于主要是讀操作的應用,傳統的伸縮方法是對數據進行復制一一有的時候是多個復制這時候的伸縮可以很好地工作。使用復制從服務器分擔主服務器的負載,并在從服務器上執行那些CPU耗時的操作。
對于從服務器,要比你執行例行運維任務所需要的數量要多加一臺,將這臺服務器用于特定任務。從這臺服務器上做備份,然后再將備份恢復回去,測試看有沒有問題。在這臺服務器上運行耗時的cron作業,以對數據進行匯總,將這些匯總數據用于數據分析的查詢,然后將結果導出,再批量導人到主服務器。使用基于會話的讀寫分離策略,以分擔主服務器的 SELECT查詢。這些事情要在應用程序生命周期的早期就開始做。假如一臺從服務器失效了,將這臺從服務器的工作轉到另一臺從服務器即可,因為從服務器之間并沒有什么區別。對這種簡單的失效轉移,可以使用各種負載均衡器來實現。
雖然這種架構很好,但仍然存在一些令人頭痛的問題:不容易實現離線的數據庫模式更新,因為通常數據庫模式更新是在主服務器上完成的,在更新時會阻塞對正在進行更新的表的訪問。而在 ALTER TABLE命令復制到從服務器上時,復制可能會延遲,這樣所分擔的主服務器負載的數據就會過期或延遲。這種主-從架構很難自動實現主服務器的故障轉移,因為主服務器和從服務器的配置是不一樣的,所以,一旦主服務器失效,則必須手工進行失效轉移。不過,這種單一故障點實際上并不那么脆弱,隨著從服務器越來越多,從服務器的失效會比主服務器的失效更為常見。
主服務器一主服務器復制,外加從服務器。
這種方式實際上與ー臺主服務器加多臺從服務器的架構一樣,但這時候主服務器本身也成為了從服務器。這種架構的主要優點是,在協同同的主服務器之間更容易實現失效轉移和失效轉回。這解決了那些令人頭痛的問題,如在線更新數據庫模式。主要的缺點是,向兩臺主服務器進行寫人存在風險,會導致數據存在某種不一致性,這種不一致很難防范,出現了不一致也很難解決。除非你特別小心,并使用特權級別進行限制,否則,簡直就是期待著導致這種不一致的錯誤的發生。
功能分區。
隨著應用的增長,這倒是個好主意。將應用中成本最高的那些部分移到特定的服務器或特定服務器的集群上,例如,將會話存儲從主服務器上分離。我經常看到“會話”表吃掉了與其作用不成比例例的大量時間。為分析查詢另外建立一個集群,如果需要的話,使用同樣的導出導人策略,將匯總結果導入主應用程序集群。將 Sphinx或Solr集群用于搜索。時間以及測量工具會告訴你,應用中哪些部分的成本最高,如果預先不清楚,則造成延遲的那部分就是了。這種架構對應用的支持會比較長久。
除了前面列出的有把握的架構之外,我想下面的建議更有把握。同任何事情一樣,一旦你了解了規則,就會常常發現規則被破壞的情況,但我認為,除非有很好的理由,否則,這些想法不應該被丟棄。
失效轉移和負載均衡。
使用負載均衡器,或者浮動的虛擬P地址。就像你知道的,失效轉移是很難實現的。如果有高級的負載均衡器,就用上,或者使用對等的解決方案,即在服務器之間轉移IP地址,如果做得合適的話,這種方案很好,而且也不貴。
不用使用DNS或應用程序邏輯。一開始好像很合理,但馬上就會變成夢魘。使用DNS查詢P地址是沒問題的,但不要使用DNS去實現失效轉移。換言之,將DNS作為靜態的系統對待,不要依賴于更新DNS、配置文件、應用程序中的代碼或諸如此類的任何東西。
不要自動化得太多,只讀服務器很容易實現失效轉移,而可寫的服務器就難得多。不要試圖構建自動化的失效轉移。有些事情應該由人來完成。凌晨3點被叫醒做失效轉移,總比6點的時候被叫醒,然后在接下來的3天沒日沒夜地試圖恢復數據,要好得多。
ACID仍然是有意義的。
從一開始就使用全事務型系統。非事務型系統的假設可能已經深深地植入了應用程序的代碼中,很難查找與解決了。而后期再切換為事務型系統,會導致很多麻煩,如死鎖、鎖等待超時,以及其他預想不到的行為。
高可用性要求快速而可靠的災難恢復,所以在 MYSQL中,要使用 INNODB作為存儲引擎,但不要用外鍵、觸發器、視圖或存儲過程,因為這些東西會導致復制問題、性能問題、備份以及其他很多問題。不要將 MYISAM用于讀寫數據,因為會導致災難,而恢復起來則需要相當長的時間。
使用正確的工具。
對每顆釘子來說,數據庫都可能成為錘子。這可不是個好主意。不要使數據庫處于關鍵路徑上,如不要將其用于隊列(隊列不能很好地映射到數據庫中,而且也是我看到的最常見的麻煩之一)。不要將應用程序的靜態信息放入數據庫中,如配置信息、可以放人緩存或應用程序代碼中的靜態查找信息、存儲映像。數據庫應該存儲數據,而非應用程序本身。
將數據庫簡單化,因為這是最難于伸縮,也是最昂貴的資源。盡可能使用文件和cron作業。例如,在存入數據庫之前,將數據預先進行匯總。用簡單的腳本或GNU命令行工具
做匯總,比用網站建設數據庫快幾個數量級!要仔細研究UNIX的核心工具,如sed、awk、sort和unqo這種做法,跟從 Oracle或 SQL Serverl的世界中學到的做法比起來,簡直就是對著干。在 Oracle或 SQL Server的世界中,應用程序只是一種建立在大規模的數據庫之上的表現邏 輯,而數據庫充滿了表、視圖、觸發器、存儲過程以及每一項細小的業務邏輯。對于復雜的業務應用,這種集中化的做法有時候是合適的,而且我自己就在這樣的環境中工作過。但是,對于Web應用,我還是堅持我的觀點:分離應用程序和數據庫,將數據庫僅用來存儲和檢索數據。
本文地址:http://m.knowyourextract.com//article/3319.html