伺服器經常掛掉的6個原因

2021-08-07 19:40:26 字數 3264 閱讀 7974

如果沒有任何經驗,學習如何擴充套件乙個**是相當困難的。假設現在你有很多像highscalability.com那樣**,你需要一些好的解決方案來擴充套件它們,但是世上沒有「萬能藥」,沒有哪個解決方案可以適應所有**的需要。你不得不自己動手,通過不斷地思考來找到乙個能滿足你的需求的解決方案。我也是這樣做的。

這個**的後台軟體是乙個php內容管理系統,基於smarty和mysql。第乙個任務是找到乙個合適的託管公司,這個公司需要具有豐富的經驗,可以為我們管理伺服器。經過一番調查研究,我們找到了一家這樣的公司,然後告訴他們我們的需求,他們給我們推薦的配置如下:

他們說,這就是我們需要的所有東西了——對此,我們深信不疑。我們最後得到的配置是:

這個配置十分的基礎,並沒有做進一步優化。為了同步檔案(php和**檔案),他們建立了乙個active-active drbd。最後,重構開始了——當然,我們很興奮。一大早,我們把網域名稱切換到了新的ip上,執行我們的監控指令碼,然後盯著螢幕看。我們馬上在這些機器上看到了流量,一切似乎都工作的很好。頁面載入的很快,mysql負擔了大量的查詢任務,我們所有人都很高興。

然後,突然我們的**開始響個不停:「我們不能訪問你們的**了,這是怎麼回事?」我們看了一下我們的監控軟體,事實的確如此——伺服器都被frozen了,站點處於離線狀態!當然,我們做的第一件事情是打**給我們的託管服務提供商:「我們的所有伺服器都宕機了。這是怎麼回事?」他們答應檢查一下機器,一會再打過來。這個**來了:「你的系統根本就無法插手。你做了什麼?它完全被搞砸了。」他們停止了負載均衡器,然後讓我觀察一下其中乙個web伺服器。看到那個index.php檔案,我大吃一驚。它包含一些奇怪的c**片段,錯誤訊息和一些看起來像日誌檔案的東西。經過進一步的調查,我們發現是drbd引發了這次事故。

"殺死"你的伺服器的方法之一

把smarty compile和模板快取放到乙個高負載的active-active drbd集群上,那麼你的伺服器將會掛掉!當我們的託管服務提供商修復了web伺服器的時候,為了在這些伺服器的本地檔案系統上儲存smarty快取檔案,我重寫了部分cms**。我們再次上線了!

現在是午後。這個**通常在下午的晚些時候到傍晚達到峰值。晚上,幾乎沒有什麼流量。我們一直盯著監控軟體,我們所有人都緊張得不得了。這個**可以被載入,但是後來,系統負載越高,響應就越慢。我增加了smarty模板快取的生存期,希望這能產生效果——但是很可惜,這並沒有產生效果!不久,伺服器開始給出超時提示,空白頁面和錯誤資訊。有兩台機器不能處理負載。

我們的客戶這個時候有一點緊張,但是他說:ok,重構通常會引發一些問題的。只要你能很快地修復它,那就沒事了!

"殺死"你的伺服器的方法之二

把乙個開箱即用的web伺服器架設在你的機器上,並且一點也沒有對它進行優化,那麼你的伺服器將會掛掉!那個管理員盡了他的最大努力,盡快地重新配置了所有的web伺服器。他拋棄了apache,然後切換到lighttpd+fastcgi+xcache上來。後來,當我們重新上線的時候,我們幾乎沒有再感受到壓力。這次,這些伺服器會維持多長時間呢?

這些伺服器執行的出奇地好。負載比以前低很多,平均響應時間也不錯。我們徹底放心了,然後我們都回家睡覺了。天已經很晚了,我們認為沒有其他的事情需要我們做了。第二天,**執行的相當好,但是在高峰時段,它一直接近於崩潰的邊緣。我們發現mysql是瓶頸,我們再次打**給我們的託管服務提供商。他們建議在每個web伺服器上用mysql從伺服器進行mysql的主-從同步。

"殺死"你的伺服器的方法之三

再強大的資料庫伺服器也有它的極限,當你到達它的極限的時候,你的伺服器將會掛掉!在這種情況下,某些時候你的資料庫會變得十分緩慢,以至於佇列中大量的網路連線會再次「殺死」我們的web伺服器。不幸的是這個問題很難修復。內容管理系統在這方面十分的簡單,它本身並不支援單獨地讀取和寫入sql查詢。重寫這一切花了很長時間,但是相對於每分鐘都遭遇到掛起休眠來說,是相當值得的。

mysql同步真的成功了,**最終穩定了!在接下來的幾周,幾個月裡,**取得了成功,使用者的數量開始不斷地增加。流量再次超過我們的資源限制,這只是時間的問題。

"殺死"你的伺服器的方法之四

不提前作規劃,你的伺服器可能會掛掉!

幸運的是,我們一直在思考,並且一直在做規劃。我們優化了**,減少了每個頁面載入的時候需要的sql查詢的數量,我們意外地發現了memcached這個好東東。首先,我們在一些核心功能上新增了對memcached的支援,在一些重量級(執行緩慢)的功能上我們也新增了對memcached的支援。當我們把這些變更部署以後,我們簡直不能相信這個結果——這感覺有點像發現了「聖杯」。我們每秒查詢的數量至少降低了50%。我們決定更多地使用memcached,而不是購買另外乙個web伺服器。

"殺死"你的伺服器的方法之五

忘記做快取,你會浪費很多錢,而且,你的伺服器還會掛掉!事實證明,memcached幫助我們減少了70%-80%的mysql伺服器上負載,同時,在web伺服器上,也產生了巨大的效能提公升。頁面載入的相當快。

最終,我們的配置看起來似乎是完美的。即使在高峰時段,我們也無須再擔心崩潰或頁面響應緩慢了。我們搞定它了嗎?不!一台藍色的web伺服器開始有一點響應緩慢了。然後出現了一些錯誤訊息,空白頁面等等。這個系統負載能力很不錯,在大多數情況下伺服器也都在工作,但是只是在「大多數情況下」而已。

"殺死"你的伺服器的方法之六

把成百上千個小檔案放在乙個資料夾裡,當索引節點耗盡的時候,你的伺服器將會掛掉!

是的,你沒有看錯。我們過去只是關注mysql,php和web伺服器本身,並沒有太關注檔案系統。smarty快取檔案儲存在本地檔案系統裡——所有的快取檔案都儲存在同乙個目錄下。解決方案是把smarty放在乙個專用的reiserfs分割槽裡。另外,我們還開啟了smarty的「use_subdirs」選項。

在過去的幾年裡,我們一直在優化頁面。我們把smarty快取放到了memcached中。為了更快速地處理靜態檔案,我們安裝了varnish來減少i/o負載。我們還切換到了nginx(lighttpd會隨機的產生error 500的訊息),安裝了更多的記憶體,購買了更好的硬體,更多的硬體......這個列表永遠不會結束。

總結

擴充套件乙個**是乙個永遠不會結束的過程。當你解決了乙個瓶頸以後,很可能馬上會遇到下乙個瓶頸。永遠都不要這樣想:「就是這樣,我們大功告成了」然後就靠邊站了。這會「殺死」你的伺服器,甚至是你的業務。規劃和學習是乙個持續的過程。如果你因為缺乏經驗或資源而不能自己完成這個工作,那麼可以找乙個有能力勝任這個工作,而且很可靠的合作夥伴,和它一起來做這個工作。永遠都不要停止和你的團隊和合作夥伴溝通當前遇到的一些問題和即將會遇到的一些問題。思考在前才能爭取主動。

伺服器經常掛掉的6個原因

如果沒有任何經驗,學習如何擴充套件乙個 是相當困難的。假設現在你有很多像highscalability.com那樣 你需要一些好的解決方案來擴充套件它們,但是世上沒有 萬能藥 沒有哪個解決方案可以適應所有 的需要。你不得不自己動手,通過不斷地思考來找到乙個能滿足你的需求的解決方案。我也是這樣做的。這...

伺服器經常被攻擊的原因?

一 cc攻擊 cc攻擊的原理便是攻擊者控制某些主機不停地發許多資料報給對方伺服器形成伺服器資源耗盡,一直到宕機潰散。cc主要是用來攻擊頁面的,每個人都有這樣的體會 當乙個網頁拜訪的人數特別多的時分,翻開網頁就慢了,cc便是模仿多個使用者 多少執行緒便是多少使用者 不停地進行拜訪那些需求許多資料操作 ...

伺服器掛掉的幾種可能

1.如果不是涉及到大併發的問題,有可能遭受惡意攻擊。檢視secure日誌。安全日誌。伺服器訪問日誌,然後檢視攻擊點,然後使用命令禁掉ip 就ok了 iptables i input s j drop 2.如果 涉及到大併發問題,有規律就是在每天的固定時間點 併發訪問高潮 掛掉,這個時候需要業務邏輯做...