學(xué)習(xí)啦>學(xué)習(xí)電腦>電腦硬件知識>CPU知識>

uptime詳解,最通俗的說明了cpu平均負(fù)載

時間: 捷鋒774 分享

  今天又個網(wǎng)友問uptime的三個平均負(fù)載值具體要怎么理解,很多人會這樣理解負(fù)載均值:三個數(shù)分別代表不同時間段的系統(tǒng)平均負(fù)載(一分鐘、五分鐘、以及十五分鐘),它們的數(shù)字當(dāng)然是越小越好。數(shù)字越高,說明服務(wù)器的負(fù)載越 大,這也可能是服務(wù)器出現(xiàn)某種問題的信號。而事實不完全如此,下面讓小編告訴你吧。

  uptime詳解,最通俗的說明了cpu平均負(fù)載:

  uptime命令,有兩大用處,一個是看您的機器的運行時間,另一個就是看看您的cpu 負(fù)載如何?

  uptime

  10:19:04 up 257 days, 18:56, 12 users, load average: 2.10, 2.10,2.09

  1、10:19:04 //系統(tǒng)當(dāng)前時間

  2、up 257 days, 18:56 //主機已運行時間,時間越大,說明你的機器越穩(wěn)定。

  3、12 user //用戶連接數(shù),是總連接數(shù)而不是用戶數(shù)

  4、load average // 系統(tǒng)平均負(fù)載,統(tǒng)計最近1,5,15分鐘的系統(tǒng)平均負(fù)載

  前面三項很容易理解,對于第四項的解釋,從網(wǎng)上找到一篇分析得非常易懂的文章

  很多人會這樣理解負(fù)載均值:三個數(shù)分別代表不同時間段的系統(tǒng)平均負(fù)載(一分鐘、五分鐘、以及十五分鐘),它們的數(shù)字當(dāng)然是越小越好。數(shù)字越高,說明服務(wù)器的負(fù)載越 大,這也可能是服務(wù)器出現(xiàn)某種問題的信號。

  而事實不完全如此,是什么因素構(gòu)成了負(fù)載均值的大小,以及如何區(qū)分它們目前的狀況是 “好”還是“糟糕”?什么時候應(yīng)該注意哪些不正常的數(shù)值?

  回答這些問題之前,首先需要了解下這些數(shù)值背后的些知識。我們先用最簡單的例子說明, 一臺只配備一塊單核處理器的服務(wù)器。

  一只單核的處理器可以形象得比喻成一條單車道。設(shè)想下,你現(xiàn)在需要收取這條道路的過橋費 -- 如果您忙于處理那些將要過橋的車輛。你首先當(dāng)然需要了解些信息,例如車輛的載重、以及還有多少車輛正在等待過橋。如果前面沒有車輛在等待,那么你可以告訴后面的司機通過。 如果車輛眾多,那么需要告知他們可能需要稍等一會。

  因此,需要些特定的代號表示目前的車流情況,例如:

  •0.00 表示目前橋面上沒有任何的車流。 實際上這種情況與 0.00 和 1.00 之間是相同的,總而言之很通暢,過往的車輛可以絲毫不用等待的通過。

  •1.00 表示剛好是在這座橋的承受范圍內(nèi)。 這種情況不算糟糕,只是車流會有些堵,不過這種情況可能會造成交通越來越慢。

  •超過 1.00,那么說明這座橋已經(jīng)超出負(fù)荷,交通嚴(yán)重的擁堵。 那么情況有多糟糕? 例如 2.00 的情況說明車流已經(jīng)超出了橋所能承受的一倍,那么將有多余過橋一倍的車輛正在焦急的等待。3.00 的話情況就更不妙了,說明這座橋基本上已經(jīng)快承受不了,還有超出橋負(fù)載兩倍多的車輛正在等待。

  上面的情況和處理器的負(fù)載情況非常相似。一輛汽車的過橋時間就好比是處理器處理某線程的實際時間。Unix 系統(tǒng)定義的進程運行時長為所有處理器內(nèi)核的處理時間加上線程在隊列中等待的時間。

  和收過橋費的管理員一樣,你當(dāng)然希望你的汽車(操作)不會被焦急的等待。所以,理想狀態(tài)下,都希望負(fù)載平均值小于 1.00 。當(dāng)然不排除部分峰值會超過 1.00,但長此以往保持這個狀態(tài),就說明會有問題,這時候你應(yīng)該會很焦急。

  “所以你說的理想負(fù)荷為 1.00 ?”

  嗯,這種情況其實并不完全正確。負(fù)荷 1.00 說明系統(tǒng)已經(jīng)沒有剩余的資源了。在實際情況中 ,有經(jīng)驗的系統(tǒng)管理員都會將這條線劃在 0.70:

  •“需要進行調(diào)查法則”: 如果長期你的系統(tǒng)負(fù)載在 0.70 上下,那么你需要在事情變得更糟糕之前,花些時間了解其原因。

  •“現(xiàn)在就要修復(fù)法則”:1.00 。 如果你的服務(wù)器系統(tǒng)負(fù)載長期徘徊于 1.00,那么就應(yīng)該馬上解決這個問題。否則,你將半夜接到你上司的電話,這可不是件令人愉快的事情。

  •“凌晨三點半鍛煉身體法則”:5.00。 如果你的服務(wù)器負(fù)載超過了 5.00 這個數(shù)字,那么你將失去你的睡眠,還得在會議中說明這情況發(fā)生的原因,總之千萬不要讓它發(fā)生。

  那么多個處理器呢?我的均值是 3.00,但是系統(tǒng)運行正常!

  哇喔,你有四個處理器的主機?那么它的負(fù)載均值在 3.00 是很正常的。

  在多處理器系統(tǒng)中,負(fù)載均值是基于內(nèi)核的數(shù)量決定的。以 100% 負(fù)載計算,1.00 表示單個處理器,而 2.00 則說明有兩個雙處理器,那么 4.00 就說明主機具有四個處理器。

  回到我們上面有關(guān)車輛過橋的比喻。1.00 我說過是“一條單車道的道路”。那么在單車道 1.00 情況中,說明這橋梁已經(jīng)被車塞滿了。而在雙處理器系統(tǒng)中,這意味著多出了一倍的負(fù)載,也就是說還有 50% 的剩余系統(tǒng)資源 -- 因為還有另外條車道可以通行。

  所以,單處理器已經(jīng)在負(fù)載的情況下,雙處理器的負(fù)載滿額的情況是 2.00,它還有一倍的資源可以利用。

  多核與多處理器

  先脫離下主題,我們來討論下多核心處理器與多處理器的區(qū)別。從性能的角度上理解,一臺主機擁有多核心的處理器與另臺擁有同樣數(shù)目的處理性能基本上可以認(rèn)為是相差無幾。當(dāng)然實際情況會復(fù)雜得多,不同數(shù)量的緩存、處理器的頻率等因素都可能造成性能的差異。

  但即便這些因素造成的實際性能稍有不同,其實系統(tǒng)還是以處理器的核心數(shù)量計算負(fù)載均值 。這使我們有了兩個新的法則:

  •“有多少核心即為有多少負(fù)荷”法則: 在多核處理中,你的系統(tǒng)均值不應(yīng)該高于處理器核心的總數(shù)量。

  •“核心的核心”法則: 核心分布在分別幾個單個物理處理中并不重要,其實兩顆四核的處理器 等于四個雙核處理器 等于 八個單處理器。所以,它應(yīng)該有八個處理器內(nèi)核。

  讓我們再來看看 uptime 的輸出

  uptime 23:05 up 14 days, 6:08, 7 users, load averages: 0.65 0.42 0.36

  這是個雙核處理器,從結(jié)果也說明有很多的空閑資源。實際情況是即便它的峰值會到 1.7,我也從來沒有考慮過它的負(fù)載問題。

  那么,怎么會有三個數(shù)字的確讓人困擾。我們知道,0.65、0.42、0.36 分別說明上一分鐘、最后五分鐘以及最后十五分鐘的系統(tǒng)負(fù)載均值。那么這又帶來了一個問題:

  我們以哪個數(shù)字為準(zhǔn)?一分鐘?五分鐘?還是十五分鐘?

  其實對于這些數(shù)字我們已經(jīng)談?wù)摿撕芏?,我認(rèn)為你應(yīng)該著眼于五分鐘或者十五分鐘的平均數(shù) 值。坦白講,如果前一分鐘的負(fù)載情況是 1.00,那么仍可以說明認(rèn)定服務(wù)器情況還是正常的。 但是如果十五分鐘的數(shù)值仍然保持在 1.00,那么就值得注意了(根據(jù)我的經(jīng)驗,這時候你應(yīng)該增加的處理器數(shù)量了)。

  那么我如何得知我的系統(tǒng)裝備了多少核心的處理器?

  在 Linux 下,可以使用

  cat /proc/cpuinfo

  獲取你系統(tǒng)上的每個處理器的信息。如果你只想得到數(shù)字,查看有幾個cpu,那么就使用下面的命令:

  grep 'model name' /proc/cpuinfo | wc -l

592489