CPU基礎(chǔ)知識大全詳解

時間：2020-11-24 19:43:39 懷健0由分享

CPU基礎(chǔ)知識大全詳解有哪些？CPU在電腦中是最核心關(guān)鍵的硬件之一，相當(dāng)于人的大腦，決定了電腦運(yùn)算能力，因此CPU的選擇至關(guān)重要。下面就讓小編帶你去看看CPU基礎(chǔ)知識大全詳解，希望對你有所幫助吧!

程序員必須了解的CPU知識 - 科普篇

1導(dǎo)讀

對于一名程序員來說，無論你使用的是什么語言，代碼最終都會交給CPU來執(zhí)行。所以了解CPU相關(guān)的知識一方面屬于程序員的內(nèi)功，另一方面也可以幫助你在日常編寫代碼時寫出更加高效的代碼

本文不打算對CPU進(jìn)行深入探究，相反是以簡單的語言來幫助大家了解CPU的工作原理以及不得不提到的CPU緩存相關(guān)知識，其中晦澀的內(nèi)容我會通過配圖來幫助大家理解，最后會以幾個例子來幫助大家更直觀的感受到CPU緩存帶來的性能影響

2CPU基礎(chǔ)知識

CPU即Central Processing Unit(中央處理器)，是我們的代碼打交道最多的硬件之一，要想讓一個CPU工作，就必須給它提供指令和數(shù)據(jù)，而這里的指令和數(shù)據(jù)一般就放在我們的內(nèi)存當(dāng)中。其中指令就是由我們平常編寫的代碼翻譯而來，數(shù)據(jù)也是我們代碼中需要用到的數(shù)據(jù)(例如一個int值、一串字符串等等)

以C語言為例，從我們開始編寫到運(yùn)行的生命周期可以粗略的用下圖表示：

大致分為以下幾個步驟

我們?nèi)粘Ｖ惺褂镁庉嬈骰蛘逫DE敲入代碼

代碼編寫完成后使用編譯和鏈接工具生成可以被執(zhí)行的程序，也就是機(jī)器語言(指令的集合)

當(dāng)程序被運(yùn)行時，整個程序(包括指令和數(shù)據(jù))會被完整的載入到內(nèi)存當(dāng)中

CPU不停的向內(nèi)存讀取該程序的指令執(zhí)行直到程序結(jié)束

通過上述第4步我們知道，CPU自身是沒有保存我們的程序的，需要不停的向內(nèi)存讀取

那么有個問題是CPU是如何向內(nèi)存讀取的呢?

這里其實存在一個“總線”的概念，即CPU會通過地址總線、控制總線、數(shù)據(jù)總線來與我們的內(nèi)存進(jìn)行交互。其中地址總線的作用是尋址，即CPU告訴內(nèi)存需要哪一個內(nèi)存地址上的數(shù)據(jù);控制總線的作用是對外部組件的控制，例如CPU希望從內(nèi)存讀取數(shù)據(jù)則會在控制總線上發(fā)一個“讀信號”，如果希望往內(nèi)存中寫一個數(shù)據(jù)則會發(fā)一個“寫信號”;而數(shù)據(jù)總線的作用顧名思義就是用來傳輸數(shù)據(jù)本身的了

例如CPU需要希望從內(nèi)存中讀一條數(shù)據(jù)，那么整個過程為：

到這里我們已經(jīng)知道了CPU在執(zhí)行我們程序的過程中會不斷的與內(nèi)存交互，讀取需要的指令和數(shù)據(jù)或者寫入相關(guān)的數(shù)據(jù)。這個過程是非常非常快的，一般CPU與內(nèi)存交互一次需要200個時鐘周期左右，而現(xiàn)代的處理器單個時鐘周期一般都短于1納秒(1秒 = 十億納秒)

但我們的前輩們?nèi)匀粚@個速度不滿足，所以又對CPU設(shè)計了一套緩存系統(tǒng)來加速對內(nèi)存中數(shù)據(jù)的讀取

3CPU緩存

現(xiàn)代CPU通常設(shè)計三級緩存(L1、L2、L3)，其中L1、L2緩存是每個CPU核心獨(dú)享的，L3緩存是所有CPU核心共享的，而L1緩存又分為數(shù)據(jù)緩存和指令緩存

我們的數(shù)據(jù)就從內(nèi)存先到L3緩存中，再到L2緩存中，再到L1緩存中，最后再到CPU寄存器中

按照大小來看，通常L1 < L2 < L3 < 內(nèi)存 < 磁盤，如果你手邊有一臺Linu__機(jī)器的話，可以通過下面的命令查看CPU各級緩存的大小

以我手上這臺服務(wù)器為例，L1指令緩存大小為32K、數(shù)據(jù)緩存大小為32K，L2緩存大小為1MB，L3緩存大小為35.75MB

按照速度來看，通常L1 > L2 > L3 > 內(nèi)存 > 磁盤，以時鐘周期為計量單位

L1緩存：約 4 個CPU時鐘周期

L2緩存：約 10 個CPU時鐘周期

L3緩存：約 40 個CPU時鐘周期

內(nèi)存：約 200 個CPU時鐘周期

也就意味著如果能命中緩存，我們程序的執(zhí)行速度至少提升5倍左右，如果能命中L1緩存則提升50倍左右，這已經(jīng)屬于相當(dāng)大的性能提升了

有了緩存系統(tǒng)后，CPU就不必要每條指令或數(shù)據(jù)都讀一次了，可以一次性讀取若干條指令或數(shù)據(jù)然后放到緩存里供以后查詢，因為根據(jù)局部性原理，CPU訪問內(nèi)存時，無論是讀取指令還是數(shù)據(jù)，所訪問的內(nèi)存單元都趨于聚集在一個較小的連續(xù)區(qū)域中，所以一次性讀取一塊連續(xù)的內(nèi)存有利于后續(xù)的緩存命中

現(xiàn)實中，CPU通常情況下每次的讀取內(nèi)存時都會一次性讀取內(nèi)存中連續(xù)的64個字節(jié)，這個連續(xù)的64字節(jié)術(shù)語就叫做Cache Line(緩存行)，所以每一級CPU緩存就像下面這樣

如果你手邊有一臺Linu__機(jī)器的話，可以通過下面的命令查看你的機(jī)器使用的CPU的Cache Line大小是多少

對于我的服務(wù)器來說，L1緩存就有 32KB / 64B = 512 個Cache Line

到這里，我們已經(jīng)知道了CPU緩存的工作原理和加載方式，這里實際上還遺留了兩個話題沒有講，一個是如何組織每一級的 Cache Line(例如 L1 的 512 個Cache Line)來提升訪問的命中率;另一個更加復(fù)雜一點(diǎn)，在現(xiàn)代CPU都是多核的場景下如何保證數(shù)據(jù)的一致性，因為每個核都有自己的L1和L2緩存，那么如果核心1修改的時候只修改了緩存的數(shù)據(jù)而沒有修改內(nèi)存中的數(shù)據(jù)，其他核心讀到的就是舊數(shù)據(jù)了，如何解決這一問題?

由于本篇文章只是期望對CPU知識進(jìn)行一個科普，不希望對于小白來說一次性接觸大量的新內(nèi)容，所以這兩個問題我準(zhǔn)備在后面的另外兩篇再進(jìn)行更細(xì)致的討論

4性能對比

下面以幾個實際的例子來加深大家對Cache Line如何影響程序性能的理解

示例一

我們假設(shè)有一個5000萬長度的int數(shù)組，接著把這個數(shù)組的其中一些元素乘以2，考慮下面這兩份代碼

直覺上代碼一比代碼二少循環(huán)了4倍，并且也少乘2了4倍，理論上代碼一比代碼二快4倍左右才合理

但在我的服務(wù)器上運(yùn)行的結(jié)果是代碼一平均花費(fèi)90毫秒，代碼二平均花費(fèi)93毫秒，性能幾乎是差不多的，讀者可以自行思考一下原因，再點(diǎn)擊下方空白處查看解析

點(diǎn)擊下方空白區(qū)域查看解析

▼

解析

這里最主要的原因還是Cache Line，雖然代碼一需要執(zhí)行的指令確實比代碼二要少4倍，但由于CPU一次會把連續(xù)的64個字節(jié)都讀入緩存，而讀寫緩存的速度又特別快(還記得嗎?L1的讀取速度只有約4個時鐘周期，是內(nèi)存的50倍)，以至于我們很難察覺到這4倍指令的差距

示例二

假設(shè)我們需要遍歷一個二維數(shù)組，考慮下面這兩種遍歷方法：

由于數(shù)組長度是一模一樣的，直覺上我們期望的是兩份代碼運(yùn)行時間相差無幾。但在我的服務(wù)器上代碼一運(yùn)行需要23毫秒，代碼二運(yùn)行需要51毫秒，讀者可以自行思考一下原因，再點(diǎn)擊下方空白處查看解析

點(diǎn)擊下方空白區(qū)域查看解析

▼

解析

這里最主要的原因依然是Cache Line，由于C語言中二維數(shù)組的內(nèi)存是連續(xù)的，所以我們按行訪問的時候訪問的一直都是連續(xù)的內(nèi)存，而Cache Line也是連續(xù)的64個字節(jié)，所以按行訪問對Cache Line更友好，更容易命中緩存

而按列訪問的話每次訪問的內(nèi)存不是連續(xù)的，每次的跨度都是256__sizeof(int)也就是1KB，更容易出現(xiàn)緩存Miss

示例三

假設(shè)我們有一個數(shù)組，我們希望計算所有大于100的元素的和，考慮下面兩份代碼

其中代碼一是隨機(jī)生成了個長度為1000W的數(shù)組，然后統(tǒng)計大于100的所有數(shù)字的和;代碼二也是隨機(jī)生成了個長度為1000W的數(shù)組，但是是先排完序，再統(tǒng)計大于100的所有數(shù)字的和。并且可以看到，兩份代碼都是只計算了統(tǒng)計sum的那段代碼的消耗時間，所以兩份代碼都不考慮隨機(jī)生成數(shù)組和排序花費(fèi)的時間

理論上來講兩份代碼花費(fèi)時間應(yīng)當(dāng)是相差無幾的，但實際上在我的機(jī)器上跑出來第一份代碼輸出的是46毫秒，第二份代碼輸出的是23毫秒

讀者可以自行思考一下原因，再點(diǎn)擊下方空白處查看解析，提示：第二份代碼中在統(tǒng)計sum之前數(shù)組是有序的

電腦CPU如何選購?臺式機(jī)CPU知識掃盲和選購建議

CPU有幾個重要的參數(shù)：架構(gòu)、主頻、核心、線程、緩存、接口。

架構(gòu)：

有句老話叫“拋開架構(gòu)看核心主頻都是耍流氓”，那什么是架構(gòu)?假如我們把架構(gòu)想象成交通工具，那么老的架構(gòu)就是火車，而新的架構(gòu)就是高鐵，所以架構(gòu)的提升直接影響CPU的性能。這也就是為什么老式的CPU雖然也有超高的主頻但性能還是被現(xiàn)在的i3碾壓的原因了。

電腦CPU如何選購?臺式機(jī)CPU知識掃盲和選購建議

主頻：

我們常在CPU的信息里看到某某CPU主頻3.6GHz，這里的主頻其實是CPU內(nèi)核工作的時鐘頻率，并不直接等于CPU的運(yùn)算速度，但是高的主頻對于CPU的運(yùn)算速度卻至關(guān)重要。

核心：

核心又稱內(nèi)核，是CPU用來完成所有計算、接受/存儲命令、處理數(shù)據(jù)等任務(wù)的裝置。我們可以簡單的把核心理解為人的手，單核就是一只手、雙核就是兩只手、四核就是四只手。

核心數(shù)并不是越多越好的，要看使用場景，比如在打字的時候，兩只手就比一只手效率高，但是在操作鼠標(biāo)的時候，使用兩只手只會起到適得其反的效果。至于什么場景需要使用多少核心的CPU在下面會講到。

電腦CPU如何選購?臺式機(jī)CPU知識掃盲和選購建議

線程：

我們通常會看到“四核四線程” 和“四核八線程”這兩種說法，我們可以簡單的把工廠里的流水線比作線程，把工人比作核心，早先由于工人工作技能不高，一個工人只能處理一條流水線的任務(wù)，我們可以把這個稱為單核單線程，但是后來工人技術(shù)熟練了，覺得操作一條流水線很無聊，不能體現(xiàn)自己的價值，于是就給又分配一條流水線，讓這個工人同時處理兩條流水線的任務(wù)，我們可以把這個稱為“單核雙線程”。

緩存：

緩存也是CPU里的一項非常重要的參數(shù)，由于CPU的運(yùn)算速度比內(nèi)存條的讀寫速度要快很多，這會讓CPU花費(fèi)很長的時間等待數(shù)據(jù)的到來或是把數(shù)據(jù)寫入內(nèi)存條，這個時候CPU內(nèi)的高速緩存可以作為臨時的存儲介質(zhì)來緩解CPU的運(yùn)算速度與內(nèi)存讀寫速度不匹配的矛盾，所以緩存越大越好。

電腦CPU如何選購?臺式機(jī)CPU知識掃盲和選購建議

接口：

CPU需要通過接口安裝在主板上才能工作，而目前CPU的接口都是針腳式接口，AMD和英特爾的CPU在接口上就有很大的差別，所以需要使用適配接口的主板才能正常工作。目前英特爾主流的接口類型為LGA-1151接口(6、7、8代i3 i5 i7都是這種接口);AMD平臺主流的接口類型有AM4接口(銳龍系列)和FM2+接口(速龍系列、APU系列)。

PS:英特爾最新的酷睿8代CPU雖然也是LGA-1151接口，但不適配老式的LGA-1151接口主板的平臺，需要另購主板

說完了這些重要的參數(shù)，相信你也對CPU有了一個大概的了解，我們再談?wù)劜煌瑘鼍皩PU的選擇。

計算機(jī)系統(tǒng)基礎(chǔ)：CPU相關(guān)知識筆記

1、什么是CPU

計算機(jī)的基本硬件系統(tǒng)由運(yùn)算器、控制器、存儲器、輸入設(shè)備、輸出設(shè)備5大部件組成。

運(yùn)算器和控制器等部件被集成在一起稱為中央處理單元(Central Processing Unit,CPU).CPU

是硬件系統(tǒng)的核心。

2、CPU的用途

CPU主要負(fù)責(zé)獲取程序指令、對指令進(jìn)行譯碼并加以執(zhí)行。

CPU的功能如下：

3、CPU的組成

CPU主要由運(yùn)算器、控制器、寄存器和內(nèi)部總線等部件組成。