學(xué)習(xí)啦 > 學(xué)習(xí)電腦 > 操作系統(tǒng) > Linux教程 > Linux系統(tǒng)監(jiān)控要用到哪些命令

Linux系統(tǒng)監(jiān)控要用到哪些命令

時間: 孫勝龍652 分享

Linux系統(tǒng)監(jiān)控要用到哪些命令

  Linux系統(tǒng)的命令有很多,今天學(xué)習(xí)啦小編主要大家介紹下Linux系統(tǒng)監(jiān)控命令,如果你對監(jiān)控命令感興趣或正在學(xué)習(xí)相關(guān)知識的話,不妨來了解下。

  找到最耗CPU的java線程

  ps命令

  命令:ps -mp pid -o THREAD,tid,time 或者 ps -Lfp pid

  結(jié)果展示:

  這個命令的作用,主要是可以獲取到對應(yīng)一個進(jìn)程下的線程的一些信息。 比如你想分析一下一個java進(jìn)程的一些運(yùn)行瓶頸點(diǎn),可以通過該命令找到所有當(dāng)前Thread的占用CPU的時間,也就是這里的最后一列。

  比如這里找到了一個TID : 30834 ,所占用的TIME時間最高。

  通過 printf “%x\n” 30834 首先轉(zhuǎn)化成16進(jìn)制, 繼續(xù)通過jstack命令dump出當(dāng)前的jvm進(jìn)程的堆棧信息。 通過Grep命令即可以查到對應(yīng)16進(jìn)制的線程id信息,很快就可以找到對應(yīng)最耗CPU的代碼快在哪。

  簡單的解釋下,jstack下這一串線程信息內(nèi)容:

  Java代碼

  “DboServiceProcessor-4-thread-295” daemon prio=10 tid=0x00002aab047a9800 nid=0x7d9b waiting on condition [0x0000000046f66000]

  nid : 對應(yīng)的linux操作系統(tǒng)下的tid,就是前面轉(zhuǎn)化的16進(jìn)制數(shù)字

  tid: 這個應(yīng)該是jvm的jmm內(nèi)存規(guī)范中的唯一地址定位,如果你詳細(xì)分析jvm的一些內(nèi)存數(shù)據(jù)時用得上,我自己還沒到那種程度,所以先放下

  top命令

  命令:top -Hp pid

  結(jié)果顯示:

  和前面的效果一下,你可以實(shí)時的跟蹤并獲取指定進(jìn)程中最耗cpu的線程。 再用前面的方法提取到對應(yīng)的線程堆棧信息。

  判斷I/O瓶頸

  mpstat命令

  命令:mpstat -P ALL 1 1000

  結(jié)果顯示:

  注意一下這里面的%iowait列,CPU等待I/O操作所花費(fèi)的時間。這個值持續(xù)很高通??赡苁荌/O瓶頸所導(dǎo)致的。

  通過這個參數(shù)可以比較直觀的看出當(dāng)前的I/O操作是否存在瓶頸

  iostat命令

  命令: iostat -m -x 1 1000

  同樣你可以觀察對應(yīng)的CPU中的%iowait數(shù)據(jù),除此之外iostat還提供了一些更詳細(xì)的I/O狀態(tài)數(shù)據(jù),比如比較重要的有:

  avgqu-sz : The average queue length of the requests that were issued to the device. (磁盤隊(duì)列的請求長度,正常的話2,3比較好??梢院蚦pu的load一樣的理解)

  await : The average time (in milliseconds) for I/O requests issued to the device to be served. (代表一個I/O操作從wait到完成的總時間)

  svctm和%util都是代表處理該I/O請求花費(fèi)的時間和CPU的時間比例。 判斷是否瓶頸時,這兩個參數(shù)不是主要的

  r/s w/s 和 rMB/s wMB/s 都是代表當(dāng)前系統(tǒng)處理的I/O的一些狀態(tài),前者是我們常說的tps,后者就是吞吐量。這也是評價一個系統(tǒng)的性能指標(biāo)

  pid命令

  命令: pidstat -p pid -u -d -t -w -h 1 1000

  結(jié)果顯示:

  相當(dāng)實(shí)用的一個命令,可以基于當(dāng)個進(jìn)程分析對應(yīng)的性能數(shù)據(jù),包括CPU,I/O,IR , CS等,可以方便開發(fā)者更加精細(xì)化的觀察系統(tǒng)的運(yùn)行狀態(tài)。不過pidstat貌似是在2.6內(nèi)核的一些較新的版本才有,需要安裝sysstat包。

  ubuntu下,可以通過sudo apt-get install sysstat進(jìn)行安裝。

  sar命令

  命令:sar -x pid 1 1000

  sar也可以指定對應(yīng)的pid,關(guān)注固定的幾個參數(shù),沒有pidstat那么強(qiáng)大。 看不到對應(yīng)的I/O, IR等信息。

  sar的功能可以覆蓋mpstat , iostat的相關(guān)功能。

  dstat命令

  命令:dstat -y --tcp 1 1000

  通過dstat --tcp可以比較方便的看到當(dāng)前的tcp的各種狀態(tài),不需要每次netstat -nat去看

  其他命令

  netstat -natp : 查看對應(yīng)的網(wǎng)絡(luò)鏈接,關(guān)注下Recv-Q , Send-Q , State。

  lsof -p pid : 查找對應(yīng)pid的文件句柄

  lsof -i : 80 : 查找對應(yīng)端口被哪個進(jìn)程占用

  lsof /tmp/1.txt :查找對應(yīng)文件被哪個進(jìn)程占用

  tcpdump / wireshark :抓包分析工具

  jstat / jmap / jstack / jps 等一系列的java監(jiān)控命令

  最后

  如果你想做一些性能調(diào)優(yōu)的工作,一定要善于利用一些工具進(jìn)行關(guān)注相應(yīng)的狀態(tài)。通過linux命令你可以比較方便的觀測到CPU , I/O , network等一些比較外圍的狀態(tài), 很多時候就已經(jīng)可以解決大部分的問題。jvm內(nèi)部的一些運(yùn)行狀態(tài)監(jiān)控,得需要借助一些特有的工具進(jìn)行細(xì)粒度的觀測。

  上面就是Linux系統(tǒng)監(jiān)控命令的介紹了,通過這些命令可以方便開發(fā)者觀察系統(tǒng)的運(yùn)行狀態(tài),這些命令都是在系統(tǒng)監(jiān)控中會使用到了,最好記一下吧。

304104