學(xué)習(xí)啦 > 學(xué)習(xí)電腦 > 操作系統(tǒng) > Linux教程 > linux命令之wget命令

linux命令之wget命令

時(shí)間: 佳洲1085 分享

linux命令之wget命令

  wget命令是linux下用來(lái)從指定的url地址下載文件。下面由學(xué)習(xí)啦小編為大家整理了linux命令之wget命令的相關(guān)知識(shí),希望對(duì)大家有所幫助!

  linux命令之wget命令詳解

  wget命令用來(lái)從指定的URL下載文件。wget非常穩(wěn)定,它在帶寬很窄的情況下和不穩(wěn)定網(wǎng)絡(luò)中有很強(qiáng)的適應(yīng)性,如果是由于網(wǎng)絡(luò)的原因下載失敗,wget會(huì)不斷的嘗試,直到整個(gè)文件下載完畢。如果是服務(wù)器打斷下載過(guò)程,它會(huì)再次聯(lián)到服務(wù)器上從停止的地方繼續(xù)下載。這對(duì)從那些限定了鏈接時(shí)間的服務(wù)器上下載大文件非常有用。

  語(yǔ)法

  wget(選項(xiàng))(參數(shù))

  選項(xiàng)

  -a<日志文件>:在指定的日志文件中記錄資料的執(zhí)行過(guò)程;

  -A<后綴名>:指定要下載文件的后綴名,多個(gè)后綴名之間使用逗號(hào)進(jìn)行分隔;

  -b:進(jìn)行后臺(tái)的方式運(yùn)行wget;

  -B<連接地址>:設(shè)置參考的連接地址的基地地址;

  -c:繼續(xù)執(zhí)行上次終端的任務(wù);

  -C<標(biāo)志>:設(shè)置服務(wù)器數(shù)據(jù)塊功能標(biāo)志on為激活,off為關(guān)閉,默認(rèn)值為on;

  -d:調(diào)試模式運(yùn)行指令; -D<域名列表>:設(shè)置順著的域名列表,域名之間用“,”分隔; -e<指令>:作為文件“.wgetrc”中的一部分執(zhí)行指定的指令;

  -h:顯示指令幫助信息;

  -i<文件>:從指定文件獲取要下載的URL地址;

  -l<目錄列表>:設(shè)置順著的目錄列表,多個(gè)目錄用“,”分隔;

  -L:僅順著關(guān)聯(lián)的連接;

  -r:遞歸下載方式;

  -nc:文件存在時(shí),下載文件不覆蓋原有文件;

  -nv:下載時(shí)只顯示更新和出錯(cuò)信息,不顯示指令的詳細(xì)執(zhí)行過(guò)程;

  -q:不顯示指令執(zhí)行過(guò)程; -nh:不查詢主機(jī)名稱(chēng); -v:顯示詳細(xì)執(zhí)行過(guò)程;

  -V:顯示版本信息;

  --passive-ftp:使用被動(dòng)模式PASV連接FTP服務(wù)器;

  --follow-ftp:從HTML文件中下載FTP連接文件。

  參數(shù)

  URL:下載指定的URL地址。

  linux命令之wget命令實(shí)例

  測(cè)試下載鏈接

  當(dāng)你打算進(jìn)行定時(shí)下載,你應(yīng)該在預(yù)定時(shí)間測(cè)試下載鏈接是否有效。我們可以增加--spider參數(shù)進(jìn)行檢查。

  wget --spider URL

  如果下載鏈接正確,將會(huì)顯示:

  Spider mode enabled. Check if remote file exists.

  HTTP request sent, awaiting response... 200 OK

  Length: unspecified [text/html]

  Remote file exists and could contain further links,

  but recursion is disabled -- not retrieving.

  這保證了下載能在預(yù)定的時(shí)間進(jìn)行,但當(dāng)你給錯(cuò)了一個(gè)鏈接,將會(huì)顯示如下錯(cuò)誤:

  wget --spider url

  Spider mode enabled. Check if remote file exists.

  HTTP request sent, awaiting response... 404 Not Found

  Remote file does not exist -- broken link!!!

  你可以在以下幾種情況下使用--spider參數(shù):

  定時(shí)下載之前進(jìn)行檢查

  間隔檢測(cè)網(wǎng)站是否可用

  檢查網(wǎng)站頁(yè)面的死鏈接

  增加重試次數(shù)

  wget --tries=40 URL

  如果網(wǎng)絡(luò)有問(wèn)題或下載一個(gè)大文件也有可能失敗。wget默認(rèn)重試20次連接下載文件。如果需要,你可以使用--tries增加重試次數(shù)。

  下載多個(gè)文件

  wget -i filelist.txt

  首先,保存一份下載鏈接文件:

  cat > filelist.txt

  url1

  url2

  url3

  url4

  接著使用這個(gè)文件和參數(shù)-i下載。

  鏡像網(wǎng)站

  wget --mirror -p --convert-links -P ./LOCAL URL

  下載整個(gè)網(wǎng)站到本地。

  --miror開(kāi)戶鏡像下載。

  -p下載所有為了html頁(yè)面顯示正常的文件。

  --convert-links下載后,轉(zhuǎn)換成本地的鏈接。

  -P ./LOCAL保存所有文件和目錄到本地指定目錄。

  過(guò)濾指定格式下載

  wget --reject=gif ur

  下載一個(gè)網(wǎng)站,但你不希望下載圖片,可以使用這條命令。

  把下載信息存入日志文件

  wget -o download.log URL

  不希望下載信息直接顯示在終端而是在一個(gè)日志文件,可以使用。

  限制總下載文件大小

  wget -Q5m -i filelist.txt

  當(dāng)你想要下載的文件超過(guò)5M而退出下載,你可以使用。注意:這個(gè)參數(shù)對(duì)單個(gè)文件下載不起作用,只能遞歸下載時(shí)才有效。

  下載指定格式文件

  wget -r -A.pdf url

  可以在以下情況使用該功能:

  下載一個(gè)網(wǎng)站的所有圖片。

  下載一個(gè)網(wǎng)站的所有視頻。

  下載一個(gè)網(wǎng)站的所有PDF文件。

  FTP下載

  wget ftp-url

  wget --ftp-user=USERNAME --ftp-password=PASSWORD url

  可以使用wget來(lái)完成ftp鏈接的下載。

  使用wget匿名ftp下載:

  wget ftp-url

  使用wget用戶名和密碼認(rèn)證的ftp下載:

  wget --ftp-user=USERNAME --ftp-password=PASSWORD url

3604745