Linux下網(wǎng)卡驅(qū)動(dòng)安裝及故障排除
網(wǎng)卡是Linux服務(wù)器中最重要網(wǎng)絡(luò)設(shè)備。據(jù)統(tǒng)計(jì),Linux網(wǎng)絡(luò)故障有35%在物理層、25%在數(shù)據(jù)鏈路層、10%在網(wǎng)絡(luò)層、10%在傳輸層、10%在對(duì)話、7%在表示層、3%在應(yīng)用層。由此可以看出,網(wǎng)絡(luò)故障通常發(fā)生在網(wǎng)絡(luò)七層模型的下三層,即物理層、鏈路層和網(wǎng)絡(luò)層。對(duì)應(yīng)于實(shí)際網(wǎng)絡(luò)也就是使用的網(wǎng)絡(luò)線纜、網(wǎng)卡、交換機(jī)、路由器等設(shè)備故障。Linux的網(wǎng)絡(luò)實(shí)現(xiàn)是模仿FreeBSD的,它支持FreeBSD的帶有擴(kuò)展的Sockets(套接字)和TCP/IP協(xié)議。它支持兩個(gè)主機(jī)間的網(wǎng)絡(luò)連接和Sockets通訊模型,實(shí)現(xiàn)了兩種類(lèi)型的Sockets:BSD Sockets和INET Sockets。它為不同的通信模型和服務(wù)質(zhì)量提供了兩種傳輸協(xié)議,即不可靠的、基于消息的UDP傳輸協(xié)議和可靠的、基于流的傳輸協(xié)議TCP,并且都是在IP網(wǎng)絡(luò)協(xié)議上實(shí)現(xiàn)的。INET sockets是在以上兩個(gè)協(xié)議及IP協(xié)議之上實(shí)現(xiàn)的。
由于交換機(jī)、路由器通常獨(dú)立于Linux或者其他操作系統(tǒng)。網(wǎng)卡設(shè)置故障是造成Linux 服務(wù)器故障最主要原因。可能因?yàn)橛布馁|(zhì)量或性能、磨損老化、人為誤操作、不正確的網(wǎng)絡(luò)設(shè)置、管理問(wèn)題、Linux軟件的BUG、系統(tǒng)受到黑客攻擊和Linux病毒等原因造成。
Linux 服務(wù)器網(wǎng)卡故障排除的思路是:應(yīng)當(dāng)遵循先硬件后軟件的方法。因?yàn)橛布绻霈F(xiàn)物理?yè)p壞那么如何設(shè)定網(wǎng)卡都不能解決故障。解決問(wèn)題的方法可以從自身Linux計(jì)算機(jī)的網(wǎng)卡查起,如果確定硬件沒(méi)有問(wèn)題了,再來(lái)考慮軟件的設(shè)定。
1. 網(wǎng)卡的選擇
一般來(lái)說(shuō),2.4版本以后的 Linux可以支持的網(wǎng)卡芯片組數(shù)量已經(jīng)很完備了,包括著名廠商如:Intel 以及使用廣泛的 RealTek, Via 等網(wǎng)卡芯片都已經(jīng)被支持,所以使用者可以很輕易的設(shè)定好他們的網(wǎng)絡(luò)卡。但是由于Linux發(fā)行版本眾多(目前超過(guò)188個(gè)),使用前最好查看Linux發(fā)行版本的文檔。以Redhat Linux 9.0為例,這個(gè)設(shè)備列表在Ethernet- HOWTO文檔中。另外最直接的方法是查看一個(gè)目錄:/lib/modules/release/kernel/drivers/net,其中release是內(nèi)核版本,可以使用命令:“uname -r”獲得。對(duì)于Redhat Linux 9.0是2.4.20-8。
#ls /lib/modules/2.4.20-8/kernel/drivers/net/
3c501.o atp.o eth16i.o ni52.o smc-ultra.o
3c503.o bonding.o ethertap.o ni65.o starfire.o
3c505.o cs89x0.o ewrk3.o ns83820.o strip.o
3c507.o de4x5.o fc pcmcia sundance.o
3c509.o de600.o fealnx.o pcnet32.o sungem.o
3c515.o de620.o hamachi.o plip.o sunhme.o
3c59x.o defxx.o hamradio ppp_async.o tc35815.o
8139cp.o depca.o hp100.o ppp_deflate.o tg3.o
8139too.o dgrs.o hp.o ppp_generic.o tlan.o
82596.o dl2k.o hp-plus.o ppp_synctty.o tokenring
8390.o dmfe.o irda r8169.o tulip
ac3200.o dummy.o lance.o rcpci.o tulip_old
acenic.o e100 lne390.o sb1000.o tun.o
aironet4500_card.o e1000 lp486e.o shaper.o via-rhine.o
aironet4500_core.o e2100.o mii.o sis900.o wan
aironet4500_proc.o eepro100.o natsemi.o sk98lin wavelan.o
amd8111e.o eepro.o ne2k-pci.o skfp wd.o
appletalk eexpress.o ne3210.o slhc.o winbond-840.o
arlan.o epic100.o ne.o slip.o wireless
arlan-proc.o eql.o netconsole.o smc9194.o wireless_old
at1700.o es3210.o ni5010.o smc-ultra32.o yellowfin.o
可以看到這個(gè)目錄列出所有Linux內(nèi)核支持的網(wǎng)絡(luò)設(shè)備驅(qū)動(dòng)程序。其中大部分是以太網(wǎng)卡(8139、3COM、Intel)。也有一些是其他類(lèi)型設(shè)備。對(duì)于初學(xué)者應(yīng)當(dāng)盡量選擇目錄中已經(jīng)列出的網(wǎng)卡。注意以.o 后綴結(jié)束的文件就是驅(qū)動(dòng)程序。而沒(méi)有后綴的是驅(qū)動(dòng)程序目錄(紅色)。
2.檢查網(wǎng)卡是否加載:
驅(qū)動(dòng)硬件是操作系統(tǒng)最基本的功能,操作系統(tǒng)通過(guò)各種驅(qū)動(dòng)程序來(lái)駕馭硬件設(shè)備,和Windows系統(tǒng)不同Linux內(nèi)核目前采用可加載的模塊化設(shè)計(jì)(LKMs Loadable Kernel Modules),就是將最基本的核心代碼編譯在內(nèi)核中,網(wǎng)卡驅(qū)動(dòng)程序是作為內(nèi)核模塊動(dòng)態(tài)加載的。可以使用命令“lsmod”查看加載情況:
## lsmod
Module Size Used by
dm_mod 54741 0
button 6481 0
battery 8901 0
ac 4805 0
md5 4033 1
joydev 10241 0
uhci_hcd 31065 0
ehci_hcd 30917 0
snd_via82xx 26437 0
snd_ac97_codec 63889 1 snd_via82xx
snd_pcm_oss 49017 0
soundcore 9889 1 snd
tulip 45025 1
via_rhine 23113 2
mii 4673 1 via_rhine
ext3 116809 2
jbd 71257 1 ext3
對(duì)每行而言,第一列是模塊名稱(chēng);第二列是模塊大小;第三列是調(diào)用數(shù)。調(diào)用數(shù)后面的信息對(duì)每個(gè)模塊而言都有所不同。如果 (unused) 被列在某模塊的那行中,該模塊當(dāng)前就沒(méi)在使用。如果 (autoclean) 被列在某模塊的那行中,該模塊可以被 rmmod -a 命令自動(dòng)清洗。當(dāng)這個(gè)命令被執(zhí)行后,所有自從上次被自動(dòng)清洗后未被使用的被標(biāo)記了“autoclean”的模塊都會(huì)被卸載。叢以上紅色粗體字符可以看到筆者Linux計(jì)算機(jī)中兩塊網(wǎng)卡模塊:tulip和via_rhine 已經(jīng)加載。對(duì)應(yīng)的網(wǎng)卡商業(yè)型號(hào)分別是:
tulip:Lite-On Communications Inc LNE100TX [Linksys EtherFast 10/100]
via_rhine:Via VT6102[Rhine-II] 常見(jiàn)主板集成網(wǎng)卡。
如果沒(méi)有檢測(cè)到硬件,用硬件檢測(cè)程序kuduz檢測(cè)網(wǎng)卡,它和Windows中添加新硬件差不多。kudzu程序是通過(guò)查看/usr/share/hwdata/目錄下的文件識(shí)別各種硬件設(shè)備的。如果核心支持該硬件,并且有該驅(qū)動(dòng)程序就可自動(dòng)裝載。首先說(shuō)明的是Linux下對(duì)網(wǎng)卡的支持往往是只對(duì)芯片的,所以對(duì)某些不是很著名的網(wǎng)卡,往往需要知道它的芯片型號(hào)以配置Linux.比如我的Top link網(wǎng)卡,就不存在Linux的驅(qū)動(dòng),但是因?yàn)樗荖E2000兼容,所以把它當(dāng)NE2000就可以在Linux下用了.所以當(dāng)你有一塊網(wǎng)卡不能用,在找Linux的驅(qū)動(dòng)程序之前一定搞清楚這個(gè)網(wǎng)卡用的什么芯片,跟誰(shuí)兼容,比如3c509,ne2000等。這樣的型號(hào)一般都在網(wǎng)卡上最大的一快芯片上印著,抄下來(lái)就是了。對(duì)于ISA接口的NE2000卡,先要作的一件事情,是將網(wǎng)卡設(shè)定為Jumpless模式.很多現(xiàn)在的網(wǎng)卡缺省 都是PnP模式,這在Windows下的確能減少很多麻煩,但是Linux不支持,所以Linux下必須是Jumpless模式.一般所有網(wǎng)卡都有帶的驅(qū)動(dòng)盤(pán)和DOS下可執(zhí)行的一個(gè)設(shè)定程序,用該程序?qū)⒕W(wǎng)卡設(shè)為 Jumpless。對(duì)于PCI網(wǎng)卡,可以使用命令來(lái)查看:lspci。在顯示的列表中找到“Ethernet Controller”,記下廠商和型號(hào)。然后使用modprobe嘗試加載正確的模塊,比如modprobe 3c509。如果出現(xiàn)錯(cuò)誤,說(shuō)明該模塊不存在。這時(shí)候你應(yīng)該找到正確的模塊并且重新編譯。問(wèn)題一般即可解決。
如果很不幸的,您使用的是比較罕見(jiàn)的一些網(wǎng)卡,或者是 Linux 核心支持不夠的網(wǎng)卡,以致于在安裝 Linux 時(shí),并無(wú)法檢測(cè)到網(wǎng)卡,那也不用擔(dān)心,我們可以使用較為簡(jiǎn)單的核心模塊編譯來(lái)支持這張網(wǎng)卡。下面以筆者的3Com的3CR990-TX-97 網(wǎng)卡為例(一款具有安全特性網(wǎng)卡)看看如何進(jìn)行模塊編譯。首先在其網(wǎng)站http://www.3com.com/infodeli/tools/nic/linuxdownload.htm 下載合適你使用內(nèi)核版本的相關(guān)驅(qū)動(dòng)程序,這里以2.4內(nèi)核為例。
#wegt http://www.3com.com/infodeli/tools/nic/3c990-1.0.0a.tar.gz
另外在開(kāi)始編譯核心模塊之前,因?yàn)轵?qū)動(dòng)程序需要配合核心來(lái)編譯,所以會(huì)使用到 kernel source 或者是 kernel header 的數(shù)據(jù),此外,也需要編譯器 ( compiler ) 的幫助,因此,先確定您的 Linux 系統(tǒng)當(dāng)中已經(jīng)下列軟件的存在 :kernel-source 、kernel 、gcc 、make。
#tar zxvf 3c990-1.0.0a.tar.gz
#make
此時(shí)會(huì)產(chǎn)生3c990.o 驅(qū)動(dòng)模塊。然后使用命令拷貝到相應(yīng)地方然后查看加載是否正常。
#modprobe 3c990
#cp 3c990.o /lib/modules/2.4.20-8/kernel/drivers/net
# depmod -a
然后使用lsmod 命令檢查加載情況,如果一切正常的話?梢宰屜到y(tǒng)啟動(dòng)時(shí)自動(dòng)加載該模塊:
#echo “alias eth0 3c990”>;>; /etc/modules.conf