1
中斷向量表
你有沒有好奇過,0內(nèi)存地址開始放了些什么東西呢?畢竟是最開始就要用的東西,一定非常重要!沒錯(cuò),那里就是中斷向量表的家。在8086開始,中斷向量表就占據(jù)這里,甚至在我們最新時(shí)髦的酷睿x代,它們還在這里。想不想看看這個(gè)頑固的家伙的樣子?寫個(gè)簡單的 程序:
long *p = (long *) 0;
printf(“%x”, *p);
運(yùn)行下看看。不出所料你的程序?qū)a(chǎn)生一個(gè)異常,導(dǎo)致被強(qiáng)制關(guān)閉。還記得我們前面講過地址轉(zhuǎn)換,這個(gè)0地址是虛擬地址而不是物理地址,在保護(hù)模式下0的虛擬地址訪問會(huì)產(chǎn)生一個(gè)異常,你是訪問不到物理0地址的。我們在內(nèi)核模式使用一些技巧或者我們進(jìn)入實(shí)模式,我們才能看到它們。每個(gè)中斷向量(vector)占據(jù)4個(gè)字節(jié),Intel定義了256個(gè)向量,共用去1KB的內(nèi)存空間。每個(gè)向量樸實(shí)無華,就是一個(gè)地址,指向該中斷(INT)處理函數(shù)的入口,這也是它起名vector的原因。整個(gè)中斷向量表就是一個(gè)大函數(shù)指針表,一個(gè)中斷發(fā)生,CPU硬件就來這里查表,跳到相應(yīng)地址就行了,好方便!實(shí)際情況稍微復(fù)雜點(diǎn),CPU還要保護(hù)現(xiàn)場,將當(dāng)前環(huán)境保存起來(一些寄存器和返回地址等壓棧),以便處理完后返回現(xiàn)場繼續(xù)執(zhí)行。不過相對于我們接下來的保護(hù)模式的中斷處理簡單很多。沒錯(cuò),這個(gè)史前遺跡只在實(shí)模式發(fā)揮作用,我們只草草看看它的樣子就行了:
這里主要是異常處理
硬件中斷向量一區(qū)。和我們上文的8259連接兩相對照一下:
沒錯(cuò),這里就是主8259的IRQ的中斷向量區(qū)。接下來就是BIOS保留區(qū),作為介紹BIOS的專區(qū),這里必須看一下:
PC傳統(tǒng)Legacy BIOS的服務(wù)例程都在這里??吹剿鼈儾粍龠駠u,曾經(jīng)INT 10H打字和INT 13H讀寫磁盤的美(YUAN)好(SHI)日子又浮現(xiàn)在眼前。。。不好,這是個(gè)暴露年齡的話題,后面我們就不講了,下課。
開個(gè)玩笑,不過中斷向量表今天也只在UEFI BIOS為了兼容傳統(tǒng)OS啟動(dòng)的CSM模塊中起作用,我們大致了解一下其中的原理即可。
2
中斷描述符
在PC進(jìn)入保護(hù)模式,一個(gè)復(fù)雜但有很多妙處的機(jī)制代替了中斷向量表,它就是中斷描述符表(IDT,interrupt Descriptor Table)。IDT將每個(gè)中斷或者異常與它的服務(wù)例程連接起來。IDT不再固定放在某個(gè)位置,而是可以放在IDTR寄存器指向的任意內(nèi)存(說是任意,也不能太隨性,有些小要求,如8字節(jié)對齊等),IDT的表項(xiàng)也從4個(gè)字節(jié)擴(kuò)展到8個(gè)字節(jié),大小也可以不滿256,IDTR也指出了它的最大限制。如圖:
IDT除了和中斷向量一樣指向一個(gè)例程地址之外,還包括其他一些信息:
其中的DPL(描述符特權(quán)級)與CS寄存器的CPL完成特權(quán)級的檢查,可以避免低特權(quán)級的代碼通過軟件中斷形式提權(quán)。它的運(yùn)作形式和中斷向量表類似,更多的是安全檢查和可能的執(zhí)行環(huán)境切換(例如ring 3 -> ring 0)。
3
中斷和異常
ARM體系中斷和異常是單獨(dú)處理的,IRQ中斷只是異常列表里的一項(xiàng)而已。X86中斷和異常處理卻混雜在一起,使用同一套機(jī)制,看似比較混亂。其實(shí)異常往往是處理器內(nèi)部發(fā)生的,是同步的;而中斷卻是外部事件,是異步的。而它們的分布也是不同的,0到31號向量保留給異常,而更高的則往往是硬件中斷和軟件中斷。異常分為三種:錯(cuò)誤,陷阱和中止。這三種類型CPU對它們有不同的處理原則:錯(cuò)誤往往是可以恢復(fù)的,錯(cuò)誤修正后再執(zhí)行剛才的錯(cuò)誤就不會(huì)出問題了,改了就是好同志嘛!例如常用于內(nèi)存管理的缺頁異常,OS常常把內(nèi)存換出到硬盤,它會(huì)在頁表上動(dòng)些手腳,CPU再次訪問這塊內(nèi)存會(huì)發(fā)生異常,OS頁面錯(cuò)誤異常例程捕獲到后趕緊把內(nèi)存換回來,然后返回原處執(zhí)行,就像沒事發(fā)生一樣。陷阱是留給軟件挖坑的,CPU希望軟件自己挖的坑自己能填上,它可以裝作沒看見,從下條繼續(xù)。典型的例子是INT 3,我們的幾乎所有調(diào)試工具(VS,windbg,甚至UEFI的source level debugger)都用它添加軟件斷點(diǎn)。中止就嚴(yán)重了,意味著發(fā)生硬件錯(cuò)誤了,它往往能造成Windows藍(lán)屏,linux panic等。異常一覽表如下:
20到31被預(yù)留將來使用。硬件中斷往往就從32開始。
4
中斷優(yōu)先級
PIC模式IRQ數(shù)目越低就意味著優(yōu)先級越高。而在APIC模式下,IOAPIC連接的24個(gè)IRQ是平權(quán)的,先后并不關(guān)乎優(yōu)先級高低。決定中斷優(yōu)先級的是它對應(yīng)的中斷向量的大小,X86體系有256個(gè)vector, 中斷優(yōu)先級的計(jì)算公式是:
優(yōu)先級 = vector num / 16
即每16個(gè)中斷一組,共享一個(gè)優(yōu)先級,共16個(gè)。因?yàn)?2以下vector被異常和保留占據(jù),2到15是中斷的優(yōu)先級。數(shù)字越大越高優(yōu)先級。中斷優(yōu)先級的控制是靠LAPIC的TPR(Task Priority Register,任務(wù)優(yōu)先級寄存器)來控制的,它的結(jié)構(gòu)如下:
TR只有4位標(biāo)識(shí)可以接受的中斷優(yōu)先級,即16個(gè)。CPU內(nèi)核只處理優(yōu)先級比TR大的中斷,也意味著TR每提高一個(gè)數(shù)字,就有16個(gè)中斷被遮蔽!看來我們的中斷要想被趕快處理,必須占個(gè)好位置。那么是不是IRQ數(shù)目越大,vector就越大呢?這是誰來決定的呢?這事可不由BIOS做主,OS是設(shè)置vector的主人。而不同的OS的處理也不近相同,我們具體看一下。
中斷處理實(shí)踐
Windows、Linux和BIOS在處理中斷上有很多區(qū)別。我們從幾個(gè)方面浮光掠影了解一二。
1
中斷向量設(shè)置
PIC如何設(shè)置中斷向量已經(jīng)過時(shí),我們就不提了。這里只介紹APIC模式,如果你還記得上節(jié)關(guān)于IOAPIC的內(nèi)容,其中最重要的PRT表,它由24個(gè)RTE( RedirectionTableEntry)項(xiàng)組成,每一項(xiàng)對應(yīng)一個(gè)IRQ引腳。它的內(nèi)容除了上節(jié)介紹過的Destination Field之外,最低8位是該IRQ對應(yīng)的vector,可以表示256個(gè)vector。OS根據(jù)自己的策略,為IRQ分配不同的vector。
1. Windows:
Windows的HAL在設(shè)置vector時(shí)是根據(jù)系統(tǒng)枚舉硬件時(shí)挨個(gè)設(shè)置的,因?yàn)橄让杜e的設(shè)備其IRQ的大小不確定,所以優(yōu)先級并無一定之規(guī)。從vector不能推導(dǎo)IRQ,IRQ也不能推導(dǎo)vector,可以說全憑運(yùn)氣。為硬件IRQ分配的vector往往從0x31開始分配,應(yīng)該是為了配合Windows的IRQL概念。大家可以在windbg里輸入命令
!idt -a
查看一下自己機(jī)器的vector分配情況。這個(gè)IRQL比較讓人混淆,實(shí)際上它并不是個(gè)硬件概念,和中斷優(yōu)先級并不同,它是微軟定義的一套軟件優(yōu)先級方案。Windows用0到31來表示優(yōu)先級,數(shù)值越大,優(yōu)先級越高。如下圖:
其中DPC/Dispatch是個(gè)分水嶺,運(yùn)行在這個(gè)優(yōu)先級的線程不會(huì)被其他線程搶占。其上3到26是為了外圍硬件保留的。最高的31顯得很高大上,誰的地位這么高?你一定見過它,它就是在Windows藍(lán)屏?xí)r的IRQL。HAL會(huì)把IRQL翻譯到不同的硬件平臺(tái)上,它和X86的中斷優(yōu)先級不是一個(gè)概念。
2. Linux:
Linux沒有IRQL的概念,他的vector就從0x20(32)開始分配,但是因?yàn)?x80(128)因?yàn)闅v史原因,被保留做系統(tǒng)調(diào)用(后改用sysenter指令,但為了兼容,還是保留),整個(gè)空間被一份為二。后面到0xee(238)為止。因?yàn)関ector的大小關(guān)系到優(yōu)先級,分配的時(shí)候?yàn)榱吮WC對各個(gè)IOAPIC公平,分配的時(shí)候在各個(gè)IOAPIC間輪流分配。大家可以在shell里輸入以下命令查看一下中斷向量的分配情況:
cat /proc/interrupts
2
IRQ在多處理器的分發(fā)
還有個(gè)問題十分重要。某個(gè)vector由哪個(gè)CPU內(nèi)核負(fù)責(zé)處理呢?Linux為了公平起見,并不會(huì)對BSP(bootstrap processor)另眼看待,所有內(nèi)核一視同仁。Linux通過填寫IOAPIC的RTE中的Delivery mode選擇最低優(yōu)先級策略,讓TRP都被初始化做固定值,因此IRQ信號就可以公平的在CPU之間分發(fā)。感覺很民主有沒有?(分分鐘被Linus的獨(dú)裁作風(fēng)打臉)。有時(shí)為了優(yōu)化性能,我們可以通過Linux的IRQ親緣性來讓特定內(nèi)核為我們服務(wù)。我們可以通過命令
cat /proc/irq/xx/smp_affinity
查看xx IRQ由誰處理,如果是f的話代表是缺省策略,即大家都可以處理。我們可以通過下面命令分配個(gè)專有內(nèi)核處理
echo 2 >/proc/irq/xx/smp_affinity
讓APIC ID為2的內(nèi)核處理。或者通過一些Irqbalance類似的工具來幫我們配置。
3
UEFI固件中的中斷
UEFI固件內(nèi)核中對異常和中斷都有處理,還包含很多使用IPI調(diào)度內(nèi)核的源程序,程序短小精干,包括大量注釋。感興趣的同學(xué)可以通過它學(xué)習(xí)中斷處理和CPU內(nèi)核調(diào)度。
1. 異常
UEFI內(nèi)核對IDT的初始化程序在UefiCpuPkg的Library/CpuExceptionHandlerLib下。內(nèi)核為所有的的中斷和異常都分配了統(tǒng)一的入口CommonExceptionHandler。它對任何中斷和異常沒有任何特殊處理,如果沒有人對該中斷或異常做處理就會(huì)dump一些現(xiàn)在的CPU狀態(tài)如APIC ID, 異常類型等,然后調(diào)用CpuDeadLoop陷入死循環(huán),這也是UEFI工程師常見的畫面。UEFI驅(qū)動(dòng)可以在自己關(guān)心的異常中添加自己的處理函數(shù),如支持通過串口和USB源程序級調(diào)試UEFI程序的Source Level Debugger就是個(gè)典型的例子,它Hook住了很多異常,用于調(diào)試和捕捉錯(cuò)誤,
2. 中斷
UEFI的CSM模塊還兼容以前BIOS使用的INT x軟中斷方式調(diào)用BIOS服務(wù)。隨著UEFI的廣泛推廣和傳統(tǒng)OS的漸漸淘汰,CSM也日薄西山,有些僅僅面向最新OS的項(xiàng)目都不含CSM的支持,所以關(guān)于它的內(nèi)容這里略過。在保護(hù)模式下,UEFI內(nèi)核僅僅對時(shí)鐘中斷進(jìn)行了處理,并通過Timer Architectural Protocol開放出來供所有UEFI程序調(diào)用。也許你會(huì)好奇,那么多種USB設(shè)備和網(wǎng)卡等等的UEFI驅(qū)動(dòng)難道不需要中斷處理?是的,他們的中斷在UEFI階段都沒有開啟,他們的驅(qū)動(dòng)通過Timer加Polling的方式來處理。舉個(gè)例子,我們在UEFI Shell 下插入鍵盤,它能立刻起作用不是如在OS中USB控制器產(chǎn)生了中斷。而是USB驅(qū)動(dòng)注冊了個(gè)Timer,過一會(huì)就Poll一下看看有沒有新設(shè)備插入。就是這個(gè)Timer發(fā)現(xiàn)了新插入的鍵盤的。
這種僅僅依靠Timer的做法在OS階段是行不通的,會(huì)帶來嚴(yán)重的效能和功耗問題。但是在Boot階段卻問題不大,而且這樣做保證了UEFI內(nèi)核的簡潔性。事實(shí)上,UEFI并不禁止驅(qū)動(dòng)自己開啟中斷,但開啟中斷需要處理的中斷共享、IOAPIC設(shè)置等等問題需要驅(qū)動(dòng)自己解決,UEFI并不提供支持。
3. IPI
內(nèi)核可以通過寫自己LAPIC的ICR(Interrupt Command Register)發(fā)出IPI((Inter-Processor Interrupt)調(diào)度別的內(nèi)核完成任務(wù),這也是任務(wù)調(diào)度的基本方法。事實(shí)上,因?yàn)锳PIC ID的不連續(xù)性,我們正是通過發(fā)送IPI的方法來統(tǒng)計(jì)內(nèi)核的數(shù)量。BSP在啟動(dòng)時(shí)需要統(tǒng)計(jì)系統(tǒng)中可用的內(nèi)核時(shí),發(fā)送廣播IPI,讓大家都來報(bào)道,BSP開始點(diǎn)數(shù),1,2,3。。。并一一記錄在案。在啟動(dòng)OS前,通過ACPI table告訴OS有多少個(gè)內(nèi)核。OS不應(yīng)該自己統(tǒng)計(jì)內(nèi)核數(shù)目,事實(shí)上固件可以通過瞞報(bào)內(nèi)核的方式將部分內(nèi)核挪作他用,但誰會(huì)這么做呢?
如何發(fā)起IPI在CPU package里有大量實(shí)例和庫,大家可以參考。
其他
一些容易混淆的名詞這里要特別說明一下
IRQ x:起源于PIC,指中斷引腳,后在APIC時(shí)代沿用,泛指中斷號。
Vector x/INT x: X是中斷向量,如前文所說 IRQ不等于INT和vector.
PIRQ : PCI IRQ。它是描述南橋內(nèi)部PCI設(shè)備的IRQ配置關(guān)系的。我們下一篇文章介紹。
GSI :Global System Interrupt,是ACPI spec規(guī)定的全局中斷表。它為多IOAPIC情況下確定了系統(tǒng)唯一的一個(gè)中斷號。例如IOAPIC1有24個(gè)IRQ,IOAPIC2也有24個(gè)IRQ,則IOAPIC2 的GSI是從24開始,GSI = 24 + IRQ(IOAPIC2)。
SCI :System Control Interrupt,系統(tǒng)控制中斷,是ACPI定義的,專用于ACPI電源管理的一個(gè)IRQ。它在Intel平臺(tái)上常常與南橋的電源管理模塊一起,當(dāng)外部EC等發(fā)生Event后會(huì)引發(fā)SCI。Windows的SCI ISR程序就是著名的acpi.sys。acpi.sys在收到SCI后會(huì)檢查GPE狀態(tài)寄存器以確定是誰引發(fā)的event,然后按照ACPI spec要求調(diào)用相應(yīng)Method。詳情請參照ACPI spec??梢哉J(rèn)為SCI是ACPI定義的所有電源管理事件的總?cè)肟?,它對?yīng)的IRQ在一般情況下是不能修改的。SCI是如何報(bào)告和簡單的GPE method我們在下一篇中會(huì)詳細(xì)介紹。
結(jié)語
說了這么多,如果我們從硬件和軟件方面,梳理整個(gè)中斷設(shè)置和處理的鏈條,會(huì)發(fā)現(xiàn)還有個(gè)環(huán)節(jié)沒有解決。那就設(shè)備的IRQ是誰來決定的?是硬件hard wired?還是軟件可以配置?OS是如何知道這些信息的呢?OS又是怎么知道IOAPIC的數(shù)目和位置的呢?這些都是UEFI固件需要解決的問題,我們在下一篇文章中會(huì)詳細(xì)說明。在此之前,如以往一樣,有幾個(gè)思考問題可以讓大家加深對中斷和UEFI的理解:
1.中斷的引入,必然帶來了代碼重入的問題。我們知道,這可以通過設(shè)定優(yōu)先級、信號量/臨界區(qū)等等辦法來解決。UEFI是通過什么方法呢?TPL和IRQL的相似和區(qū)別又是什么呢?
2.UEFI內(nèi)核還不支持多線程,我們?nèi)绻枰黾佣嗑€程調(diào)度,僅僅依靠時(shí)鐘中斷,夠不夠用呢?
3.OS利用缺頁異常可以調(diào)度內(nèi)存到硬盤上和實(shí)現(xiàn)Lazy loading等等實(shí)用的功能。UEFI的SMM內(nèi)核也開啟了缺頁異常,但是卻為了另外一個(gè)目的,你能看出是為了什么嗎?
-
寄存器
+關(guān)注
關(guān)注
31文章
5372瀏覽量
121305 -
ARM處理器
+關(guān)注
關(guān)注
6文章
361瀏覽量
41960 -
中斷處理
+關(guān)注
關(guān)注
0文章
94瀏覽量
11023 -
Linux驅(qū)動(dòng)
+關(guān)注
關(guān)注
0文章
43瀏覽量
10026 -
DPL芯片
+關(guān)注
關(guān)注
0文章
2瀏覽量
5769
發(fā)布評論請先 登錄
相關(guān)推薦
ARM系統(tǒng)預(yù)引導(dǎo)固件的新機(jī)遇-UEFI
UEFI有什么定義?
如何切換BIOS啟動(dòng)與UEFI啟動(dòng) bios與uefi切換方法
結(jié)合生活例子,講講中斷和處理流程。
中斷處理函數(shù)(IRQHandler)的標(biāo)準(zhǔn)流程
linux中斷處理之IRQ中斷
處理器中異常和中斷解決
STM32中斷系統(tǒng)(NVIC和EXTI)
![STM32<b class='flag-5'>中斷</b>系統(tǒng)(NVIC和EXTI)](https://file.elecfans.com/web1/M00/D9/4E/pIYBAF_1ac2Ac0EEAABDkS1IP1s689.png)
評論