我們知道,內(nèi)存可以看做一個非常大的數(shù)組,我們想要查找內(nèi)存中某個元素的話,會通過數(shù)組的下標(biāo)來指定,內(nèi)存也是如此,不過這有一個前提是這個數(shù)組是由一組有序的字節(jié)組成的,在這個有序的字節(jié)數(shù)組中,每個字節(jié)都有一個唯一的地址,這個地址也叫做內(nèi)存地址。
內(nèi)存中存儲著很多對象,每個對象是由不同字節(jié)組成的,比如一個 char 對象,一個 byte 對象,一個 int 對象等等,它們都分部在內(nèi)存的各個位置中,CPU 對內(nèi)存中這些對象的地址進行定位的操作就叫做內(nèi)存尋址。內(nèi)存總線寬度決定了可以尋址多少位的內(nèi)存地址,從地址0開始計算。由于 80X86 是 32 位的,所以總線寬度也是 32 位,因此一共有 2 ^ 32 個內(nèi)存地址,所以總共可以存放 4GB 的內(nèi)存地址。可以通過連續(xù)的內(nèi)存地址來提取多個字節(jié)的數(shù)據(jù)類型,比如 int、long、double。
雖然能夠?qū)ぶ返綄ο螅沁@些對象存放的字節(jié)順序是不同的,這里分為兩種存放方式,即大端法和小端法。
比如現(xiàn)在有一個 int 類型的對象,位于地址 0x100 處,它的十六進制數(shù)值是 0x01234567,我給你畫一幅圖你就明白這兩個存放順序的區(qū)別了。
這個其實很好理解,0x01234567 的 int 數(shù)據(jù)類型可以拆分為 01 23 45 67 個字節(jié),并且 01 是高位,67 是低位,于是可以解釋小端法和大端法的存儲順序:即小端法是低位在前,而大端法是高位在前。大端法和小端法只是存儲順序的區(qū)別,和對象的位數(shù)、數(shù)值無關(guān)。大多數(shù) Intel 機器都采用的是小端模式,所以 80X86 也是小端存儲,而一些 IBM 和 Oracle 的大多數(shù)機器都是使用的大端存儲方式。
由于計算機是無法直接將內(nèi)存中的數(shù)據(jù)一次性全部尋址完畢,因為它相對實在太過龐大,所以內(nèi)存一般會進行分段,這里就涉及一個疑問:即內(nèi)存為什么要分段。我上面只是籠統(tǒng)的介紹了下。
內(nèi)存為什么要分段?
https://www.php.cn/link/d005ce7aeef46bd18515f783fb8e87fa
使用分段機制,內(nèi)存空間被劃分為線性區(qū)域,每個線性區(qū)域可以通過段基址加上段內(nèi)偏移來定位。段基址部分由 16 位的段選擇符來指定,其中 14 位是可以選擇 2 ^ 14 次方即 16384 個段,段內(nèi)偏移地址部分使用 32 位的值來指定,因此段內(nèi)地址可以是 0 – 4G ,一個段的最大長度是 4 GB,這也就和上面所說的 4 GB 的內(nèi)存地址相呼應(yīng)。由 16 位段和 32 位段內(nèi)偏移構(gòu)成的 48 位地址或長指針稱為一個邏輯地址,邏輯地址就是虛擬地址。
X86架構(gòu)中有六個特殊的寄存器用于存放段基址,它們分別是CS、DS、ES、SS、FS和GS。其中 CS 用于尋址代碼段,SS 用于尋址堆棧段,其他寄存器用于尋址數(shù)據(jù)段。在任何指定時刻由 CS 尋址的段稱為當(dāng)前代碼段。當(dāng)前代碼段內(nèi)下一條需要執(zhí)行的指令的偏移地址已經(jīng)存在于EIP寄存器中。此時的段基址:偏移地址就可以表示為 CS:EIP 了。
由段寄存器 SS 尋址的段稱為當(dāng)前堆棧段,棧頂由 ESP 寄存器給出,在任何時刻 SS:ESP 都指向棧頂,并且沒有例外情況,其他四個是通用數(shù)據(jù)段寄存器,當(dāng)指令中默認(rèn)沒有數(shù)據(jù)段時,由 DS 給出。
地址轉(zhuǎn)換
通常,一個完整的內(nèi)存管理系統(tǒng)由兩個組成部分組成:訪問保護和地址轉(zhuǎn)換。訪問保護是為了防止一個應(yīng)用程序訪問的內(nèi)存地址是另一塊程序所使用的;地址轉(zhuǎn)換就是給不同的應(yīng)用程序提供一個動態(tài)的地址分配方式。訪問保護和地址轉(zhuǎn)換是相輔相成的。
地址轉(zhuǎn)換通常以內(nèi)存塊作為基本單位,這里解釋下什么是塊,大家知道在 Linux 中,一切都是文件,而文件就是由一個個的塊構(gòu)成的,塊(block)是用于描述文件系統(tǒng)的組成單位,也是數(shù)據(jù)處理的基本單位。常見的塊有不同大小,如 512B、1KB、4KB 等,雖然塊是基本單位,但它實質(zhì)上是由一個個扇區(qū)構(gòu)成的。
地址轉(zhuǎn)換有兩種實現(xiàn)方式:分段機制和分頁機制。x86 在內(nèi)存管理的實現(xiàn)方式結(jié)合了分段和分頁機制,下面是虛擬地址經(jīng)過分段和分頁后轉(zhuǎn)換為物理地址的映射圖
針對這張圖,有必要解釋一下:
首先,這張圖包含三個地址和這三個地址的轉(zhuǎn)換過程,從大體上來看,邏輯地址會經(jīng)過分段基址轉(zhuǎn)換后變?yōu)榫€性地址,線性地址是保護模式下的段基址 + 段內(nèi)偏移,因此這張圖是保護模式下的地址轉(zhuǎn)換圖。線性地址會經(jīng)過分頁機制后轉(zhuǎn)換為物理地址,前提是需要開啟分頁機制;如果沒有開啟分頁機制,線性地址 = 物理地址。
需要再說一下邏輯地址,邏輯地址里面包含段選擇子和段內(nèi)偏移,段選擇子這個概念我剛開始接觸也比較模糊,簡單一點來說可以把它理解為是保護模式下的段基址,大家知道段基址是 16 位的,而段內(nèi)偏移是 32 位的。
很多書或者文章中都提到了段選擇符,其實段選擇子就是段選擇符,這完全是翻譯問題,英文都是 selector。
后面會提到段描述符,段描述符和段選擇子不是一回事,但段選擇子是一個 16 位的段描述符。
再和大家說一下這個圖上沒有寫出來的內(nèi)容,現(xiàn)在大家知道邏輯地址可以轉(zhuǎn)換為線性地址,線性地址可以轉(zhuǎn)換為物理地址,那么根源是如何轉(zhuǎn)換的呢?實際上這里使用的方式是 MMU(內(nèi)存管理單元)進行轉(zhuǎn)換;而線性地址轉(zhuǎn)換為物理地址使用的是分頁單元的硬件電路。本文的重點不在于討論具體的轉(zhuǎn)換過程,而是將重點放在分段和分頁這兩個機制上。
下面來詳細(xì)聊一聊分段和分頁這兩個機制。
分段機制
這里推薦大家先看一下我寫的 “內(nèi)存為什么要分段” 的那段描述。
https://www.php.cn/link/d005ce7aeef46bd18515f783fb8e87fa
多個程序在同一個內(nèi)存空間中運行,不會相互干擾,這是因為分段提供了隔離代碼、數(shù)據(jù)和堆棧區(qū)域的機制。如果 CPU 中有多個程序或者任務(wù)正在運行,那么每個程序都可以分配各自的一套段(包含程序代碼、數(shù)據(jù)和堆棧),CPU 通過加強段之間的界限來達到防止應(yīng)用程序相互干擾的目的。
一個系統(tǒng)中所有使用的段都包含在 CPU 的線性地址空間中。為了定位指定段中的字節(jié),程序必須提供邏輯地址才能進行轉(zhuǎn)換。邏輯地址包含段選擇子和段內(nèi)偏移,每個段都有一個段描述符,段描述符用于指出段的大小、訪問權(quán)限和段的特權(quán)級、段類型以及段第一個字節(jié)在線性地址空間中的位置(段基址)。邏輯地址的偏移量部分加到段基址上就可以定位段中某個字節(jié)的位置,因此段基址 + 偏移量形成了 CPU 線性地址空間中的地址。
線性地址空間與物理地址空間具有相同的結(jié)構(gòu),但是它們所能容納的段相差甚遠(yuǎn),虛擬地址也就是邏輯地址空間可包含最多 16 K 的段,而每個段可容納的大小為 4 GB ,所以虛擬地址總共能查找到 64TB(2 ^ 46) 的段,線性地址和物理地址的空間是 4GB (2 ^ 32)。所以,如果禁用了分頁機制,那么線性地址空間就是物理地址空間。
這幅圖就是邏輯地址 -> 線性地址 -> 物理地址的映射圖,GDT 表和 LDT 表各占一半的地址空間,各為 8192 個段,每個段最長為 4 G,從 GDT 表還是 LDT 表查詢,具體從哪個表查還是要看段選擇子的 TI 屬性,段選擇子的結(jié)構(gòu)如下所示
段選擇子總共分為三個部分:
- RPL(Request Privilege Level):請求特權(quán)級,表示進程應(yīng)該以什么權(quán)限來訪問段,數(shù)值越大權(quán)限越小。TI(Table Indicator):表示應(yīng)該查詢哪個表,TI = 0 查 GDT 表;TI = 1 查 LDT 表。Index:CPU 會自動將 Index * 8,在加上 GDT 和 LDT 中的段基址,就是要加載的段描述符。
這里沒有太細(xì)致的詳解一下段描述符,因為此篇還是偏向于內(nèi)存管理,沒有太執(zhí)著于某個細(xì)節(jié)。
在GDTR中,段選擇子和偏移量組成的邏輯地址可以合成段描述符,并直接保存。段選擇子和段內(nèi)偏移經(jīng)過 MMU 后可以轉(zhuǎn)換成為線性地址。
分頁機制
上面我們說到,線性地址是由邏輯地址轉(zhuǎn)換過來的,如果禁用了分頁機制,線性地址就是物理地址,如果開啟分頁機制,線性地址和邏輯地址空間的數(shù)量還是不同的。一般程序都是多任務(wù)的,而多任務(wù)通常定義的線性地址空間要比物理內(nèi)存容量大得多,為什么呢?地址轉(zhuǎn)換映射圖上畫著明明線性地址和物理地址都是 4G 的大小啊。那是因為,線性地址被虛擬存儲技術(shù)所虛擬化了。
虛擬存儲是一種內(nèi)存管理技術(shù),使用這項技術(shù)可以讓我們產(chǎn)生內(nèi)存空間要比實際的物理內(nèi)存容量大的多的錯覺,其本質(zhì)是把內(nèi)存虛擬化了,就是說內(nèi)存可能只有 4G,但是你以為內(nèi)存有 64 G,所以我為什么能開那么多應(yīng)用程序的原因。
分頁機制其實就是虛擬化的一種實現(xiàn),在虛擬化的環(huán)境中,大量的線性地址空間會映射到一小塊物理內(nèi)存(RAM 或者 ROM)中。當(dāng)進行分頁時,每個段被分割為頁面(通常是4K),這些頁面會被存儲在物理內(nèi)存或磁盤上。操作系統(tǒng)通過使用一個頁目錄和頁表來維護這些頁面。當(dāng)程序試圖訪問線性地址空間中的某一個地址位置時,CPU 就會使用頁目錄和頁表把這個線性地址轉(zhuǎn)換成物理地址,再存儲在物理內(nèi)存上。
如果當(dāng)前訪問的頁面不在物理內(nèi)存中,CPU 就會執(zhí)行中斷,一般錯誤就是頁面異常,然后操作系統(tǒng)會把這個頁面從硬盤上讀入物理內(nèi)存中,然后繼續(xù)從中斷處執(zhí)行程序。操作系統(tǒng)常常頻繁進行頁面換入和換出,這也成為一個性能瓶頸。
在分段中,每個段的長度是不固定的,最大長度為4G;而在分頁中,每個頁面的大小是固定的。不論在物理內(nèi)存還是磁盤上,使用固定大小的頁面更適合管理物理內(nèi)存;而分段機制使用大小可變的塊更適合處理復(fù)雜系統(tǒng)的邏輯分區(qū)。
盡管分段和分頁是兩種不同的地址轉(zhuǎn)換機制,但它們在整個地址變換過程中被獨立處理,每個過程都是獨立的。這兩種機制都使用了一種中間表來存儲表項映射,但是這個中間表的結(jié)構(gòu)是不同的。段表存在線性地址空間中,頁表則存儲在物理地址空間。
保護機制
80×86擁有兩種保護機制,其中一種是通過為每個任務(wù)分配不同的虛擬地址空間來實現(xiàn)任務(wù)之間的完全隔離。這是通過給每個任務(wù)邏輯地址到物理地址的不同變換得到的,每個應(yīng)用程序只能訪問自己虛擬空間內(nèi)的數(shù)據(jù)和指令,只能通過它自己的映射得到物理地址;第二種機制是保護任務(wù),保護操作系統(tǒng)的內(nèi)存段和一些特殊寄存器不會被應(yīng)用程序所訪問。下面我們就來具體探討一下這兩個任務(wù)。
任務(wù)之間的保護
每個任務(wù)會單獨的放在自己的虛擬地址空間中,再經(jīng)過硬件映射成為物理地址,不同的虛擬地址會變換成為不同的物理地址,不會存在 A 的虛擬地址會映射到 B 所在的物理地址的范圍內(nèi),這樣就會把所有的任務(wù)都隔絕開,且不同任務(wù)之間不會相互干擾。
每個任務(wù)都有各自的映射表、段表和頁表,當(dāng) CPU 切換不同的應(yīng)用程序或任務(wù)時,這些表也會進行切換。
虛擬地址是操作系統(tǒng)的抽象,也就是說虛擬地址完全是操作系統(tǒng)所抽象出來能夠更好管理應(yīng)用程序和任務(wù)的一個載體,每個任務(wù)都可以把邏輯地址映射成為虛擬地址,這也表明每個任務(wù)都可以訪問操作系統(tǒng),操作系統(tǒng)可以被所有的任務(wù)所共享。這個所有任務(wù)都具有相同虛擬地址空間的部分被稱為全局地址空間(Global address space),Linux 就使用到了全局地址空間。
全局地址空間中每個任務(wù)都有自己的唯一的虛擬地址空間,這個虛擬地址空間叫做局部地址空間(Local address space)。
內(nèi)存段和寄存器的特殊保護
如果將操作系統(tǒng)在不同任務(wù)之間的保護比喻為橫向保護,那么對內(nèi)存段和寄存器的保護可看作是縱向保護。為了限制對任務(wù)中各段的訪問,操作系統(tǒng)設(shè)定了4個特權(quán)級別,以保護每個任務(wù)。
優(yōu)先級分為 4 個等級,0 最高,3 最低。一般最敏感的數(shù)據(jù)會被賦予最高優(yōu)先級,它們只能被任務(wù)中最受信任的部分訪問,不太敏感的數(shù)據(jù)會賦予低優(yōu)先級;內(nèi)核操作系統(tǒng)訪問一般是 0 級,應(yīng)用程序數(shù)據(jù)一般是 3 級。每個內(nèi)存段都與一個特權(quán)級相關(guān)聯(lián)。
我們知道 CPU 通過 CS 從段中取得指令和數(shù)據(jù)執(zhí)行,從段中取得的指令和數(shù)據(jù)是具有特權(quán)級的,一般用當(dāng)前特權(quán)級(Current Privilege Level)來訪問,CPL 就是當(dāng)前活動代碼的特權(quán)級。當(dāng)應(yīng)用程序嘗試訪問段時,將與該特權(quán)級進行比較,只有低于該段的特權(quán)級才能訪問。
以上就是Linux 保護模式下的內(nèi)存管理的詳細(xì)內(nèi)容,更多請關(guān)注www.92cms.cn其它相關(guān)文章!