本文是關(guān)于 fork 和 exec 是如何在 Unix 上工作的。你或許已經(jīng)知道,也有人還不知道。幾年前當(dāng)我了解到這些時,我驚嘆不已。
我們要做的是啟動一個進(jìn)程。我們已經(jīng)在博客上討論了很多關(guān)于系統(tǒng)調(diào)用的問題,每當(dāng)你啟動一個進(jìn)程或者打開一個文件,這都是一個系統(tǒng)調(diào)用。所以你可能會認(rèn)為有這樣的系統(tǒng)調(diào)用:
start_process(["ls","-l","my_cool_directory"])
這是一個合理的想法,顯然這是它在 DOS 或 Windows 中的工作原理。我想說的是,這并不是 Linux 上的工作原理。但是,我查閱了文檔,確實有一個 posix_spawn 的系統(tǒng)調(diào)用基本上是這樣做的,不過這不在本文的討論范圍內(nèi)。
fork 和 exec
Linux 上的 posix_spawn 是通過兩個系統(tǒng)調(diào)用實現(xiàn)的,分別是 fork 和 exec(實際上是 execve),這些都是人們常常使用的。盡管在 OS X 上,人們使用 posix_spawn,而 fork 和 exec 是不提倡的,但我們將討論的是 Linux。
Linux 中的每個進(jìn)程都存在于“進(jìn)程樹”中。你可以通過運(yùn)行 pstree 命令查看進(jìn)程樹。樹的根是 init,進(jìn)程號是 1。每個進(jìn)程(init 除外)都有一個父進(jìn)程,一個進(jìn)程都可以有很多子進(jìn)程。
所以,假設(shè)我要啟動一個名為 ls 的進(jìn)程來列出一個目錄。我是不是只要發(fā)起一個進(jìn)程 ls 就好了呢?不是的。
我要做的是,創(chuàng)建一個子進(jìn)程,這個子進(jìn)程是我(me)本身的一個克隆,然后這個子進(jìn)程的“腦子”被吃掉了,變成 ls。
開始是這樣的:
my parent
|- me
然后運(yùn)行 fork(),生成一個子進(jìn)程,是我(me)自己的一份克隆:
my parent
|- me
|-- cloneof me
然后我讓該子進(jìn)程運(yùn)行 exec("ls"),變成這樣:
my parent
|- me
|-- ls
當(dāng) ls 命令結(jié)束后,我?guī)缀跤肿兓亓宋易约海?/p>
my parent
|- me
|-- ls(zombie)
在這時 ls 其實是一個僵尸進(jìn)程。這意味著它已經(jīng)死了,但它還在等我,以防我需要檢查它的返回值(使用 wait 系統(tǒng)調(diào)用)。一旦我獲得了它的返回值,我將再次恢復(fù)獨(dú)自一人的狀態(tài)。
my parent
|- me
fork 和 exec 的代碼實現(xiàn)
如果你要編寫一個 shell,這是你必須做的一個練習(xí)。
事實證明,有了 C 或 Python 的技能,你可以在幾個小時內(nèi)編寫一個非常簡單的 shell,像 bash 一樣。(至少如果你旁邊能有個人多少懂一點,如果沒有的話用時會久一點。)我已經(jīng)完成啦,真的很棒。
這就是 fork 和 exec 在程序中的實現(xiàn)。我寫了一段 C 的偽代碼。請記住,fork 也可能會失敗哦。
intpid = fork();
// 我要分身啦
// “我”是誰呢?可能是子進(jìn)程也可能是父進(jìn)程
if(pid == 0){
// 我現(xiàn)在是子進(jìn)程
// “l(fā)s” 吃掉了我腦子,然后變成一個完全不一樣的進(jìn)程
exec(["ls"])
}elseif(pid == -1){
// 天啊,fork 失敗了,簡直是災(zāi)難!
}else{
// 我是父進(jìn)程耶
// 繼續(xù)做一個酷酷的美男子吧
// 需要的話,我可以等待子進(jìn)程結(jié)束
}
上文提到的“腦子被吃掉”是什么意思呢?
進(jìn)程有很多屬性:
打開的文件(包括打開的網(wǎng)絡(luò)連接)
環(huán)境變量
信號處理程序(在程序上運(yùn)行 Ctrl + C 時會發(fā)生什么?)
內(nèi)存(你的“地址空間”)
可執(zhí)行文件(/proc/$pid/exe)
cgroups 和命名空間(與 Linux 容器相關(guān))
當(dāng)前的工作目錄
運(yùn)行程序的用戶
其他我還沒想到的
當(dāng)你運(yùn)行execve并讓另一個程序吃掉你的腦子的時候,實際上幾乎所有東西都是相同的! 你們有相同的環(huán)境變量、信號處理程序和打開的文件等等。
唯一改變的是,內(nèi)存、寄存器以及正在運(yùn)行的程序,這可是件大事。
為何 fork 并非那么耗費(fèi)資源(寫入時復(fù)制)
你可能會問:“如果我有一個使用了 2GB 內(nèi)存的進(jìn)程,這是否意味著每次我啟動一個子進(jìn)程,所有 2 GB 的內(nèi)存都要被復(fù)制一次?這聽起來要耗費(fèi)很多資源!”
事實上,Linux 為fork()調(diào)用實現(xiàn)了寫時復(fù)制copy on write,對于新進(jìn)程的 2GB 內(nèi)存來說,就像是“看看舊的進(jìn)程就好了,是一樣的!”。然后,當(dāng)如果任一進(jìn)程試圖寫入內(nèi)存,此時系統(tǒng)才真正地復(fù)制一個內(nèi)存的副本給該進(jìn)程。如果兩個進(jìn)程的內(nèi)存是相同的,就不需要復(fù)制了。
為什么你需要知道這么多
你可能會說,好吧,這些細(xì)節(jié)聽起來很厲害,但為什么這么重要?關(guān)于信號處理程序或環(huán)境變量的細(xì)節(jié)會被繼承嗎?這對我的日常編程有什么實際影響呢?
有可能哦!比如說,在 Kamal 的博客上有一個很有意思的bug。它討論了 Python 如何使信號處理程序忽略了SIGPIPE。也就是說,如果你從 Python 里運(yùn)行一個程序,默認(rèn)情況下它會忽略SIGPIPE!這意味著,程序從 Python 腳本和從 shell 啟動的表現(xiàn)會有所不同。在這種情況下,它會造成一個奇怪的問題。
所以,你的程序的環(huán)境(環(huán)境變量、信號處理程序等)可能很重要,都是從父進(jìn)程繼承來的。知道這些,在調(diào)試時是很有用的。
-
Linux
+關(guān)注
關(guān)注
87文章
11350瀏覽量
210462 -
UNIX
+關(guān)注
關(guān)注
0文章
296瀏覽量
41592 -
Fork
+關(guān)注
關(guān)注
0文章
14瀏覽量
3334
原文標(biāo)題:當(dāng)你在 Linux 上啟動一個進(jìn)程時會發(fā)生什么?
文章出處:【微信號:LinuxHub,微信公眾號:Linux愛好者】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
AttachedInterrupt如何在NodeMCU上工作?
Linux下多進(jìn)程編程之fork()函數(shù)語法
【Linux學(xué)習(xí)雜談】之exec族函數(shù)
使用fork/exec/wait/exit等函數(shù)去創(chuàng)建一個進(jìn)程
最常見的fork用法是什么
esp32在MacBook M1上工作,無法調(diào)試的原因?
如何在esp8266的LX6上工作?
如何在GitHub上更新Fork以及PullRequest給源項目
![如<b class='flag-5'>何在</b>GitHub上更新<b class='flag-5'>Fork</b>以及PullRequest給源項目](https://file.elecfans.com/web1/M00/81/F0/pIYBAFwz_5SASnwtAAAOvYzuYf0873.png)
對“Fork”做一個技術(shù)方面的簡介
如何在Mac終端上使用UNIX命令
信號通路如何在多層PCB上工作
通過一個腳本搞懂fork、source和exec
Qt中的三個exec之間有什么聯(lián)系
Linux中可怕的fork炸彈介紹
![Linux中可怕的<b class='flag-5'>fork</b>炸彈介紹](https://file1.elecfans.com/web2/M00/88/80/wKgaomRq19mAJnT0AAAm_WugADY738.png)
評論