欧美性猛交xxxx免费看_牛牛在线视频国产免费_天堂草原电视剧在线观看免费_国产粉嫩高清在线观看_国产欧美日本亚洲精品一5区

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

四個方面全面解析Linux 下 C++ 編譯&鏈接

開關電源芯片 ? 來源:華為云開發(fā)者社區(qū) ? 作者:華為云開發(fā)者社區(qū) ? 2021-08-27 09:36 ? 次閱讀

【導讀】:編譯與鏈接對C&C++程序員既熟悉又陌生,熟悉在于每份代碼都要經(jīng)歷編譯與鏈接過程,陌生在于大部分人并不會刻意關注編譯與鏈接的原理。本文通過開發(fā)過程中碰到的四個典型問題來探索64位linux下C++編譯&鏈接的那些事。

以下是正文

編譯原理

將如下最簡單的C++程序(main.cpp)編譯成可執(zhí)行目標程序,實際上可以分為四個步驟:預處理、編譯、匯編、鏈接,可以通過

g++ main.cpp –v看到詳細的過程,不過現(xiàn)在編譯器已經(jīng)把預處理和編譯過程合并。

預處理:g++ -E main.cpp -o main.ii,-E表示只進行預處理。預處理主要是處理各種宏展開;添加行號和文件標識符,為編譯器產(chǎn)生調試信息提供便利;刪除注釋;保留編譯器用到的編譯器指令等。

編譯:g++ -S main.ii –o main.s,-S表示只編譯。編譯是在預處理文件基礎上經(jīng)過一系列詞法分析、語法分析及優(yōu)化后生成匯編代碼。

匯編:g++ -c main.s –o main.o。匯編是將匯編代碼轉化為機器可以執(zhí)行的指令。

鏈接:g++ main.o。鏈接生成可執(zhí)行程序,之所以需要鏈接是因為我們代碼不可能像main.cpp這么簡單,現(xiàn)代軟件動則成百上千萬行,如果寫在一個main.cpp既不利于分工合作,也無法維護,因此通常是由一堆cpp文件組成,編譯器分別編譯每個cpp,這些cpp里會引用別的模塊中的函數(shù)或全局變量,在編譯單個cpp的時候是沒法知道它們的準確地址,因此在編譯結束后,需要鏈接器將各種還沒有準確地址的符號(函數(shù)、變量等)設置為正確的值,這樣組裝在一起就可以形成一個完整的可執(zhí)行程序。

問題一:頭文件遮擋

在編譯過程中最詭異的問題莫過于頭文件遮擋,如下代碼中main.cpp包含頭文件common.h,真正想用的頭文件是圖中最右邊那個包含name

c984c19a-f62b-11eb-9bcf-12bb97331649.png

成員的文件(所在目錄為。/include),但在編譯過程中中間的common.h(所在目錄為。/include1)搶先被發(fā)現(xiàn),導致編譯器報錯:Test結構沒有name成員,對程序員來講,自己明明定義了name成員,居然說沒有name這個成員,如果第一次碰到這種情況可能會懷疑人生。應對這種詭異的問題,我們可以用-E參數(shù)看下編譯器預處理后的輸出,如下圖。

c9b0d500-f62b-11eb-9bcf-12bb97331649.jpg

預處理文件格式如下:# linenum filename flag,表示之后的內(nèi)容是從文件名為filaname的文件中第linenum行展開的,flag的取值可以是1,2,3,4,可以是用空格分開的多值,1表示接下來要展開一個新文件;2表示一個文件展開完畢;3表示接下來內(nèi)容來自一個系統(tǒng)頭文件;4表示接下來的內(nèi)容應該看做是extern C形式引入的。

從展開后的輸出我們可以清楚地看到Test結構確實沒有定義name這個成員,并且Test這個結構是在。/include1中的common.h中定義的,到此真相大白,編譯器壓根就沒用我們定義的Test結構,而是被別的同名頭文件截胡了。我們可以通過調整-I或者在頭文件中帶上部分路徑更詳細制定頭文件位置來解決。

目標文件:

編譯鏈接最終會生成各種目標文件,Linux下目標文件格式為ELF(Executable Linkable Format),詳細定義見/usr/include/elf.h頭文件,常見的目標文件有:可重定位目標文件,也即.o結尾的目標文件,當然靜態(tài)庫也歸為此類;可執(zhí)行文件,比如默認編譯出的a.out文件;共享目標文件.so;核心轉儲文件,也就是core dump后產(chǎn)出的文件。Linux文件格式可以通過file命令查看。

一個典型的ELF文件格式如下圖所示,文件有兩種視角:編譯視角,以section頭部表為核心組織程序;運行視角,程序頭部表以segment為核心組織程序。這么做主要是為了節(jié)約存儲,很多細碎的section在運行時由于對齊要求會導致很大的內(nèi)存浪費,運行時通常會將權限類似的section組織成segment一起加載。

通過命令objdump和readelf可以查看ELF文件的內(nèi)容。

對可重定位目標文件常見的section有:

ca2e1600-f62b-11eb-9bcf-12bb97331649.png

符號解析:

鏈接器會為對外部符號的引用修改為正確的被引用符號的地址,當無法為引用的外部符號找到對應的定義時,鏈接器會報undefined reference to XXXX的錯誤。另外一種情況是,找到了多個符號的定義,這種情況鏈接器有一套規(guī)則。在描述規(guī)則前需要了解強符號和弱符號的概念,簡單講函數(shù)和已初始化的全局變量是強符號,未初始化的全局變量是弱符號。

針對符號的多重定義鏈接器處理規(guī)則如下(作者在gcc 7.3.0上貌似規(guī)則2,3都按1處理):

1. 不允許多個強符號定義,鏈接器會報告重復定義貌似的錯誤

2. 如果一個強符號和多個弱符號同名,則選擇強符號

3. 如果符號在所有目標文件中都為弱符號,那么選擇占用空間最大的一個

有了這些基礎,我們先來看一下靜態(tài)鏈接過程:

1. 鏈接器從左到右按照命令行出現(xiàn)順序掃描目標文件和靜態(tài)庫

2. 鏈接器維護一個目標文件的集合E,一個未解析符號集合U,以及E中已定義的符號集合D,初始狀態(tài)E、U、D都為空

3. 對命令行上每個文件f,鏈接器會判斷f是否是一個目標文件還是靜態(tài)庫,如果是目標文件,則f加入到E,f中未定義的符號加入到U中,已定義符號加入到D中,繼續(xù)下一文件

4. 如果是靜態(tài)庫,鏈接器嘗試到靜態(tài)庫目標文件中匹配U中未定義的符號,如果m中匹配U中的一個符號,那么m就和上步中文件f一樣處理,對每個成員文件都依次處理,直到U、D無變化,不包含在E中的成員文件簡單丟棄

5. 所有輸入文件處理完后,如果U中還有符號,則出錯,否則鏈接正常,輸出可執(zhí)行文件

問題二:靜態(tài)庫順序

如下圖所示,main.cpp依賴liba.a,liba.a又依賴libb.a,根據(jù)靜態(tài)鏈接算法,如果用g++ main.cpp liba.a libb.a的順序能正常鏈接,因為解析liba.a時未定義符號FunB會加入到上述算法的U中,然后在libb.a中找到定義。

如果用g++ main.cpp libb.a liba.a的順序編譯,則無法找到FunB的定義,因為根據(jù)靜態(tài)鏈接算法,在解析libb.a的時候U為空,所以不需要做任何解析,簡單拋棄libb.a,但在解析liba.a的時候又發(fā)現(xiàn)FunB沒有定義,導致U最終不為空,鏈接錯誤。

因此在做靜態(tài)鏈接時,需要特別注意庫的順序安排,引用別的庫的靜態(tài)庫需要放在前面,碰到鏈接很多庫的時候,可能需要做一些庫的調整,從而使依賴關系更清晰。

ca48b7c6-f62b-11eb-9bcf-12bb97331649.png

動態(tài)鏈接:

之前大部分內(nèi)容都是靜態(tài)鏈接相關,但靜態(tài)鏈接有很多不足:不利于更新,只要有一個庫有變動,都需要重新編譯;不利于共享,每個可執(zhí)行程序都單獨保留一份,對內(nèi)存和磁盤是極大的浪費。

要生成動態(tài)鏈接庫需要用到參數(shù)“-shared -fPIC”表示要生成位置無關PIC(Position Independent Code)的共享目標文件。對靜態(tài)鏈接,在生成可執(zhí)行目標文件時整個鏈接過程就完成了,但要想實現(xiàn)動態(tài)鏈接的效果,就需要把程序按照模塊拆分成相對獨立的部分。

在程序運行時將他們鏈接成一個完整的程序,同時為了實現(xiàn)代碼在不同程序間共享要保證代碼是和位置無關的(因為共享目標文件在每個程序中被加載的虛擬地址都不一樣,要保證它不管被加載在哪都能工作),而為了實現(xiàn)位置無關又依賴一個前提:數(shù)據(jù)段和代碼段的距離總是保持不變。

由于不管在內(nèi)存中如何加載一個目標模塊,數(shù)據(jù)段和代碼段間的距離是不變的,編譯器在數(shù)據(jù)段前面引入了一個全局偏移表GOT(Global Offset Table),被引用的全局變量或者函數(shù)在GOT中都有一條記錄,同時編譯器為GOT中每個條目生成一個重定位記錄,因為數(shù)據(jù)段是可以修改的,動態(tài)鏈接器在加載時會重定位GOT中的每個條目,這樣就實現(xiàn)了PIC。

大體原理基本就這樣,但具體實現(xiàn)時,對函數(shù)的處理和全局變量有所不同。由于大型程序函數(shù)成千上萬,而程序很可能只會用到其中的一小部分,因此沒必要加載的時候把所有的函數(shù)都做重定位,只有在用到的時候才對地址做修訂。

為此編譯器引入了過程鏈接表PLT(Procedure Linkage Table)來實現(xiàn)延時綁定。PLT在代碼段中,它指向了GOT中函數(shù)對應的地址,第一次調用時候,GOT存放的不是函數(shù)的實際地址,而是PLT跳轉到GOT代碼的后一條指令地址。

這樣第一次通過PLT跳轉到GOT,然后通過GOT又調回到PLT的下一條指令,相當于什么也沒做,緊接著PLT后面的代碼會將動態(tài)鏈接需要的參數(shù)入棧,然后調用動態(tài)鏈接器修正GOT中的地址,從這以后,PLT中代碼跳轉到GOT的地址就是函數(shù)真正的地址,從而實現(xiàn)了所謂的延時綁定。

對共享目標文件而言,有幾個需要關注的section:

ca5aa10c-f62b-11eb-9bcf-12bb97331649.png

有了以上基礎后,我們看一下動態(tài)鏈接的過程:

1. 裝載過程中程序執(zhí)行會跳轉到動態(tài)鏈接器

2. 動態(tài)鏈接器自舉通過GOT、.dynamic信息完成自身的重定位工作

3. 裝載共享目標文件:將可執(zhí)行文件和鏈接器本身符號合并入全局符號表,依次廣度優(yōu)先遍歷共享目標文件,它們的符號表會不斷合并到全局符號表中,如果多個共享對象有相同的符號,則優(yōu)先載入的共享目標文件會屏蔽掉后面的符號

4. 重定位和初始化

問題三:全局符號介入

動態(tài)鏈接過程中最關鍵的第3步可以看到,當多個共享目標文件中包含一個相同的符號,那么會導致先被加載的符號占住全局符號表,后續(xù)共享目標文件中相同符號被忽略。當我們代碼中沒有很好的處理命名的話,會導致非常奇怪的錯誤,幸運的話立刻core dump,不幸的話直到程序運行很久以后才莫名其妙的core dump,甚至永遠不會core dump但是結果不正確。

如下圖所示,main.cpp中會用到兩個動態(tài)庫libadd.so,libadd1.so的符號,我們把重點

ca741d12-f62b-11eb-9bcf-12bb97331649.png

放在Add函數(shù)的處理上,當我們以g++ main.cpp libadd.so libadd1.so編譯時,程序輸出“Add in add lib”說明Add是用的libadd.so中的符號(add.cpp),當我們以g++ main.cpp libadd1.so libadd.so編譯時。

程序輸出“Add in add1 lib”說明Add是用的libadd1.so中的符號,這時候問題就大了,調用方main.cpp中認為Add只有兩個參數(shù),而add1.cpp中認為Add有三個參數(shù),程序中如果有這樣的代碼,可以預見很可能造成巨大的混亂。

具體符號解析我們可以通過LD_DEBUG=all 。/a.out來觀察Add的解析過程,如下圖所示:左邊是對應libadd.so在編譯時放在前面的情況,Add綁定在libadd.so中,右邊對應libadd1.so放前面的情況,Add綁定在libadd1.so中。

caa41b20-f62b-11eb-9bcf-12bb97331649.png

運行時加載動態(tài)庫:

有了動態(tài)鏈接和共享目標文件的加持,Linux提供了一種更加靈活的模塊加載方式:通過提供dlopen,dlsym,dlclose,dlerror幾個API,可以實現(xiàn)在運行的時候動態(tài)加載模塊,從而實現(xiàn)插件的功能。

如下代碼演示了動態(tài)加載Add函數(shù)的過程,add.cpp按照正常編譯“g++ -fPIC –shared –o libadd.so add.cpp”成libadd.so,main.cpp通過“g++ main.cpp -ldl”編譯為a.out。main.cpp中首先通過dlopen接口取得一個句柄void *handle。

然后通過dlsym從句柄中查找符號Add,找到后將其轉化為Add函數(shù),然后就可以按照正常的函數(shù)使用,最后dlclose關閉句柄,期間有任何錯誤可以通過dlerror來獲取。

caef8b32-f62b-11eb-9bcf-12bb97331649.jpg

問題四:靜態(tài)全局變量與動態(tài)庫導致double free

在全面了解了動態(tài)鏈接相關知識后,我們來看一個靜態(tài)全局變量和動態(tài)庫糾結在一起引發(fā)的問題,代碼如下,foo.cpp中有一個靜態(tài)全局對象foo_,foo.cpp會編譯成一個libfoo.a,bar.cpp依賴libfoo.a庫,它本身會編譯成libbar.so,main.cpp既依賴于libfoo.a又依賴libbar.so。

caf98eac-f62b-11eb-9bcf-12bb97331649.jpg

編譯的makefile如下:

cb1d0724-f62b-11eb-9bcf-12bb97331649.png

運行a.out會導致double free的錯誤。這是由于在一個位置上調用了兩次析構函數(shù)造成的。之所以會這樣是因為鏈接的時候先鏈接的靜態(tài)庫,將foo_的符號解析為靜態(tài)庫中的全局變量,當動態(tài)鏈接libbar.so時,由于全局已經(jīng)有符號foo_,因此根據(jù)全局符號介入,動態(tài)庫中對foo_的引用會指向靜態(tài)庫中版本,導致最后在同一個對象上析構了兩次。

cb2b9a28-f62b-11eb-9bcf-12bb97331649.png

解決辦法如下:

1. 不使用全局對象

2. 編譯時候調換庫的順序,動態(tài)庫放在前面,這樣全局只會有一個foo_對象

3. 全部使用動態(tài)庫

4. 通過編譯器參數(shù)來控制符號的可見性。

總結:

通過四個編譯鏈接中碰到的問題,基本把編譯鏈接的這些事覆蓋了一遍,有了這些基礎,在日常工作中應對一般的編譯鏈接問題應該可以做到游刃有余。由于篇幅有限,文章省略了大量的細節(jié),主要集中在大的框架原理性梳理,如果想進一步深挖相關的細節(jié),可參與相關參考文獻,以及閱讀elf.h相關的頭文件。

轉自:https://my.oschina.net/u/4526289/blog/4651990

編輯:jq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • PIC
    PIC
    +關注

    關注

    8

    文章

    507

    瀏覽量

    87850
  • 函數(shù)
    +關注

    關注

    3

    文章

    4346

    瀏覽量

    62998
  • 代碼
    +關注

    關注

    30

    文章

    4830

    瀏覽量

    69110
  • 編譯器
    +關注

    關注

    1

    文章

    1642

    瀏覽量

    49311
  • got
    got
    +關注

    關注

    0

    文章

    11

    瀏覽量

    3794

原文標題:從四個問題透析 Linux 下 C++ 編譯&鏈接

文章出處:【微信號:gh_3980db2283cd,微信公眾號:開關電源芯片】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    C語言的編譯鏈接過程

    ? C語言的編譯鏈接過程要把我們編寫的一C程序源代碼轉換成可以在硬件上運行的程序(可執(zhí)行代碼),需要進行
    的頭像 發(fā)表于 08-21 10:06 ?2727次閱讀
    <b class='flag-5'>C</b>語言的<b class='flag-5'>編譯</b><b class='flag-5'>鏈接</b>過程

    Linux GCC的編譯

    一、Linux 多文件編譯 在上一篇 Linux C 編程我們知道了
    的頭像 發(fā)表于 09-11 15:18 ?2731次閱讀
    <b class='flag-5'>Linux</b> <b class='flag-5'>下</b>GCC的<b class='flag-5'>編譯</b>

    c++編譯鏈接失敗的原因?如何解決?

    /c++項目,將剛才新建的項目轉換為c++項目。 完成后點擊編譯,此時也是正常的。 新建一cpp文件,將原項目的main.c中內(nèi)容全部拷貝
    發(fā)表于 07-25 08:13

    C/C++中的整型常識

    C/C++中的整型常識很多人對C/C++中的整型不太了解,導致代碼移植的時候出現(xiàn)問題,本人在此總結一,若有描述錯誤,請務必指出,謝謝! &
    發(fā)表于 10-07 11:12

    程序的鏈接和裝入及Linux動態(tài)鏈接的實現(xiàn)

    之后最終的可執(zhí)行程序就生成了。 可執(zhí)行程序生成后,下一步就是將其裝入內(nèi)存運行。Linux編譯器(C語言)是cc1,匯編器是as,鏈接器是
    發(fā)表于 09-13 11:18

    高質量C&;amp;C++

    高質量C&;amp;C++
    發(fā)表于 08-16 19:45

    Linux系統(tǒng)鏈接原理是什么?有哪些應用呢

    顯而易見的,就是可執(zhí)行文件可能會變得很臃腫。靜態(tài)庫的創(chuàng)建本文以則運算來創(chuàng)建一靜態(tài)庫,該靜態(tài)庫中包含四個函數(shù):加、減、乘、除。生成一可重定位的目標文件。在
    發(fā)表于 06-21 17:05

    LinuxC/C++編譯器gcc使用指南

    1.gcc包含的c/c++編譯器 gcc,cc與c++,g++ gcc和cc是一樣的,c++和g++是一樣的。一般
    發(fā)表于 11-02 10:59 ?0次下載

    高級C/C++編譯技術

    C/C++編譯技術
    發(fā)表于 12-04 17:19 ?18次下載

    了解“預編譯、編譯、匯編、鏈接”這四個過程對你有很大幫助

    C語言的編譯鏈接過程要把我們編寫的一c程序(源代碼)轉換成可以在硬件上運行的程序(可執(zhí)行代碼),需要進行
    的頭像 發(fā)表于 04-18 10:08 ?3.6w次閱讀
    了解“預<b class='flag-5'>編譯</b>、<b class='flag-5'>編譯</b>、匯編、<b class='flag-5'>鏈接</b>”這<b class='flag-5'>四個</b>過程對你有很大幫助

    linux嵌入式主要學什么,學嵌入式linux,用什么開發(fā)板,請大家推薦一

    基礎、數(shù)據(jù)結構、電子電路)第一天上數(shù)電&amp;C語言基礎測試第一天C++語言&amp;操作系統(tǒng)基礎測試第二天上操作系統(tǒng)基礎第二天
    發(fā)表于 11-02 14:51 ?17次下載
    <b class='flag-5'>linux</b>嵌入式主要學什么,學嵌入式<b class='flag-5'>linux</b>,用什么開發(fā)板,請大家推薦一<b class='flag-5'>下</b>

    存儲類&amp;作用域&amp;生命周期&amp;鏈接屬性

    目錄前言一、存儲類&amp;amp;作用域&amp;amp;生命周期&amp;amp;
    發(fā)表于 12-09 15:51 ?5次下載
    存儲類&<b class='flag-5'>amp</b>;作用域&<b class='flag-5'>amp</b>;生命周期&<b class='flag-5'>amp</b>;<b class='flag-5'>鏈接</b>屬性

    Linux系統(tǒng)C/C++編譯流程與步驟

    編譯的,即每個.c文件會形成一.o文件,為了滿足前面說的依賴關系,則需要將這些源文件產(chǎn)生的目標文件進行鏈接,從而形成一可以執(zhí)行的程序。這
    的頭像 發(fā)表于 11-08 16:11 ?1485次閱讀

    探索64位linuxC++編譯&amp;amp;鏈接的那些事

    編譯鏈接C&;C++程序員既熟悉又陌生,熟悉在于每份代碼都要經(jīng)歷編譯鏈接過程,陌生在
    的頭像 發(fā)表于 04-15 10:44 ?1016次閱讀

    OK3568-C開發(fā)板_AMP_Linux4.19.232+QT5.15.8_用戶編譯手冊_V1.0

    OK3568-C_AMP_Linux4.19.232+QT5.15.8_用戶編譯手冊_V1.0_20231227
    發(fā)表于 01-23 16:28 ?12次下載