欧美性猛交xxxx免费看_牛牛在线视频国产免费_天堂草原电视剧在线观看免费_国产粉嫩高清在线观看_国产欧美日本亚洲精品一5区

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

Too many open files錯誤導致服務器死循環(huán)

Linux閱碼場 ? 來源:卯時卯刻 ? 2023-05-23 09:08 ? 次閱讀

0x01 前言

在服務器編程中,經(jīng)常會遇到 Too many open files 這個報錯,而且這個報錯如果處理不好,很有可能會導致服務器死循環(huán)。

0x02 示例代碼

6eb5ae6a-f8fd-11ed-90ce-dac502259ad0.png

以上是我用rust寫的一個非常簡單的tcp服務器,它的主要邏輯是,先創(chuàng)建一個listener,然后再在循環(huán)里不斷調用listener.accept接收tcp連接,如果接收成功,就調用handle_client處理這個連接,如果接收失敗,就打印一行錯誤日志。

handle_client里的邏輯也非常簡單,就是等待客戶端關閉連接,或等待其發(fā)送任意數(shù)據(jù),當這兩種情況發(fā)生時,handle_client就會直接關閉這個連接。

當然,如果在等待期間報錯了,handle_client也會打印一行錯誤日志。

下面我們就會使用這段程序,來演示服務器死循環(huán)的情況,這段程序不必非要用rust編寫,用其他語言也都可以。

0x03 動手演示

先啟動該服務器:

6edcb6b8-f8fd-11ed-90ce-dac502259ad0.png

由上圖可見,該服務器的進程id是312004,監(jiān)聽地址是0.0.0.0:9999。

再查看下該服務器已打開的文件數(shù):

6f0a1270-f8fd-11ed-90ce-dac502259ad0.png

一共是10個,主要包括標準輸入輸出、epoll、及一些socket。

再查看下該服務器進程最多可打開的文件數(shù):

6f3a0c50-f8fd-11ed-90ce-dac502259ad0.png

看選中行,Soft Limit那一列,其表示該進程最多可用的文件描述符數(shù)量為1024個,即最多可同時打開的文件數(shù)為1024個。

我們把它改小一點,方便后續(xù)測試:

6f53f6c4-f8fd-11ed-90ce-dac502259ad0.png

上圖中,先使用prlimit命令將該服務器進程的Max open files數(shù)改成12,然后再用cat命令確認下該改動已生效。

至此,我們已經(jīng)設置好該服務器進程最多可用的文件描述符數(shù)量為12,其當前已用的文件描述符數(shù)量為10,所以該服務器最多還可以再接收2個tcp連接。

我們用 `ncat localhost 9999` 命令建立連接試一下,當然你也可以用telnet, nc等其他命令,只要能建立tcp連接就行:

6f82eede-f8fd-11ed-90ce-dac502259ad0.png

由上圖服務器日志可見,該tcp連接已建立成功。

再看下當前服務器已使用的文件描述符數(shù)量:

6fc1c30c-f8fd-11ed-90ce-dac502259ad0.png

由上圖可見,新建socket使用的文件描述符為10,當前服務器進程已使用11個文件描述符,到目前為止一切正常。

用同樣的命令再建立一個tcp連接,這次應該也能連接成功,不過會有一些有意思的事情發(fā)生:

6ff862fe-f8fd-11ed-90ce-dac502259ad0.png

首先看上圖中最后一行info日志,它表示第二次tcp連接也建立成功了,如果此時去看文件描述符數(shù)量,也正好是12。

不過此次連接建立也導致不斷的error日志輸出,該服務器死循環(huán)了。

但此時,如果我們關閉第二次ncat命令建立的tcp連接,服務器又不會一直輸出error日志了,它又會恢復到正常狀態(tài):

707b880a-f8fd-11ed-90ce-dac502259ad0.png

看上圖中的最后一條info日志,它表示第二個tcp連接正常關閉了,且當前已建立的連接數(shù)量是1。

此時,如果我們去看文件描述符數(shù)量,其也變成了11,這里就不再截圖了,有興趣的可以自己動手試下。

0x04 為什么會出現(xiàn)死循環(huán)?

首先,在linux的世界里,一切皆文件,這里就包括socket。

其次,linux為保證系統(tǒng)的整體性安全,為每個進程限制了其最大可使用的文件描述符數(shù)量,即最大可打開的文件數(shù),這個數(shù)量就是上面我們用 `cat /proc/$(pidof too-many-open-files)/limits` 命令輸出的Max open files行,Soft Limit列對應的值,該值是可以通過各種方式修改的,在我的系統(tǒng)上,該值默認為1024。

接著,我們啟動了服務器,然后通過 `l /proc/$(pidof too-many-open-files)/fd/` 命令查看該服務器已使用的文件描述符數(shù)量,其為10。

之后,我們用prlimit命令將該服務器進程最大可使用的文件描述符數(shù)量改成了12,這樣該服務器就還只剩兩個文件描述符可用。

再之后,我們用ncat命令建立了兩個tcp連接,在服務器端的循環(huán)里,accept接收到這兩個連接并進行處理,此時該服務器進程消耗完了最后兩個可用的文件描述符。

接下來,服務器代碼進入下一次循環(huán),繼續(xù)調用accept嘗試接收新的連接,問題的關鍵點也就出現(xiàn)在了這里。

accept是個系統(tǒng)調用,我們看下其對應的內核實現(xiàn):

70baa9a4-f8fd-11ed-90ce-dac502259ad0.png

這個是accept系統(tǒng)調用的入口函數(shù),沿著函數(shù)調用,可找到以下代碼:

70df7248-f8fd-11ed-90ce-dac502259ad0.png

由上圖可見,在真正的do_accept之前,會先調用get_unused_fd_flags找一個還未被使用的文件描述符,如果尋找時報錯了,即newfd < 0,則直接返回該錯誤碼給用戶層,如果找到了一個可用的文件描述符,則開始執(zhí)行真正的accept操作。

繼續(xù)看get_unused_fd_flags函數(shù):

712824f2-f8fd-11ed-90ce-dac502259ad0.png

它在調用其他函數(shù)之前,會通過 rlimit(RLIMIT_NOFILE) 獲取當前進程最大可使用的文件描述符數(shù)量,即我們上面通過prlitmit命令設置的12。

繼續(xù)往下看,我們會找到以下代碼:

7147c500-f8fd-11ed-90ce-dac502259ad0.png

該函數(shù)的目的是分配一個文件描述符,即fd,圖中選中行之前是找到一個還未被使用的fd,然后判斷該 fd 是否 >= end,如果是,則goto到out,進而return error,而這個error就是EMFILE。

那end值是什么呢?它就是上面用 rlimit(RLIMIT_NOFILE) 獲取的當前進程最大可用的文件描述符數(shù)。

結合上面的例子我們知道,當服務器接收完兩個tcp連接后,其最大可使用的12個文件描述符已全部被用完,當其循環(huán)到下一次accept系統(tǒng)調用后,會最終進入到上圖這個函數(shù),這次新分配的fd值一定是12(因為fd值從0開始的,所以fd值為12表示第13個文件描述符),而我們又限制了該進程最大可用12個文件描述符,即我們限制了end值為12,所以在上圖選中行進行判斷時,fd 一定是 >= end 的,所以,該函數(shù)一定會返回EMFILE這個錯誤碼。

而EMFILE是什么呢?

7191e536-f8fd-11ed-90ce-dac502259ad0.png

它就是我們在運行測試程序時看到的 Too many open files 這個錯誤。

示例程序調用accept收到這個錯誤碼后,會打印一行error日志,然后繼續(xù)循環(huán)調用accept,然后繼續(xù)報錯,就這樣,服務器就在accept這里發(fā)生了死循環(huán)。

0x05 這個問題如何處理?

因為 too many open files 是個臨時性錯誤,當進程中的其他地方關閉了一些文件,或者管理人員調高了該進程的 max open files值,accept就不會再報 EMFILE 錯誤,也就不會再死循環(huán)了。

所以其處理方法也很簡單,就是在accept發(fā)生錯誤時,sleep一段時間,這樣既防止了cpu 100%的發(fā)生,也給進程時間來調整已用及最大的文件描述符數(shù)。

0x06 用epoll也會有這個問題嗎?

會有,epoll只是個通知機制,當epoll檢測到有連接可被接收時,還是會通過accept來接收這個連接。

不過這里分成兩種情況。

當使用epoll的edge-triggered模式時,正確寫法是要一直循環(huán)調用accept接收連接,直到其返回 EAGAIN 或 EWOULDBLOCK 錯誤碼,表示已經(jīng)沒有連接可接收了,這時才能退出accept循環(huán),但如果在這之前accept返回了 too many open files 這個錯誤,就會發(fā)生死循環(huán)了。

當使用epoll的level-triggered模式時,可以不必一直循環(huán)調用accept直到其返回EAGAIN 或 EWOULDBLOCK,可以提前退出,但如果操作系統(tǒng)里還有建立好的連接等待被接收,epoll還是會一直通知應用層,告知其要調用accept接收這些連接,如果此時文件描述符沒有了,accept還是會一直報 too many open files 錯誤,最終還是進入到了死循環(huán)。

0x07 Go是如何處理的?

下面我們看下go內置的http服務器,是如何處理這個問題的:

71c64876-f8fd-11ed-90ce-dac502259ad0.png

當accept返回err后,其會通過ne.Temporary()來檢查該err是否是臨時性錯誤,如果是,則會根據(jù)一定的規(guī)則,sleep一段時間。

這里,臨時性錯誤就包括 EMFILE,即too many open files錯誤:

7203ec08-f8fd-11ed-90ce-dac502259ad0.png

我們也可以寫個簡單的例子測試下:

721b8264-f8fd-11ed-90ce-dac502259ad0.png

按照之前的方式,讓其觸發(fā) too many open files 這個錯誤:

7244e2d0-f8fd-11ed-90ce-dac502259ad0.png

由圖可見,和我們上面分析的一樣,其也陷入了死循環(huán),但是它用sleep的方式,防止cpu使用率100%。

0x08 Redis是如何處理的?

下面我們看下redis是如何處理這個問題的:

727fddd6-f8fd-11ed-90ce-dac502259ad0.png

當anetTcpAccept返回 too many open files 錯誤時,它只打印了一行錯誤日志,就直接return了。

不過因為redis使用的是level-triggered模式的epoll,所以雖然這里直接return了,但因為底層的連接沒接收出來,epoll一直會調用這個函數(shù),然后一直報錯,進而死循環(huán)。

實驗下:

72b90a48-f8fd-11ed-90ce-dac502259ad0.png

可以看到,其一直在輸出這個錯誤。





審核編輯:劉清

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • TCP
    TCP
    +關注

    關注

    8

    文章

    1381

    瀏覽量

    79344
  • TELNET
    +關注

    關注

    0

    文章

    17

    瀏覽量

    10806
  • Rust
    +關注

    關注

    1

    文章

    230

    瀏覽量

    6675

原文標題:Too many open files 錯誤導致服務器死循環(huán)

文章出處:【微信號:LinuxDev,微信公眾號:Linux閱碼場】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    獨立看門狗檢測及如何解決軟件錯誤導致故障

    其用于檢測和解決由軟件錯誤導致的故障,當計數(shù)達到設定的超時時間值時會產生系統(tǒng)復位。
    的頭像 發(fā)表于 01-23 09:14 ?1.2w次閱讀
    獨立看門狗檢測及如何解決軟件<b class='flag-5'>錯誤導致</b>故障

    編譯錯誤too many global/static 'bit' variables

    用的CodeVisionAVR編譯,編譯出錯,很多都是說too many global/static 'bit' variablesError: D:\AVRproject\2014\test
    發(fā)表于 04-04 22:37

    too many jtag devices in chain

    用keil下載程序時,出現(xiàn)too many jtag devices in chain,哪位大神知道怎么解決,十分感謝!
    發(fā)表于 01-20 13:46

    什么是服務器500錯誤

    500報錯:被稱為http500服務器內部錯誤,從名稱上可以理解為服務器問題導致錯誤。一般給站長展現(xiàn)出的問題分為兩種情況,一是
    發(fā)表于 07-08 09:38

    為什么單片機的主程序是死循環(huán)

    任何一個可用程序都必然是死循環(huán)程序,這不僅僅是指單片機程序。因為任何微處理系統(tǒng)一旦開機,系統(tǒng)都在處理內部事件和外設響應,這個過程是一個循環(huán)過程,除非關機才能結束這個死循環(huán)程序。因此,
    發(fā)表于 07-15 17:38 ?5439次閱讀

    單片機的死循環(huán)有什么作用

    單片機是可編程器件,在使用時需要編寫滿足需求的程序。其C語言程序在各個端口、配置初始化完成后,會進入一個死循環(huán),一般用while(1){;}的形式。初始化完成后,單片機就在死循環(huán)內一遍又一遍的執(zhí)行程序邏輯。復位后,就從頭開始,初始化完成后,再次進入
    發(fā)表于 08-09 17:01 ?5814次閱讀
    單片機的<b class='flag-5'>死循環(huán)</b>有什么作用

    如何避免Xil_Assert系列宏導致死循環(huán)的情況

    原文標題:【工程師分享】避免Xil_Assert系列宏導致死循環(huán) 文章出處:【微信公眾號:FPGA開發(fā)圈】歡迎添加關注!文章轉載請注明出處。
    的頭像 發(fā)表于 12-02 16:20 ?4270次閱讀
    如何避免Xil_Assert系列宏<b class='flag-5'>導致</b>的<b class='flag-5'>死循環(huán)</b>的情況

    STM32片內FLASH燒寫錯誤導致ST-li

    STM32片內FLASH燒寫錯誤導致ST-li
    發(fā)表于 12-02 18:06 ?7次下載
    STM32片內FLASH燒寫<b class='flag-5'>錯誤導致</b>ST-li

    IAR中出現(xiàn)“ the file is too large to open in the editor”

    IAR中出現(xiàn)“ the file is too large to open in the editor”出現(xiàn)此錯誤是,先在在工程設置“Options”----》“General Options
    發(fā)表于 12-03 11:06 ?0次下載
    IAR中出現(xiàn)“ the file is <b class='flag-5'>too</b> large to <b class='flag-5'>open</b> in the editor”

    Linux服務器為什么會出現(xiàn)503錯誤?

      瀏覽網(wǎng)頁時最常見的錯誤之一是“503服務不可用錯誤(503 Service Unavailable Error)”,此消息表明網(wǎng)絡服務器遇到技術問題,無法處理請求。本文將介紹下Li
    的頭像 發(fā)表于 04-13 15:43 ?1474次閱讀

    Too many open files錯誤導致服務器死循環(huán)

    0x01 前言 在服務器編程中,經(jīng)常會遇到 Too many open files 這個報錯,而且這個報錯如果處理不好,很有可能會
    的頭像 發(fā)表于 05-23 09:09 ?3055次閱讀
    <b class='flag-5'>Too</b> <b class='flag-5'>many</b> <b class='flag-5'>open</b> <b class='flag-5'>files</b><b class='flag-5'>錯誤導致</b><b class='flag-5'>服務器</b><b class='flag-5'>死循環(huán)</b>

    為什么HashMap會產生死循環(huán)呢?

    死循環(huán)問題發(fā)生在 JDK 1.7 版本中,造成這個問題主要是由于 HashMap 自身的運行機制,加上并發(fā)操作,從而導致死循環(huán)
    的頭像 發(fā)表于 12-21 09:06 ?931次閱讀
    為什么HashMap會產生<b class='flag-5'>死循環(huán)</b>呢?

    應用程序中的服務器錯誤怎么解決?

    在使用應用程序時,可能會遇到服務器錯誤的問題。這種錯誤通常會導致應用程序無法正常運行 ,給用戶帶來不便。下面將介紹應用程序中的服務器
    的頭像 發(fā)表于 03-12 15:13 ?6556次閱讀

    服務器數(shù)據(jù)恢復—SAN環(huán)境下LUN映射錯誤導致寫操作互斥失敗的數(shù)據(jù)恢復案例

    服務器數(shù)據(jù)恢復環(huán)境: SAN環(huán)境下一臺存儲設備中有一組由6塊硬盤組建的RAID6磁盤陣列,劃分若干LUN,MAP到不同業(yè)務的SOLARIS操作系統(tǒng)服務器上。 服務器故障: 用戶新增了一臺
    的頭像 發(fā)表于 09-26 16:31 ?312次閱讀

    服務器錯誤是怎么回事

    服務器錯誤通常指的是在訪問網(wǎng)站或應用程序時,由于服務器端的問題導致無法正常處理請求。主機測評小編為您整理發(fā)布一些常見的服務器
    的頭像 發(fā)表于 11-04 11:11 ?516次閱讀