![](https://file1.elecfans.com//web2/M00/B4/CC/wKgZomVxKE6AH5zMAAHUHXdxAL4762.gif)
關(guān)鍵詞:數(shù)據(jù)意外變化導致條件判斷流程異常
目錄預(yù)覽
1、問題描述
2、問題分析
3、小結(jié)
01
問題描述
在客戶的代碼中有多個條件語句,在條件里面的變量數(shù)值沒有變化的情況下執(zhí)行了條件里面的邏輯。有點類似如下 C 語句 :
![](https://file1.elecfans.com//web2/M00/B4/CC/wKgZomVxKE6AaDIqAAAgSBzj6bM798.jpg)
即變量 A 在明明沒有變化且條件不滿足的情況下, 程序運行時偏偏執(zhí)行了條件內(nèi)部的代碼. 很奇怪的現(xiàn)象。一時很難判斷是編譯器的問題還是芯片問題.
了解到客戶的代碼中使用了第三方庫, xx.o 文件, 像這樣的條件有 80 多個, 每次出現(xiàn)問題的具體變量并不是固定哪一個, 但是在大概 10 分鐘內(nèi)肯定會有其中一個出現(xiàn)執(zhí)行邏輯問題。隨意動一下代碼問題就不出現(xiàn), 或者出現(xiàn)的位置發(fā)生變化 ; 用 KEIL 編譯器去設(shè)置斷點, 想看該變量信息, 也會導致問題不再出現(xiàn)。
02
問題分析
一開始查看 errta sheet, 看到以下相關(guān)內(nèi)容 :
![](https://file1.elecfans.com//web2/M00/B4/CC/wKgZomVxKE-AY2T4AACy6dyNWu4254.jpg)
即懷疑問題跟 AXI SRAM 相關(guān). 查看客戶的這些變量, 確實是存放在 AXI SRAM 中. 由于任何修改代碼都可能導致問題不再出現(xiàn), 因此所有嘗試須建立在不修改代碼的基礎(chǔ)上, 不然無法說明問題。
于是讓客戶用 STM32CubeProgrammer 以 hot plug 模式連接 MCU, 按照勘誤手冊中 2.2.9 節(jié)所描述的 workaround 方式將 AXI_TARG7_FN_MOD 寄存器的 READ_ISS_OVERRIDE 位通過地址的方式直接修改 :
![](https://file1.elecfans.com//web2/M00/B4/CC/wKgZomVxKE-AHFv3AAFZc_YTqb8988.jpg)
結(jié)果發(fā)現(xiàn)并沒什么效果. 于是排除了這種可能性.
一開始也懷疑問題可能跟 Cache 有關(guān), 于是測試下關(guān)閉 Cahce 會怎么樣. 通過 KEIL 調(diào)試模式下,暫停住 CPU 運行, 然后手動關(guān)閉 D-Cache :
![](https://file1.elecfans.com//web2/M00/B4/CC/wKgZomVxKE-AVpz7AABsg6d2Ryg158.jpg)
結(jié)果發(fā)現(xiàn)問題消失不見 ! 說明問題肯定跟 Cache 有關(guān).
但客戶的代碼最終肯定是不能關(guān)閉 Cache 的, 想到內(nèi)核中有一個寄存器可以打開全局 Cache 的write throght 模式, 如下編程手冊中的 CACR 寄存器的 FORCEWT 位 :
![](https://file1.elecfans.com//web2/M00/B4/CC/wKgZomVxKE-AP6TtAACZhT5O_eU740.jpg)
結(jié)果發(fā)現(xiàn), 客戶的代碼本身就已經(jīng)打開 :
![](https://file1.elecfans.com//web2/M00/B4/CC/wKgZomVxKE-AKO4CAABA4BDD5mI059.jpg)
看樣子此模式與此問題無關(guān). 得換個思路.
考慮到問題跟內(nèi)存數(shù)據(jù)有關(guān), 代碼又不能動. 但是得想辦法讓內(nèi)存中數(shù)據(jù)的位置動動, 看看會有什么效果 ?
通過修改 KEIL 的鏈接配置文件.sct 文件, 將變量隨意動動, 結(jié)果發(fā)現(xiàn)問題也會消失不見 ! 這說明,數(shù)據(jù)的地址跟問題絕對有關(guān)聯(lián).那么具體是哪些數(shù)據(jù)呢 ?
為了精確定位到與哪些變量有關(guān), 查看 KEIL 生成的 map 文件, 按地址倒序?qū)⒚總€程序中所用到的.o 的對應(yīng)變量逐個挪移動 DTCM RAM 中.
![](https://file1.elecfans.com//web2/M00/B4/CC/wKgZomVxKE-AXliiAABZEzbyPo0849.jpg)
為什么要倒序呢? 主要是因為, 假如先挪低地址的變量, 肯定會導致高地址的變量向低地址移動.這好比, 如果先抽掉下面的磚頭, 那么上面的磚頭會自動移動下面去. 假如先抽掉上面的磚頭情況就不一樣了, 下面的磚頭還會保持不動. 這就是為什么先挪移上面的磚頭的意義, 也就是所謂的倒序.
通過這種方式, 最終定位到問題跟 heap_4.o 文件以及用戶使用到的第三方提供的 xx.o 文件中的ZI 數(shù)據(jù)有關(guān). 只要保持這兩種數(shù)據(jù)位置不變, 那么問題就可以穩(wěn)定觸發(fā), 一旦其中任何一個位置有所變動, 問題就消失不見.
![](https://file1.elecfans.com//web2/M00/B4/CC/wKgZomVxKFCAAj2QAABFZMU0i1o745.jpg)
現(xiàn)在我們知道規(guī)律了, 那么只要固定好這兩種 ZI 數(shù)據(jù)位置不變的情況下, 再去嘗試修改代碼, 結(jié)果發(fā)現(xiàn), 此時修改代碼不再會對結(jié)果產(chǎn)生影響! 換句話說, 現(xiàn)在可以自由修改代碼了.
考慮到此問題與 Cache 有關(guān), 于是接下來通過 MPU 設(shè)置將 heap_4.o 所在區(qū)域的 Cache 功能關(guān)閉, 結(jié)果發(fā)現(xiàn)問題消失.
![](https://file1.elecfans.com//web2/M00/B4/CC/wKgZomVxKFGAa5vMAAEPcts3Hzs493.jpg)
![](https://file1.elecfans.com//web2/M00/B4/CC/wKgZomVxKFGAPlzuAACtY0g87dE674.jpg)
Heap_4.o 的 ZI 數(shù)據(jù)是存放在 SRAM2 中的 0x3002 E050 位置.
![](https://file1.elecfans.com//web2/M00/B4/CC/wKgZomVxKFGADKfYAAAj6lYvk4M686.jpg)
![](https://file1.elecfans.com//web2/M00/B4/CC/wKgZomVxKFGADxc3AAAKy2Qv5X8962.jpg)
現(xiàn)在的現(xiàn)象是,Heap_4.o 的 ZI 數(shù)據(jù)只需要固定在這個位置, 問題就能穩(wěn)定重現(xiàn),只不過將其對應(yīng)的cache 關(guān)閉, 問題則消失.
那么此區(qū)域默認的 Cache 屬性是怎么樣的呢? 這個在 AN4839 中可以找到其默認屬性:
![](https://file1.elecfans.com//web2/M00/B4/CC/wKgZomVxKFGAFT8jAAC-q4s_Qnw561.jpg)
于是我們通過代碼, 將其 MPU 屬性再次配置其默認屬性:
![](https://file1.elecfans.com//web2/M00/B4/CC/wKgZomVxKFKAPfjOAACqQHv8zyU869.jpg)
![](https://file1.elecfans.com//web2/M00/B4/CC/wKgZomVxKFKAOntwAAEQlRyaIUk266.jpg)
結(jié)果問題可以重現(xiàn). 這再次說明, cache 屬性對結(jié)果有影響.
但是此時還無法對其產(chǎn)生的過程細節(jié)進行解釋.
與此同時, 嘗試關(guān)閉客戶使用第三方庫 xx.o 文件中的數(shù)據(jù) cache, 問題也同樣會消失。這說明, 此問題跟客戶所使用的第三方庫是有關(guān)系的, 其數(shù)據(jù)在 cache 中產(chǎn)生了一致性問題.
于是詢問客戶這個第三方庫是如何來的? 他們回復是一家歐洲公司提供的, 且是以 M4 內(nèi)核編譯的.
很明顯, 在使用原則上, M4 編譯出來的.o 文件, 就不應(yīng)該用在 H7 工程上.
以 M4 為內(nèi)核編譯的.o 文件放到 M7 工程中會產(chǎn)生什么樣的影響? 雖然理論上, M7 內(nèi)核的指令集是向下兼容的, 但是也需要考慮 M7 內(nèi)核相關(guān)的一些特性, 比如 Cache, memory barrier 等等. 不能完全確保不會出問題, 最保險就是重新以 M7 內(nèi)核編譯這個.o 文件.
由于這個第三方.o 文件客戶自己也是無法知道其內(nèi)部是如何實現(xiàn)的, 因此, 問題的具體產(chǎn)生過程是沒辦法進一步調(diào)查了. 但定位到這個.o 文件已經(jīng)是當前能得到的最終結(jié)果.
03
小結(jié)
本文最終問題的真相雖有點匪夷所思, 但這正反映了當前國內(nèi)軟件應(yīng)用上的混亂情況. 本文所描述的問題根本原因雖然很另類, 但所涉及到的方法卻對開發(fā)者有一定的參考意義, 在不能動代碼的情況下, 需要挪動數(shù)據(jù)的位置, 這就必須對編譯器有一定的了解. 雖也不至于太難, 但對很多開發(fā)都來說, 對編譯器的了解未必很深, 因此, 一開始很多人就會卡住。另外, 對 MPU 的了解也是一大門檻. 因此, 特奉上此文, 以供參考.
原文標題:實戰(zhàn)經(jīng)驗 | 數(shù)據(jù)意外變化導致條件判斷流程異常
文章出處:【微信公眾號:STM32單片機】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
-
單片機
+關(guān)注
關(guān)注
6044文章
44628瀏覽量
638994 -
STM32
+關(guān)注
關(guān)注
2273文章
10926瀏覽量
357793
原文標題:實戰(zhàn)經(jīng)驗 | 數(shù)據(jù)意外變化導致條件判斷流程異常
文章出處:【微信號:STM32_STM8_MCU,微信公眾號:STM32單片機】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
提升開關(guān)電源效率的理論分析與實戰(zhàn)經(jīng)驗
![提升開關(guān)電源效率的理論分析與<b class='flag-5'>實戰(zhàn)經(jīng)驗</b>](https://file1.elecfans.com/web3/M00/05/55/wKgZPGd_LySAYShvAAAZtQjQtaA655.jpg)
使用MCUXpresso for VS Code插件開發(fā)Zephyr的hello world
![使用MCUXpresso for VS Code插件開發(fā)Zephyr的hello world](https://file1.elecfans.com/web3/M00/04/A6/wKgZPGd3PBeAcAcFAABDETVNApk954.png)
AD7616輸出異常,導致后續(xù)控制的IGBT炸掉怎么解決?
VTT供電電源變換是否會導致DDR的Leveling出現(xiàn)time out的異常?
技術(shù)干貨驛站 ▏深入理解C語言:掌握C語言條件判斷,從if到switch的應(yīng)用
![技術(shù)干貨驛站 ▏深入理解C語言:掌握C語言<b class='flag-5'>條件</b><b class='flag-5'>判斷</b>,從if到switch的應(yīng)用](https://file1.elecfans.com/web2/M00/FC/CD/wKgZomaWI5uASgBaAABuQHdMO4I302.png)
plc突然斷電會導致什么異常
服務(wù)器數(shù)據(jù)恢復—異常斷電導致RAID信息丟失的數(shù)據(jù)恢復案例
服務(wù)器數(shù)據(jù)恢復—異常斷電導致存儲癱瘓的數(shù)據(jù)恢復案例
![服務(wù)器<b class='flag-5'>數(shù)據(jù)</b>恢復—<b class='flag-5'>異常</b>斷電<b class='flag-5'>導致</b>存儲癱瘓的<b class='flag-5'>數(shù)據(jù)</b>恢復案例](https://file.elecfans.com/web2/M00/A7/9B/pYYBAGRsboWAHB3gAAOZriatnis300.png)
PLC出現(xiàn)問題時如何快速判斷是CPU異常
HarmonyOS實戰(zhàn)開發(fā)-合理選擇條件渲染和顯隱控制
服務(wù)器數(shù)據(jù)恢復—異常斷電導致RAID管理信息丟失的數(shù)據(jù)恢復案例
lc振蕩電路判斷是否起振的相位條件是什么
服務(wù)器數(shù)據(jù)恢復-異常斷電導致服務(wù)器故障的數(shù)據(jù)恢復案例
![服務(wù)器<b class='flag-5'>數(shù)據(jù)</b>恢復-<b class='flag-5'>異常</b>斷電<b class='flag-5'>導致</b>服務(wù)器故障的<b class='flag-5'>數(shù)據(jù)</b>恢復案例](https://file1.elecfans.com/web2/M00/C2/C2/wKgaomXe3RKAB9LAAAGGXQmfEy8104.png)
評論