研發紀事

文章

顯示從 2025 起發佈的文章

STM32H7x 最佳化的數學運算，採用 CMSIS-DSP 函數庫

- 6月 29, 2025

STM32H750 的晶片核心是 ARM Cortex-M7，它是以 Armv7-M 架構所設計而成。內建浮點運算單元 (FPU - Floating Point Unit)，以及數位訊號處理(DSP)模組，不過需要搭配適合的函數庫才能編譯成適合機器執行的指令碼。ARM 提供一套開源的 CMSIS-DSP 函數庫，支援 Cortext-M 系列的數學運算，能提升運算的速度。在 Keil IDE 開發環境下，STM32H750 的項目中打開下圖的選單，將CMSIS Core 和 DSP 模組載入，完成第一步驟。接下來，我們要了解 CMSIS-DSP 有支援三種 ARM 的核心架構，這將影響程式碼的定義。 ARM_MATH_NEON 是第一種定義，代表 Neon 的核心， ARM Neon 技術是一種先進單指令多資料 (SIMD) 架構延伸，應用於 Arm Cortex-A 系列及 Cortex-R 系列處理器。 ARM_MATH_HELIUM 是第二種定義，代表 Helium 的核心， ARM Helium 技術是 Arm Cortex-M 處理器系列的 M 系列向量擴充方案 (MVE)。Helium 為 Armv8.1-M 架構的延伸，可協助機器學習 (ML) 與數位訊號處理 (DSP) 應用大幅提升效能。STM32H750 並不屬於前面兩種的定義，就不用將它們放進編譯的過程裡。不過，我們要將這三個定義放進編譯，分別是 ARM_MATH_DSP ︑ ARM_MATH_MATRIX_CHECK ︑ ARM_MATH_ROUNDING 才行。因為 STM32H750 晶片支援浮點運算，所以下圖的選單要開啟，如果不開啟的話，數學運算將會花費數倍的時間，甚至更多。最後我們測試三角函數的運算，Cos(x)*Cos(x) + Sin(x)*Sin(x)，運算一百萬次後，比較有無採用 DSP 的兩者效能。下圖的程式碼，上半段是採用一般數學函數的運算，沒有 DSP 優化。下半段是採用 DSP 優化的函數，然後比較兩者的效能差異。 ...

[筆記] RAG 檢索增強生成的技術概念

- 6月 16, 2025

Q ：為何需要 RAG 資料檢索？ A ：光靠 LLM 大語言模型無法準確回答問題，反而出現一本正經地胡說八道，專業術語稱為 LLM 的幻覺 (Hallucination) 。為了解決這問題，有兩種方法：第一種是對 LLM 的預訓練模型進行微調訓練，第二種是加入 RAG 做資料檢索和 LLM 的語句生成。前者需要花費硬體設備進行訓練，後者採用 LLM+RAG 架構可大幅節省成本，市面上比較接受後者方案。其系統架構如下： Q ： RAG 的開發與架構？ A ：初期 RAG 開發階段，需要對資料進行多模態的處理，比如對 PDF 檔案擷取文字、表格、圖片 … 等多種模態，過程包含資料清洗，剔除一些符號、重複語句、無意義文字 … 等。然後，對清洗後的資料進行分塊和向量化，最後寫入向量資料庫。這裡的分塊和向量化會使用到現有的演算法來實現，向量資料庫也有現有的架構可使用。前面是前期 RAG 的資料處理階段，後期是指 RAG 運行階段，需要對接到 LLM 模型，如下圖。 Q ：如何資料擷取與清洗？ A ：客戶提供技術文件，可能是 TXT 或 PDF 檔案。首先，將檔案的文字擷取下來存放成自訂格式 (JSON) ，對於 PDF 檔案而言，內容包含文字、表格、圖片都必須分別寫 python 程式處理。即使把文字從檔案取出，在這一大堆文字裡面包含換行符號，語句切割不連續，無意義的詞或標題數字 … 等問題，這些問題需要靠程式來做清洗後才能進到下階段。 Q ：如何向量化？ A ：資料清洗後，資料要進行切塊 (chunk) ，再將其向量化，這過程稱為 embedding 。有人研究中文 embedding 的檢索能力，參考 https://ihower.tw/blog/archives/12167 ，需要導入有支援多語言的 embedding model 效果最好。切塊採用 Jieba 分詞的算法，文本會切成小的詞彙，以便之後檢索。這些詞彙換算成向量，而典型檢索的演算法為 BM25 ，優點為方法簡單效果不錯，因此使用廣泛，缺點是單純根據詞頻等統計和關鍵字檢索做判斷，無法理解語意。而 Word2Vec 使用高維向量來表示單詞，能分辨細微語意之差別。向量化的數據要存放在向量資料庫，基礎型的有 ChromaDB 、 MilvusDB… 等可本地部署。

[筆記] 製作一個 STM32H750 的外部 Flash 燒錄器

- 6月 02, 2025

STM32H750這顆晶片是 Cortex-M7 核心，內部時脈 480MHz，在同級的 STM32 系列中屬於高效能晶片。不過，它有個問題就是內部 Flash 容量太小，只有 128MB 而已，為了解決這問題，通常外部會掛一顆 Flash 晶片。此時，我們需要自製一個燒錄程式，如下圖所示，紅線標示的 On-chip Flash 是官方提供的燒錄程式，而另一紅線標示的 Ext Flash SPI 就是我們要提供給 Keil IDE 的燒錄程式。如何自製一套燒錄程式給 Keil IDE 使用呢？放心，IDE 有提供一個範例項目，放在 \Keil_v5\ARM\Flash\_Template 目錄底下，我們工作就是將 FlashDev.c 和 FlashPrg.c 兩個檔案的函數給實現了即可。在 FlashDev.c，我們填入外掛 Flash 的屬性，比如容量大小﹑STM32 存取的位址﹑Sector size, Sector Addr...等，如下。在 FlashPrg.c，我們必須實現底下幾個函式的驅動。由於外掛 Flash 晶片型號為 W25Q256，也就是寫一套驅動這顆晶片的程式碼。不必擔心！這部分可以從網路的開源找到相關的驅動程式碼 ( https://pan.baidu.com/s/1LuH_zhXgZMqHJcKoLcepdQ 提取码：kmbf )。筆者下載後，還是會遇上驅動的問題，必須再進行 debug 後才能使用。這裡有一點要注意的，W25Q256 預設的 SPI 通訊指令是 3-byte Address Mode，但是整個驅動程式都採用 4-byte 模式，於是在初始化過程要先設定為 4-byte Addr Mode 才能成功使驅動程式執行，如下圖。最後，將這個 Flash 項目編譯後，產生的 .axf 複製成 .FLM 檔案，再把這檔案放到 \Keil_v5\ARM\Flash 目錄底下，這樣就完成自製外部燒錄器的功...

[筆記] STM32H750 如何宣告一塊外部記憶體? 而不發生 HardFault 異常。

- 5月 18, 2025

STM32H750 內部記憶體不到 1MB，在記憶空間使用大的情況下，我們需要在晶片外部增加外部 SRAM 以滿足空間需求。如何宣告一個變數映射到這外部記憶體？對於編譯器版本 AC5 或 AC6 最安全的做法是底下這樣宣告： uint16_t *myTest = (uint16_t *) 0xC0000000; 直接將變數的位址映射到外部記憶體位址上，然後計算好這個變數的 array 長度大小。另一個宣告方式，如下，但僅適用於 AC5 版本， uint8_t myTest[128] __attribute__((section(" .exsram "))); 這樣宣告後，需要在 Keil IDE 的 scatter 檔案中，添加一個記憶體空間，如下圖所示。上面變數宣告的 section 名稱為 .exsram ，正好對應到下面 scatter 檔裡面的定義空間。如此一來，變數與外部記憶體的綁在一起了。不過，光這樣做還不夠，因為在系統 SystemInit 函數執行後，跳到 main 函數前會對變數進行初始化，此時的外部記憶體與晶片之間的介面還未配置好，系統就直接存取外部記憶體會發生硬體異常，掉進 HardFault_Handler( ) 中斷裡面。因此，在跳到 main 函數前必須執行 FMC 介面的初始化，把外部 SRAM 介面參數配置好，這樣就能存取外部空間了，而不發生異常情況。

[筆記] 兩款 STM32H7xx 攝影模組開發板 (H750XBH6 / H743VIT6)

- 4月 14, 2025

最近動手研究兩款 STM32H7xx 系列的開發板，去年已經做過 STM32H750 相關的案子，這次是研究攝像頭模組。購買一塊是 H750XBH6，另一塊是 H743VIT6，兩款的核心都是 Cortext-M7，最高時脈 480MHz ，屬於 STM32 系列的高效能晶片，開發板適合實現照相﹑攝影﹑記錄...等功能。兩款的主要差別在於 Flash 和 SRAM 容量的大小，如下圖。Flash 128kB vs 2MB ，H743可以用來開發更大型複雜的程式。內部可使用的 SRAM 都是 864kB ，透過擴充介面，可以外部再增加 SRAM 容量，H750 開發板外部又多了 16MB SRAM，可惜 H743 開發板沒有外增 SRAM。若要開發邊緣運算的功能，所占用的 Flash 和 SRAM 空間都不少，這兩款開發板以 STM32H743 最為適合，但是需要再外增 SRAM 容量才行。實際上，STM32 市面上的開發板還沒看到帶有特大的記憶空間，反觀 ESP32-S3 Cam 模組很容易買到 Flash 8MB / SRAM 8MB 的型號板子，因此未來想要開發影像方面的功能，或許用 ESP32 做為前期研究較為適合，且價格更便宜。

[筆記] ARM Compiler 6 且不勾選 MicroLIB，晶片無法開機運行？

- 3月 25, 2025

問題：STM32晶片用 ARM compiler 6 版本編譯，不勾選 MicroLIB，如下圖設定。燒錄後，晶片不會自動運行？ 1. 使用 C++ 編譯，不能再勾選 MicroLIB，因為組譯會出現錯誤。由於 MicroLIB 不支援C++。 2. 改回 ARM Compiler 5，勾選 MicroLIB。 3. 或者使用 C++ 編譯，但需要重新定義一些 stdio 的函數，參考 keil MDK AC5向AC6迁移后如何重定向printf_ac6 printf-CSDN博客。然後，勾選 MicroLIB，全部重新編譯。 4. 使用 C++ 編譯的解決方式，新增 Compiler I/O，如下圖。如果有用到 File or TTY，就勾選起來。

STM32H743VIT6 開發板並帶有 CAM 和 LCD 模組

- 3月 24, 2025

STM32H743 開發板帶有 DCMI 的鏡頭模組和 LTDC 控制器可外接 LCD 顯示模組，晶片的內部時脈最高可達 480MHz，內建 Flash 和 SRAM 記憶體，開發板的正背面，如下圖所示。開發板上面還有 SD 卡槽和 USB 接口，在應用方面可開發為照相機﹑攝影機﹑行車紀錄器...等終端產品。晶片開機啟動機制：STM32H7x 系列晶片有一根 BOOT 接腳，當腳位電壓為低時，開機通電後，系統會從 Flash 的 0x08000000 位址開始執行，這塊區域正是我們所存放的應用程式碼。萬一我們程式碼寫得不夠完整而造成晶片系統陷入異常的時候，此時可能我們也無法透過 ST-Link 燒錄或除錯，遇到這種情況，必須將 BOOT 腳位電壓拉高，再開機通電，讓晶片進入 Bootloader。晶片在生產期間，ST會將官方的 Bootloader 燒錄在 Flash 的 0x1FF00000 位址，於是通電後進入這段程式後，我們就可以透過官方工具 STM32CubeProgrammer 從 USB 端口進行燒錄下載。開發板生產商提供鏡頭與顯示模組的範例程式碼，連結如下 http://www.fdiot.top/forum.php?mod=forumdisplay&fid=52 ，我們用 Keil IDE 環境就能編譯並除錯運行。所提供的範例不帶 RTOS 架構，為了往後擴展便利，我將此範例架構修改為 RTOS 系統。首先，在 Keil 環境下需添加三個部分：CMSIS-RTOS2 ﹑ Device-Startup ﹑ RTOS，如下所示。然後，程式碼呼叫 osKernelInitialize() 初始化函數，再創建新的線程函數 osThreadNew ( Routine, NULL, &osAttr )，最後呼叫 osKernelStart() 啟動函數，開發板就能運行 RTOS 架構了。操作影片 https://youtube.com/shorts/LuNI9CanfJ4?feature=share

初學 ESP32-S3 攝像模組的開發

- 2月 25, 2025

ESP32-S3模組的核心是 XTensa 雙核的處理器，運行最高時脈為 240MHz。這個無線模組具備 WiFi 2.4G 無線網路，還有低功耗的藍芽 BLE。模組外觀如下圖一，晶片本身帶有兩組 USB 介面，其中一組是 USB_UART 通訊介面，另一組為 USB OTG。圖一的右邊 type-C USB 是 serial 通訊端口，用來接 Arduino IDE 或者 debug 之用，圖一的左邊 type-C USB 則是 OTG 之用。圖一：攝像模組的外觀 ESP32-S3 模組的硬體規格能從晶片命名來得知，我們從外觀圖知道這是 N16R8 編號，再根據技術文件的命名規則(下圖二)，因此這顆模組帶有 Flash 16MB (Quad SPI) 以及 PSRAM 8MB (Octal SPI)，這項資訊會用在稍後的 Arduino IDE 的環境設定。圖二：晶片模組的命名規則依據上述的規格，開啟 Arduino IDE，在工具欄位底下設定相關的參數，如下圖三。開發板選擇"ESP32S3 Dev Module"，然後記憶體分配的模式設為Huge APP，這樣才有足夠的空間存放攝像模組的APP程式碼。圖三：Arduino IDE 的環境配置接下來，我們要驗證攝像模組是否能不能正常運作。因此，開啟範例選項，如下圖四，選擇 CameraWebServer 的參考範例。在範例的程式碼中，先要選擇這個模型，下面這段定義要被採用，編譯過程便會將模組對應的腳位啟用。最後，我們再填入無線網路的 ssid 與 password，並且檢驗編譯範例有沒有出現錯誤。 #define CAMERA_MODEL_ESP32S3_EYE // Has PSRAM 圖四：攝像模組的參考範例成功編譯後，再進行燒錄。在圖一的模組外觀，上面有兩顆小按鈕，左邊是 rese...