文章

顯示從 6月, 2022 起發佈的文章

[應用] 關於 Helium LoRa WAN 物聯網路 (HNT挖礦機)

圖片
        在前一篇介紹 LoRa 的公眾網路(TTN)  https://han-ya.blogspot.com/2022/05/lora-thethingsnetwork-helium.html ,本文打算再介紹由 LoRa 通訊協定所建構的物聯網路,這網路稱為 Helium 網,而當下仍以擴展網路網,提升覆蓋率為主 。該系統網主要由 Hotspot ( 熱點 )路由器與各類 LoRa 終端設備(或稱為 節點 )所構成,目前全球 Hotspot 裝機量已超過 86 萬台,就我個人看法,Helium 應該還在尋找商業應用的目標階段,不過我會從技術與操作的角度去了解這個 LoRa  公網,底下分別介紹這兩個系統成員 。 Helium Hotspots         就運作角色而言,這個 Hotspots 熱點路由器的功能是做為連接 LoRa 網路與 Internet 網的橋樑,類似一個 IP 分享器的概念。負責接收來自 LoRa 終端設備的連線請求,並轉傳資料到 Internet 網路。另外,每個 Hotspots 涵蓋的範圍大約是方圓 500 公尺,因此整個 LoRa 網則由各地無數個 Hotspots 所形成的覆蓋網,如下圖一的蜂巢狀,我們可以連上  https://explorer.helium.com/  ,從這個網站就能看到全球 Hotspots 分布的情況,圖一是顯示高雄市三民區附近的路由器,蜂巢上面的數字代表這個區域內有多少台 Hotspots 路由器。 圖一:Hotspots 熱點路由器的蜂巢圖         目前 Hotspot 機器由不同的廠商所製造[1][2],並沒有特定的專屬廠商,也就是大家都能製造這台設備的戰國時代,我手上測試的機器是 Linxdot 礦機。為何它稱為挖礦機?在前一篇文章有說明,Helium 網路為了提高覆蓋率,利用加密貨幣的區塊鏈技術,設計一套補貼的商業模式,藉由這誘因以便建構一個全球的 LoRa 物聯網路。當資料流量通過這個 Hotspots,後台系統透過計算機制得出流量的報酬,便會在這台機器上記錄 reward,也就是 HNT 幣,如下圖二所示。HNT 幣也有市場換算成美元的價格,可以從上述的網站查詢到市價 、 市值 、流通量....等資訊,這個幣也能支付我們本身使用  LoRa  資料傳輸量的費用,換句話

[工具] 中文自然語言處理 NLP 的開發套件

圖片
        自然語言處理 ( NLP - Nature Language Processing) 主要能讓機器分析對話文字,進而理解對話的意思,這項技術其實已經發展很多很多年了,但在近年來,拜高速網路 、 海量數據 、 智能發展之賜,有機會廣泛地應用到實際生活之中,比如聊天機器人 、 文件資料搜索 、演講內容分析...等 。開發 NLP 技術的含量很高,需要建立模型 、收集 大量語料 、 訓練與 運算,一般的開發人員其實很難短時間就能將 NLP 的語意功能實現出來。目前幾個雲端平台的大廠(微軟 、 谷歌 、 阿里 、 百度)有提供 NLP 相關的服務,但所幸在中文自然語言處理領域中有幾個學術單位開發出不錯的模型,並且提供 SDK 工具包給工程人員進行二次開發,常見的中文 NLP 模型有:哈爾濱工業大學的 LTP 、中科院的 NLPIR 、清華大學的 THULAC ...等等,其中以哈工大和中科院的 NLP 模型效果比較佳 (根據網路使用者的比較後,這兩家的 CP 值較高),中科院的 SDK 提供 C# / C++ / Java 這些程式語言的介面,對我們開發者更為便利 。本文將介紹中科院的 NLPIR SDK 開發和操作的結果。         首先,我們到 github 網站下載 NLPIR, https://github.com/NLPIR-team/NLPIR ,當中有一個 SDK 目錄,裡面存放了 20 種自然語言處理的組件,各個組件的功能說明,如下圖一所示。雖然這套 SDK 提供便利的介面讓大家進行二次開發,但是它有 license 的限制,對於短期測試的開發人員而言,github 上面會定期提供一個月期限的 license,我們只要下載並更新 license 後就能繼續使用 SDK。如果有商業需求的話,則需要購買商業 license,取得長期使用權。下圖中以藍色標示的組件是我實際測試操作過的部分,當中的 NLPIR-ICTCLAS 組件為系統的核心,可以做到中文分詞,將一段句子或文章經過這組件的分析後,切出一個一個詞並標示出名詞 、 動詞 、 形容詞 、 副詞....等詞性,這一刀切的精不精準就代表這套系統優不優秀了。除了處理中文分詞之外, NLPIR-ICTCLAS  同時也能找出句子的關鍵字或有無發現新詞。         另外其他組件,像 K