面向邊緣設備的TinyML模(mo)型自動(dong)化(hua)(hua)剪(jian)枝與(yu)量化(hua)(hua)聯合(he)優化(hua)(hua)框架
引言:邊(bian)緣(yuan)計算與(yu)TinyML的(de)挑戰 隨著物聯網(IoT)和(he)(he)邊(bian)緣(yuan)計算的(de)快速發展,部(bu)(bu)署(shu)在資源受限設備(bei)(如傳(chuan)(chuan)感器、攝像頭、可穿戴設備(bei))上的(de)微(wei)型機(ji)器學習(TinyML)模型需求激增。然而,這類設備(bei)的(de)計算能力、內(nei)存和(he)(he)能耗限制,使(shi)得傳(chuan)(chuan)統的(de)深度學習模型難以直接部(bu)(bu)署(shu)。為(wei)此,模型壓縮技術(如剪枝和(he)(he)量(liang)化)成為(wei)關鍵手…
嵌(qian)入式視覺系統中基于硬件(jian)加速的YOLO目標(biao)檢測算法移(yi)植與優化
一、引言 隨著物聯網(IoT)和智能設(she)備的(de)快速(su)發展,嵌(qian)入式視覺(jue)系(xi)統(tong)(tong)變(bian)得越(yue)來越(yue)重(zhong)要。這些系(xi)統(tong)(tong)能夠使設(she)備看見并(bing)理解它們周圍的(de)環(huan)境,從而做出相應(ying)的(de)反(fan)應(ying)。YOLO(You Only Look Once)是一種流行的(de)目(mu)標檢(jian)測(ce)算法,它以其快速(su)且準確的(de)特點(dian)被廣(guang)泛應(ying)用于(yu)各種場景。本(ben)文將(jiang)介紹(shao)如何在嵌(qian)入式系(xi)統(tong)(tong)上實(shi)現(xian)基于(yu)硬(ying)件加速(su)…
嵌入式設備固件空(kong)中升級(OTA)的安全性與可靠性保(bao)障方案
嵌入(ru)式(shi)設(she)備OTA升(sheng)級(ji):構筑安全(quan)可(ke)靠的(de)(de)(de)空中(zhong)升(sheng)級(ji)生命線 在萬物互聯(lian)的(de)(de)(de)智能(neng)時(shi)代,嵌入(ru)式(shi)設(she)備的(de)(de)(de)固件空中(zhong)升(sheng)級(ji)(OTA)技術已成(cheng)為產品競爭力的(de)(de)(de)核心要素(su)。從智能(neng)家(jia)居到(dao)工業物聯(lian)網(wang),OTA技術讓數億臺設(she)備得以持續進化,但(dan)2021年某(mou)知名車(che)企因OTA漏(lou)洞導致(zhi)數萬輛汽車(che)被遠程破解的(de)(de)(de)事件,暴露出(chu)空中(zhong)升(sheng)級(ji)系統的(de)(de)(de)安全(quan)短板。…
嵌(qian)入式Linux實(shi)時性改造:Xenomai雙核方案與PREEMPT_RT性能對比
引言 在工業控制、機器(qi)人、汽車電(dian)子等領域,實時性(xing)是嵌入式系統(tong)的(de)關鍵需求。傳(chuan)統(tong)Linux內核由于調度機制的(de)限制,難以滿足微秒級(ji)響應的(de)要求。為了(le)解決這(zhe)一問題(ti),開源社(she)區提出(chu)了(le)多種實時性(xing)改(gai)造方案(an),其中Xenomai雙核架(jia)構和PREEMPT_RT補丁是目(mu)前主流的(de)選擇。本文將從技術原理、性(xing)能表現和適用場景三個方面…
了解自動駕駛的嵌入式視覺SoC中(zhong)ISP與(yu)NPU
自(zi)動(dong)駕(jia)駛的嵌入式視(shi)覺SoC(System on Chip,片上系統)是自(zi)動(dong)駕(jia)駛汽車實(shi)(shi)現環境感知、決策(ce)和控制(zhi)的核心硬件(jian)(jian)組件(jian)(jian),它集成(cheng)了多種功能模(mo)塊,以實(shi)(shi)現高效、實(shi)(shi)時的視(shi)覺處理(li)與智能分析。其(qi)架構(gou)一(yi)般由(you)CPU(中央處理(li)器(qi)(qi))、GPU(圖(tu)形處理(li)器(qi)(qi))、ASIC(專用集成(cheng)電路)、ISP(圖(tu)像(xiang)信(xin)號(hao)處理(li)器(qi)(qi))、接口(kou)控制(zhi)器(qi)(qi)、內(nei)部總線…
基于LoRaWAN 2.4GHz的(de)星型拓撲網絡(luo)抗干(gan)擾與頻(pin)譜效(xiao)率(lv)提升方(fang)案(an)
1. 引(yin)言 隨著物(wu)(wu)聯(lian)網(wang)(IoT)技術的(de)快(kuai)速發展,低功耗廣(guang)域(yu)網(wang)(LPWAN)在智(zhi)慧(hui)城(cheng)市(shi)、工(gong)業(ye)物(wu)(wu)聯(lian)網(wang)(IIoT)、智(zhi)能家(jia)居等(deng)領域(yu)的(de)應用日(ri)益廣(guang)泛。LoRaWAN作為一種主流的(de)LPWAN技術,憑(ping)借(jie)其(qi)遠距(ju)離、低功耗和低成(cheng)(cheng)本的(de)優(you)勢,成(cheng)(cheng)為大規模(mo)物(wu)(wu)聯(lian)網(wang)部署的(de)首選方案之一。然而,傳統(tong)的(de)Sub-GHz LoRaWAN(如868MHz/915MHz)在頻譜…
大語(yu)言模型(LLM)中(zhong)的(de)KV緩存壓縮與動態稀疏注意力(li)機制設計
隨(sui)(sui)著(zhu)大語言(yan)模型(LLM)參(can)數規(gui)模的(de)增(zeng)長,推理階段的(de)內存(cun)占用(yong)和計(ji)算復雜度(du)成為(wei)(wei)(wei)核心(xin)挑(tiao)戰。傳統注意力機(ji)制(zhi)的(de)計(ji)算復雜度(du)隨(sui)(sui)序列(lie)長度(du)呈二次方增(zeng)長,而KV緩(huan)存(cun)的(de)內存(cun)消耗可能高達數十GB(例如(ru)Llama2-7B處(chu)理100K token時需50GB內存(cun))。為(wei)(wei)(wei)此,KV緩(huan)存(cun)壓(ya)縮(suo)與動態稀疏(shu)注意力成為(wei)(wei)(wei)提升(sheng)效率的(de)關鍵技(ji)術(shu)。 1)KV緩(huan)存(cun)壓(ya)縮(suo) …
基于擴散模型的(de)高分(fen)辨率圖像生成加速與顯存優化(hua)
一(yi). 什么(me)是(shi)擴(kuo)(kuo)散模(mo)型 擴(kuo)(kuo)散模(mo)型是(shi)近年來快速崛起的(de)生成式人工智能模(mo)型,通過(guo)模(mo)擬物理中的(de)擴(kuo)(kuo)散過(guo)程(如墨(mo)水(shui)在水(shui)中擴(kuo)(kuo)散),逐步將隨機(ji)噪聲轉化為有意義的(de)圖(tu)像、音頻(pin)或其他數據。 擴(kuo)(kuo)散模(mo)型的(de)核心就(jiu)是(shi)破壞與(yu)重建. 破壞: 前向(xiang)擴(kuo)(kuo)散(加噪) 像把(ba)一(yi)幅畫反復潑(po)墨(mo),逐步添加噪聲直至(zhi)變(bian)成完全隨機(ji)的(de)噪聲圖(tu)。 重建:…

