日韩亚洲欧美无砖专区,中文有码亚洲制服av片,67194成是人免费无码

詳析卷積神經(jīng)網(wǎng)絡(luò)CNN的特性和應(yīng)用

2023-03-30 784次

一、神經(jīng)網(wǎng)絡(luò)的訓(xùn)練過程

前文中討論的CIFAR網(wǎng)絡(luò)由不同層的神經(jīng)元組成。如圖1所示，32 × 32像素的圖像數(shù)據(jù)被呈現(xiàn)給網(wǎng)絡(luò)并通過網(wǎng)絡(luò)層傳遞。CNN處理過程的第一步就是提取待區(qū)分對象的特性和結(jié)構(gòu)，這需要借助濾波器矩陣實現(xiàn)。設(shè)計人員對CIFAR網(wǎng)絡(luò)進行建模后，由于最初無法確定這些濾波器矩陣，因此這個階段的網(wǎng)絡(luò)無法檢測模式和對象。

為此，首先需要確定濾波器矩陣的所有參數(shù)，以最大限度地提高檢測對象的精度或最大限度地減少損失函數(shù)。這個過程就稱為神經(jīng)網(wǎng)絡(luò)訓(xùn)練。前文所描述的常見應(yīng)用在開發(fā)和測試期間只需對網(wǎng)絡(luò)進行一次訓(xùn)練就可以使用，無需再調(diào)整參數(shù)。如果系統(tǒng)對熟悉的對象進行分類，則無需額外訓(xùn)練;當(dāng)系統(tǒng)需要對全新的對象進行分類時，才需要額外進行訓(xùn)練。

進行網(wǎng)絡(luò)訓(xùn)練需要使用訓(xùn)練數(shù)據(jù)集，并使用類似的一組測試數(shù)據(jù)集來測試網(wǎng)絡(luò)的精度。例如CIFAR-10網(wǎng)絡(luò)數(shù)據(jù)集為十個對象類的圖像集合：飛機、汽車、鳥、貓、鹿、狗、青蛙、馬、輪船和卡車。我們必須在訓(xùn)練CNN之前對這些圖像進行命名，這也是人工智能應(yīng)用開發(fā)過程中最為復(fù)雜的部分。本文討論的訓(xùn)練過程采用反向傳播的原理，即向網(wǎng)絡(luò)連續(xù)展示大量圖像，并且每次都同時傳送一個目標(biāo)值。本例的目標(biāo)值為圖像中相關(guān)的對象類。在每次顯示圖像時，濾波器矩陣都會被優(yōu)化，這樣對象類的目標(biāo)值就會和實際值相匹配。完成此過程的網(wǎng)絡(luò)就能夠檢測出訓(xùn)練期間從未看到過的圖像中的對象。

圖1.CIFAR CNN架構(gòu)

圖2.由前向傳播和反向傳播組成的訓(xùn)練循環(huán)

二、過擬合和欠擬合

在神經(jīng)網(wǎng)絡(luò)的建模過程中經(jīng)常會出現(xiàn)的問題是：神經(jīng)網(wǎng)絡(luò)應(yīng)該有多少層，或者是神經(jīng)網(wǎng)絡(luò)的濾波器矩陣應(yīng)該有多大。回答這個問題并非易事，因此討論網(wǎng)絡(luò)的過擬合和欠擬合至關(guān)重要。過擬合由模型過于復(fù)雜以及參數(shù)過多而導(dǎo)致。我們可以通過比較訓(xùn)練數(shù)據(jù)集和測試數(shù)據(jù)集的損失來確定預(yù)測模型與訓(xùn)練數(shù)據(jù)集的擬合程度。如果訓(xùn)練期間損失較低并且在向網(wǎng)絡(luò)呈現(xiàn)從未顯示過的測試數(shù)據(jù)時損失過度增加，這就強烈表明網(wǎng)絡(luò)已經(jīng)記住了訓(xùn)練數(shù)據(jù)而不是在實施模式識別。此類情況主要發(fā)生在網(wǎng)絡(luò)的參數(shù)存儲空間過大或者網(wǎng)絡(luò)的卷積層過多的時候。這種情況下應(yīng)當(dāng)縮小網(wǎng)絡(luò)規(guī)模。

三、損失函數(shù)和訓(xùn)練算法

學(xué)習(xí)分兩個步驟進行。第一步，向網(wǎng)絡(luò)展示圖像，然后由神經(jīng)元網(wǎng)絡(luò)處理這些圖像生成一個輸出矢量。輸出矢量的最大值表示檢測到的對象類，例如示例中的"狗"，該值不一定是正確的。這一步稱為前向傳播。

目標(biāo)值與輸出時產(chǎn)生的實際值之間的差值稱為損失，相關(guān)函數(shù)則稱為損失函數(shù)。網(wǎng)絡(luò)的所有要素和參數(shù)均包含在損失函數(shù)中。神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)過程旨在以最小化損失函數(shù)的方式定義這些參數(shù)。這種最小化可通過反向傳播的過程實現(xiàn)。在反向傳播的過程中，輸出產(chǎn)生的偏置(損失 = 目標(biāo)值-實際值)通過網(wǎng)絡(luò)的各層反饋，直至達到網(wǎng)絡(luò)的起始層。

因此，前向傳播和反向傳播在訓(xùn)練過程中產(chǎn)生了一個可以逐步確定濾波器矩陣參數(shù)的循環(huán)。這種循環(huán)過程會不斷重復(fù)，直至損失值降至一定程度以下。

四、優(yōu)化算法、梯度和梯度下降法

為說明訓(xùn)練過程，圖3顯示了一個包含x和y兩個參數(shù)的損失函數(shù)的示例，這里z軸對應(yīng)于損失。如果我們仔細查看該損失函數(shù)的三維函數(shù)圖，我們就會發(fā)現(xiàn)這個函數(shù)有一個全局最小值和一個局部最小值。

目前，有大量數(shù)值優(yōu)化算法可用于確定權(quán)重和偏置。其中，梯度下降法最為簡單。梯度下降法的理念是使用梯度算子在逐步訓(xùn)練的過程中找到一條通向全局最小值的路徑，該路徑的起點從損失函數(shù)中隨機選擇。梯度算子是一個數(shù)學(xué)運算符，它會在損失函數(shù)的每個點生成一個梯度矢量。該矢量的方向指向函數(shù)值變化最大的方向，幅度對應(yīng)于函數(shù)值的變化程度。在圖3的函數(shù)中，右下角(紅色箭頭處)由于表面平坦，因此梯度矢量的幅度較小。而接近峰值時的情況則完全不同。此處矢量(綠色箭頭)的方向急劇向下，并且由于此處高低差明顯，梯度矢量的幅度也較大。

圖3.使用梯度下降法確定到最小值的不同路徑

因此我們可以利用梯度下降法從任意選定的起點開始以迭代的方式尋找下降至山谷的最陡峭路徑。這意味著優(yōu)化算法會在起點計算梯度，并沿最陡峭的下降方向前進一小步。之后算法會重新計算該點的梯度，繼續(xù)尋找創(chuàng)建一條從起點到山谷的路徑。這種方法的問題在于起點并非是提前定義的，而是隨機選擇的。在我們的三維地圖中，某些細心的讀者會將起點置于函數(shù)圖左側(cè)的某個位置，以確保路徑的終點為全局最小值(如藍色路徑所示)。其他兩個路徑(黃色和橙色)要么非常長，要么終點位于局部最小值。但是，算法必須對成千上萬個參數(shù)進行優(yōu)化，顯然起點的選擇不可能每次都碰巧正確。在具體實踐中，這種方法用處不大。因為所選擇的起點可能會導(dǎo)致路徑(即訓(xùn)練時間)較長，或者目標(biāo)點并不位于全局最小值，導(dǎo)致網(wǎng)絡(luò)的精度下降。

因此，為避免上述問題，過去幾年已開發(fā)出大量可作為替代的優(yōu)化算法。一些替代的方法包括隨機梯度下降法、動量法、AdaGrad方法、RMSProp方法、Adam方法等。鑒于每種算法都有其特定的優(yōu)缺點，實踐中具體使用的算法將由網(wǎng)絡(luò)開發(fā)人員決定。

五、訓(xùn)練數(shù)據(jù)

在訓(xùn)練過程中，我們會向網(wǎng)絡(luò)提供標(biāo)有正確對象類的圖像，如汽車、輪船等。本例使用了已有的 CIFAR-10 dataset。當(dāng)然，在具體實踐中，人工智能可能會用于識別貓、狗和汽車之外的領(lǐng)域。這可能需要開發(fā)新應(yīng)用，例如檢測制造過程中螺釘?shù)馁|(zhì)量必須使用能夠區(qū)分好壞螺釘?shù)挠?xùn)練數(shù)據(jù)對網(wǎng)絡(luò)進行訓(xùn)練。創(chuàng)建此類數(shù)據(jù)集極其耗時費力，往往是開發(fā)人工智能應(yīng)用過程中成本最高的一步。編譯完成的數(shù)據(jù)集分為訓(xùn)練數(shù)據(jù)集和測試數(shù)據(jù)集。訓(xùn)練數(shù)據(jù)集用于訓(xùn)練，而測試數(shù)據(jù)則用于在開發(fā)過程的最后檢查訓(xùn)練好的網(wǎng)絡(luò)的功能。

電源管理應(yīng)用領(lǐng)域上一篇下一篇優(yōu)化MCU SPI驅(qū)動程序提高ADC吞吐速率

最新文章

一文讀懂DRAM（動態(tài)隨機存取存儲器）工作原理、分類、主要廠商

DRAM是一種易失性半導(dǎo)體存儲器，用于計算機和其他數(shù)字設(shè)備作為主內(nèi)存。它的名字“動態(tài)”源于需要周期性刷新存儲的數(shù)據(jù)。

2025-06-19 120次

一文讀懂FPGA的工作原理、關(guān)鍵參數(shù)、品牌、運用

FPGA代表Field-Programmable Gate Array，中文譯為現(xiàn)場可編程門陣列。它是一種非常特殊的半導(dǎo)體集成電路芯片。與 CPU、GPU 或?qū)Ｓ眉呻娐沸酒诔鰪S時功能就固定不同，F(xiàn)PGA的硬件邏輯功能在制造完成后，可以由用戶在現(xiàn)場（Field）根據(jù)需要進行編程（Programmable）來定義。它本質(zhì)上是由大量可配置邏輯塊、可編程互連資源和豐富的輸入/輸出單元組成的陣列（Array）。

2025-06-05 104次

一文讀懂ADC（模數(shù)轉(zhuǎn)換器）與DAC（數(shù)模轉(zhuǎn)換器）類型、應(yīng)用

ADC（模數(shù)轉(zhuǎn)換器）與DAC（數(shù)模轉(zhuǎn)換器）芯片是連接模擬世界與數(shù)字系統(tǒng)的核心元器件，廣泛應(yīng)用于通信、工業(yè)控制、醫(yī)療設(shè)備、消費電子等領(lǐng)域。以下是它們的核心技術(shù)原理、類型及市場應(yīng)用解析：

2025-05-21 77次

一文讀懂GNSS模組產(chǎn)品分類、品牌、運用

全球?qū)Ш叫l(wèi)星系統(tǒng)（GNSS，Global Navigation Satellite System）是一種通過衛(wèi)星信號提供地理定位、導(dǎo)航和時間同步服務(wù)的技術(shù)。常見的GNSS包括美國的GPS、俄羅斯的GLONASS、歐盟的伽利略（Galileo）和中國的北斗（BDS）。以下從產(chǎn)品、品牌和應(yīng)用領(lǐng)域三個方面進行介紹：

2025-04-28 205次

一文讀懂什么是MEMS壓力傳感器？

MEMS壓力傳感器是一種基于微機電系統(tǒng)（Micro-Electro-Mechanical Systems, MEMS）技術(shù)制造的微型傳感器，主要用于測量氣體或液體的壓力。憑借其小型化、高靈敏度和低成本等優(yōu)勢，MEMS壓力傳感器被廣泛應(yīng)用于汽車、醫(yī)療、工業(yè)、消費電子和航空航天等領(lǐng)域。

2025-04-17 162次

更多資訊

熱門資訊

萬聯(lián)芯微信公眾號

元器件現(xiàn)貨+BOM配單+PCBA制造平臺

關(guān)注公眾號，優(yōu)惠活動早知道！

* 我的問題/建議：
* 聯(lián)系電話：
上傳圖片（選填）：	請您提交2M以內(nèi)的jpg,gif,png格式文件
投訴訂單號（選填）：

h1_key

萬聯(lián)芯微信公眾號

4000-306-326