referaty.sk – Všetko čo študent potrebuje
Irma
Štvrtok, 14. novembra 2024
Modely neurónových sietí pre pohľad – Kunihiko Fukushima
Dátum pridania: 14.01.2003 Oznámkuj: 12345
Autor referátu: dusdos
 
Jazyk: Slovenčina Počet slov: 562
Referát vhodný pre: Stredná odborná škola Počet A4: 2.2
Priemerná známka: 2.99 Rýchle čítanie: 3m 40s
Pomalé čítanie: 5m 30s
 
Neokognitrón pre rozpoznávanie ručne písaných číslic.

Autor už v minulosti navrhol jeden neokognitrón, ktorý rozpoznával obrazové vzorky. Mal hierarchickú multivrstvovú architektúru, a vedel rozpoznávať niekoľko naučených obrazových vzorov. Pozostával z vrstiev obsahujúcich S-bunky, ktoré slúžili na jednoduché rozpoznávanie kôry obrazu čiže jeho okrajov (S ako simple) a komplexné C-bunky (pochopiteľne C ako complex). Tieto vrstvy sú hierarchicky usporiadané. Bunky typu S majú premenlivé vstupné hodnoty a váhy ich prepojení sa počas procesu učenia menia. Bunky typu C zas majú váhy pevne nastavené na konštantnú hodnotu a v najvyšších vrstvách fungujú ako samotné rozpoznávače danej vzorky. My si však popíšeme novú neurónovú sieť od tohoto autora – zdokonalenú, určenú na rozpoznávanie rukou písaných číslic. Na zvýšenie úrovne rozpoznávania bolo pozmenených niekoľko vecí: medzi vrstvami obsahujúcimi S-bunky a medzi vrstvami obsahujúcimi C-bunky bol zvýšený počet prepojení, medzi vstupnou vrstvou a vrstvou rozpoznávajúcou okraje bola pridaná vrstva rozpoznávajúca kontrast, na najvyššej vrstve bol prevedený supervised learning, rozloženie S a C vrstiev je zamotanejšie, atď. Tieto modifikácie umožnili odstránenie vedľajších okruhov z predchádzajúcej neurónovej siete, ako aj v konečnom dôsledku celkové zjednodušenie konštrukcie siete.

Architektúra siete.

Sieť pozostáva zo štyroch S a C vrstiev a počiatočných vrstiev. Vrstve U0 sú prezentované vstupné vizuálne údaje. Potom nasleduje vrstva UG, ktorá slúži na zistenie kontrastu analýzou jasu. Skladá sa z dvoch typov buniek, jedny zisťujú pozitívny kontrast v jase, druhé negatívny (čiže biele a čierne miesta). Ďalej sa informácie dostávajú už k vrstve US1, ktorá bola vytrénovaná na extrakciu okrajov daného obrazca – pretože pôvodný obrázok môže byť pootočený, a to pozor – ľubovoľne! Získané informácie sa ďalej prenášajú do prvej C vrstvy: vrstvy UC1, ktorá vygeneruje rozmazaný obraz danej číslice. V ďalších vrstvách sa generuje zhrubnutie okrajov tohoto rozmazaného obrazu, pričom konce čiar vyvolávajú v C-bunkách väčšiu odozvu. Týmto sa určí kostra daného čísla. Môže tu však nastať problém – pri rozmazaní číslice nevidieť rozdiel napríklad medzi jednou čiarou a dvoma čiarami nakreslenými tesne okolo seba. Toto riešia nasledujúce S-vrstvy, ktoré medzi takéto čiary vložia tzv. tichú zónu, ktorá usmerňuje odozvy týchto častí číslice do C-vrstiev.
 
   1  |  2    ďalej ďalej
 
Copyright © 1999-2019 News and Media Holding, a.s.
Všetky práva vyhradené. Publikovanie alebo šírenie obsahu je zakázané bez predchádzajúceho súhlasu.