Takže když budu dejme tomu rozpoznávat, jestli je na obrázku člověk nebo kočka, tak:
1) vstupů bude tolik, kolik pixelů
2) výstupy budou dva: pravděpodobnost psa, pravděpodobnost kočky (nebo ani jeden, popř. oba)
3) bude víc vrstvev uprosted sítě
Chápu to tak dobře? To množství vstupů totiž vypadá děsivě, už teď mi těch 2000 trénovacích dat trvalo naučit skoro minutu (i5).