Najnovšie nápady v rozpoznávaní vzorov. Príklady problémov s rozpoznávaním vzorov

Odoslanie dobrej práce do databázy znalostí je jednoduché. Použite nižšie uvedený formulár

Študenti, postgraduálni študenti, mladí vedci, ktorí využívajú vedomostnú základňu pri štúdiu a práci, vám budú veľmi vďační.

Uverejnené dňa http://www.allbest.ru/

Ministerstvo školstva a vedy Ruskej federácie

Novosibirská štátna univerzita ekonómie a manažmentu "NINKh"

Fakulta informačných technológií

Katedra aplikovaných informačných technológií

v disciplíne Fuzzy logika a neurónové siete

Rozpoznávanie vzorov

Smer: Obchodná informatika (elektronické podnikanie)

Celé meno študenta: Mazur Ekaterina Vitalievna

Kontrolovala: Pavlova Anna Illarionovna

Novosibirsk 2016

Úvod
1. Pojem uznania

1.1 História vývoja
1.2 Klasifikácia metód rozpoznávania vzorov

2. Metódy rozpoznávania vzorov
3. Všeobecná charakteristika problémov rozpoznávania vzorov a ich typy
4. Problémy a perspektívy rozvoja rozpoznávania vzorov

4.1 Aplikácia rozpoznávania vzorov v praxi

Záver

Úvod

Pomerne dlho sa problém rozpoznávania vzorov posudzoval len z biologického hľadiska. V tomto prípade boli pozorované iba kvalitatívne charakteristiky, ktoré neumožňovali popísať mechanizmus fungovania.

Koncept zavedený N. Wienerom na začiatku 20. storočia kybernetika(náuka o všeobecných zákonitostiach procesov riadenia a prenosu informácií v strojoch, živých organizmoch a spoločnosti), umožnila zaviesť kvantitatívne metódy v otázkach rozpoznávania. Teda reprezentovať tento proces (v podstate prírodný jav) pomocou matematických metód.

Teória rozpoznávania vzorov je jedným z hlavných odvetví kybernetiky, a to z teoretického aj aplikovaného hľadiska. Automatizácia niektorých procesov teda zahŕňa vytváranie zariadení schopných reagovať na meniace sa charakteristiky vonkajšieho prostredia určitým počtom pozitívnych reakcií.

Základom riešenia problémov tejto úrovne sú výsledky klasickej teórie štatistických riešení. V jeho rámci boli vytvorené algoritmy na určenie triedy, do ktorej možno rozpoznaný objekt zaradiť.

Účelom tejto práce je zoznámiť sa s pojmami teórie rozpoznávania vzorov: odhaliť hlavné definície, študovať históriu jeho výskytu, zdôrazniť hlavné metódy a princípy teórie.

Relevantnosť témy spočíva v tom, že rozpoznávanie vzorov je v súčasnosti jednou z vedúcich oblastí kybernetiky. V posledných rokoch sa teda čoraz viac využíva: zjednodušuje interakciu človeka s počítačom a vytvára predpoklady pre využitie rôznych systémov umelej inteligencie.

aplikácia na rozpoznávanie obrázkov

1. Koncept uznania

Problém uznania dlho priťahoval pozornosť iba vedcov v oblasti aplikovanej matematiky. V dôsledku toho diela R. Fischera, vytvorené v r 20. roky, viedol k vytvoreniu diskriminačnej analýzy - jednej z vetiev teórie a praxe rozpoznávania vzorov. IN 40-te roky A. N. Kolmogorov a A. Ya Khinchin si stanovili za cieľ oddeliť zmes dvoch distribúcií. A v 50-60 rokov rokoch dvadsiateho storočia sa na základe veľkého množstva prác objavila teória štatistických rozhodnutí. V rámci kybernetiky sa začal objavovať nový smer spojený s rozvojom teoretických základov a praktickou implementáciou mechanizmov, ako aj systémov určených na rozpoznávanie objektov a procesov. Nová disciplína sa volá „Rozpoznanie vzoru“.

Rozpoznávanie vzorov(objekty) je úlohou identifikovať predmet podľa jeho obrazu (optické rozpoznávanie), zvukového záznamu (akustické rozpoznávanie) alebo iných charakteristík. Obrázok je klasifikačné zoskupenie, ktoré vám umožňuje kombinovať skupinu objektov podľa určitých kritérií. Obrazy majú charakteristickú vlastnosť, ktorá sa prejavuje v tom, že oboznámenie sa s konečným počtom javov z jedného súboru umožňuje rozpoznať veľké množstvo jeho predstaviteľov. Pri klasickej formulácii rozpoznávacieho problému je súbor rozdelený na časti.

Jednou zo základných definícií je aj pojem zástupy. V počítači je množina súborom neopakujúcich sa prvkov rovnakého typu. „Neopakuje sa“ znamená, že prvok v množine buď existuje alebo neexistuje. Univerzálna množina obsahuje všetky možné prvky;

Technika priradenia prvku k nejakému obrázku sa nazýva rozhodujúce pravidlo.Ďalším dôležitým konceptom je metriky- určuje vzdialenosť medzi prvkami súpravy. Čím je táto vzdialenosť menšia, tým sú predmety (symboly, zvuky atď.), ktoré rozpoznávame, podobnejšie. Štandardne sú prvky špecifikované ako množina čísel a metrika je špecifikovaná ako nejaký druh funkcie. Efektívnosť programu závisí od výberu reprezentácie obrazu a implementácie metrík: rovnaký rozpoznávací algoritmus s rôznymi metrikami bude robiť chyby s rôznymi frekvenciami.

Školenie zvyčajne nazývaný proces vývoja v určitom systéme jednej alebo druhej reakcie na faktory vonkajších podobných signálov prostredníctvom ich opakovaného vplyvu na systém. Samoštúdium sa líši od tréningu tým, že tu nie sú do systému poskytnuté dodatočné informácie o reakcii.

Príklady úloh rozpoznávania vzorov sú:

Rozpoznávanie písmen;

Rozpoznávanie čiarových kódov;

Rozpoznanie ŠPZ;

Rozpoznávanie tvárí a iných biometrických údajov;

Rozpoznávanie reči atď.

1.1 Príbeh rozvoj

V polovici 50. rokov R. Penrose spochybnil model neurónovej siete mozgu a poukázal na významnú úlohu kvantových mechanických efektov v jeho fungovaní. Na základe toho F. Rosenblatt vyvinul model na učenie sa vizuálneho rozpoznávania obrazu, nazývaný perceptrón.

Kreslenie1 - Perceptrónový obvod

Ďalej boli vynájdené rôzne zovšeobecnenia perceptrónu a funkcia neurónov bola komplikovaná: neuróny mohli nielen násobiť vstupné čísla a porovnávať výsledok s prahovými hodnotami, ale mohli na ne aplikovať aj zložitejšie funkcie. Obrázok 2 ukazuje jednu takúto komplikáciu:

Ryža. 2 Schéma neurónovej siete.

Navyše topológia neurónovej siete by mohla byť ešte komplikovanejšia. Napríklad takto:

Obrázok 3 - Schéma Rosenblattovej neurónovej siete.

Neurónové siete, ako komplexný objekt pre matematickú analýzu, pri správnom použití umožnili nájsť veľmi jednoduché dátové zákony. Táto výhoda je však aj zdrojom potenciálnych chýb. Náročnosť analýzy sa vo všeobecnosti vysvetľuje iba zložitou štruktúrou, ale v dôsledku toho prakticky nevyčerpateľnými možnosťami zovšeobecnenia širokej škály vzorov.

1.2 Klasifikáciametódyuznaniesnímky

Ako sme už uviedli, rozpoznávanie vzorov sa týka úlohy stanovenia vzťahov ekvivalencie medzi určitými obrazovými modelmi objektov v reálnom alebo ideálnom svete.

Tieto vzťahy určujú príslušnosť rozpoznaných objektov k akýmkoľvek triedam, ktoré sa považujú za nezávislé jednotky.

Pri konštrukcii rozpoznávacích algoritmov môže tieto triedy špecifikovať výskumník, ktorý používa svoje vlastné nápady alebo používa dodatočné informácie o podobnosti alebo odlišnosti objektov v kontexte danej úlohy. V tomto prípade hovoríme o „uznávaní s učiteľom“. V inom, t.j. Keď automatizovaný systém vyrieši problém klasifikácie bez toho, aby zahŕňal ďalšie informácie, hovorí o „rozpoznaní bez dozoru“.

V dielach V.A. Duke poskytuje akademický prehľad metód rozpoznávania a používa dva hlavné spôsoby reprezentácie vedomostí:

Intenzionálne (vo forme diagramu súvislostí medzi atribútmi);

Rozširujúce pomocou konkrétnych faktov (predmetov, príkladov).

Intenzionálna reprezentácia zachytáva vzory, ktoré vysvetľujú štruktúru údajov. Vo vzťahu k diagnostickým problémom takáto fixácia spočíva v určovaní operácií na charakteristikách objektov, ktoré vedú k požadovanému výsledku. Intenzionálne reprezentácie sú implementované prostredníctvom operácií s hodnotami a nezahŕňajú operácie na konkrétnych objektoch.

Extenzívne reprezentácie vedomostí sú zasa spojené s popisom a fixáciou konkrétnych objektov z predmetnej oblasti a realizujú sa v operáciách, ktorých prvkami sú objekty ako nezávislé systémy.

Základom pre klasifikáciu metód rozpoznávania navrhnutých V.A. Duke, sú stanovené základné zákony, ktoré sú v princípe základom ľudského spôsobu poznania. To stavia toto rozdelenie do tried do zvláštneho postavenia v porovnaní s inými menej známymi klasifikáciami, ktoré na tomto pozadí vyzerajú umelo a neúplne.

2. Metódyrozpoznávanie vzorov

Metóda hrubej sily. Pri tejto metóde sa robí porovnanie s určitou databázou, kde sú pre každý objekt prezentované rôzne možnosti úpravy zobrazenia. Napríklad na optické rozpoznávanie vzorov môžete použiť metódu enumerácie v rôznych uhloch alebo mierkach, posunoch, deformáciách atď. Pri písmenách môžete enumerovať písmo alebo jeho vlastnosti. V prípade rozpoznávania zvukových vzorov sa vykoná porovnanie s niektorými známymi vzormi (slovo, ktoré hovorí veľa ľudí). Ďalej sa vykoná hlbšia analýza charakteristík obrazu. V prípade optického rozpoznávania to môže byť určenie geometrických charakteristík. V tomto prípade je vzorka zvuku podrobená frekvenčnej a amplitúdovej analýze.

Ďalšia metóda - použitie umelých neurónových sietí(INS). Vyžaduje si to buď obrovské množstvo príkladov úlohy rozpoznávania, alebo špeciálnu štruktúru neurónovej siete, ktorá zohľadňuje špecifiká danej úlohy. Táto metóda je však vysoko efektívna a produktívna.

Metódy založené na odhadoch distribučných hustôt hodnôt znakov. Prevzaté z klasickej teórie štatistických rozhodnutí, v ktorej sa predmety štúdia považujú za realizácie viacrozmernej náhodnej premennej rozloženej v priestore znakov podľa nejakého zákona. Sú založené na Bayesovskej schéme rozhodovania, ktorá sa odvoláva na počiatočné pravdepodobnosti objektov patriacich do určitej triedy a podmienené hustoty rozloženia znakov.

Skupina metód založených na odhade distribučných hustôt hodnôt znakov priamo súvisí s metódami diskriminačnej analýzy. Bayesovský prístup k rozhodovaniu je jednou z najrozvinutejších parametrických metód v modernej štatistike, pre ktorú sa predpokladá, že analytické vyjadrenie distribučného zákona (normálny zákon) je známe a len malý počet parametrov (vektory priemerov a kovariančné matice ) je potrebné odhadnúť. Za hlavné ťažkosti pri používaní tejto metódy sa považuje potreba zapamätať si celú tréningovú vzorku na výpočet odhadov hustoty a vysoká citlivosť na tréningovú vzorku.

Metódy založené na predpokladoch o triede rozhodovacích funkcií. V tejto skupine sa typ rozhodovacej funkcie považuje za známy a špecifikuje sa funkcionál jej kvality. Na základe tohto funkcionálu sa pomocou tréningovej sekvencie nájde optimálna aproximácia k rozhodovacej funkcii. Funkcionalita kvality rozhodovacieho pravidla je zvyčajne spojená s chybou. Hlavnou výhodou metódy je prehľadnosť matematickej formulácie rozpoznávacieho problému Schopnosť extrahovať nové poznatky o povahe objektu, najmä poznatky o mechanizmoch interakcie atribútov, je tu zásadne obmedzená danou štruktúrou. interakcie, fixované vo vybranej forme rozhodovacích funkcií.

Metóda porovnania s prototypom. Ide o najjednoduchšiu metódu rozšíreného rozpoznávania v praxi. Používa sa, keď sú rozpoznané triedy zobrazené ako kompaktné geometrické triedy. Potom sa ako prototypový bod vyberie stred geometrického zoskupenia (alebo objekt najbližšie k stredu).

Na klasifikáciu nedefinovaného objektu sa nájde jeho najbližší prototyp a objekt patrí do rovnakej triedy ako on. Pri tejto metóde sa samozrejme nevytvárajú žiadne zovšeobecnené obrazy. Ako meradlo možno použiť rôzne typy vzdialeností.

k metóda najbližších susedov. Metóda spočíva v tom, že pri klasifikácii neznámeho objektu sa nájde daný počet (k) geometricky najbližších prvkov v priestore ďalších najbližších susedov s už známou príslušnosťou k akejkoľvek triede. Rozhodnutie o klasifikácii neznámeho objektu sa robí analýzou informácií o jeho najbližších susedoch. Potreba znížiť počet objektov v trénovacej vzorke (diagnostické precedensy) je nevýhodou tejto metódy, pretože to znižuje reprezentatívnosť trénovacej vzorky.

Na základe skutočnosti, že rôzne rozpoznávacie algoritmy sa správajú odlišne na tej istej vzorke, vyvstáva otázka syntetického rozhodovacieho pravidla, ktoré by využívalo silné stránky všetkých algoritmov. Na tento účel existuje syntetická metóda alebo skupiny rozhodovacích pravidiel, ktoré kombinujú najpozitívnejšie aspekty každej metódy.

Na záver prehľadu metód rozpoznávania uvedieme podstatu vyššie uvedeného v súhrnnej tabuľke a pridáme tam aj niektoré ďalšie metódy používané v praxi.

Tabuľka 1. Tabuľka klasifikácie metód rozpoznávania, porovnanie oblastí ich použitia a obmedzení

Klasifikácia metód rozpoznávania	Oblasť použitia	Obmedzenia (nevýhody)
Intenzívne metódy rozpoznávania	Metódy založené na odhadoch hustoty	Problémy so známou distribúciou (normálna), potreba zbierať veľké štatistiky	Potreba enumerácie celej trénovacej vzorky pri rozpoznávaní, vysoká citlivosť na nereprezentatívnosť trénovacej vzorky a artefaktov
	Metódy založené na predpokladoch	Triedy musia byť dobre oddeliteľné	Typ rozhodovacej funkcie musí byť známy vopred. Neschopnosť brať do úvahy nové poznatky o koreláciách medzi znakmi
	Booleovské metódy	Malé problémy	Pri výbere logických rozhodovacích pravidiel je potrebné dôkladné vyhľadávanie. Vysoká pracovná náročnosť
	Lingvistické metódy		Úloha určovania gramatiky z určitého súboru výrokov (popisov objektov) je ťažko formalizovateľná. Nevyriešené teoretické problémy
Metódy rozšíreného rozpoznávania	Metóda porovnania s prototypom	Problémy malého rozmeru priestoru prvkov	Vysoká závislosť výsledkov klasifikácie od metrík. Neznáma optimálna metrika
	k metóda najbližších susedov		Vysoká závislosť výsledkov klasifikácie od metrík. Potreba úplného vyčíslenia tréningovej vzorky počas rozpoznávania. Výpočtové úsilie
	Algoritmy na výpočet odhadov (ABO)	Problémy malého rozmeru z hľadiska počtu tried a vlastností	Závislosť výsledkov klasifikácie od metrík. Potreba úplného vyčíslenia tréningovej vzorky počas rozpoznávania. Vysoká technická náročnosť metódy
	Kolektívy rozhodovacích pravidiel (DRC) sú syntetickou metódou.	Problémy malého rozmeru z hľadiska počtu tried a vlastností	Veľmi vysoká technická náročnosť metódy, nevyriešené množstvo teoretických problémov, a to tak pri určovaní oblastí kompetencie súkromných metód, ako aj v samotných súkromných metódach.

3. Všeobecná charakteristika problémov rozpoznávania vzorov a ich typy

Všeobecná štruktúra rozpoznávacieho systému a jeho fázy sú znázornené na obrázku 4:

Obrázok 4 - Štruktúra systému rozpoznávania

Úlohy rozpoznávania majú tieto charakteristické fázy:

Konverzia zdrojových údajov do vhodnej formy na rozpoznávanie;

Rozpoznanie (označenie, že objekt patrí do určitej triedy).

V týchto problémoch môžete zaviesť koncept podobnosti objektov a sformulovať súbor pravidiel, na základe ktorých je objekt zaradený do jednej alebo rôznych tried.

Môžete tiež pracovať so súborom príkladov, ktorých klasifikácia je známa a ktoré je možné vo forme daných popisov deklarovať do rozpoznávacieho algoritmu na prispôsobenie úlohe počas procesu učenia.

Ťažkosti pri riešení problémov rozpoznávania sú spojené s neschopnosťou aplikovať klasické matematické metódy bez korekcií (často nie sú dostupné informácie pre presný matematický model)

Rozlišujú sa tieto typy úloh rozpoznávania:

Úlohou rozpoznávania je priradiť prezentovaný predmet podľa jeho popisu do jednej z daných tried (učenie pod dohľadom);

Úlohou automatickej klasifikácie je rozdeliť množinu do systému disjunktných tried (taxonómia, zhluková analýza, samoučenie);

Úloha výberu informatívneho súboru atribútov počas rozpoznávania;

Úloha uviesť zdrojové údaje do vhodnej podoby;

Dynamické rozpoznávanie a klasifikácia;

Problém prognózy – to znamená, že rozhodnutie sa musí týkať konkrétneho bodu v budúcnosti.

Existujú dva najťažšie problémy existujúcich systémov rozpoznávania:

Problém „triedy 1001“ – pridanie 1 triedy k 1000 existujúcim spôsobuje ťažkosti pri preškolení systému a kontrole predtým prijatých údajov;

Problém „korelácie medzi slovníkom a zdrojmi“ je najvýraznejší pri rozpoznávaní reči. Súčasné systémy dokážu rozpoznať buď veľké množstvo slov od malej skupiny jednotlivcov, alebo malé množstvo slov od veľkej skupiny jednotlivcov. Tiež je ťažké rozoznať veľké množstvo tvárí s mejkapom či grimasami.

Neurónové siete tieto problémy neriešia priamo, ale zo svojej podstaty sa oveľa ľahšie prispôsobujú zmenám vstupných sekvencií.

4. Problémy a vyhliadkyrozvojrozpoznávanie vzorov

4.1 Aplikácia rozpoznávania vzorov v praxi

Vo všeobecnosti sa problém rozpoznávania vzorov skladá z dvoch častí: tréningu a rozpoznávania. Učenie sa uskutočňuje ukazovaním samostatných predmetov a ich priraďovaním do jednej alebo druhej triedy. V dôsledku tréningu by rozpoznávací systém mal nadobudnúť schopnosť reagovať rovnakými reakciami na všetky objekty jedného obrazu a odlišnými na všetky ostatné. Je dôležité, aby boli počas procesu učenia označené iba samotné predmety a ich príslušnosť k obrázku. Po školení nasleduje proces rozpoznávania, ktorý charakterizuje činnosti už vyškoleného systému. Problémom je automatizácia týchto postupov.

Predtým, ako začnete s analýzou akéhokoľvek objektu, musíte o ňom získať určité, usporiadané a presné informácie. Takáto informácia je súbor vlastností predmetov, ich zobrazenie na rôznych vnímavých orgánoch rozpoznávacieho systému.

Ale každý objekt pozorovania môže ovplyvniť inak, v závislosti od podmienok vnímania. Okrem toho sa objekty toho istého obrázka môžu navzájom značne líšiť.

Každé mapovanie objektu na vnímacie orgány rozpoznávacieho systému, bez ohľadu na jeho polohu voči týmto orgánom, sa zvyčajne nazýva obrazom objektu a súbory takýchto obrazov, spojené niektorými spoločnými vlastnosťami, sú obrazy. Pri úspešnom zvolení úvodného popisu (priestoru funkcií) môže byť úloha rozpoznávania celkom jednoduchá a naopak neúspešná voľba môže viesť k veľmi zložitému ďalšiemu spracovaniu informácií, prípadne k absencii riešenia.

Rozpoznávanie predmetov, signálov, situácií, javov je najčastejšou úlohou, ktorú človek potrebuje každú sekundu riešiť. Na tento účel sa používajú obrovské zdroje mozgu, ktoré sa odhadujú podľa takého ukazovateľa, ako je počet neurónov rovný 10 10.

S uznaním sa neustále stretávame aj v technológiách. Výpočty v sieťach formálnych neurónov sú v mnohom podobné spracovaniu informácií v mozgu. V poslednom desaťročí si neuropočítač získal extrémnu obľubu a stal sa inžinierskou disciplínou spojenou s výrobou komerčných produktov. Prebieha veľké množstvo práce na vytvorení základnej základne pre neuropočítače.

Ich hlavnou charakteristickou črtou je schopnosť riešiť neformalizované problémy, pre ktoré z jedného alebo druhého dôvodu nie sú navrhnuté žiadne algoritmy riešenia. Neuropočítače ponúkajú relatívne jednoduchú technológiu na odvodzovanie algoritmov prostredníctvom učenia. To je ich hlavná výhoda. Preto sa ukazuje, že neurocomputing je relevantný práve teraz – počas rozkvetu multimédií, keď globálny vývoj vyžaduje vývoj nových technológií úzko súvisiacich s rozpoznávaním obrazu.

Jedným z hlavných problémov vo vývoji a aplikácii umelej inteligencie zostáva problém rozpoznávania zvukových a vizuálnych obrazov. Všetky ostatné technológie sú už pripravené nájsť uplatnenie v medicíne, biológii a bezpečnostných systémoch. V medicíne rozpoznávanie vzorov pomáha lekárom robiť presnejšie diagnózy v továrňach, používa sa na predpovedanie chýb v dávkach tovaru. Biometrické osobné identifikačné systémy sú tiež založené na výsledkoch rozpoznávania ako ich algoritmické jadro. Ďalší vývoj a dizajn počítačov schopných priamejšej komunikácie s ľuďmi v jazykoch, ktoré sú pre človeka prirodzené a prostredníctvom reči, nemožno vyriešiť bez uznania. Tu vyvstáva otázka o vývoji robotiky a umelých riadiacich systémov obsahujúcich rozpoznávacie systémy ako životne dôležité subsystémy.

Záver

Výsledkom práce bol stručný prehľad hlavných definícií pojmov takého odvetvia kybernetiky, ako je rozpoznávanie vzorov, boli zvýraznené metódy rozpoznávania a formulované úlohy.

Samozrejme, existuje veľa smerov rozvoja tejto vedy. Okrem toho, ako sa uvádza v jednej z kapitol, uznanie je v súčasnosti jednou z kľúčových oblastí rozvoja. Softvér sa tak v najbližších desaťročiach môže stať ešte atraktívnejším pre používateľa a konkurencieschopným na modernom trhu, ak získa komerčný formát a začne sa distribuovať veľkému počtu spotrebiteľov.

Ďalší výskum môže byť zameraný na tieto aspekty: hĺbkovú analýzu hlavných metód spracovania a vývoj nových kombinovaných alebo modifikovaných metód rozpoznávania. Na základe uskutočneného výskumu bude možné vyvinúť funkčný rozpoznávací systém, pomocou ktorého bude možné testovať účinnosť vybraných metód rozpoznávania.

Bibliografia

1. David Formais, Jean Pons Počítačové videnie. Moderný prístup, 2004

2. Aizerman M.A., Braverman E.M., Rozonoer L.I. Metóda potenciálnych funkcií v teórii strojového učenia. - M.: Nauka, 2004.

3. Zhuravlev Yu.I. O algebraickom prístupe k riešeniu problémov rozpoznávania alebo klasifikácie // Problémy kybernetiky. M.: Nauka, 2005. - Vydanie. 33.

4. Mazurov V.D. Výbory systémov nerovností a problém rozpoznávania // Kybernetika, 2004, č.

5. Potapov A.S. Rozpoznávanie vzorov a strojové vnímanie. - Petrohrad: Politechnika, 2007.

6. Minsky M., Papert S. Perceptrons. - M.: Mir, 2007.

7. Rastrigin L. A., Erenshtein R. Kh. M. Energoizdat, 2006.

8. Rudakov K.V. K algebraickej teórii univerzálnych a lokálnych obmedzení pre klasifikačné problémy // Rozpoznávanie, klasifikácia, prognóza. Matematické metódy a ich aplikácia. Vol. 1. - M.: Nauka, 2007.

9. Fu K. Štrukturálne metódy v rozpoznávaní vzorov. - M.: Mir, 2005.

Uverejnené na Allbest.ru

...

Podobné dokumenty

Základné pojmy teórie rozpoznávania vzorov a jej význam. Podstata matematickej teórie rozpoznávania vzorov. Hlavné úlohy, ktoré vznikajú pri vývoji systémov rozpoznávania obrazu. Klasifikácia systémov rozpoznávania vzorov v reálnom čase.

kurzová práca, pridané 15.01.2014

Koncepcia a vlastnosti konštrukcie algoritmov rozpoznávania vzorov. Rôzne prístupy k typológii metód rozpoznávania. Štúdium základných spôsobov reprezentácie vedomostí. Charakteristika intenzionálnych a extenzívnych metód, hodnotenie ich kvality.

prezentácia, pridané 01.06.2014

Teoretické základy rozpoznávania vzorov. Funkčná schéma rozpoznávacieho systému. Aplikácia Bayesovských metód pri riešení problému rozpoznávania vzorov. Bayesovská segmentácia obrazu. TAN model na riešenie problému klasifikácie obrazu.

práca, pridané 13.10.2017

Prehľad problémov vznikajúcich pri vývoji systémov rozpoznávania vzorov. Trénovateľné klasifikátory obrázkov. Perceptrónový algoritmus a jeho modifikácie. Vytvorenie programu určeného na klasifikáciu obrázkov pomocou metódy najmenších štvorcov.

kurzová práca, pridané 04.05.2015

Metódy rozpoznávania vzorov (klasifikátory): Bayesovská, lineárna, metóda potenciálnych funkcií. Vývoj programu na rozpoznávanie človeka z jeho fotografií. Príklady fungovania klasifikátorov, experimentálne výsledky o presnosti metód.

kurzová práca, pridané 15.08.2011

Vytvorenie softvérového nástroja, ktorý vykonáva vizuálne rozpoznávanie obrazu na základe umelých neurónových sietí. Metódy používané na rozpoznávanie vzorov. Selfridgeovo pandemonium. Rosenblatt Perceptron. Pravidlo pre tvorbu reťazového kódu.

práca, pridané 06.04.2014

Rozpoznávanie vzorov je úlohou identifikovať objekt alebo určiť jeho vlastnosti z jeho obrazu alebo zvukového záznamu. História teoretických a technických zmien v tejto oblasti. Metódy a princípy používané v počítačovej technike na rozpoznávanie.

abstrakt, pridaný 4.10.2010

Koncept systému rozpoznávania vzorov. Klasifikácia rozpoznávacích systémov. Vývoj systému na rozpoznávanie tvaru mikroobjektov. Algoritmus na vytvorenie systému na rozpoznávanie mikroobjektov na kryštalograme, vlastnosti jeho implementácie v softvérovom prostredí.

kurzová práca, pridané 21.06.2014

Výber typu a štruktúry neurónovej siete. Výber metódy rozpoznávania, bloková schéma Hopfieldovej siete. Školenie systému rozpoznávania vzorov. Vlastnosti práce s programom, jeho výhody a nevýhody. Popis používateľského rozhrania a obrazovkových formulárov.

kurzová práca, pridané 14.11.2013

Vznik technických systémov automatického rozpoznávania. Človek ako prvok alebo článok zložitých automatických systémov. Možnosti automatických rozpoznávacích zariadení. Etapy vytvárania systému rozpoznávania vzorov. Procesy merania a kódovania.

Preskúmanie existujúcich metód rozpoznávania vzorov

L.P. Popova , A O. Datiev

Schopnosť „rozpoznať“ sa považuje za hlavnú vlastnosť ľudí, ako aj iných živých organizmov. Rozpoznávanie vzorov je odvetvie kybernetiky, ktoré rozvíja princípy a metódy klasifikácie, ako aj identifikácie objektov, javov, procesov, signálov, situácií - všetkých tých objektov, ktoré možno opísať konečnou množinou nejakých znakov alebo vlastností, ktoré charakterizujú objekt. .

Obrázok je popis objektu. Obrazy majú charakteristickú vlastnosť, ktorá sa prejavuje v tom, že oboznámenie sa s konečným počtom javov z tej istej množiny umožňuje rozpoznať ľubovoľne veľký počet jej predstaviteľov.

V teórii rozpoznávania vzorov možno rozlíšiť dva hlavné smery:

štúdium rozpoznávacích schopností ľudí a iných živých organizmov;

vývoj teórie a metód konštrukcie zariadení určených na riešenie jednotlivých problémov rozpoznávania vzorov v určitých aplikačných oblastiach.

Ďalej článok popisuje problémy, princípy a metódy implementácie systémov rozpoznávania obrazu spojené s vývojom druhého smeru. Druhá časť článku pojednáva o metódach rozpoznávania vzorov pomocou neurónových sietí, ktoré možno pripísať prvému smeru teórie rozpoznávania vzorov.

Problémy budovania systémov rozpoznávania obrazu

Problémy, ktoré vznikajú pri budovaní systémov automatického rozpoznávania vzorov, možno zvyčajne rozdeliť do niekoľkých hlavných oblastí. Prvý z nich súvisí s prezentáciou počiatočných údajov získaných ako výsledky merania pre objekt, ktorý sa má rozpoznať problém citlivosti. Každá nameraná hodnota je nejakou „charakteristikou obrázka alebo objektu, napríklad predpokladajme, že obrázky sú alfanumerické znaky Ak sa sietnica skladá z n-prvkov, potom môžu byť výsledky merania reprezentované ako vektor merania alebo obrazový vektor ,

kde každý prvok xi má napríklad hodnotu 1, ak obraz symbolu prechádza i-tou bunkou sietnice, a hodnotu 0 inak.

Pozrime sa na Obr. 2(b). V tomto prípade sú obrazy spojitými funkciami (ako sú zvukové signály) premennej t. Ak sa meranie funkčných hodnôt vykonáva v diskrétnych bodoch t1,t2, ..., tn, potom obrazový vektor možno vytvoriť tak, že x1= f(t1),x2=f(t2),... , xn = f(tn).

Obrázok 1. Meranie sietnice

Druhý problém rozpoznávania vzorov je spojený s izoláciou charakteristických znakov alebo vlastností zo získaných zdrojových údajov a zmenšením rozmeru vektorov vzorov. Tento problém sa často definuje ako problém predspracovanie a výber funkcií.

Vlastnosti triedy obrázkov sú charakteristické vlastnosti spoločné pre všetky obrázky danej triedy. Znaky, ktoré charakterizujú rozdiely medzi jednotlivými triedami, možno interpretovať ako medzitriedne znaky. Vnútrotriedne znaky, spoločné pre všetky uvažované triedy, nenesú užitočné informácie z hľadiska rozpoznávania a nemusia sa brať do úvahy. Výber prvkov sa považuje za jednu z dôležitých úloh spojených s konštrukciou rozpoznávacích systémov. Ak nám výsledky meraní umožnia získať úplný súbor charakteristických znakov pre všetky triedy, skutočné rozpoznanie a klasifikácia obrázkov nespôsobí žiadne zvláštne ťažkosti. Automatické rozpoznávanie sa potom zredukuje na jednoduchý proces párovania alebo procedúry, ako je skenovanie tabuľky. Vo väčšine praktických problémov s rozpoznávaním sa však určenie úplného súboru charakteristických znakov ukazuje ako mimoriadne ťažké, ak nie nemožné. Zvyčajne je možné extrahovať niektoré rozlišovacie znaky z pôvodných údajov a použiť ich na zjednodušenie procesu automatického rozpoznávania vzorov. Najmä rozmer meracích vektorov možno zmenšiť pomocou transformácií, ktoré minimalizujú stratu informácií.

Tretím problémom spojeným s konštrukciou systémov rozpoznávania vzorov je nájdenie optimálnych rozhodovacích postupov potrebných na identifikáciu a klasifikáciu. Keď sú údaje zhromaždené o vzoroch, ktoré sa majú rozpoznať, reprezentované bodmi alebo meracími vektormi v priestore vzorov, nechajte stroj zistiť, ktorej triede vzorov tieto údaje zodpovedajú. Nech je stroj navrhnutý tak, aby rozlišoval triedy M, označované w1, w2, ... ..., wm. V tomto prípade možno priestor obrazu považovať za pozostávajúci z M oblastí, z ktorých každá obsahuje body zodpovedajúce obrazom z jednej triedy. V tomto prípade možno úlohu rozpoznávania považovať za konštrukciu hraníc rozhodovacích oblastí oddeľujúcich M triedy na základe registrovaných meracích vektorov. Nech sú tieto hranice definované napríklad rozhodovacími funkciami d1(x), d2(x),..., dm(x). Tieto funkcie, nazývané aj diskriminačné funkcie, sú skalárne a jednohodnotové funkcie obrazu x. Ak di (x) > dj (x), potom obrázok x patrí do triedy w1. Inými slovami, ak i-tá rozhodovacia funkcia di(x) má najväčšiu hodnotu, potom zmysluplná ilustrácia takejto automatickej klasifikačnej schémy na základe implementácie rozhodovacieho procesu je znázornená na obr. 2 (v diagrame „GR“ je generátor rozhodovacích funkcií).

Obrázok 2. Schéma automatickej klasifikácie.

Rozhodujúce funkcie je možné získať rôznymi spôsobmi. V prípadoch, keď existujú úplné a priori informácie o rozpoznaných obrazoch, rozhodovacie funkcie možno určiť presne na základe týchto informácií. Ak sú k dispozícii iba kvalitatívne informácie týkajúce sa obrázkov, je možné urobiť rozumné predpoklady o forme rozhodujúcich funkcií. V druhom prípade sa hranice oblastí riešenia môžu výrazne odchyľovať od skutočných, a preto je potrebné vytvoriť systém schopný dosiahnuť uspokojivý výsledok sériou postupných úprav.

Objekty (obrázky), ktoré sa majú rozpoznať a klasifikovať pomocou systému automatického rozpoznávania vzorov, musia mať súbor merateľných charakteristík. Keď sa pre celú skupinu obrázkov výsledky zodpovedajúcich meraní ukážu byť podobné, tieto objekty sa považujú za objekty patriace do rovnakej triedy. Účelom systému rozpoznávania vzorov je na základe zhromaždených informácií určiť triedu objektov s charakteristikami podobnými tým, ktoré sú namerané v rozpoznávaných objektoch. Správnosť rozpoznávania závisí od množstva diskriminačných informácií obsiahnutých v meraných charakteristikách a efektívnosti využitia týchto informácií.

Základné metódy implementácie systémov rozpoznávania vzorov

Rozpoznávanie vzorov sa týka problému konštrukcie a aplikácie formálnych operácií na numerických alebo symbolických reprezentáciách objektov v reálnom alebo ideálnom svete, ktorých výsledky odrážajú ekvivalenčné vzťahy medzi týmito objektmi. Vzťahy ekvivalencie vyjadrujú príslušnosť hodnotených objektov k ľubovoľným triedam považovaným za samostatné sémantické jednotky.

Pri konštrukcii rozpoznávacích algoritmov môže ekvivalenčné triedy špecifikovať výskumník, ktorý používa svoje vlastné zmysluplné nápady alebo používa externé dodatočné informácie o podobnostiach a rozdieloch objektov v kontexte riešeného problému. Potom hovoria o „uznaní s učiteľom“. V opačnom prípade, t.j. Keď automatizovaný systém vyrieši problém klasifikácie bez použitia externých informácií o školení, hovoríme o automatickej klasifikácii alebo „rozpoznaní bez dozoru“. Väčšina algoritmov rozpoznávania vzorov vyžaduje použitie veľmi významného výpočtového výkonu, ktorý môže poskytnúť iba vysokovýkonná počítačová technológia.

Rôzni autori (Yu.L. Barabash, V.I. Vasiliev, A.L. Gorelik, V.A. Skripkin, R. Duda, P. Hart, L.T. Kuzin, F.I. Peregudov, F.P. Tarasenko, Temnikov F.E., Afonin V.A., Dmitriev V.I., Dmitriev V.I., Gonzalez, P. Winston, K. Fu, Ya.Z. Tsypkin atď.) uvádzajú inú typológiu metód rozpoznávania vzorov. Niektorí autori rozlišujú parametrické, neparametrické a heuristické metódy, iní identifikujú skupiny metód na základe historicky ustálených škôl a trendov v tejto oblasti.

Známe typológie zároveň nezohľadňujú jednu veľmi významnú charakteristiku, ktorá odráža špecifickosť spôsobu reprezentácie vedomostí o predmetnej oblasti pomocou akéhokoľvek formálneho algoritmu rozpoznávania vzorov. D.A. Pospelov identifikuje dva hlavné spôsoby prezentácie vedomostí:

Intenzionálna reprezentácia - vo forme diagramu súvislostí medzi atribútmi (vlastnosťami).

Extenzionálna reprezentácia – pomocou konkrétnych faktov (predmetov, príkladov).

Je potrebné poznamenať, že existencia práve týchto dvoch skupín metód rozpoznávania: tých, ktoré pracujú so znakmi a tých, ktoré pracujú s objektmi, je hlboko prirodzená. Z tohto hľadiska žiadna z týchto metód, braná oddelene od druhej, nám neumožňuje vytvoriť adekvátnu reflexiu predmetnej oblasti. Medzi týmito metódami existuje vzťah komplementarity v zmysle N. Bohra, preto by perspektívne rozpoznávacie systémy mali poskytovať implementáciu oboch týchto metód, a nie iba jednej z nich.

Klasifikácia metód rozpoznávania, ktorú navrhol D.A. Pospelov, je teda založená na základných vzorcoch, ktoré sú základom ľudského spôsobu poznávania vo všeobecnosti, čo ho stavia do úplne špeciálnej (privilegovanej) pozície v porovnaní s inými klasifikáciami, ktoré na tomto pozadí vyzerajú ľahšie a ľahšie. umelé.

Intenzívne metódy

Charakteristickým rysom intenzionálnych metód je, že používajú rôzne charakteristiky vlastností a ich spojenia ako prvky operácií pri konštrukcii a aplikácii algoritmov rozpoznávania vzorov. Takýmito prvkami môžu byť jednotlivé hodnoty alebo intervaly hodnôt vlastností, priemerné hodnoty a odchýlky, matice vzťahov medzi vlastnosťami atď., na ktorých sa vykonávajú akcie, vyjadrené v analytickej alebo konštruktívnej forme. Zároveň sa objekty v týchto metódach nepovažujú za integrálne informačné jednotky, ale pôsobia ako indikátory na hodnotenie interakcie a správania sa ich atribútov.

Skupina intenzionálnych metód na rozpoznávanie vzorov je rozsiahla a jej rozdelenie do podtried je do určitej miery podmienené:

– metódy založené na odhadoch distribučných hustôt hodnôt znakov

– metódy založené na predpokladoch o triede rozhodovacích funkcií

– logické metódy

– lingvistické (štrukturálne) metódy.

Metódy založené na odhadoch distribučných hustôt hodnôt znakov. Tieto metódy rozpoznávania vzorov sú prevzaté z klasickej teórie štatistických rozhodnutí, v ktorej sa predmety štúdia považujú za realizácie viacrozmernej náhodnej premennej distribuovanej v priestore znakov podľa nejakého zákona. Sú založené na Bayesovskej rozhodovacej schéme, ktorá sa odvoláva na a priori pravdepodobnosti objektov patriacich do konkrétnej rozpoznanej triedy a podmienené hustoty rozloženia hodnôt vektora znakov. Tieto metódy sa obmedzujú na určenie pomeru pravdepodobnosti v rôznych oblastiach viacrozmerného priestoru funkcií.

Skupina metód založených na odhade distribučných hustôt hodnôt znakov priamo súvisí s metódami diskriminačnej analýzy. Bayesovský prístup k rozhodovaniu je jednou z najrozvinutejších takzvaných parametrických metód v modernej štatistike, pre ktorú sa analytické vyjadrenie distribučného zákona (v tomto prípade normálneho zákona) považuje za známe a len malý počet parametrov ( vektory priemerných hodnôt a kovariančné matice) je potrebné odhadnúť.

Do tejto skupiny patrí aj metóda výpočtu pravdepodobnostného pomeru pre nezávislé charakteristiky. Táto metóda, s výnimkou predpokladu nezávislosti charakteristík (ktorá v skutočnosti nie je takmer nikdy splnená), nepredpokladá znalosť funkčnej podoby distribučného zákona. Možno ju klasifikovať ako neparametrickú metódu.

Iné neparametrické metódy, ktoré sa používajú, keď nie je známy tvar krivky hustoty distribúcie a nie je možné urobiť žiadne predpoklady o jej povahe, zaujímajú osobitné postavenie. Patrí medzi ne známa metóda viacrozmerných histogramov, metóda „k-nearest susedov“, metóda euklidovskej vzdialenosti, metóda potenciálnych funkcií atď., ktorých zovšeobecnením je metóda nazývaná „Parzenove odhady“. Tieto metódy formálne pracujú s objektmi ako integrálnymi štruktúrami, ale v závislosti od typu rozpoznávacej úlohy môžu pôsobiť v intenzionálnej aj extenzionálnej forme.

Neparametrické metódy analyzujú relatívne počty objektov spadajúcich do daných viacrozmerných objemov a využívajú rôzne funkcie vzdialenosti medzi objektmi v trénovacej množine a objektmi, ktoré sú rozpoznávané. Pre kvantitatívne charakteristiky, keď je ich počet oveľa menší ako veľkosť vzorky, hrajú operácie s objektmi prostrednú úlohu pri odhadovaní lokálnych distribučných hustôt podmienených pravdepodobností a objekty nenesú sémantickú záťaž nezávislých informačných jednotiek. Zároveň, keď je počet znakov úmerný alebo väčší ako počet skúmaných objektov a znaky sú kvalitatívneho alebo dichotomického charakteru, potom nemôže byť reč o žiadnych lokálnych odhadoch hustoty rozdelenia pravdepodobnosti. V tomto prípade sa objekty v špecifikovaných neparametrických metódach považujú za nezávislé informačné jednotky (integrálne empirické fakty) a tieto metódy nadobúdajú význam hodnotenia podobností a rozdielov skúmaných objektov.

Rovnaké technologické operácie neparametrických metód teda v závislosti od podmienok problému dávajú zmysel buď lokálnym odhadom hustôt rozdelenia pravdepodobnosti hodnôt znakov, alebo odhadom podobnosti a rozdielnosti objektov.

V kontexte intenzionálnej reprezentácie vedomostí sa tu uvažuje o prvej strane neparametrických metód, ako sú odhady hustôt rozdelenia pravdepodobnosti. Mnohí autori poznamenávajú, že v praxi dobre fungujú neparametrické metódy, ako sú Parzenove odhady. Hlavnými ťažkosťami pri používaní týchto metód je potreba zapamätať si celú trénovaciu vzorku na výpočet odhadov lokálnych hustôt rozdelenia pravdepodobnosti a vysoká citlivosť na nereprezentatívnosť trénovacej vzorky.

Metódy založené na predpokladoch o triede rozhodovacích funkcií. V tejto skupine metód sa všeobecná forma rozhodovacej funkcie považuje za známu a špecifikuje sa funkcionál jej kvality. Na základe tohto funkcionálu sa v trénovacej sekvencii hľadá najlepšia aproximácia rozhodovacej funkcie. Najbežnejšie sú reprezentácie rozhodovacích funkcií vo forme lineárnych a zovšeobecnených nelineárnych polynómov. Funkcionalita kvality rozhodovacieho pravidla je zvyčajne spojená s chybou klasifikácie.

Hlavnou výhodou metód založených na predpokladoch o triede rozhodovacích funkcií je prehľadnosť matematickej formulácie rozpoznávacieho problému ako problému hľadania extrému. Riešenie tohto problému sa často dosahuje pomocou niektorých gradientových algoritmov. Rôznorodosť metód v tejto skupine je vysvetlená širokým rozsahom použitých funkcionalít kvality rozhodovacích pravidiel a extrémnych vyhľadávacích algoritmov. Zovšeobecnením uvažovaných algoritmov, medzi ktoré patrí najmä Newtonov algoritmus, algoritmy perceptrónového typu atď., je metóda stochastickej aproximácie. Na rozdiel od metód parametrického rozpoznávania nezávisí úspešnosť použitia tejto skupiny metód až tak od rozporu medzi teoretickými predstavami o zákonitostiach rozloženia objektov v priestore znakov a empirickou realitou. Všetky operácie sú podriadené jednému hlavnému cieľu – nájdeniu extrému kvalitatívneho funkcionálu rozhodovacieho pravidla. Zároveň môžu byť výsledky parametrických a uvažovaných metód podobné. Ako je uvedené vyššie, parametrické metódy pre prípad normálneho rozdelenia objektov v rôznych triedach s rovnakými kovariančnými maticami vedú k lineárnym rozhodovacím funkciám. Všimnite si tiež, že algoritmy na výber informatívnych prvkov v lineárnych diagnostických modeloch možno interpretovať ako špeciálne verzie gradientových algoritmov na vyhľadávanie extrémov.

Schopnosti gradientových extrémnych vyhľadávacích algoritmov, najmä v skupine lineárnych rozhodovacích pravidiel, boli celkom dobre preštudované. Konvergencia týchto algoritmov bola preukázaná len pre prípad, keď sú rozpoznané triedy objektov zobrazené v priestore prvkov kompaktnými geometrickými štruktúrami. Túžbu dosiahnuť dostatočnú kvalitu rozhodovacieho pravidla je však možné často uspokojiť pomocou algoritmov, ktoré nemajú striktný matematický dôkaz o konvergencii riešenia ku globálnemu extrému.

Takéto algoritmy zahŕňajú veľkú skupinu heuristických programovacích procedúr, ktoré predstavujú smer evolučného modelovania. Evolučné modelovanie je bionická metóda vypožičaná z prírody. Je založená na využití známych mechanizmov evolúcie s cieľom nahradiť proces zmysluplného modelovania komplexného objektu fenomenologickým modelovaním jeho evolúcie.

Známym predstaviteľom evolučného modelovania v rozpoznávaní vzorov je metóda skupinového účtovania argumentov (MGUA). Základom GMDH je princíp samoorganizácie a GMDH algoritmy reprodukujú schému hromadného výberu. V algoritmoch GMDH sa členovia zovšeobecneného polynómu syntetizujú a vyberajú špeciálnym spôsobom, ktorý sa často nazýva Kolmogorov-Gaborov polynóm. Táto syntéza a výber sa uskutočňuje s narastajúcou zložitosťou a nie je možné vopred predpovedať, akú konečnú podobu bude mať zovšeobecnený polynóm. Najprv sa zvyčajne uvažujú jednoduché párové kombinácie počiatočných znakov, z ktorých sa zostavujú rovnice rozhodovacích funkcií, zvyčajne nie vyšších ako druhého rádu. Každá rovnica sa analyzuje ako nezávislá rozhodovacia funkcia a hodnoty parametrov zostavených rovníc sa nájdu tak či onak pomocou trénovacej vzorky. Potom sa z výslednej množiny rozhodovacích funkcií vyberú niektoré z najlepších. Kvalita jednotlivých rozhodovacích funkcií sa kontroluje na kontrolnej (validačnej) vzorke, ktorá sa niekedy nazýva princíp externého sčítania. Vybrané čiastkové rozhodovacie funkcie sa ďalej považujú za intermediárne premenné, ktoré slúžia ako východiskové argumenty pre podobnú syntézu nových rozhodovacích funkcií atď. Proces takejto hierarchickej syntézy pokračuje, kým sa nedosiahne extrém kritéria kvality rozhodovacej funkcie, ktorý v praxi sa prejavuje zhoršením tejto kvality pri pokuse o ďalšie zvýšenie poradia polynomických členov vzhľadom na pôvodné znaky.

Princíp samoorganizácie, ktorý je základom GMDH, sa nazýva heuristická samoorganizácia, pretože celý proces je založený na zavedení externých doplnkov, vybraných heuristicky. Výsledok rozhodnutia môže výrazne závisieť od týchto heuristiek. Výsledný diagnostický model závisí od toho, ako sú objekty rozdelené na trénovacie a testovacie vzorky, ako sa určuje kritérium kvality rozpoznávania, koľko premenných sa prenesie do nasledujúceho výberového riadku atď.

Naznačené vlastnosti GMDH algoritmov sú charakteristické aj pre iné prístupy k evolučnému modelovaniu. Všimnime si však ešte jeden aspekt posudzovaných metód. Toto je ich významová podstata. Pomocou metód založených na predpokladoch o triede rozhodovacích funkcií (evolučných a gradientných) je možné zostaviť diagnostické modely vysokej zložitosti a získať prakticky prijateľné výsledky. Zároveň dosiahnutie praktických cieľov v tomto prípade nesprevádza získavanie nových poznatkov o povahe rozpoznaných predmetov. Možnosť extrakcie týchto poznatkov, najmä poznatkov o mechanizmoch interakcie atribútov (vlastností), je tu zásadne obmedzená danou štruktúrou takejto interakcie, fixovanou vo vybranej forme rozhodovacích funkcií. Preto najviac, čo možno povedať po skonštruovaní konkrétneho diagnostického modelu, je uviesť zoznam kombinácií funkcií a samotných vlastností zahrnutých vo výslednom modeli. Ale význam kombinácií, ktoré odrážajú povahu a štruktúru distribúcie skúmaných objektov, zostáva v rámci tohto prístupu často neodhalený.

Booleovské metódy. Logické metódy rozpoznávania vzorov sú založené na aparáte logickej algebry a umožňujú pracovať s informáciami obsiahnutými nielen v jednotlivých znakoch, ale aj v kombináciách hodnôt znakov. V týchto metódach sa hodnoty akéhokoľvek atribútu považujú za elementárne udalosti.

V najvšeobecnejšej podobe možno logické metódy charakterizovať ako typ hľadania prostredníctvom cvičnej vzorky logických vzorcov a formovania určitého systému logických rozhodovacích pravidiel (napríklad vo forme konjunkcií elementárnych dejov), pričom každý z nich ktorý má svoju váhu. Skupina logických metód je rôznorodá a zahŕňa metódy rôznej zložitosti a hĺbky analýzy. Pre dichotomické (booleovské) vlastnosti sú obľúbené takzvané stromové klasifikátory, metóda slepého testu, algoritmus „Bark“ a iné. Zložitejšie metódy sú založené na formalizácii induktívnych metód D. S. Milla. Formalizácia sa vykonáva konštrukciou kvázi-axiomatickej teórie a je založená na multi-triedenej mnohohodnotovej logike s kvantifikátormi nad n-ticemi premenlivej dĺžky.

Algoritmus „Kora“, podobne ako iné logické metódy rozpoznávania vzorov, je pomerne náročný na prácu, pretože pri výbere konjunkcií je potrebné úplné vyhľadávanie. Preto sú pri použití logických metód kladené vysoké nároky na efektívnu organizáciu výpočtového procesu a tieto metódy dobre fungujú aj pri relatívne malých rozmeroch priestoru funkcií a len na výkonných počítačoch.

Lingvistické (syntaktické alebo štrukturálne) metódy. Lingvistické metódy rozpoznávania vzorov sú založené na použití špeciálnych gramatík, ktoré generujú jazyky, pomocou ktorých možno popísať množinu vlastností rozpoznaných objektov. Gramatika sa vzťahuje na pravidlá na vytváranie objektov z týchto neodvodených prvkov.

Ak sa opis obrázkov robí pomocou neodvodených prvkov (subobrazov) a ich vzťahov, potom sa na budovanie systémov automatického rozpoznávania používa lingvistický alebo syntaktický prístup využívajúci princíp všeobecnosti vlastností. Obraz možno opísať pomocou hierarchickej štruktúry podobrazov, podobnej syntaktickej štruktúre jazyka. Táto okolnosť umožňuje aplikovať teóriu formálnych jazykov pri riešení problémov s rozpoznávaním obrazu. Predpokladá sa, že gramatika obrázkov obsahuje konečné množiny prvkov nazývaných premenné, nederivatívne prvky a substitučné pravidlá. Charakter substitučných pravidiel určuje typ gramatiky. Medzi najštudovanejšie gramatiky môžeme zaradiť regulárne, bezkontextové a gramatiky priamych komponentov. Kľúčovými bodmi tohto prístupu je výber nederivátových prvkov obrazu, kombinácia týchto prvkov a vzťahov, ktoré ich spájajú do obrazových gramatík, a napokon implementácia procesov analýzy a rozpoznávania vo vhodnom jazyku. Tento prístup je užitočný najmä pri práci s obrázkami, ktoré sa buď nedajú opísať numerickými meraniami, alebo sú také zložité, že nie je možné identifikovať ich lokálne vlastnosti a treba sa obrátiť na globálne vlastnosti objektov.

Napríklad E.A. Butakov, V.I. Ostrovský, I.L. Fadeev navrhuje nasledujúcu systémovú štruktúru pre spracovanie obrazu (obr. 3) s použitím lingvistického prístupu, kde každý z funkčných blokov je softvérový (mikroprogramový) komplex (modul), ktorý implementuje zodpovedajúce funkcie.

Obrázok 3. Bloková schéma rozpoznávacieho zariadenia

Pokusy aplikovať metódy matematickej lingvistiky na problém analýzy obrazu vedú k potrebe riešiť množstvo problémov spojených s mapovaním dvojrozmernej štruktúry obrazu na jednorozmerné reťazce formálneho jazyka.

Rozširujúce metódy

V metódach tejto skupiny, na rozdiel od intenzionálneho smeru, sa každému študovanému objektu vo väčšej či menšej miere pripisuje nezávislý diagnostický význam. Vo svojom jadre sú tieto metódy blízke klinickému prístupu, ktorý ľudí nepovažuje za reťazec objektov zoradených podľa jedného alebo druhého ukazovateľa, ale za integrálne systémy, z ktorých každý je individuálny a má osobitnú diagnostickú hodnotu. Takýto opatrný prístup k objektom výskumu neumožňuje vylúčiť alebo stratiť informácie o každom jednotlivom objekte, čo sa stáva pri použití metód intenzionálneho smerovania, ktoré využívajú objekty iba na zisťovanie a zaznamenávanie vzorcov správania ich atribútov.

Hlavnými operáciami pri rozpoznávaní vzorov pomocou diskutovaných metód sú operácie určovania podobností a rozdielov objektov. Objekty v špecifikovanej skupine metód zohrávajú úlohu diagnostických precedensov. Okrem toho, v závislosti od podmienok konkrétnej úlohy, sa úloha jednotlivého precedensu môže meniť v najširších medziach: od hlavnej a určujúcej až po veľmi nepriamu účasť na procese uznávania. Na druhej strane, podmienky problému môžu vyžadovať účasť rôzneho počtu diagnostických precedensov na úspešné riešenie: od jedného v každej rozpoznanej triede až po úplnú veľkosť vzorky, ako aj rôzne metódy na výpočet mier podobnosti a rozdielu objektov. . Tieto požiadavky vysvetľujú ďalšie rozdelenie rozširujúcich metód do podtried:

spôsob porovnania s prototypom;

metóda k-najbližších susedov;

kolektívy rozhodovacích pravidiel.

Spôsob porovnania s prototypom. Toto je najjednoduchšia metóda rozšíreného rozpoznávania. Používa sa napríklad vtedy, keď sú rozpoznané triedy zobrazené v priestore prvkov pomocou kompaktných geometrických zoskupení. V tomto prípade sa zvyčajne ako prototypový bod vyberie stred geometrického zoskupenia triedy (alebo objekt najbližšie k stredu).

Na klasifikáciu neznámeho objektu sa nájde jeho najbližší prototyp a objekt patrí do rovnakej triedy ako tento prototyp. Je zrejmé, že touto metódou sa negenerujú žiadne zovšeobecnené obrázky tried.

Ako meradlo blízkosti možno použiť rôzne typy vzdialeností. Často sa pre dichotomické znaky používa Hammingova vzdialenosť, ktorá sa v tomto prípade rovná druhej mocnine euklidovskej vzdialenosti. V tomto prípade je rozhodovacie pravidlo pre klasifikáciu objektov ekvivalentné lineárnej rozhodovacej funkcii.

Túto skutočnosť je potrebné osobitne poznamenať. Jasne demonštruje prepojenie medzi prototypovou a atribútovou reprezentáciou informácií o štruktúre dát. Pomocou vyššie uvedeného znázornenia je možné napríklad považovať akúkoľvek tradičnú meraciu stupnicu, ktorá je lineárnou funkciou hodnôt dichotomických charakteristík, za hypotetický diagnostický prototyp. Na druhej strane, ak nám analýza priestorovej štruktúry rozpoznaných tried umožní vyvodiť záver o ich geometrickej kompaktnosti, potom stačí nahradiť každú z týchto tried jedným prototypom, ktorý je vlastne ekvivalentom lineárneho diagnostického modelu.

V praxi je samozrejme situácia často odlišná od opísaného idealizovaného príkladu. Výskumník, ktorý má v úmysle použiť metódu rozpoznávania založenú na porovnaní s prototypovými diagnostickými triedami, čelí zložitým problémom. Ide v prvom rade o výber miery priblíženia (metriky), ktorá môže výrazne zmeniť priestorovú konfiguráciu rozmiestnenia objektov. A po druhé, nezávislým problémom je analýza viacrozmerných štruktúr experimentálnych údajov. Oba tieto problémy sú pre bádateľa obzvlášť akútne v podmienkach vysokej dimenzionality priestoru rysov, charakteristických pre reálne problémy.

Metóda k-najbližších susedov. Metóda k-najbližších susedov na riešenie problémov diskriminačnej analýzy bola prvýkrát navrhnutá už v roku 1952. Je to nasledovné.

Pri klasifikácii neznámeho objektu sa zistí daný počet (k) geometricky najbližších k nemu v priestore znakov iných objektov (najbližší susedia) s už známou príslušnosťou k uznávaným triedam. Rozhodnutie o priradení neznámeho objektu konkrétnej diagnostickej triede sa robí analýzou informácií o tejto známej príslušnosti jeho najbližších susedov, napríklad pomocou jednoduchého sčítania hlasov.

Spočiatku sa metóda k-najbližších susedov považovala za neparametrickú metódu na odhadovanie pomeru pravdepodobnosti. Pre túto metódu boli získané teoretické odhady jej účinnosti v porovnaní s optimálnym bayesovským klasifikátorom. Bolo dokázané, že pravdepodobnosti asymptotických chýb pre metódu k-najbližších susedov prevyšujú chyby Bayesovho pravidla maximálne dvakrát.

Ako bolo uvedené vyššie, v reálnych problémoch je často potrebné operovať s objektmi, ktoré sú opísané veľkým počtom kvalitatívnych (dichotomických) znakov. V tomto prípade je rozmer priestoru znakov úmerný alebo väčší ako objem skúmanej vzorky. V takýchto podmienkach je vhodné interpretovať každý objekt trénovacej vzorky ako samostatný lineárny klasifikátor. Potom túto alebo tú diagnostickú triedu nepredstavuje jeden prototyp, ale súbor lineárnych klasifikátorov. Kombinovaná interakcia lineárnych klasifikátorov má v konečnom dôsledku za následok po častiach lineárny povrch oddeľujúci rozpoznané triedy v priestore prvkov. Typ deliacej plochy, pozostávajúcej z kusov nadrovín, môže byť rôzny a závisí od relatívnej polohy klasifikovaných agregátov.

Môže sa použiť aj iná interpretácia klasifikačných mechanizmov pomocou pravidla k-najbližších susedov. Je založený na myšlienke existencie niektorých latentných premenných, abstraktných alebo spojených nejakou transformáciou s pôvodným priestorom funkcií. Ak sú v priestore latentných premenných párové vzdialenosti medzi objektmi rovnaké ako v priestore pôvodných znakov a počet týchto premenných je výrazne menší ako počet objektov, potom interpretácia metódy k-najbližších susedov môže z hľadiska porovnania neparametrických odhadov podmienených hustôt rozdelenia pravdepodobnosti. Tu prezentovaný pohľad na latentné premenné je svojou povahou blízky pohľadu na skutočnú dimenzionalitu a iným pohľadom používaným v rôznych technikách redukcie dimenzií.

Pri použití metódy k-najbližších susedov na rozpoznávanie vzorov musí výskumník vyriešiť zložitý problém výberu metriky na určenie blízkosti diagnostikovaných objektov. Tento problém v podmienkach vysokej dimenzionality priestoru prvkov je extrémne zhoršený v dôsledku dostatočnej zložitosti tejto metódy, ktorá sa stáva významnou aj pre vysokovýkonné počítače. Preto je tu, rovnako ako pri metóde porovnávania s prototypom, potrebné vyriešiť kreatívny problém analýzy viacrozmernej štruktúry experimentálnych dát, aby sa minimalizoval počet objektov reprezentujúcich diagnostické triedy.

Algoritmy na výpočet hodnotenia (hlasovanie). Princípom fungovania algoritmov výpočtu hodnotenia (ABO) je vypočítať prioritu (skóre podobnosti) charakterizujúcu „blízkosť“ rozpoznaných a referenčných objektov podľa systému súborov vlastností, čo je systém podmnožín daného súboru vlastností. .

Na rozdiel od všetkých predtým diskutovaných metód, algoritmy na výpočet odhadov pracujú s popismi objektov zásadne novým spôsobom. Pre tieto algoritmy existujú objekty súčasne vo veľmi odlišných podpriestoroch priestoru prvkov. Trieda ABO doťahuje myšlienku používania funkcií k svojmu logickému záveru: keďže nie je vždy známe, ktoré kombinácie funkcií sú najinformatívnejšie, potom v triede ABO sa miera podobnosti objektov vypočíta porovnaním všetkých možných alebo špecifických kombinácií vlastnosti zahrnuté v popisoch objektov.

Kolektívy rozhodovacích pravidiel. Rozhodovacie pravidlo používa dvojúrovňovú schému uznávania. Na prvej úrovni fungujú súkromné rozpoznávacie algoritmy, ktorých výsledky sa kombinujú na druhej úrovni v bloku syntézy. Najbežnejšie metódy takéhoto zjednotenia sú založené na identifikácii oblastí kompetencie konkrétneho algoritmu. Najjednoduchší spôsob, ako nájsť oblasti kompetencie, je a priori rozdeliť priestor atribútov na základe odborných úvah konkrétnej vedy (napríklad stratifikovať vzorku podľa určitého atribútu). Potom sa pre každú z vybraných oblastí vytvorí vlastný rozpoznávací algoritmus. Iná metóda je založená na použití formálnej analýzy na určenie miestnych oblastí priestoru prvkov ako susedstiev rozpoznaných objektov, pre ktoré bola preukázaná úspešnosť akéhokoľvek konkrétneho rozpoznávacieho algoritmu.

Najvšeobecnejší prístup ku konštrukcii bloku syntézy považuje výsledné ukazovatele konkrétnych algoritmov za počiatočné charakteristiky pre konštrukciu nového zovšeobecneného rozhodovacieho pravidla. V tomto prípade možno použiť všetky vyššie uvedené spôsoby intenzionálnych a predlžovacích smerov pri rozpoznávaní vzorov. Na riešenie problému tvorby množiny rozhodovacích pravidiel sú efektívne logické algoritmy typu „Kora“ a algoritmy na výpočet odhadov (ABO), ktoré tvoria základ tzv. algebraického prístupu, ktorý poskytuje štúdium a konštruktívny popis rozpoznávacie algoritmy, do ktorých rámca zapadajú všetky existujúce typy algoritmov.

Metódy neurónových sietí

Metódy neurónových sietí sú metódy založené na použití rôznych typov neurónových sietí (NN). Hlavné oblasti použitia rôznych neurónových sietí na rozpoznávanie vzorov a obrázkov:

aplikácia na extrahovanie kľúčových charakteristík alebo vlastností daných obrázkov,

klasifikácia samotných obrázkov alebo charakteristík z nich už extrahovaných (v prvom prípade k extrakcii kľúčových charakteristík dochádza implicitne v rámci siete),

riešenie optimalizačných problémov.

Viacvrstvové neurónové siete. Architektúra viacvrstvovej neurónovej siete (MNN) pozostáva zo sekvenčne spojených vrstiev, kde neurón každej vrstvy je svojimi vstupmi spojený so všetkými neurónmi predchádzajúcej vrstvy a výstupmi ďalšej vrstvy.

Najjednoduchšou aplikáciou jednovrstvovej neurónovej siete (nazývanej autoasociatívna pamäť) je trénovať sieť na rekonštrukciu privádzaných obrázkov. Zadaním testovacieho obrázka ako vstupu a výpočtom kvality rekonštruovaného obrázka môžete vyhodnotiť, ako dobre sieť rozpoznala vstupný obrázok. Pozitívne vlastnosti tejto metódy spočívajú v tom, že sieť dokáže obnoviť skreslené a zašumené obrázky, ale nie je vhodná na vážnejšie účely.

MNN sa používa aj na priamu klasifikáciu obrazu – na výstupe je dodávaný buď samotný obraz v nejakej forme, alebo súbor predtým extrahovaných kľúčových charakteristík obrazu, neurón s maximálnou aktivitou indikuje príslušnosť k rozpoznanej triede (obr. 4). Ak je táto aktivita pod určitou hranicou, potom sa má za to, že predložený obrázok nepatrí do žiadnej zo známych tried. Proces učenia stanovuje súlad obrázkov dodávaných na vstup s príslušnosťou k určitej triede. Toto sa nazýva učenie pod dohľadom. Tento prístup je vhodný pre úlohy riadenia prístupu malej skupiny ľudí. Tento prístup zaisťuje, že sieť priamo porovnáva samotné obrázky, ale s nárastom počtu tried exponenciálne narastá čas školenia a prevádzky siete. Preto úlohy, ako je nájdenie podobnej osoby vo veľkej databáze, vyžadujú extrahovanie kompaktného súboru kľúčových charakteristík, na ktorých bude založené vyhľadávanie.

Prístup ku klasifikácii pomocou frekvenčných charakteristík celého obrazu je opísaný v. Použila sa jednovrstvová neurónová sieť založená na viachodnotových neurónoch.

Aplikácia neurónovej siete na klasifikáciu obrazu sa ukáže, keď sieťový vstup dostane výsledky rozkladu obrazu pomocou metódy hlavných komponentov.

V klasickom MNN sú medzivrstvové neurónové spojenia plne prepojené a obraz je reprezentovaný ako jednorozmerný vektor, hoci je dvojrozmerný. Architektúra konvolučnej neurónovej siete má za cieľ tieto nedostatky prekonať. Využíval lokálne receptorové polia (poskytujú lokálnu dvojrozmernú konektivitu neurónov), zdieľané váhy (poskytujú detekciu určitých znakov kdekoľvek na obrázku) a hierarchickú organizáciu s priestorovým podvzorkovaním. Konvolučná neurónová sieť (CNN) poskytuje čiastočnú odolnosť voči zmenám mierky, posunom, rotáciám a deformáciám.

MNN sa tiež používajú na detekciu objektov určitého typu. Okrem toho, že každý trénovaný MNN môže do určitej miery určiť, či obrázky patria do „ich“ tried, môže byť špeciálne trénovaný na spoľahlivé zistenie určitých tried. V tomto prípade budú výstupnými triedami triedy, ktoré patria a nepatria do daného typu obrázka. Na detekciu obrazu tváre na vstupnom obrázku bol použitý detektor neurónovej siete. Obraz bol naskenovaný oknom 20x20 pixelov, ktoré bolo privedené na vstup siete, ktorá rozhoduje o tom, či daná oblasť patrí do triedy tvárí. Školenie sa uskutočnilo s použitím pozitívnych príkladov (rôzne obrázky tvárí) aj negatívnych príkladov (obrázky, ktoré nie sú tvárami). Pre zvýšenie spoľahlivosti detekcie bol použitý tím neurónových sietí natrénovaný s rôznymi počiatočnými váhami, v dôsledku čoho sa neurónové siete dopúšťali chýb rôznymi spôsobmi a konečné rozhodnutie padlo hlasovaním celého tímu.

Obrázok 5. Hlavné komponenty (vlastné tváre) a rozklad obrazu na hlavné komponenty

Neurónová sieť sa používa aj na extrakciu kľúčových charakteristík obrazu, ktoré sa potom používajú na následnú klasifikáciu. V , je znázornený spôsob implementácie metódy analýzy hlavných komponentov neurónovou sieťou. Podstatou metódy analýzy hlavných komponentov je získanie maximálne zdobených koeficientov charakterizujúcich vstupné obrázky. Tieto koeficienty sa nazývajú hlavné komponenty a používajú sa na štatistickú kompresiu obrazu, pri ktorej sa na reprezentáciu celého obrazu používa malý počet koeficientov. Neurónová sieť s jednou skrytou vrstvou obsahujúcou N neurónov (ktorá je oveľa menšia ako rozmer obrazu), natrénovaná pomocou metódy spätného šírenia na obnovenie výstupného obrazu privádzaného na vstup, generuje koeficienty prvých N hlavných komponentov na výstupe. skrytých neurónov, ktoré sa používajú na porovnanie. Zvyčajne sa používa 10 až 200 hlavných komponentov. So zvyšujúcim sa počtom komponentu výrazne klesá jeho reprezentatívnosť a nemá zmysel používať komponenty s veľkým počtom. Pri použití nelineárnych aktivačných funkcií neurónových prvkov je možný nelineárny rozklad na hlavné zložky. Nelinearita umožňuje presnejšie odrážať variácie vo vstupných údajoch. Aplikovaním analýzy hlavných komponentov na dekompozíciu obrazov tváre získame hlavné komponenty, nazývané vlastné tváre, ktoré majú tiež užitočnú vlastnosť - sú to komponenty, ktoré odrážajú najmä také základné charakteristiky tváre, ako je pohlavie, rasa, emócie. Po rekonštrukcii majú komponenty vzhľad podobný tvári, pričom prvé odrážajú najvšeobecnejší tvar tváre, druhé predstavujú rôzne malé rozdiely medzi tvárami (obr. 5). Táto metóda je vhodná na vyhľadávanie podobných obrázkov tvárí vo veľkých databázach. Je tiež znázornená možnosť ďalšieho zmenšenia rozmerov hlavných komponentov pomocou NN. Posúdením kvality rekonštrukcie vstupného obrazu môžete veľmi presne určiť jeho príslušnosť k triede tvárí.

Neurónové siete vysokého rádu. Neurónové siete vysokého rádu (HANN) sa líšia od MNN v tom, že majú iba jednu vrstvu, ale neurónové vstupy dostávajú aj výrazy vysokého rádu, ktoré sú produktom dvoch alebo viacerých komponentov vstupného vektora. Takéto siete môžu vytvárať aj zložité deliace plochy.

Hopfieldove neurónové siete. Hopfield NN (HNS) je jednovrstvový a plne prepojený (medzi neurónmi na sebe nie sú žiadne spojenia), jeho výstupy sú spojené so vstupmi. Na rozdiel od MNS je NSC relaxácia – t.j. po nastavení do počiatočného stavu pracuje, kým nedosiahne stabilný stav, ktorý bude jeho výstupnou hodnotou. Na hľadanie globálneho minima vo vzťahu k problémom optimalizácie sa používajú stochastické modifikácie NSC.

Použitie NSH ako asociatívnej pamäte umožňuje presne obnoviť obrázky, pre ktoré je sieť trénovaná, keď sa na vstup privedie skreslený obrázok. V tomto prípade si sieť „zapamätá“ najbližší (v zmysle lokálnej minimálnej energie) obraz, a tak ho rozpozná. Takéto fungovanie môže byť tiež reprezentované ako sekvenčná aplikácia auto-asociatívnej pamäte opísaná vyššie. Na rozdiel od auto-asociatívnej pamäte, NSC dokonale presne obnoví obraz. Aby sa predišlo minimám rušenia a zvýšila sa kapacita siete, používajú sa rôzne metódy.

Samoorganizujúce sa Kohonenove neurónové siete. Samoorganizujúce sa Kohonenove neurónové siete (KONN) poskytujú topologické usporiadanie priestoru vstupného obrazu. Umožňujú topologicky spojité mapovanie n-rozmerného vstupného priestoru na m-rozmerný výstupný priestor, m<

Cognitron. Architektúra Cognitronu je podobná štruktúre vizuálnej kôry, má hierarchickú viacvrstvovú organizáciu, v ktorej sú neuróny medzi vrstvami spojené iba lokálne. Učí sa súťažným učením (bez učiteľa). Každá vrstva mozgu implementuje rôzne úrovne zovšeobecnenia; vstupná vrstva je citlivá na jednoduché vzory, ako sú čiary, a ich orientáciu v určitých oblastiach vizuálnej domény, zatiaľ čo odozva ostatných vrstiev je zložitejšia, abstraktnejšia a nezávislá od polohy vzoru. Podobné funkcie sú implementované v kognitróne modelovaním organizácie zrakovej kôry.

Neocognitron je ďalším vývojom myšlienky kognitronu a presnejšie odráža štruktúru vizuálneho systému, umožňuje vám rozpoznávať obrázky bez ohľadu na ich transformácie, rotácie, skreslenia a zmeny v mierke.

Cognitron je výkonný nástroj na rozpoznávanie obrázkov, ale vyžaduje si vysoké výpočtové náklady, ktoré sú v súčasnosti nedosiahnuteľné.

Uvažované metódy neurónovej siete poskytujú rýchle a spoľahlivé rozpoznávanie obrazu, pri použití týchto metód však vznikajú problémy s rozpoznávaním trojrozmerných objektov. Tento prístup má však mnoho výhod.

Záver

V súčasnosti existuje pomerne veľké množstvo systémov automatického rozpoznávania vzorov pre rôzne aplikované úlohy.

Rozpoznávanie vzorov formálnymi metódami ako základný vedecký smer je nevyčerpateľné.

Matematické metódy spracovania obrazu majú širokú škálu aplikácií: veda, technika, medicína, sociálna sféra. V budúcnosti sa úloha rozpoznávania vzorov v ľudskom živote ešte zvýši.

Metódy neurónových sietí poskytujú rýchle a spoľahlivé rozpoznávanie obrazu. Tento prístup má množstvo výhod a je jedným z najsľubnejších.

Literatúra

D.V. Brilyuk, V.V. Starovoitov. Metódy neurónovej siete na rozpoznávanie obrazu // /

Kuzin L.T. Základy kybernetiky: Základy kybernetických modelov. T.2. - M.: Energia, 1979. - 584 s.

Peregudov F.I., Tarasenko F.P. Úvod do systémovej analýzy: Učebnica. – M.: Vyššia škola, 1997. - 389 s.

Temnikov F.E., Afonin V.A., Dmitriev V.I. Teoretické základy informačných technológií. - M.: Energia, 1979. - 511 s.

Tu J., Gonzalez R. Princípy rozpoznávania vzorov. /Pres. z angličtiny - M.: Mir, 1978. - 410 s.

Winston P. Umelá inteligencia. /Pres. z angličtiny - M.: Mir, 1980. - 520 s.

Fu K. Štrukturálne metódy v rozpoznávaní vzorov: Preklad z angličtiny. - M.: Mir, 1977. - 320 s.

Tsypkin Ya.Z. Základy informačnej teórie identifikácie. - M.: Nauka, 1984. - 520 s.

Pospelov G.S. Umelá inteligencia je základom nových informačných technológií. - M.: Nauka, 1988. - 280 s.

Yu Lifshits, Štatistické metódy rozpoznávania vzorov ///modern/07modernnote.pdf

Bohr N. Atómová fyzika a ľudské poznanie. /Preložené z angličtiny - M.: Mir, 1961. - 151 s.

Butakov E.A., Ostrovsky V.I., Fadeev I.L. Spracovanie obrazu na počítači.1987.-236s.

Duda R., Hart P. Rozpoznávanie vzorov a analýza scény. /Preložené z angličtiny - M.: Mir, 1978. - 510 s.

Vojvoda V.A. Počítačová psychodiagnostika. - Petrohrad: Bratstvo, 1994. - 365 s.

Aizenberg I. N., Aizenberg N. N. a Krivosheev G. A. Viachodnotové a univerzálne binárne neuróny: Algoritmy učenia, aplikácie na spracovanie a rozpoznávanie obrazu. Poznámky z prednášok z umelej inteligencie – strojové učenie a dolovanie údajov v rozpoznávaní vzorov, 1999, s. 21-35.

Ranganath S. a Arun K. Rozpoznávanie tváre pomocou transformačných funkcií a neurónových sietí. Rozpoznanie vzoru 1997, roč. 30, str. 1615-1622.

Golovko V.A. Neurointeligencia: teória a aplikácie. Kniha 1. Organizácia a trénovanie neurónových sietí s priamymi a spätnoväzbovými spojeniami - Brest: BPI, 1999, - 260 s.

Vetter T. a Poggio T. Triedy lineárnych objektov a syntéza obrazu z jedného príkladu obrazu. IEEE Transactions on Pattern Analysis and Machine Intelligence 1997, Vol. 19, str. 733-742.

Golovko V.A. Neurointeligencia: teória a aplikácie. Kniha 2. Samoorganizácia, odolnosť voči chybám a aplikácia neurónových sietí - Brest: BPI, 1999, - 228 s.

Lawrence S., Giles C. L., Tsoi A. C. a Back A. D. Face Recognition: A Convolutional Neural Network Approach. IEEE Transactions on Neural Networks, Special Issue on Neural Networks and Pattern Recognition, pp. 1-24.

Wasserman F. Neuropočítačová technika: Teória a prax, 1992 – 184 s.

Rowley, H. A., Baluja, S. a Kanade, T. Neural Network-Based Face Detection. IEEE Transactions on Pattern Analysis and Machine Intelligence 1998, Vol. 20, str. 23-37.

Valentin D., Abdi H., O"Toole A.J. a Cottrell G.W. Connectionistické modely spracovania tváre: prieskum. IN: Pattern Recognition 1994, zväzok 27, s. 1209-1230.

Dokument

Vytvárajú algoritmy uznaniesnímky. Metódyuznaniesnímky Ako je uvedené vyššie, neexistuje žiadna realita existuje„ekosystémy vo všeobecnosti“ a existujú len individuálne... závery z tohto podrobného preskúmaniemetódyuznanie predstavili sme v...

Prehľad metód identifikácie ľudí na základe obrázkov tváre, berúc do úvahy vlastnosti vizuálneho rozpoznávania
Preskúmanie
... uznanie osobou málo kontrastných predmetov, vr. osôb Dané preskúmanie bežné metódy ... Existuje celý riadok metódy ... spôsobom ako výsledok výskumu platforma pre rozvoj metódauznanie ...
Pomenované po Glazkovej Valentine Vladimirovne VÝSKUM A VÝVOJ METÓD NA KONŠTRUKCIU SOFTVÉROVÝCH NÁSTROJOV NA KLASIFIKÁCIU HYPERTEXTOVÝCH DOKUMENTOV NA VEĽKÉ TÉMY Špecialita 05
Abstrakt dizertačnej práce
Hypertextové dokumenty. Kapitola poskytuje preskúmanieexistujúcemetódy riešenia uvažovaného problému, popis... odrezaním najmenej relevantných tried // Matematické metódyuznaniesnímky: 13. celoruská konferencia. Leningradská oblasť...
Snímka 0 Prehľad bioinformatických úloh súvisiacich s analýzou a spracovaním genetických textov
Prednáška
DNA a proteínové sekvencie. Preskúmanie bioinformatické úlohy ako úlohy... signály vyžadujú použitie moderných metódyuznaniesnímky, štatistické prístupy a... s nízkou hustotou génov. Existujúce programy na predpovedanie génov nie sú...

V tomto článku som sa rozhodol zdôrazniť niektoré zo základných výsledkov teórie strojového učenia spôsobom, ktorý čitateľom s určitými znalosťami o problémoch klasifikácie a regresie ozrejmí tieto pojmy. Myšlienka napísať takýto článok sa mi v mysli čoraz viac ujasňovala s každou prečítanou knihou, v ktorej boli myšlienky o učení strojov rozpoznávať akoby od stredu a bolo úplne nejasné, čo autori tejto resp. táto metóda sa opierala pri jej vývoji. Na druhej strane existuje množstvo kníh venovaných základným pojmom v strojovom učení, no prezentácia látky v nich sa môže zdať na prvé čítanie príliš zložitá.

Motivácia

Zvážme tento problém. Máme jablká dvoch tried - chutné a nie chutné, 1 a 0. Jablká majú vlastnosti - farbu a veľkosť. Farba sa bude plynule meniť od 0 do 1, t.j. 0 - úplne zelené jablko, 1 - úplne červené. Veľkosť sa môže meniť rovnakým spôsobom, 0 - malé jablko, 1 - veľké. Chceli by sme vyvinúť algoritmus, ktorý by ako vstup prijímal farbu a veľkosť a vydával triedu jablka – či je chutné alebo nie. Je veľmi žiaduce, aby čím menej chýb, tým lepšie. Zároveň máme konečný zoznam, ktorý obsahuje historické údaje o farbe, veľkosti a triede jabĺk. Ako by sme mohli vyriešiť takýto problém?

Logický prístup

Pri riešení nášho problému nám ako prvá napadne táto metóda: vytvorme ručne pravidlá ako if-else a v závislosti od hodnôt farby a veľkosti priradíme jablku určitú triedu. Tie. máme predpoklady - farbu a veľkosť a je tu dôsledok - chuť jablka. Je to celkom rozumné, keď existuje málo znakov a prahy sa dajú odhadnúť okom na porovnanie. Môže sa však stať, že nie je možné vypracovať jasné podmienky a z údajov nie je zrejmé, ktoré prahové hodnoty je potrebné vziať, a počet znakov sa môže v budúcnosti zvýšiť. Čo keby sme v našom zozname s historickými údajmi našli dve jablká s rovnakou farbou a veľkosťou, no jedno je označené ako chutné a druhé nie? Naša prvá metóda teda nie je taká flexibilná a škálovateľná, ako by sme chceli.

Označenia

Uveďme si nasledujúci zápis. Jablko označíme ako . Každý sa zase skladá z dvoch čísel – farby a veľkosti. Túto skutočnosť označíme dvojicou čísel: . Triedu každého -tého jablka označujeme ako . Zoznam s historickými údajmi bude označený písmenom , dĺžka tohto zoznamu je . Prvým prvkom tohto zoznamu je hodnota atribútov jablka a jeho trieda. Tie. . Nazvime to aj vzorka. Na označenie premenných, ktoré môžu nadobudnúť hodnoty konkrétneho atribútu a triedy, používame veľké písmená. Predstavme si nový koncept – rozhodovacie pravidlo je funkcia, ktorá berie farbu a veľkosť ako vstup a vracia označenie triedy ako výstup:

Pravdepodobnostný prístup

Pri rozvíjaní myšlienky logickej metódy s predpokladmi a dôsledkami si položme otázku - aká je pravdepodobnosť, že jablko, ktoré nepatrí do našej vzorky, bude chutné, vzhľadom na namerané hodnoty farby a veľkosti ? V zápise teórie pravdepodobnosti možno túto otázku napísať takto:

Tento výraz možno interpretovať ako predpoklad, ako dôsledok, ale prechod z predpokladu na dôsledok sa bude riadiť pravdepodobnostnými zákonmi, nie logickými. Tie. Namiesto pravdivostnej tabuľky s booleovskými hodnotami 0 a 1 pre triedu budú hodnoty pravdepodobnosti v rozsahu od 0 do 1. Použite Bayesov vzorec a získajte nasledujúci výraz:

Pozrime sa na pravú stranu tohto výrazu podrobnejšie. Násobiteľ sa nazýva predchádzajúca pravdepodobnosť a znamená pravdepodobnosť nájdenia chutného jablka medzi všetkými možnými jablkami. Je a priori pravdepodobnosť, že sa stretnete s jablkom bez chuti. Táto pravdepodobnosť môže odrážať naše osobné znalosti o tom, ako chutné a nechutné jablká sú v prírode distribuované. Napríklad z našich minulých skúseností vieme, že 80 % všetkých jabĺk je chutných. Alebo môžeme túto hodnotu odhadnúť jednoducho vypočítaním podielu chutných jabĺk v našom zozname s historickými údajmi S. Ďalší faktor ukazuje, aká je pravdepodobnosť získania konkrétnej hodnoty farby a veľkosti pre jablko triedy 1. Tento výraz sa tiež nazýva pravdepodobnostná funkcia a môže vyzerať takto: nejaké špecifické rozdelenie, napríklad normálne. Menovateľa používame ako normalizačnú konštantu, aby sa požadovaná pravdepodobnosť menila od 0 do 1. Naším konečným cieľom nie je hľadať pravdepodobnosti, ale hľadať rozhodujúce pravidlo, ktoré by nám triedu okamžite dalo. Konečná podoba rozhodovacieho pravidla závisí od toho, aké hodnoty a parametre sú nám známe. Napríklad môžeme poznať iba hodnoty predchádzajúcej pravdepodobnosti a zostávajúce hodnoty nemožno odhadnúť. Potom bude rozhodujúce pravidlo - priradiť všetkým jablkám hodnotu triedy, pre ktorú je apriórna pravdepodobnosť najväčšia. Tie. ak vieme, že 80% jabĺk v prírode je chutných, tak každému jablku dáme triedu 1. Potom bude naša chyba 20%. Ak dokážeme odhadnúť aj hodnoty pravdepodobnostnej funkcie $p(X=x_m | Y=1)$, potom môžeme hodnotu požadovanej pravdepodobnosti nájsť pomocou Bayesovho vzorca, ako je napísané vyššie. Rozhodujúce pravidlo tu bude toto: dajte označenie pre triedu, pre ktorú je pravdepodobnosť maximálna:

Nazvime toto pravidlo Bayesovský klasifikátor. Keďže máme čo do činenia s pravdepodobnosťami, ani veľká hodnota pravdepodobnosti nezaručí, že jablko nepatrí do triedy 0. Pravdepodobnosť chyby na jablku odhadneme takto: ak rozhodovacie pravidlo vrátilo hodnotu triedy rovnajúcu sa 1 , potom bude pravdepodobnosť chyby a naopak:

Pravdepodobnosť chyby klasifikátora nás zaujíma nielen v tomto konkrétnom príklade, ale vo všeobecnosti pre všetky možné jablká:

Tento výraz predstavuje očakávanú hodnotu chyby. Riešením pôvodného problému sme sa dostali k bayesovskému klasifikátoru, ale aké sú jeho nevýhody? Hlavným problémom je odhadnúť podmienenú pravdepodobnosť z údajov. V našom prípade predstavujeme objekt dvojicou čísel - farbou a veľkosťou, ale v zložitejších úlohách môže byť rozmer znakov mnohonásobne vyšší a počet pozorovaní z nášho zoznamu s historickými údajmi nemusí stačiť na odhad pravdepodobnosť viacrozmernej náhodnej premennej. Ďalej sa pokúsime zovšeobecniť náš koncept chyby klasifikátora a tiež uvidíme, či je možné na vyriešenie problému vybrať akýkoľvek iný klasifikátor.

Straty chýb klasifikátora

Predpokladajme, že už máme nejaké rozhodovacie pravidlo. Potom môže robiť dva typy chýb – prvou je priradiť objekt do triedy 0, ktorej reálna trieda je 1 a naopak, priradiť objekt do triedy 1, ktorého reálna trieda je 0. Pri niektorých úlohách je dôležité rozlišovať medzi týmito prípadmi. Napríklad viac trpíme, keď sa jablko označené ako chutné ukáže ako bez chuti a naopak. Stupeň nášho nepohodlia zo sklamaných očakávaní formalizujeme v koncepte Všeobecnejšie povedané, máme stratovú funkciu, ktorá vracia číslo pre každú chybu klasifikátora. Buď skutočným štítkom triedy. Stratová funkcia potom vráti hodnotu straty pre skutočný štítok triedy a hodnotu nášho rozhodovacieho pravidla. Príklad použitia tejto funkcie - berieme z jablka so známou triedou, prejdeme jablko ako vstup do nášho rozhodovacieho pravidla, získame odhad triedy z rozhodovacieho pravidla, ak sa hodnoty zhodujú, potom predpokladáme že klasifikátor sa nemýli a nedochádza k žiadnym stratám, ak sa hodnoty nezhodujú, potom výška straty povie naša funkcia

Podmienené a Bayesovské riziko

Teraz, keď máme stratovú funkciu a vieme, koľko strácame nesprávnou klasifikáciou objektov, bolo by pekné pochopiť, koľko v priemere strácame na mnohých objektoch. Ak poznáme hodnotu - pravdepodobnosť, že jablko bude chutné, vzhľadom na namerané hodnoty farby a veľkosti, ako aj skutočnú hodnotu triedy (napríklad zoberte jablko zo vzorky S, viď. začiatok článku), potom môžeme zaviesť pojem podmienené riziko . Podmienené riziko je priemerná hodnota strát na facilite pre rozhodujúce pravidlo:

V našom prípade binárnej klasifikácie, keď sa ukáže:

Vyššie sme popísali rozhodovacie pravidlo, ktoré priraďuje objekt do triedy s najvyššou hodnotou pravdepodobnosti. Toto pravidlo prináša minimum našich priemerných strát (Bayesovské riziko), preto je Bayesovský klasifikátor optimálny z hľadiska funkcionality rizika. sme predstavili. To znamená, že Bayesovský klasifikátor má najmenšiu možnú klasifikačnú chybu.

Niektoré typické stratové funkcie

Jednou z najbežnejších stratových funkcií je symetrická funkcia, keď straty z prvého a druhého typu chýb sú ekvivalentné. Napríklad funkcia straty 1-0 (strata nula jedna) je definovaná takto:

Potom bude podmienené riziko pre a(x) = 1 jednoducho hodnotou pravdepodobnosti získania triedy 0 na objekte:

Podobne pre a(x) = 0:

Stratová funkcia 1-0 má hodnotu 1, ak klasifikátor urobí na objekte chybu, a 0, ak nie. Teraz sa uistite, že hodnota chyby sa nerovná 1, ale inej funkcii Q, v závislosti od rozhodovacieho pravidla a skutočného označenia triedy:

Potom môže byť podmienené riziko zapísané takto:

Poznámky k notácii

Predchádzajúci text bol napísaný podľa notácie, ktorú v knihe prevzali Duda a Hart. V origináli knihy V.N. Vapnik zvažoval nasledujúci proces: príroda vyberie objekt podľa distribúcie $p(x)$ a potom mu priradí označenie triedy podľa podmieneného rozdelenia $p(y|x)$. Potom je riziko (očakávanie strát) definované ako

Kde je funkcia, ktorou sa snažíme aproximovať neznámu závislosť, je stratová funkcia pre skutočnú hodnotu a hodnotu našej funkcie. Toto označenie je jasnejšie, aby sa zaviedol ďalší pojem - empirické riziko.

Empirické riziko

V tejto fáze sme už zistili, že logická metóda nie je pre nás vhodná, pretože nie je dostatočne flexibilná a nemôžeme použiť Bayesovský klasifikátor, keď je veľa funkcií, ale existuje obmedzený počet trénovacích údajov a my nemôže obnoviť pravdepodobnosť. Vieme tiež, že Bayesovský klasifikátor má najmenšiu možnú klasifikačnú chybu. Keďže nemôžeme použiť Bayesovský klasifikátor, použijeme niečo jednoduchšie. Opravme nejakú parametrickú rodinu funkcií H a vyberieme klasifikátor z tejto rodiny.

Príklad: nech súbor všetkých funkcií formulára

Všetky funkcie tejto množiny sa budú od seba líšiť len koeficientmi Keď sme si vybrali takúto rodinu, predpokladali sme, že vo farebno-veľkostných súradniciach medzi bodmi triedy 1 a bodmi triedy 0 môžeme nakresliť priamku s koeficientmi v takom. spôsobom, že body s rôznymi triedami sú umiestnené pozdĺž rôznych strán priamky. Je známe, že pre priamku tohto typu je vektor koeficientu kolmý na priamku. Teraz to urobíme - vezmeme naše jablko, zmeriame jeho farbu a veľkosť a bod so získanými súradnicami vynesieme do grafu v osiach veľkosti farieb. Ďalej zmeriame uhol medzi týmto bodom a vektorom $w$. Všimli sme si, že náš bod môže ležať buď na jednej alebo na druhej strane priamky. Potom bude uhol medzi bodom a bodom ostrý alebo tupý a skalárny súčin bude pozitívny alebo negatívny. To vedie k rozhodujúcemu pravidlu:

Potom, čo sme zafixovali triedu funkcií $H$, vyvstáva otázka - ako z nej vybrať funkciu s požadovanými koeficientmi? Odpoveď znie – vyberme si funkciu, ktorá minimalizuje naše Bayesovské riziko $R()$. Problém je opäť v tom, že na výpočet Bayesovských hodnôt rizika potrebujete poznať rozdelenie $p(x,y)$, ale nie je nám dané a nie vždy je možné ho obnoviť. Ďalšou myšlienkou je minimalizovať riziko nie na všetkých možných objektoch, ale iba na vzorke. Tie. minimalizácia funkcie:

Táto funkcia sa nazýva empirické riziko. Ďalšou otázkou je, prečo sme sa rozhodli, že minimalizovaním empirického rizika minimalizujeme aj Bayesovské riziko? Pripomínam, že našou praktickou úlohou je robiť čo najmenej chýb v klasifikácii. Čím menej chýb, tým nižšie Bayesovské riziko. Zdôvodnenie konvergencie empirického rizika k bayesovskému riziku so zvyšujúcim sa objemom údajov získali v 70. rokoch dvaja vedci – V. N. Vapnik a A. Ya Chervonenkis.

Garancie konvergencie. Najjednoduchší prípad

Dospeli sme teda k záveru, že Bayesovský klasifikátor dáva najmenšiu možnú chybu, no vo väčšine prípadov ho nevieme natrénovať a chybu (riziko) tiež nevieme vypočítať. Môžeme však vypočítať aproximáciu k Bayesovskému riziku, ktoré sa nazýva empirické riziko, a pri znalosti empirického rizika vybrať aproximatívnu funkciu, ktorá by minimalizovala empirické riziko. Pozrime sa na najjednoduchšiu situáciu, keď minimalizácia empirického rizika vytvára klasifikátor, ktorý zároveň minimalizuje Bayesovské riziko. V najjednoduchšom prípade budeme musieť urobiť predpoklad, ktorý je v praxi málokedy splnený, ale ktorý možno neskôr poľaviť. Stanovme si konečnú triedu funkcií, z ktorých vyberieme náš klasifikátor a predpokladáme, že skutočná funkcia, ktorú príroda používa na klasifikáciu našich jabĺk do chutí, je v tejto konečnej množine hypotéz: . Máme aj vzorku získanú z distribúcie cez objekty. Všetky vzorové objekty považujeme za rovnako nezávisle rozdelené (iid). Potom bude platiť nasledovné

Veta

Výberom funkcie z triedy pomocou empirickej minimalizácie rizika zaručene nájdeme takú, že má malú hodnotu Bayesovho rizika, ak je vzorka, na ktorej vykonávame minimalizáciu, dostatočne veľká.

Čo znamená „malá hodnota“ a „dostatočná veľkosť“ nájdete v nižšie uvedenej literatúre.

Myšlienka dôkazu

Podľa podmienok vety získame vzorku z rozdelenia, t.j. proces výberu predmetov z prírody je náhodný. Zakaždým, keď zozbierame vzorku, bude z rovnakej distribúcie, ale samotné objekty sa môžu líšiť. Hlavnou myšlienkou dôkazu je, že môžeme získať tak zlú vzorku, že algoritmus, ktorý zvolíme minimalizovaním empirického rizika na tejto vzorke, bude zlý pri minimalizácii bayesovského rizika, ale zároveň bude dobrý. minimalizovaním empirického rizika, ale pravdepodobnosť získania takejto vzorky je malá a pri zvyšovaní veľkosti vzorky sa táto pravdepodobnosť znižuje. Podobné vety existujú pre realistickejšie predpoklady, ale nebudeme ich tu uvažovať.

Praktické výsledky

Keďže máme dôkaz, že funkcia zistená minimalizovaním empirického rizika nebude mať veľkú chybu na predtým nepozorovaných údajoch s dostatočnou veľkosťou trénovacej vzorky, môžeme tento princíp použiť v praxi napríklad takto - vezmeme si výraz:

A nahrádzame rôzne stratové funkcie v závislosti od riešeného problému. Pre lineárnu regresiu:

Pre logistickú regresiu:

Hoci podporné vektorové stroje majú primárne geometrickú motiváciu, možno ich považovať aj za empirický problém minimalizácie rizika.

Záver

Mnohé metódy učenia pod dohľadom môžu byť okrem iného považované za špeciálne prípady teórie vyvinutej V. N. Vapnikom a A. Ya. Táto teória poskytuje záruky ohľadom chyby na testovacej množine za predpokladu dostatočnej veľkosti trénovacej vzorky a určitých požiadaviek na priestor hypotéz, v ktorom hľadáme náš algoritmus.

Použité knihy

Povaha štatistickej teórie učenia, Vladimír N. Vapnik
Klasifikácia vzorov, 2. vydanie, Richard O. Duda, Peter E. Hart, David G. Stork
Pochopenie strojového učenia: Od teórie k algoritmom, Shai Shalev-Shwartz, Shai Ben-David

P.S. Prípadné nepresnosti a preklepy napíšte do osobnej správy.

Štítky: Pridajte štítky

→

Kapitola 3: Analytický prehľad metód rozpoznávania vzorov a rozhodovania

Teória rozpoznávania vzorov a automatizácia riadenia

Hlavné úlohy adaptívneho rozpoznávania vzorov

Rozpoznávanie je informačný proces implementovaný nejakým konvertorom informácií (inteligentný informačný kanál, rozpoznávací systém), ktorý má vstup a výstup. Vstupom systému je informácia o tom, aké vlastnosti majú prezentované objekty. Výstup systému zobrazuje informácie o tom, do ktorých tried (generalizované obrázky) patria rozpoznané objekty.

Pri vytváraní a prevádzke automatizovaného systému rozpoznávania vzorov sa rieši množstvo problémov. Pozrime sa stručne a jednoducho na tieto úlohy. Všimnite si, že rôzni autori majú rovnaké formulácie týchto problémov a samotná množina sa nezhoduje, pretože do určitej miery závisí od konkrétneho matematického modelu, na ktorom je tento alebo ten rozpoznávací systém založený. Okrem toho niektoré problémy v určitých modeloch rozpoznávania nemajú riešenie, a preto sa nevyskytujú.

Úlohou formalizácie predmetnej oblasti

Táto úloha je v podstate úlohou kódovania. Zostaví sa zoznam zovšeobecnených tried, do ktorých môžu patriť konkrétne implementácie objektov, ako aj zoznam charakteristík, ktoré tieto objekty v zásade môžu mať.

Úloha vytvoriť tréningovú vzorku

Tréningová množina je databáza obsahujúca popisy konkrétnych implementácií objektov v jazyku funkcií, doplnená o informácie o príslušnosti týchto objektov k určitým triedam rozpoznávania.

Úloha výcviku rozpoznávacieho systému

Tréningová vzorka sa používa na vytvorenie zovšeobecnených obrazov tried rozpoznávania na základe zovšeobecnenia informácií o tom, aké vlastnosti majú objekty trénovacej vzorky patriace do tejto triedy a iných tried.

Problém zmenšenia rozmeru priestoru funkcií

Po trénovaní rozpoznávacieho systému (získanie štatistík o frekvenčnom rozdelení znakov podľa tried) je možné určiť pre každý znak jeho hodnotu pre riešenie problému rozpoznávania. Potom môžu byť najmenej hodnotné funkcie odstránené zo systému funkcií. Potom sa musí systém rozpoznávania znova natrénovať, pretože v dôsledku odstránenia niektorých prvkov sa zmení štatistika distribúcie zostávajúcich prvkov podľa tried. Tento proces je možné opakovať, t.j. byť iteračný.

Úloha rozpoznávania

Rozpoznajú sa predmety rozpoznanej vzorky, ktoré môžu pozostávať najmä z jedného predmetu. Vzorka rozpoznávania je vytvorená podobne ako trénovacia, ale neobsahuje informácie o príslušnosti objektov k triedam, pretože práve tá sa určuje počas procesu rozpoznávania. Výsledkom rozpoznania každého objektu je distribúcia alebo zoznam všetkých tried rozpoznávania v zostupnom poradí podľa stupňa podobnosti rozpoznaného objektu s nimi.

Problém kontroly kvality rozpoznávania

Po uznaní je možné stanoviť jeho primeranosť. Pre objekty trénovacej vzorky to možno urobiť okamžite, pretože pre nich je jednoducho známe, do ktorých tried patria. Pre ostatné objekty je možné tieto informácie získať neskôr. V každom prípade sa dá určiť skutočná priemerná pravdepodobnosť chyby pre všetky rozpoznávacie triedy, ako aj pravdepodobnosť chyby pri priraďovaní rozpoznaného objektu ku konkrétnej triede.

Výsledky rozpoznávania sa musia interpretovať s prihliadnutím na dostupné informácie o kvalite rozpoznávania.

Adaptačný problém

Ak sa v dôsledku postupu kontroly kvality zistí, že nevyhovuje, potom je možné skopírovať popisy nesprávne rozpoznaných objektov z rozpoznávacej vzorky do cvičnej, doplniť o adekvátne klasifikačné informácie a použiť na preformátovanie rozhodovacích pravidiel. , t.j. vziať do úvahy. Navyše, ak tieto objekty nepatria do existujúcich tried rozpoznávania, čo by mohlo byť dôvodom ich nesprávneho rozpoznania, potom je možné tento zoznam rozšíriť. V dôsledku toho sa rozpoznávací systém prispôsobí a začne tieto objekty adekvátne klasifikovať.

Problém inverzného rozpoznávania

Úlohou rozpoznávania je, že pre daný objekt na základe jeho známych charakteristík systém určí jeho príslušnosť k nejakej predtým neznámej triede. Naopak, v probléme inverzného rozpoznávania pre danú triedu rozpoznávania systém stanovuje, ktoré vlastnosti sú pre objekty tejto triedy najcharakteristickejšie a ktoré nie (alebo ktoré objekty trénovacej vzorky patria do tejto triedy).

Problémy klastrovej a konštruktívnej analýzy

Klastre sú také skupiny objektov, tried alebo prvkov, ktoré v rámci každého zhluku sú si čo najviac podobné a medzi rôznymi zhlukami sa čo najviac líšia.

Konštrukt (v kontexte diskutovanom v tejto časti) je systém protichodných zhlukov. V určitom zmysle sú teda konštrukty výsledkom zhlukovej analýzy zhlukov.

Pri zhlukovej analýze sa kvantitatívne meria miera podobnosti a rozdielu medzi objektmi (triedami, znakmi) a tieto informácie sa používajú na klasifikáciu. Výsledkom zhlukovej analýzy je klasifikácia objektov do zhlukov. Táto klasifikácia môže byť reprezentovaná vo forme sémantických sietí.

Úloha kognitívnej analýzy

V kognitívnej analýze sú informácie o podobnostiach a rozdieloch medzi triedami alebo charakteristikami zaujímavé pre výskumníka samého osebe, a nie preto, aby ich mohol použiť na klasifikáciu, ako pri klastrovej a konštruktívnej analýze.

Ak je rovnaký znak charakteristický pre dve triedy rozpoznávania, prispieva to k podobnosti týchto dvoch tried. Ak je táto vlastnosť pre jednu z tried netypická, prispieva to k rozdielu.

Ak dva znaky navzájom korelujú, potom ich v určitom zmysle možno považovať za jeden znak, a ak sú antikorelované, tak za rozdielne. Berúc do úvahy túto okolnosť, prítomnosť rôznych charakteristík v rôznych triedach tiež určitým spôsobom prispieva k ich podobnosti a odlišnosti.

Výsledky kognitívnej analýzy možno prezentovať vo forme kognitívnych diagramov.

Metódy rozpoznávania vzorov a ich charakteristiky

Princípy klasifikácie metód rozpoznávania vzorov

Rôzni autori (Yu.L. Barabash, V.I. Vasiliev, A.L. Gorelik, V.A. Skripkin, R. Duda, P. Hart, L.T. Kuzin, F.I. Peregudov, F.P. Tarasenko, F.E. Temnikov, J. Tu, R. Gonzalez, P. Winston, K. Fu, Ya.Z Tsypkin atď.) uvádzajú inú typológiu metód rozpoznávania vzorov. Niektorí autori rozlišujú parametrické, neparametrické a heuristické metódy, iní identifikujú skupiny metód na základe historicky ustálených škôl a trendov v tejto oblasti. Napríklad v práci, ktorá poskytuje akademický prehľad metód rozpoznávania, je použitá nasledujúca typológia metód rozpoznávania vzorov:

metódy založené na princípe separácie;
štatistické metódy;
metódy postavené na základe „potenciálnych funkcií“;
metódy výpočtu ratingov (hlasovanie);
metódy založené na výrokovom počte, najmä na aparáte logickej algebry.

Táto klasifikácia je založená na rozdieloch vo formálnych metódach rozpoznávania vzorov, a preto vynecháva zohľadnenie heuristického prístupu k rozpoznávaniu, ktorý sa plne a primerane rozvinul v expertných systémoch. Heuristický prístup je založený na ťažko formalizovateľných poznatkoch a intuícii výskumníka. V tomto prípade výskumník sám určuje, aké informácie a akým spôsobom má systém použiť na dosiahnutie požadovaného rozpoznávacieho efektu.

Podobná typológia metód rozpoznávania s rôznym stupňom detailov sa nachádza v mnohých prácach o rozpoznávaní. Známe typológie zároveň nezohľadňujú jednu veľmi významnú charakteristiku, ktorá odráža špecifickosť spôsobu reprezentácie vedomostí o predmetnej oblasti pomocou akéhokoľvek formálneho algoritmu rozpoznávania vzorov.

D.A. Pospelov (1990) identifikuje dva hlavné spôsoby prezentácie vedomostí:

intenzionálny, vo forme diagramu súvislostí medzi atribútmi (vlastnosťami).
extenzívne, pomocou konkrétnych faktov (predmetov, príkladov).

Intenzionálna reprezentácia zachytáva vzory a súvislosti, ktoré vysvetľujú štruktúru údajov. Vo vzťahu k diagnostickým úlohám takáto fixácia spočíva v definovaní operácií s atribútmi (vlastnosťami) objektov, ktoré vedú k požadovanému diagnostickému výsledku. Intenzionálne reprezentácie sú implementované prostredníctvom operácií s hodnotami atribútov a neimplikujú operácie s konkrétnymi informačnými faktami (objektmi).

Extenzívne reprezentácie vedomostí sú zasa spojené s popisom a fixáciou konkrétnych predmetov z predmetnej oblasti a realizujú sa v operáciách, ktorých prvkami sú objekty ako integrálne systémy.

Analógiu možno nájsť medzi intenzionálnymi a extenzívnymi reprezentáciami vedomostí a mechanizmami, ktoré sú základom aktivity ľavej a pravej hemisféry ľudského mozgu. Ak je pravá hemisféra charakterizovaná holistickým prototypom reprezentácie okolitého sveta, potom ľavá hemisféra operuje so vzormi, ktoré odrážajú súvislosti medzi atribútmi tohto sveta.

Dva základné spôsoby reprezentácie vedomostí opísané vyššie nám umožňujú navrhnúť nasledujúcu klasifikáciu metód rozpoznávania vzorov:

intenzionálne metódy založené na operáciách s atribútmi.
extenzívne metódy založené na operáciách s objektmi.

Zvlášť treba zdôrazniť, že existencia práve týchto dvoch (a iba dvoch) skupín metód rozpoznávania: tých, ktoré pracujú so znakmi a tých, ktoré pracujú s objektmi, je hlboko prirodzená. Z tohto hľadiska žiadna z týchto metód, braná oddelene od druhej, nám neumožňuje vytvoriť adekvátnu reflexiu predmetnej oblasti. Podľa autorov existuje medzi týmito metódami vzťah komplementárnosti v zmysle N. Bohra, preto by perspektívne rozpoznávacie systémy mali zabezpečiť implementáciu oboch týchto metód, a nie hociktorej z nich.

Klasifikácia metód rozpoznávania navrhovaná D. A. Pospelovom je teda založená na základných vzorcoch, ktoré sú základom ľudského spôsobu poznávania vo všeobecnosti, čo ho stavia do úplne špeciálnej (privilegovanej) pozície v porovnaní s inými klasifikáciami, ktoré na tomto pozadí vyzerajú odľahčenejšie a umelé.

Intenzívne metódy

Skupina intenzionálnych metód na rozpoznávanie vzorov je rozsiahla a jej rozdelenie do podtried je do určitej miery podmienené.

Metódy založené na odhadoch distribučných hustôt hodnôt znakov

Tieto metódy rozpoznávania vzorov sú prevzaté z klasickej teórie štatistických rozhodnutí, v ktorej sa predmety štúdia považujú za realizácie viacrozmernej náhodnej premennej distribuovanej v priestore znakov podľa nejakého zákona. Sú založené na Bayesovskej rozhodovacej schéme, ktorá sa odvoláva na a priori pravdepodobnosti objektov patriacich do konkrétnej rozpoznanej triedy a podmienené hustoty rozloženia hodnôt vektora znakov. Tieto metódy sa obmedzujú na určenie pomeru pravdepodobnosti v rôznych oblastiach viacrozmerného priestoru funkcií.

Skupina metód založených na odhade distribučných hustôt hodnôt znakov priamo súvisí s metódami diskriminačnej analýzy. Bayesovský prístup k rozhodovaniu je jednou z najrozvinutejších takzvaných parametrických metód v modernej štatistike, pre ktorú sa analytické vyjadrenie distribučného zákona (v tomto prípade normálneho zákona) považuje za známe a len malý počet parametrov ( vektory priemerných hodnôt a kovariančné matice) je potrebné odhadnúť.

Hlavnými ťažkosťami pri používaní týchto metód je potreba zapamätať si celú trénovaciu vzorku na výpočet odhadov lokálnych hustôt rozdelenia pravdepodobnosti a vysoká citlivosť na nereprezentatívnosť trénovacej vzorky.

Metódy založené na predpokladoch o triede rozhodovacích funkcií

V tejto skupine metód sa všeobecná forma rozhodovacej funkcie považuje za známu a špecifikuje sa funkcionál jej kvality. Na základe tohto funkcionálu sa pomocou trénovacej sekvencie nájde najlepšia aproximácia rozhodovacej funkcie. Najbežnejšie sú reprezentácie rozhodovacích funkcií vo forme lineárnych a zovšeobecnených nelineárnych polynómov. Funkcionalita kvality rozhodovacieho pravidla je zvyčajne spojená s chybou klasifikácie.

Hlavnou výhodou metód založených na predpokladoch o triede rozhodovacích funkcií je prehľadnosť matematickej formulácie rozpoznávacieho problému ako problému hľadania extrému. Rôznorodosť metód v tejto skupine je vysvetlená širokým rozsahom použitých funkcionalít kvality rozhodovacích pravidiel a extrémnych vyhľadávacích algoritmov. Zovšeobecnením uvažovaných algoritmov, medzi ktoré patrí najmä Newtonov algoritmus, algoritmy perceptrónového typu atď., je metóda stochastickej aproximácie.

Dostatočne vysokú kvalitu rozhodovacieho pravidla je možné dosiahnuť pomocou algoritmov, ktoré nemajú striktne matematický dôkaz o konvergencii riešenia ku globálnemu extrému. Takéto algoritmy zahŕňajú veľkú skupinu heuristických programovacích procedúr, ktoré predstavujú smer evolučného modelovania. Evolučné modelovanie je bionická metóda vypožičaná z prírody. Je založená na využití známych mechanizmov evolúcie s cieľom nahradiť proces zmysluplného modelovania komplexného objektu fenomenologickým modelovaním jeho evolúcie. Známym predstaviteľom evolučného modelovania v rozpoznávaní vzorov je metóda skupinového účtovania argumentov (MGUA). Základom GMDH je princíp samoorganizácie a GMDH algoritmy reprodukujú schému hromadného výberu.

Dosiahnutie praktických cieľov však v tomto prípade nesprevádza získavanie nových poznatkov o povahe rozpoznávaných predmetov. Možnosť extrakcie týchto poznatkov, najmä poznatkov o mechanizmoch interakcie atribútov (vlastností), je tu zásadne obmedzená danou štruktúrou takejto interakcie, fixovanou vo vybranej forme rozhodovacích funkcií.

Booleovské metódy

Logické metódy rozpoznávania vzorov sú založené na aparáte logickej algebry a umožňujú pracovať s informáciami obsiahnutými nielen v jednotlivých znakoch, ale aj v kombináciách hodnôt znakov. V týchto metódach sa hodnoty akéhokoľvek atribútu považujú za elementárne udalosti.

Algoritmus „Kora“, podobne ako iné logické metódy rozpoznávania vzorov, je pomerne náročný na výpočty, pretože pri výbere konjunkcií je potrebné úplné vyhľadávanie. Preto sú pri použití logických metód kladené vysoké nároky na efektívnu organizáciu výpočtového procesu a tieto metódy dobre fungujú aj pri relatívne malých rozmeroch priestoru funkcií a len na výkonných počítačoch.

Lingvistické (štrukturálne) metódy

Lingvistické metódy rozpoznávania vzorov sú založené na použití špeciálnych gramatík, ktoré generujú jazyky, ktoré možno použiť na opis množiny vlastností rozpoznaných objektov.

Pre rôzne triedy objektov sa identifikujú neodvodené (atómové) prvky (podobrazy, atribúty) a možné vzťahy medzi nimi. Gramatika sa vzťahuje na pravidlá na vytváranie objektov z týchto neodvodených prvkov.

Každý objekt je teda súborom neodvodených prvkov, ktoré sú navzájom „prepojené“ tak či onak, alebo inými slovami, „vetou“ nejakého „jazyka“. Osobitne by som chcel zdôrazniť veľmi významnú ideologickú hodnotu tejto myšlienky.

Syntaktickým analyzovaním „vety“ sa určuje jej syntaktická „správnosť“ alebo ekvivalentne, či nejaká pevná gramatika popisujúca triedu môže generovať existujúci popis objektu.

Úloha rekonštruovať (definovať) gramatiky z určitého súboru výrokov (viet - opisov objektov), ktoré generujú daný jazyk, je však ťažko formalizovateľná.

Rozširujúce metódy

Metóda porovnania s prototypom

Toto je najjednoduchšia metóda rozšíreného rozpoznávania. Používa sa napríklad v prípade, keď sú rozpoznané triedy zobrazené v priestore prvkov kompaktnými geometrickými zoskupeniami. V tomto prípade sa zvyčajne ako prototypový bod vyberie stred geometrického zoskupenia triedy (alebo objekt najbližšie k stredu).

Túto skutočnosť je potrebné osobitne poznamenať. Jasne demonštruje prepojenie medzi prototypovou a atribútovou reprezentáciou informácií o štruktúre dát. Pomocou vyššie uvedeného znázornenia je možné napríklad považovať akúkoľvek tradičnú meraciu stupnicu, ktorá je lineárnou funkciou hodnôt dichotomických charakteristík, za hypotetický diagnostický prototyp. Na druhej strane, ak nám analýza priestorovej štruktúry rozpoznaných tried umožňuje vyvodiť záver o ich geometrickej kompaktnosti, potom stačí nahradiť každú z týchto tried jedným prototypom, ktorý je vlastne ekvivalentom lineárneho diagnostického modelu.

Po prvé, ide o výber miery priblíženia (metriky), ktorá môže výrazne zmeniť priestorovú konfiguráciu rozmiestnenia objektov. Po druhé, nezávislým problémom je analýza viacrozmerných štruktúr experimentálnych údajov. Oba tieto problémy sú pre bádateľa obzvlášť akútne v podmienkach vysokej dimenzionality priestoru rysov, charakteristických pre reálne problémy.

k metóda najbližších susedov

Metóda k-najbližšieho suseda na riešenie problémov diskriminačnej analýzy bola prvýkrát navrhnutá už v roku 1952. Je to nasledovné.

Potreba znížiť počet objektov v trénovacej vzorke (diagnostické precedensy) je nevýhodou tejto metódy, pretože znižuje reprezentatívnosť trénovacej vzorky.

Algoritmy na výpočet hodnotení („hlasovanie“)

Princípom fungovania algoritmov výpočtu hodnotenia (ABO) je vypočítať priority (skóre podobnosti) charakterizujúce „blízkosť“ rozpoznaných a referenčných objektov podľa systému súborov vlastností, čo je systém podmnožín daného súboru vlastností. .

Použité kombinácie vlastností (podpriestorov) autori nazývajú podporné množiny alebo množiny čiastkových popisov objektov. Zavádza sa koncept zovšeobecnenej blízkosti medzi rozpoznaným objektom a objektmi trénovacej vzorky (so známou klasifikáciou), ktoré sa nazývajú referenčné objekty. Táto blízkosť je reprezentovaná kombináciou blízkosti rozpoznaného objektu s referenčnými objektmi, vypočítanej na súboroch čiastkových popisov. ABO je teda rozšírením metódy k-najbližších susedov, v ktorej sa blízkosť objektov berie do úvahy len v jednom danom priestore znakov.

Ďalším rozšírením ABO je, že v týchto algoritmoch je úloha určovania podobnosti a rozdielnosti objektov formulovaná ako parametrická a je zvýraznená fáza nastavenia ABO na základe trénovacej množiny, pri ktorej sú optimálne hodnoty zadaných parametre sú vybrané. Kritériom kvality je chyba rozpoznávania a doslova všetko je parametrizované:

pravidlá na výpočet blízkosti objektov na základe individuálnych charakteristík;
pravidlá na výpočet blízkosti objektov v podpriestoroch prvkov;
stupeň dôležitosti konkrétneho referenčného objektu ako diagnostického precedensu;
význam prínosu každého referenčného súboru znakov ku konečnému posúdeniu podobnosti rozpoznaného objektu s akoukoľvek diagnostickou triedou.

Parametre ABO sú špecifikované vo forme prahových hodnôt a (alebo) ako hmotnosti špecifikovaných komponentov.

Teoretické možnosti AVO nie sú prinajmenšom nižšie ako schopnosti akéhokoľvek iného algoritmu rozpoznávania vzorov, pretože pomocou AVO je možné implementovať všetky mysliteľné operácie so skúmanými objektmi.

Ako to však zvyčajne býva, rozširovanie potenciálnych schopností naráža pri ich praktickej implementácii na veľké ťažkosti, najmä v štádiu konštrukcie (ladenia) algoritmov tohto typu.

Niektoré ťažkosti boli zaznamenané skôr pri diskusii o metóde k-najbližších susedov, ktorá by sa dala interpretovať ako skrátená verzia ABO. Dá sa uvažovať aj v parametrickej forme a zredukovať problém na nájdenie váženej metriky zvoleného typu. Zároveň už tu pre vysokorozmerné problémy vznikajú zložité teoretické otázky a problémy súvisiace s organizáciou efektívneho výpočtového procesu.

Pre AVO, ak sa pokúsite využiť možnosti týchto algoritmov v plnej miere, tieto ťažkosti sa mnohonásobne zvýšia.

Uvedené problémy vysvetľujú skutočnosť, že v praxi je použitie ABO na riešenie vysokorozmerných problémov sprevádzané zavedením niektorých heuristických obmedzení a predpokladov. Známy je najmä príklad použitia ABO v psychodiagnostike, v rámci ktorého sa testoval typ ABO, čo je vlastne ekvivalent metódy k-nearest suseds.

Kolektívy rozhodovacích pravidiel

Na dokončenie nášho prehľadu metód rozpoznávania vzorov sa pozrime na ďalší prístup. Ide o takzvané kolektívy rozhodovacích pravidiel (DRG).

Keďže rôzne rozpoznávacie algoritmy sa prejavujú odlišne na tej istej vzorke objektov, prirodzene vyvstáva otázka syntetického rozhodovacieho pravidla, ktoré adaptívne využíva silné stránky týchto algoritmov. Syntetické rozhodovacie pravidlo používa dvojúrovňovú schému rozpoznávania. Na prvej úrovni fungujú súkromné rozpoznávacie algoritmy, ktorých výsledky sa kombinujú na druhej úrovni v bloku syntézy. Najbežnejšie metódy takéhoto zjednotenia sú založené na identifikácii oblastí kompetencie konkrétneho algoritmu. Najjednoduchší spôsob, ako nájsť oblasti kompetencie, je a priori rozdeliť priestor atribútov na základe odborných úvah konkrétnej vedy (napríklad stratifikovať vzorku podľa určitého atribútu). Potom sa pre každú z vybraných oblastí vytvorí vlastný rozpoznávací algoritmus. Iná metóda je založená na použití formálnej analýzy na určenie miestnych oblastí priestoru prvkov ako susedstiev rozpoznaných objektov, pre ktoré bola preukázaná úspešnosť akéhokoľvek konkrétneho rozpoznávacieho algoritmu.

Najvšeobecnejší prístup ku konštrukcii bloku syntézy považuje výsledné ukazovatele konkrétnych algoritmov za počiatočné charakteristiky pre konštrukciu nového zovšeobecneného rozhodovacieho pravidla. V tomto prípade možno použiť všetky vyššie uvedené spôsoby intenzionálnych a predlžovacích smerov pri rozpoznávaní vzorov. Na riešenie problému vytvorenia skupiny rozhodovacích pravidiel sú efektívne logické algoritmy typu „Kora“ a algoritmy na výpočet odhadov (ABO), ktoré tvoria základ tzv. algebraického prístupu, ktorý poskytuje štúdium a konštruktívny popis rozpoznávacie algoritmy, do ktorých rámca zapadajú všetky existujúce typy algoritmov.

Porovnávacia analýza metód rozpoznávania vzorov

Porovnajme vyššie opísané metódy rozpoznávania vzorov a zhodnoťme stupeň ich primeranosti požiadavkám formulovaným v časti 3.3.3 pre modely SDA pre adaptívne automatizované riadiace systémy pre komplexné systémy.

Na riešenie reálnych problémov zo skupiny intenzionálnych metód majú praktickú hodnotu parametrické metódy a metódy založené na návrhoch podoby rozhodovacích funkcií. Parametrické metódy tvoria základ tradičnej metodiky konštrukcie ukazovateľov. Aplikácia týchto metód v reálnych problémoch je spojená s uvalením silných obmedzení na dátovú štruktúru, ktoré vedú k lineárnym diagnostickým modelom s veľmi hrubými odhadmi ich parametrov. Pri použití metód založených na predpokladoch o forme rozhodovacích funkcií je výskumník nútený prejsť aj k lineárnym modelom. Je to spôsobené vysokou dimenzionálnosťou priestoru znakov, charakteristickou pre reálne problémy, ktorá pri zvyšovaní stupňa polynomickej rozhodovacej funkcie dáva obrovský nárast počtu jej členov s problematickým sprievodným zvýšením kvality rozpoznávania. Premietnutím oblasti potenciálnej aplikácie metód intenzionálneho rozpoznávania na reálne problémy tak získame obraz, ktorý zodpovedá dobre rozvinutej tradičnej metodológii lineárnych diagnostických modelov.

Vlastnosti lineárnych diagnostických modelov, v ktorých je diagnostický indikátor reprezentovaný váženým súčtom počiatočných charakteristík, boli dobre preštudované. Výsledky týchto modelov (s príslušnou normalizáciou) sú interpretované ako vzdialenosti od skúmaných objektov k nejakej nadrovine v priestore prvkov alebo ekvivalentne ako projekcie objektov na nejakú priamku v tomto priestore. Lineárne modely sú preto adekvátne iba jednoduchým geometrickým konfiguráciám oblastí priestorových prvkov, do ktorých sú mapované objekty rôznych diagnostických tried. Pri zložitejších distribúciách tieto modely v zásade nemôžu odrážať mnohé vlastnosti štruktúry experimentálnych údajov. Zároveň môžu takéto funkcie poskytnúť cenné diagnostické informácie.

Zároveň by sa výskyt jednoduchých viacrozmerných štruktúr (najmä viacrozmerných normálnych rozdelení) v akomkoľvek skutočnom probléme mal považovať skôr za výnimku než za pravidlo. Diagnostické triedy sa často vytvárajú na základe komplexných externých kritérií, čo automaticky znamená geometrickú heterogenitu týchto tried v priestore znakov. To platí najmä pre „životne dôležité“ kritériá, s ktorými sa v praxi najčastejšie stretávame. Za takýchto podmienok použitie lineárnych modelov zachytáva len tie „najhrubšie“ vzory experimentálnych informácií.

Použitie extenzívnych metód nie je spojené so žiadnymi predpokladmi o štruktúre experimentálnych informácií, okrem toho, že v rámci uznávaných tried by mala existovať jedna alebo viac skupín trochu podobných objektov a objekty rôznych tried by sa mali od seba trochu líšiť. Je zrejmé, že pre akúkoľvek konečnú veľkosť trénovacej vzorky (a nemôže to byť žiadna iná) je táto požiadavka vždy splnená jednoducho z toho dôvodu, že medzi objektmi existujú náhodné rozdiely. Ako miery podobnosti sa používajú rôzne miery blízkosti (vzdialenosti) objektov v priestore prvkov. Efektívne využitie extenzívnych metód rozpoznávania vzorov preto závisí od toho, ako dobre sú určené špecifikované miery blízkosti, ako aj od toho, ktoré objekty trénovacej vzorky (objekty so známou klasifikáciou) slúžia ako diagnostické precedensy. Úspešné riešenie týchto problémov dáva výsledky blížiace sa teoreticky dosiahnuteľným hraniciam efektívnosti rozpoznávania.

Proti výhodám extenzívnych metód rozpoznávania vzorov stojí predovšetkým vysoká technická náročnosť ich praktickej implementácie. Pre vysokorozmerné priestory prvkov sa zdanlivo jednoduchá úloha nájsť páry najbližších bodov stáva vážnym problémom. Taktiež mnohí autori uvádzajú ako problém potrebu zapamätať si dostatočne veľký počet objektov reprezentujúcich rozpoznané triedy.

To samo o sebe nie je problém, ale je to vnímané ako problém (napríklad pri metóde k-nearest suseds) z toho dôvodu, že pri rozpoznávaní každého objektu dochádza ku kompletnému prehľadaniu všetkých objektov v trénovacej množine.

Preto je vhodné použiť model rozpoznávacieho systému, v ktorom sa odstráni problém úplného vyčíslenia objektov v trénovacej vzorke počas rozpoznávania, pretože sa vykonáva iba raz pri generovaní zovšeobecnených obrázkov tried rozpoznávania. Pri samotnom rozpoznávaní sa identifikovaný objekt porovnáva iba so zovšeobecnenými obrázkami tried rozpoznávania, ktorých počet je pevný a úplne nezávislý od veľkosti trénovacej vzorky. Tento prístup vám umožňuje zväčšovať veľkosť trénovacej vzorky, kým sa nedosiahne požadovaná vysoká kvalita zovšeobecnených obrázkov, bez obáv, že by to mohlo viesť k neprijateľnému predĺženiu času rozpoznávania (keďže čas rozpoznávania v tomto modeli nezávisí od veľkosť tréningovej vzorky vôbec).

Teoretické problémy používania metód extenzívneho rozpoznávania sú spojené s problémami hľadania informatívnych skupín vlastností, hľadania optimálnych metrík na meranie podobností a rozdielov objektov a analýzy štruktúry experimentálnych informácií. Úspešné riešenie týchto problémov zároveň umožňuje nielen skonštruovať efektívne rozpoznávacie algoritmy, ale aj prejsť od extenzívneho poznania empirických faktov k intenzionálnym znalostiam o zákonitostiach ich štruktúry.

Prechod od extenzívnych k intenzionálnym znalostiam nastáva v štádiu, keď už bol skonštruovaný formálny algoritmus rozpoznávania a bola preukázaná jeho účinnosť. Potom sa študujú mechanizmy, ktorými sa dosahuje výsledná účinnosť. Takáto štúdia spojená s analýzou geometrickej štruktúry dát môže viesť napríklad k záveru, že stačí nahradiť objekty reprezentujúce určitú diagnostickú triedu jedným typickým zástupcom (prototypom). To je ekvivalentné, ako je uvedené vyššie, k špecifikácii tradičnej lineárnej diagnostickej stupnice. Je tiež možné, že stačí nahradiť každú diagnostickú triedu niekoľkými objektmi, konceptualizovanými ako typickí predstavitelia niektorých podtried, čo je ekvivalentné zostrojeniu vejára lineárnych škál. Existujú aj ďalšie možnosti, o ktorých sa bude diskutovať nižšie.

Prehľad metód rozpoznávania teda ukazuje, že v súčasnosti bolo teoreticky vyvinutých množstvo rôznych metód rozpoznávania vzorov. Literatúra uvádza ich podrobnú klasifikáciu. Pre väčšinu týchto metód však neexistuje žiadna softvérová implementácia, čo je hlboko prirodzené, dokonca by sa dalo povedať „predurčené“ vlastnosťami samotných metód rozpoznávania. Dá sa to posúdiť podľa toho, že takéto systémy sa v odbornej literatúre a iných zdrojoch informácií spomínajú len zriedka.

V dôsledku toho zostáva nedostatočne rozvinutá otázka praktickej použiteľnosti určitých metód teoretického rozpoznávania pri riešení praktických problémov s reálnymi (t. j. dosť významnými) dátovými dimenziami a na reálnych moderných počítačoch.

Uvedenú okolnosť možno pochopiť, ak si pripomenieme, že zložitosť matematického modelu exponenciálne zvyšuje náročnosť softvérovej implementácie systému a v rovnakej miere znižuje šance, že tento systém bude prakticky fungovať. To znamená, že v skutočnosti možno na trhu implementovať iba softvérové systémy, ktoré sú založené na pomerne jednoduchých a „transparentných“ matematických modeloch. Preto vývojár so záujmom o replikáciu svojho softvérového produktu pristupuje k problematike výberu matematického modelu nie z čisto vedeckého hľadiska, ale ako pragmatik, berúc do úvahy možnosti implementácie softvéru. Domnieva sa, že model by mal byť čo najjednoduchší, čo znamená, že by mal byť realizovaný s nižšími nákladmi a kvalitnejšie, a zároveň musí fungovať (prakticky efektívny).

V tomto ohľade sa javí ako obzvlášť dôležitá úloha implementovať do rozpoznávacích systémov mechanizmus na zovšeobecňovanie opisov objektov patriacich do rovnakej triedy, t.j. mechanizmus tvorby kompaktných zovšeobecnených obrazov. Je zrejmé, že takýto mechanizmus zovšeobecňovania umožní „komprimovať“ trénovaciu vzorku akejkoľvek dimenzie do databázy zovšeobecnených obrázkov vopred známych podľa dimenzií. To tiež umožní nastoliť a vyriešiť množstvo problémov, ktoré sa v takých rozpoznávacích metódach, akými sú metóda porovnávania s prototypom, metóda k-nearest susedov a ABO, ani nedajú sformulovať.

Ide o tieto úlohy:

určenie informačného príspevku vlastností k informačnému portrétu zovšeobecneného obrazu;
klastrovo-konštruktívna analýza zovšeobecnených obrazov;
určenie sémantického zaťaženia prvku;
sémantická klastrovo-konštruktívna analýza vlastností;
zmysluplné porovnávanie zovšeobecnených obrazov tried navzájom a charakteristík medzi sebou (kognitívne diagramy vrátane Merlinových diagramov).

Metóda, ktorá umožnila dosiahnuť riešenie týchto problémov, tiež odlišuje sľubný systém, ktorý je na ňom založený, od iných systémov, rovnako ako sa kompilátory líšia od interpretov, pretože vďaka vytváraniu zovšeobecnených obrazov v tomto sľubnom systéme je nezávislosť času rozpoznávania od dosiahne sa veľkosť tréningovej vzorky. Je známe, že práve existencia tejto závislosti vedie k prakticky neprijateľným nákladom na počítačový čas na rozpoznávanie v metódach ako metóda k-nearest suseds, ABO a KRP pri takých rozmeroch tréningovej vzorky, kedy môžeme hovoriť o dostatočnej štatistike. .

Na záver stručného prehľadu metód rozpoznávania uveďme podstatu vyššie uvedeného v súhrnnej tabuľke (tabuľka 3.1), ktorá obsahuje stručný popis rôznych metód rozpoznávania vzorov podľa nasledujúcich parametrov:

klasifikácia metód rozpoznávania;
oblasti použitia metód rozpoznávania;
klasifikácia obmedzení metód rozpoznávania.

Klasifikácia metód rozpoznávania		Oblasť použitia	Obmedzenia (nevýhody)
Intenzívne metódy rozpoznávania	Metódy založené na odhadoch distribučných hustôt hodnôt vlastností (alebo podobností a rozdielov objektov)	Problémy so známym rozdelením, zvyčajne normálnym, si vyžadujú veľkú zbierku štatistík	Potreba enumerácie celej trénovacej vzorky počas rozpoznávania, vysoká citlivosť na nereprezentatívnosť trénovacej vzorky a artefaktov
	Metódy založené na predpokladoch o triede rozhodovacích funkcií	Triedy musia byť dobre oddeliteľné, systém znakov musí byť ortonormálny	Typ rozhodovacej funkcie musí byť známy vopred. Neschopnosť brať do úvahy nové poznatky o koreláciách medzi znakmi
	Booleovské metódy		Pri výbere logických rozhodovacích pravidiel (konjunkcií) je potrebné úplné vyhľadávanie. Vysoká výpočtová náročnosť
	Lingvistické (štrukturálne) metódy	Problémy malého rozmeru priestoru prvkov	Úloha rekonštruovať (definovať) gramatiku z určitého súboru výrokov (opisov objektov) je ťažko formalizovateľná. Nevyriešené teoretické problémy
Metódy rozšíreného rozpoznávania	Metóda porovnania s prototypom	Problémy malého rozmeru priestoru prvkov	Vysoká závislosť výsledkov klasifikácie od miery vzdialenosti (metriky). Neznáma optimálna metrika
	k metóda najbližších susedov		Vysoká závislosť výsledkov klasifikácie od miery vzdialenosti (metriky). Potreba úplného vyčíslenia tréningovej vzorky počas rozpoznávania. Výpočtové úsilie
	Algoritmy na výpočet hodnotenia (hlasovania) AVO	Problémy malého rozmeru z hľadiska počtu tried a vlastností	Závislosť výsledkov klasifikácie od miery vzdialenosti (metriky). Potreba úplného vyčíslenia tréningovej vzorky počas rozpoznávania. Vysoká technická náročnosť metódy
	Kolektívy pravidiel rozhodovania (DRC)	Problémy malého rozmeru z hľadiska počtu tried a vlastností	Veľmi vysoká technická náročnosť metódy, nevyriešené množstvo teoretických problémov, a to tak pri určovaní oblastí kompetencie súkromných metód, ako aj v samotných súkromných metódach.

Tabuľka 3.1 — Súhrnná tabuľka klasifikácie metód rozpoznávania, porovnanie oblastí ich použitia a obmedzení

Úloha a miesto rozpoznávania vzorov v automatizácii riadenia zložitých systémov

Automatizovaný riadiaci systém pozostáva z dvoch hlavných častí: riadiaceho objektu a riadiaceho systému.

Riadiaci systém vykonáva nasledujúce funkcie:

identifikácia stavu riadiaceho objektu;
rozvoj kontrolnej činnosti na základe cieľov riadenia s prihliadnutím na stav objektu kontroly a prostredia;
poskytujúci riadiaci vplyv na riadiaci objekt.

Rozpoznávanie vzorov nie je nič iné ako identifikácia stavu nejakého objektu.

V dôsledku toho sa možnosť použitia systému rozpoznávania vzorov v štádiu identifikácie stavu riadiaceho objektu javí ako celkom zrejmá a prirodzená. To však nemusí byť potrebné. Preto vzniká otázka, v ktorých prípadoch je vhodné použiť rozpoznávací systém v automatizovanom systéme riadenia a v ktorých nie.

Podľa literatúry mnohé už skôr vyvinuté a moderné automatizované riadiace systémy v podsystémoch na identifikáciu stavu objektu riadenia a vývoj riadiacich akcií využívajú deterministické matematické modely „priameho výpočtu“, ktoré jednoznačne a celkom jednoducho určujú, čo sa má s riadením robiť. objekt, ak má určité externé parametre.

Zároveň nie je nastolená ani vyriešená otázka, ako tieto parametre súvisia s určitými stavmi riadiaceho objektu. Táto pozícia korešponduje s názorom, že „štandardne“ je akceptovaný ich vzťah jeden k jednému. Preto sa pojmy „parametre riadiaceho objektu“ a „stav riadiaceho objektu“ považujú za synonymá a pojem „stav riadiaceho objektu“ nie je vôbec explicitne zavedený. Je však zrejmé, že vo všeobecnom prípade má vzťah medzi pozorovateľnými parametrami riadiaceho objektu a jeho stavom dynamický a pravdepodobnostný charakter.

Tradičné automatizované riadiace systémy sú teda v podstate parametrické riadiace systémy, t.j. systémy, ktoré riadia nie stavy riadiaceho objektu, ale iba jeho pozorovateľné parametre. O kontrolnej akcii sa rozhoduje v takýchto systémoch akoby „naslepo“, t.j. bez vytvárania holistického obrazu riadiaceho objektu a prostredia v ich aktuálnom stave, ako aj bez predpovedania vývoja prostredia a reakcie riadiaceho objektu na určité riadiace vplyvy naň pôsobiace súčasne s predpokladaným vplyvom prostredia. .

Z perspektívy rozvinutej v tejto práci je pojem „rozhodovanie“ v modernom zmysle sotva plne aplikovateľný na tradičné automatizované riadiace systémy. Faktom je, že „rozhodovanie“ prinajmenšom predpokladá holistickú víziu objektu v prostredí, a to nielen v jeho súčasnom stave, ale aj v dynamike a vo vzájomnej interakcii a interakcii s riadiacim systémom. zváženie rôznych alternatívnych možností rozvoja celého tohto systému, ako aj zúženie diverzity (redukcia) týchto alternatív na základe určitých cieľových kritérií. Je zrejmé, že nič z toho sa v tradičných automatizovaných riadiacich systémoch nenachádza alebo existuje, ale v zjednodušenej forme.

Tradičná metóda je samozrejme adekvátna a jej použitie je celkom správne a opodstatnené v prípadoch, keď je objekt riadenia skutočne stabilný a prísne určený systém a vplyv prostredia naň možno zanedbať.

V iných prípadoch je však táto metóda neúčinná.

Ak je riadiaci objekt dynamický, potom sa modely, ktoré sú základom riadiacich algoritmov, rýchlo stanú neadekvátnymi, pretože sa menia vzťahy medzi vstupnými a výstupnými parametrami, ako aj samotný súbor základných parametrov. V podstate to znamená, že tradičné automatizované riadiace systémy sú schopné kontrolovať stav riadiaceho objektu len v blízkosti rovnovážneho bodu prostredníctvom slabých riadiacich akcií na ňom, t.j. metódou malých porúch. Ďaleko od rovnovážneho stavu, z tradičného pohľadu, správanie riadiaceho objektu vyzerá nepredvídateľne a nekontrolovateľne.

Ak neexistuje jednoznačná súvislosť medzi vstupnými a výstupnými parametrami riadiaceho objektu (t.j. medzi vstupnými parametrami a stavom objektu), inými slovami, ak má toto spojenie vyslovene pravdepodobnostný charakter, potom deterministické modely, v ktorých je predpokladané, že výsledkom merania určitého parametra je jednoducho číslo, nie sú spočiatku použiteľné. Navyše, typ tohto spojenia môže byť jednoducho neznámy, a potom je potrebné vychádzať z najvšeobecnejšieho predpokladu: že je pravdepodobný alebo nie je určený vôbec.

Automatizovaný riadiaci systém vybudovaný na tradičných princípoch môže fungovať len na základe parametrov, ktorých vzory väzieb sú už známe, preštudované a premietnuté do matematického modelu V tejto štúdii je úlohou vyvinúť takéto metódy pre automatizované navrhovanie riadiace systémy, ktoré umožnia vytvárať systémy schopné identifikovať a najvýznamnejšie parametre a určiť povahu väzieb medzi nimi a stavmi riadiaceho objektu.

V tomto prípade je potrebné použiť rozvinutejšie metódy merania, ktoré sú adekvátne reálnej situácii:

klasifikácia alebo rozpoznávanie obrazov (učenie na základe trénovacej množiny, prispôsobivosť rozpoznávacích algoritmov, prispôsobivosť množín skúmaných tried a parametrov, výber najvýznamnejších parametrov a redukcia dimenzie popisu pri zachovaní danej redundancie atď.);
štatistické merania, kedy výsledkom merania určitého parametra nie je samostatné číslo, ale rozdelenie pravdepodobnosti: zmena štatistickej premennej neznamená zmenu jej hodnoty ako takej, ale zmenu charakteristík rozdelenia pravdepodobnosti tzv. jeho hodnoty.

Výsledkom je, že automatizované riadiace systémy založené na tradičnom deterministickom prístupe prakticky nepracujú s komplexnými dynamickými viacparametrovými slabo určenými riadiacimi objektmi, akými sú napríklad makro- a mikro-socio-ekonomické systémy v dynamickej ekonomike tzv. prechodné obdobie“, hierarchické elity a etnické skupiny, spoločnosť a voličstvo, fyziológia a psychika človeka, prírodné a umelé ekosystémy a mnohé ďalšie.

Je veľmi príznačné, že v polovici 80-tych rokov vyvinula škola I. Prigogina prístup, podľa ktorého sa pri vývoji akéhokoľvek systému (vrátane človeka) striedajú obdobia, počas ktorých sa systém správa buď ako „prevažne deterministický“, alebo ako „väčšinou náhodný“. Prirodzene, reálny riadiaci systém musí stabilne ovládať riadiaci objekt nielen v „deterministických“ úsekoch jeho histórie, ale aj v bodoch, kedy sa jeho ďalšie správanie stáva značne neistým. To samo osebe znamená, že je potrebné vyvinúť prístupy k riadiacim systémom, ktorých správanie obsahuje veľký prvok náhodnosti (alebo to, čo sa v súčasnosti matematicky označuje ako „náhodnosť“).

Preto perspektívne automatizované riadiace systémy, ktoré poskytujú riadenie zložitých dynamických viacparametrových slabo deterministických systémov, budú zrejme zahŕňať podsystémy na identifikáciu a predikciu stavov prostredia a riadiaceho objektu, založené na metódach umelej inteligencie (predovšetkým rozpoznávanie vzorov), podporných metódach rozhodovania. tvorba a teória informácie.

Pozrime sa stručne na otázku používania systémov rozpoznávania obrazu na rozhodovanie o kontrolných akciách (táto problematika bude podrobnejšie diskutovaná neskôr, pretože je pre túto prácu kľúčová). Ak vezmeme cieľové a iné stavy riadiaceho objektu ako rozpoznávacie triedy a faktory, ktoré ho ovplyvňujú, ako vlastnosti, potom možno v modeli rozpoznávania vzorov vytvoriť mieru vzťahu medzi faktormi a stavmi. To umožňuje pre daný stav riadiaceho objektu získať informácie o faktoroch, ktoré podporujú alebo bránia jeho prechodu do tohto stavu, a na základe toho vypracovať rozhodnutie o riadiacej akcii.

Faktory možno rozdeliť do nasledujúcich skupín:

charakterizujúce pozadie riadiaceho objektu;
charakterizujúci aktuálny stav riadiaceho objektu;
enviromentálne faktory;
technologické (kontrolovateľné) faktory.

Systémy rozpoznávania vzorov teda môžu byť použité ako súčasť automatizovaných riadiacich systémov: v podsystémoch na identifikáciu stavu riadiaceho objektu a vývoj riadiacich akcií.

Toto je vhodné, keď je objektom riadenia zložitý systém.

Rozhodovanie o riadiacej činnosti v automatizovanom riadiacom systéme

V tejto práci sa uvažuje o riešení problému syntézy adaptívnych automatizovaných riadiacich systémov komplexnými systémami, berúc do úvahy početné a hlboké analógie medzi metódami rozpoznávania vzorov a rozhodovania.

Na jednej strane je problémom rozpoznávania vzorov rozhodovanie o tom, či rozpoznaný objekt patrí do určitej triedy rozpoznávania.

Na druhej strane autori navrhujú považovať problém rozhodovania za problém inverzného dekódovania alebo problém s inverzným rozpoznávaním vzorov (pozri časť 2.2.2).

Spoločnosť základných myšlienok, ktoré sú základom metód rozpoznávania vzorov a rozhodovania, sa stáva obzvlášť zrejmou, keď ich zvažujeme z pohľadu teórie informácie.

Rôzne problémy s rozhodovaním

Rozhodovanie ako realizácia cieľa

Definícia: rozhodovanie („výber“) je činnosť nad súborom alternatív, v dôsledku čoho sa zužuje počiatočný súbor alternatív, t.j. dochádza k jej zníženiu.

Voľba je činnosť, ktorá dáva účel všetkým činnostiam. Prostredníctvom aktov voľby sa realizuje podriadenie všetkých činností konkrétnemu cieľu alebo súboru vzájomne súvisiacich cieľov.

Preto, aby sa akt voľby stal možným, je potrebné:

generovanie alebo objavovanie súboru alternatív, na základe ktorých sa musí rozhodnúť;
určenie cieľov, pre ktoré sa výber uskutočňuje;
vývoj a aplikácia metódy na vzájomné porovnávanie alternatív, t.j. Stanovenie preferenčného hodnotenia pre každú alternatívu podľa určitých kritérií, ktoré umožňuje nepriamo posúdiť, do akej miery každá alternatíva zodpovedá cieľu.

Moderná práca v oblasti podpory rozhodovania odhalila charakteristickú situáciu, ktorá spočíva v tom, že úplná formalizácia hľadania najlepšieho (v istom zmysle) riešenia je možná len pri dobre preštudovaných, relatívne jednoduchých problémoch, zatiaľ čo v praxi sú slabo štruktúrované problémy sa častejšie vyskytujú, pre ktoré neboli vyvinuté úplne žiadne formalizované algoritmy (okrem vyčerpávajúceho hľadania a pokusov a omylov). Skúsení, kompetentní a schopní odborníci však často robia rozhodnutia, ktoré sa ukážu ako celkom dobré. Preto je moderným trendom v praxi rozhodovania v prirodzených situáciách spájať ľudskú schopnosť riešiť neformálne problémy so schopnosťami formálnych metód a počítačového modelovania: interaktívne systémy na podporu rozhodovania, expertné systémy, adaptívne automatizované riadiace systémy človek-stroj , neurónové siete a kognitívne systémy.

Rozhodovanie ako odstránenie neistoty (informačný prístup)

Proces získavania informácií možno považovať za zníženie neistoty v dôsledku prijatia signálu a množstvo informácií možno považovať za kvantitatívne meradlo miery odstránenia neistoty.

Ale v dôsledku výberu určitej podmnožiny alternatív z množiny, t.j. v dôsledku rozhodovania sa deje to isté (zníženie neistoty). To znamená, že každá voľba, každé rozhodnutie generuje určité množstvo informácií, a preto ich možno opísať z hľadiska teórie informácie.

Klasifikácia problémov rozhodovania

Mnohopočetnosť rozhodovacích úloh je spôsobená tým, že každá zložka situácie, v ktorej sa prijímajú rozhodnutia, môže byť realizovaná v kvalitatívne odlišných možnostiach.

Uveďme len niekoľko z týchto možností:

množina alternatív môže byť na jednej strane konečná, spočítateľná alebo spojitá a na druhej strane uzavretá (t. j. úplne známa) alebo otvorená (vrátane neznámych prvkov);
posúdenie alternatív sa môže vykonať podľa jedného alebo viacerých kritérií, ktoré môžu mať naopak kvantitatívny alebo kvalitatívny charakter;
Režim výberu môže byť jednorazový (jednorazový), alebo viacnásobný, opakujúci sa, vrátane spätnej väzby na výsledky výberu, t.j. umožnenie školenia rozhodovacích algoritmov s prihliadnutím na dôsledky predchádzajúcich volieb;
dôsledky výberu každej alternatívy môžu byť vopred presne známe (výber za podmienok istoty), majú pravdepodobnostný charakter, keď sú známe pravdepodobnosti možných výsledkov po vykonaní voľby (výber za podmienok rizika) alebo majú nejednoznačný výsledok s neznámou pravdepodobnosti (výber v podmienkach neistoty);
zodpovednosť za výber môže chýbať, jednotlivec alebo skupina;
miera konzistentnosti cieľov pri skupinovom výbere sa môže meniť od úplnej zhody záujmov strán (kooperatívna voľba) až po ich opak (výber v konfliktnej situácii). Možné sú aj prechodné možnosti: kompromis, koalícia, rastúci alebo doznievajúci konflikt.

Rôzne kombinácie týchto možností vedú k mnohým problémom pri rozhodovaní, ktoré boli v rôznej miere študované.

Jazyky na popis metód rozhodovania

O jednom a tom istom fenoméne možno hovoriť v rôznych jazykoch s rôznym stupňom všeobecnosti a primeranosti. K dnešnému dňu sa objavili tri hlavné jazyky na opis výberu.

Najjednoduchší, najrozvinutejší a najpopulárnejší je jazyk kritéria.

Jazyk kritérií

S názvom tohto jazyka sa spája základný predpoklad, že každú jednotlivú alternatívu možno ohodnotiť nejakým konkrétnym (jedným) číslom, po ktorom sa porovnávanie alternatív zredukuje na porovnanie zodpovedajúcich čísel.

Nech je napríklad (X) množina alternatív a x je nejaká špecifická alternatíva patriaca do tejto množiny: x∈X. Potom sa predpokladá, že pre všetky x možno špecifikovať funkciu q(x), ktorá sa nazýva kritérium (kritérium kvality, účelová funkcia, preferenčná funkcia, funkcia užitočnosti atď.), ktoré má tú vlastnosť, že ak je alternatíva x 1 výhodnejšia až x 2 (označené: x 1 > x 2), potom q (x 1) > q (x 2).

V tomto prípade výber spočíva v nájdení alternatívy s najvyššou hodnotou funkcie kritéria.

V praxi sa však používanie iba jedného kritéria na porovnanie miery preferencie alternatív ukazuje ako neopodstatnené zjednodušenie, pretože detailnejšie zvažovanie alternatív vedie k potrebe hodnotiť ich nie podľa jedného, ale podľa mnohých kritérií, ktoré môžu mať inú povahu a kvalitatívne odlišné od seba navzájom.

Napríklad pri výbere najprijateľnejšieho typu lietadla pre cestujúcich a prevádzkovú organizáciu na určitých typoch trás sa porovnávajú súčasne podľa mnohých skupín kritérií: technické, technologické, ekonomické, sociálne, ergonomické atď.

Multikriteriálne problémy nemajú jedinečné všeobecné riešenie. Preto sa navrhuje mnoho spôsobov, ako dať viackriteriálnemu problému konkrétnu formu, ktorá umožňuje jediné všeobecné riešenie. Prirodzene, tieto riešenia sa vo všeobecnosti líšia pre rôzne metódy. Preto azda najdôležitejšou vecou pri riešení multikriteriálneho problému je opodstatnenosť tohto typu formulácie.

Na zjednodušenie problému multikriteriálneho výberu sa používajú rôzne možnosti. Uveďme si niektoré z nich.

Podmienená maximalizácia (nenájde sa globálny extrém integrálneho kritéria, ale lokálny extrém hlavného kritéria).
Hľadajte alternatívu so špecifikovanými vlastnosťami.
Nájdenie Paretovej sady.
Redukcia viackriteriálneho problému na jednokriteriálny problém zavedením integrálneho kritéria.

Pozrime sa podrobnejšie na formálnu formuláciu metódy redukcie viackriteriálneho problému na jednokriteriálny.

Zaveďme integrálne kritérium q 0 (x) ako skalárnu funkciu vektorového argumentu:

qo (x) = qo ((qi (x), q2 (x), ..., qn (x)).

Integrálne kritérium vám umožňuje zoradiť alternatívy podľa hodnoty q 0, čím zvýrazníte najlepšie (v zmysle tohto kritéria). Tvar funkcie q 0 je určený tým, ako konkrétne si predstavujeme príspevok každého kritéria k integrálnemu kritériu. Typicky sa používajú aditívne a multiplikatívne funkcie:

q 0 = ∑a i ⋅q i /s i

1 - q 0 = ∏(1 - b i ⋅q i /s i)

Koeficienty, ktoré poskytujem:

Bezrozmernosť alebo jeden rozmer čísla a i ⋅q i /s i (rôzne čiastkové kritériá môžu mať rôzne rozmery a potom s nimi nemožno vykonávať aritmetické operácie a redukovať ich na celočíselné kritérium).
Normalizácia, t.j. zabezpečenie podmienky: b i ⋅q i /s i<1.

Koeficienty a i a b i odrážajú relatívny príspevok čiastkových kritérií q i k integrálnemu kritériu.

Takže pri multikriteriálnej formulácii problém rozhodovania o výbere jednej z alternatív spočíva v maximalizácii integrálneho kritéria:

x * = arg max (q 0 (q 1 (x), q 2 (x), ..., q n (x)))

Hlavným problémom pri multikriteriálnej formulácii rozhodovacieho problému je, že je potrebné nájsť takú analytickú formu koeficientov a i a b i, ktorá by poskytovala nasledujúce vlastnosti modelu:

vysoká miera primeranosti k predmetnej oblasti a pohľadu odborníkov;
minimálne výpočtové ťažkosti pri maximalizácii integrálneho kritéria, t.j. jeho výpočet pre rôzne alternatívy;
stabilita výsledkov maximalizácie integrálneho kritéria z malých porúch počiatočných údajov.
Stabilita riešenia znamená, že malá zmena v počiatočných údajoch by mala viesť k malej zmene hodnoty integrálneho kritéria, a teda k malej zmene prijatého rozhodnutia. Ak sú teda počiatočné údaje prakticky rovnaké, rozhodnutie by malo byť urobené buď rovnako, alebo veľmi blízko.

Jazyk sekvenčnej binárnej voľby

Jazyk binárnych vzťahov je zovšeobecnením multikriteriálneho jazyka a je založený na zohľadnení skutočnosti, že keď hodnotíme alternatívu, toto hodnotenie je vždy relatívne, t.j. explicitne alebo častejšie implicitne sa ako základ alebo referenčný rámec na porovnanie používajú iné alternatívy zo skúmaného súboru alebo zo všeobecnej populácie. Ľudské myslenie je založené na hľadaní a analýze protikladov (konštruktov), preto je pre nás vždy jednoduchšie vybrať si jednu z dvoch protikladných možností ako jednu možnosť z veľkého a nijako usporiadaného súboru.

Základné predpoklady tohto jazyka sú teda nasledovné:

nehodnotí sa samostatná alternatíva, t.j. nie je zavedená funkcia kritéria;
pre každú dvojicu alternatív možno nejakým spôsobom stanoviť, že jedna z nich je výhodnejšia ako druhá, alebo že sú ekvivalentné alebo neporovnateľné;
preferenčný vzťah v žiadnej dvojici alternatív nezávisí od ostatných alternatív prezentovaných na výber.

Existujú rôzne spôsoby, ako špecifikovať binárne vzťahy: priame, maticové, pomocou preferenčných grafov, metóda rezu atď.

Vzťahy medzi alternatívami jedného páru sú vyjadrené prostredníctvom pojmov ekvivalencie, poradia a dominancie.

Jazyk zovšeobecnených funkcií výberu

Jazyk funkcie výberu je založený na teórii množín a umožňuje vám pracovať s zobrazeniami množín do ich podmnožín zodpovedajúcich rôznym výberom bez toho, aby ste museli vymenovať prvky. Tento jazyk je veľmi všeobecný a má potenciál opísať akúkoľvek voľbu. Matematický aparát zovšeobecnených výberových funkcií sa však v súčasnosti stále vyvíja a testuje najmä na problémoch, ktoré už boli vyriešené pomocou kritérií alebo binárnych prístupov.

Výber skupiny

Nech existuje skupina ľudí, ktorí majú právo podieľať sa na kolektívnom rozhodovaní. Predpokladajme, že táto skupina zvažuje určitý súbor alternatív a každý člen skupiny si vyberie sám. Úlohou je vyvinúť riešenie, ktoré určitým spôsobom koordinuje jednotlivé voľby a v istom zmysle vyjadruje „všeobecný názor“ skupiny, t. prijaté ako skupinová voľba.

Prirodzene, rôznym skupinovým rozhodnutiam budú zodpovedať rôzne princípy koordinácie individuálnych rozhodnutí.

Pravidlá pre koordináciu individuálnych rozhodnutí pri skupinovom výbere sa nazývajú pravidlá hlasovania. Najbežnejšie je „pravidlo väčšiny“, v ktorom sa ako skupinové rozhodnutie prijíma alternatíva s najväčším počtom hlasov.

Je potrebné pochopiť, že takéto rozhodnutie odráža iba prevahu rôznych názorov v skupine, a nie skutočne optimálnu možnosť, za ktorú nemôže hlasovať vôbec nikto. "Pravda sa neurčuje hlasovaním."

Okrem toho existujú takzvané „hlasovacie paradoxy“, z ktorých najznámejší je Arrowov paradox.

Tieto paradoxy môžu viesť a niekedy vedú k veľmi nepríjemným črtám postupu hlasovania: napríklad existujú prípady, keď skupina nemôže urobiť jediné rozhodnutie (nie je kvórum alebo každý hlasuje za svoju jedinečnú možnosť atď.). .) a niekedy (pri viacstupňovom hlasovaní) môže menšina vnútiť svoju vôľu väčšine.

Voľba v podmienkach neistoty

Istota je špeciálny prípad neistoty, a to: je to neistota blízka nule.

V modernej teórii výberu sa verí, že existujú tri hlavné typy neistoty v problémoch rozhodovania:

Informačná (štatistická) neistota počiatočných údajov pre rozhodovanie.
Neistota dôsledkov rozhodovania (voľby).
Nejasnosť v popise komponentov rozhodovacieho procesu.

Pozrime sa na ne v poradí.

Informačná (štatistická) neistota v zdrojových údajoch

Údaje získané o predmetnej oblasti nemožno považovať za absolútne presné. Okrem toho nás tieto údaje očividne nezaujímajú samy o sebe, ale len ako signály, ktoré môžu niesť určité informácie o tom, čo nás skutočne zaujíma. Je teda reálnejšie uvažovať, že máme do činenia s údajmi, ktoré sú nielen zašumené a nepresné, ale aj nepriame a možno neúplné. Navyše tieto údaje sa netýkajú celej skúmanej populácie, ale len jej určitej podmnožiny, o ktorej sa nám podarilo reálne zozbierať dáta, no zároveň chceme vyvodiť závery o celej populácii a tiež chcú poznať stupeň spoľahlivosti týchto záverov.

V týchto podmienkach sa využíva teória štatistických rozhodnutí.

V tejto teórii existujú dva hlavné zdroje neistoty. Po prvé, nie je známe, aké rozdelenie nasledujú pôvodné údaje. Po druhé, nie je známe, aké rozdelenie má súbor (všeobecná populácia), o ktorom chceme vyvodiť závery z jeho podmnožiny, ktorá tvorí počiatočné údaje.

Štatistické postupy sú rozhodovacie postupy, ktoré odstraňujú oba tieto typy neistoty.

Je potrebné poznamenať, že existuje niekoľko dôvodov, ktoré vedú k nesprávnemu použitiu štatistických metód:

Štatistické závery, ako každé iné, majú vždy určitú spoľahlivosť alebo platnosť. Ale na rozdiel od mnohých iných prípadov je spoľahlivosť štatistických záverov známa a určená počas štatistickej štúdie;
kvalita riešenia získaného ako výsledok uplatnenia štatistického postupu závisí od kvality zdrojových údajov;
údaje, ktoré nemajú štatistický charakter, by nemali byť predmetom štatistického spracovania;
mali by sa použiť štatistické postupy, ktoré zodpovedajú úrovni a priori informácií o skúmanej populácii (napríklad metódy ANOVA by sa nemali aplikovať na negaussovské údaje). Ak distribúcia počiatočných údajov nie je známa, je potrebné ju buď zistiť, alebo použiť niekoľko rôznych metód a porovnať výsledky. Ak sú veľmi rozdielne, svedčí to o nepoužiteľnosti niektorých použitých postupov.

Neistota následkov

Keď sú dôsledky voľby tej či onej alternatívy jednoznačne určené alternatívou samotnou, potom nemôžeme rozlišovať medzi alternatívou a jej dôsledkami, pričom je samozrejmé, že výberom alternatívy si vlastne vyberáme jej dôsledky.

V reálnej praxi sa však často musíme vysporiadať so zložitejšou situáciou, keď výber tej či onej alternatívy nejednoznačne určuje dôsledky vykonanej voľby.

V prípade diskrétneho súboru alternatív a výsledkov podľa ich výberu, za predpokladu, že samotný súbor možných výsledkov je spoločný pre všetky alternatívy, môžeme predpokladať, že rôzne alternatívy sa navzájom líšia v rozložení pravdepodobnosti výsledkov. Tieto rozdelenia pravdepodobnosti môžu vo všeobecnom prípade závisieť od výsledkov výberu alternatív a skutočných výsledkov, ktoré z toho vyplynuli. V najjednoduchšom prípade sú výsledky rovnako pravdepodobné. Samotné výsledky majú zvyčajne význam ziskov alebo strát a sú vyjadrené kvantitatívne.

Ak sú výsledky pre všetky alternatívy rovnaké, potom nie je z čoho vyberať. Ak sa líšia, môžete porovnať alternatívy zavedením určitých kvantitatívnych odhadov pre ne. Rôznorodosť problémov v teórii hier je spojená s rôznymi voľbami numerických charakteristík strát a ziskov v dôsledku výberu alternatív, rôznymi stupňami konfliktu medzi stranami, ktoré si vyberajú alternatívy atď.

Považujte tento typ neistoty za vágnu neistotu

Akýkoľvek problém výberu je úlohou cieleného zužovania množiny alternatív. Formálny popis alternatív (samotný ich zoznam, zoznam ich vlastností či parametrov), ako aj popis pravidiel ich porovnávania (kritériá, vzťahy) sú vždy uvedené v zmysle tej či onej meracej škály (aj keď ten, kto toto o tom nevie).

Je známe, že všetky stupnice sú rozmazané, ale v rôznej miere. Pojem „rozmazanie“ označuje vlastnosť škál, ktorá spočíva v tom, že vždy je možné predložiť dve alternatívy, ktoré sú rozlíšiteľné, t.j. rozdielne v rovnakej mierke a nerozoznateľné, t.j. identické, v druhom - viac rozmazané. Čím menej gradácií v určitej škále, tým je rozmazanejšia.

Alternatívy teda jasne vidíme a zároveň ich nejasne zaraďujeme, t.j. majú neistotu, do ktorých tried patria.

Už vo svojej prvej práci o rozhodovaní v nejasných situáciách predložili Bellman a Zadeh myšlienku, že ciele aj obmedzenia by mali byť reprezentované ako fuzzy množiny na množine alternatív.

O niektorých obmedzeniach optimalizačného prístupu

Vo všetkých vyššie diskutovaných výberových problémoch a metódach rozhodovania bol problém nájsť tie najlepšie v pôvodnom súbore za daných podmienok, t.j. alternatívy, ktoré sú v určitom zmysle optimálne.

Myšlienka optimálnosti je ústrednou myšlienkou kybernetiky a pevne sa etablovala v praxi navrhovania a prevádzky technických systémov. Zároveň si táto myšlienka vyžaduje opatrné zaobchádzanie, keď sa ju snažíme preniesť do oblasti riadenia zložitých, veľkých a slabo determinovaných systémov, akými sú napríklad sociálno-ekonomické systémy.

Na tento záver existujú celkom dobré dôvody. Pozrime sa na niektoré z nich:

Optimálne riešenie sa často ukazuje ako nestabilné, t.j. menšie zmeny v problémových podmienkach, vstupoch alebo obmedzeniach môžu viesť k výberu výrazne odlišných alternatív.
Optimalizačné modely sa vyvíjajú len pre úzke triedy pomerne jednoduchých problémov, ktoré nie vždy dostatočne a systematicky odrážajú skutočné objekty riadenia. Optimalizačné metódy najčastejšie umožňujú optimalizovať len pomerne jednoduché a dobre formálne popísané podsystémy niektorých veľkých a zložitých systémov, t.j. umožňujú iba lokálnu optimalizáciu. Ak však každý podsystém veľkého systému funguje optimálne, vôbec to neznamená, že systém ako celok bude fungovať optimálne. Optimalizácia podsystému teda nemusí nevyhnutne viesť k správaniu, ktoré sa od neho vyžaduje pri optimalizácii systému ako celku. Navyše niekedy môže lokálna optimalizácia viesť k negatívnym dôsledkom pre systém ako celok. Preto pri optimalizácii podsystémov a systému ako celku je potrebné určiť strom cieľov a podcieľov a ich prioritu.
Za cieľ optimalizácie sa často považuje maximalizácia optimalizačného kritéria podľa nejakého matematického modelu, ale v skutočnosti je cieľom optimalizovať objekt riadenia. Kritériá optimalizácie a matematické modely súvisia s cieľom vždy len nepriamo, t.j. viac-menej primerane, ale vždy približne.

Myšlienka optimality, ktorá je mimoriadne plodná pre systémy, ktoré možno primerane matematicky formalizovať, sa teda musí preniesť do zložitých systémov opatrne. Samozrejme, matematické modely, ktoré možno niekedy navrhnúť pre takéto systémy, možno optimalizovať. Vždy však treba brať do úvahy výrazné zjednodušenie týchto modelov, ktoré v prípade komplexných systémov už nemožno zanedbávať, ako aj skutočnosť, že miera primeranosti týchto modelov v prípade komplexných systémov je prakticky neznáma. . Preto nie je známe, aký čisto praktický význam má táto optimalizácia. Vysoká praktickosť optimalizácie v technických systémoch by nemala vyvolávať ilúziu, že bude rovnako účinná aj pri optimalizácii zložitých systémov. Zmysluplné matematické modelovanie zložitých systémov je veľmi ťažké, približné a nepresné. Čím je systém zložitejší, tým opatrnejší by ste mali byť pri myšlienke jeho optimalizácie.

Preto autori pri vývoji metód riadenia zložitých, veľkých, slabo deterministických systémov považujú za hlavnú vec nielen optimálnosť zvoleného prístupu z formálneho matematického hľadiska, ale aj jeho primeranosť cieľu a samotnú povahu riadiaci objekt.

Odborné metódy výberu

Pri štúdiu zložitých systémov často vznikajú problémy, ktoré z rôznych dôvodov nie je možné striktne formulovať a riešiť pomocou súčasne vyvinutého matematického aparátu. V týchto prípadoch sa využívajú služby odborníkov (systémových analytikov), ktorých skúsenosti a intuícia pomáhajú znižovať zložitosť problému.

Treba však brať do úvahy, že samotní experti sú vysoko komplexné systémy a ich činnosť závisí aj od mnohých vonkajších a vnútorných podmienok. Preto sa v metódach organizácie znaleckých posudkov veľká pozornosť venuje vytváraniu priaznivých vonkajších a psychologických podmienok pre prácu znalcov.

Práca odborníka je ovplyvnená nasledujúcimi faktormi:

zodpovednosť za použitie výsledkov vyšetrení;
vedomie, že sú zapojení aj ďalší odborníci;
dostupnosť informačného kontaktu medzi odborníkmi;
medziľudské vzťahy odborníkov (ak je medzi nimi informačný kontakt);
osobný záujem odborníka o výsledky hodnotenia;
osobné vlastnosti odborníkov (namyslenosť, konformita, vôľa atď.)

Interakcia medzi odborníkmi môže stimulovať aj potláčať ich aktivitu. Preto sa v rôznych prípadoch používajú rôzne vyšetrovacie metódy, ktoré sa líšia povahou interakcie odborníkov medzi sebou: anonymné a otvorené prieskumy a dotazníky, stretnutia, diskusie, obchodné hry, brainstorming atď.

Na matematické spracovanie znaleckých posudkov existujú rôzne metódy. Odborníci sú požiadaní, aby zhodnotili rôzne alternatívy buď pomocou jedného indikátora alebo sústavy indikátorov. Okrem toho sú požiadaní, aby zhodnotili stupeň dôležitosti každého ukazovateľa (jeho „váhu“ alebo „príspevok“). Samotní experti majú tiež pridelenú úroveň kompetencií zodpovedajúcu príspevku každého z nich k výslednému názoru skupiny.

Rozvinutou metodikou pre prácu s odborníkmi je metóda Delphi. Hlavnou myšlienkou tejto metódy je, že kritika a argumentácia majú priaznivý vplyv na odborníka, ak nie je ovplyvnená jeho hrdosť a sú poskytnuté podmienky, ktoré vylučujú osobnú konfrontáciu.

Osobitne treba zdôrazniť, že zásadný rozdiel je v charaktere použitia expertných metód v expertných systémoch a v podpore rozhodovania. Ak sa v prvom prípade vyžaduje, aby odborníci formalizovali metódy rozhodovania, potom v druhom prípade iba samotné rozhodnutie ako také.

Keďže odborníci sa podieľajú na implementácii práve tých funkcií, ktoré v súčasnosti automatizované systémy buď vôbec nezabezpečujú, alebo ich vykonávajú horšie ako ľudia, sľubným smerom rozvoja automatizovaných systémov je maximálna automatizácia týchto funkcií.

Automatizované systémy na podporu rozhodovania

Človek vždy využíval pri rozhodovaní asistentov: boli to jednoducho poskytovatelia informácií o predmete riadenia a konzultanti (poradcovia), ktorí ponúkali možnosti rozhodovania a analyzovali ich dôsledky. Človek, ktorý rozhoduje, ich vždy robil v určitom informačnom prostredí: pre vojenského veliteľa je to veliteľstvo, pre rektora akademická rada, pre ministra kolégium.

Informačná infraštruktúra pre rozhodovanie je v dnešnej dobe nemysliteľná bez automatizovaných systémov na interaktívne hodnotenie rozhodovania a najmä systémov na podporu rozhodovania (DDS - Decision Support Systems), t.j. automatizované systémy, ktoré sú špeciálne navrhnuté na prípravu informácií, ktoré človek potrebuje na to, aby sa rozhodol. Vývoj systémov na podporu rozhodovania sa realizuje najmä v rámci medzinárodného projektu realizovaného pod záštitou Medzinárodného inštitútu pre analýzu aplikovaných systémov v Laxenburgu (Rakúsko).

Rozhodovanie v reálnych situáciách si vyžaduje množstvo operácií, z ktorých niektoré efektívnejšie vykonávajú ľudia a iné stroje. Efektívna kombinácia ich výhod pri kompenzácii ich nedostatkov je stelesnená v automatizovaných systémoch na podporu rozhodovania.

Človek sa v podmienkach neistoty rozhoduje lepšie ako stroj, no na správne rozhodnutie potrebuje aj adekvátne (úplné a spoľahlivé) informácie charakterizujúce predmetnú oblasť. Je však známe, že ľudia si nevedia dobre poradiť s veľkým množstvom „surových“ nespracovaných informácií. Úlohou stroja pri podpore rozhodovania preto môže byť predbežná príprava informácií o riadiacom objekte a nekontrolovateľných faktoroch (prostredí), napomôcť zobrazenie dôsledkov prijímania určitých rozhodnutí a tiež prezentovať všetky tieto informácie vo vizuálnej podobe. a pohodlný spôsob rozhodovania.

Automatizované systémy na podporu rozhodovania teda kompenzujú slabé stránky človeka, oslobodzujú ho od rutinného predbežného spracovania informácií a poskytujú mu pohodlné informačné prostredie, v ktorom môže lepšie preukázať svoje silné stránky. Cieľom týchto systémov nie je automatizovať funkcie osoby s rozhodovacou právomocou (a v dôsledku toho mu tieto funkcie odcudziť, a teda aj zodpovednosť za prijaté rozhodnutia, čo je často všeobecne neprijateľné), ale poskytnúť mu pomoc pri hľadaní dobrého Riešenie.

Moderné roboty vybavené systémami videnia sú schopné dobre vidieť, aby mohli pracovať so skutočným svetom. Môžu robiť závery o tom, aký typ objektov sa tam nachádza, aké vzťahy majú medzi sebou a aké skupiny tvoria.

Podstatou rozpoznávacej úlohy je zistiť, či skúmané objekty majú pevnú konečnú množinu vlastností, ktorá im umožňuje zaradiť ich do určitej triedy.

Ciele vedy o rozpoznávaní vzorov:

Nahradenie ľudského experta alebo komplexného expertného systému jednoduchším systémom (automatizácia ľudských činností alebo zjednodušenie zložitých systémov);

Konštrukcia učiacich sa systémov, ktoré môžu robiť rozhodnutia bez špecifikovania jasných pravidiel, konkrétne systémov, ktoré samy dokážu syntetizovať rozhodovacie pravidlá na základe určitého konečného počtu príkladov správnych rozhodnutí „predvedených“ systému.

Úlohy na rozpoznávanie možno charakterizovať nasledovne.

1. Ide o informačné úlohy pozostávajúce z dvoch hlavných etáp: redukcia zdrojových údajov do formy vhodnej na rozpoznávanie a samotné rozpoznávanie.

2. V týchto úlohách môžete zaviesť pojem analógie a podobnosti predmetov a formulovať pojem blízkosti predmetov ako základ pre zaradenie objektu do určitej triedy.

3. V týchto úlohách môžete pracovať so súborom príkladov, ktorých klasifikácia je známa a ktoré vo forme formalizovaných popisov možno predložiť rozpoznávaciemu algoritmu, aby sa prispôsobil úlohe počas procesu učenia.

4. Pre tieto problémy je ťažké vybudovať formálne teórie a aplikovať klasické matematické metódy.

5. V týchto problémoch sú možné „zlé“ informácie.

Typy rozpoznávacích úloh:

Priradenie prezentovaného predmetu do jednej z tried (školenie s učiteľom);

Automatická klasifikácia – rozdelenie množiny objektov (situácií) podľa ich popisu do systému neprekrývajúcich sa tried;

Výber súboru informácií počas rozkladu;

Prevedenie zdrojových údajov do formy vhodnej na rozpoznanie;

Dynamické rozpoznávanie a dynamická klasifikácia;

Problémy s predpovedaním.

Základné definície

Obrázok– ide o štruktúrovaný popis objektu alebo javu, reprezentovaný vektorom znakov, z ktorých každý prvok predstavuje číselnú hodnotu jedného zo znakov charakterizujúcich tento objekt. Inými slovami: obraz je akýkoľvek objekt, pre ktorý je možné merať súbor určitých numerických charakteristík. Príklad obrázka: písmeno, obrázok, kardiogram atď.

Číselný znak(alebo len znamenie). je vzorec alebo iný opis metódy na porovnávanie objektu s určitou číselnou charakteristikou, ktorá funguje v rámci špecifickej úlohy rozpoznávania vzoru. Pre každý objekt možno definovať niekoľko rôznych charakteristík, teda niekoľko číselných charakteristík.

Priestor funkcie.N-rozmerný priestor definovaný pre danú úlohu rozpoznávania, kde N je pevný počet meraných prvkov pre ľubovoľné objekty. Vektor z priestoru vlastností zodpovedajúci objektu rozpoznávacej úlohy je N-rozmerný vektor so zložkami (x1, x2, ..., xN), čo sú hodnoty vlastností tohto objektu.

OBJECT->Nfeatures->M-rozmerný vektor prvku

Trieda- neformalizovaná (spravidla) predstava o možnosti priradiť ľubovoľný objekt zo súboru objektov rozpoznávacej úlohy k určitej skupine objektov. Pre objekty rovnakej triedy sa predpokladá prítomnosť „podobnosti“. Pre úlohu rozpoznávania vzorov je možné definovať ľubovoľný počet tried väčší ako 1. Počet tried je označený číslom S.

Vo všeobecnosti sa problém rozpoznávania vzorov skladá z dvoch častí: rozpoznávania a tréningu.

Rozpoznávanie vzorov pozostáva z klasifikácie určitej skupiny objektov na základe určitých požiadaviek. Objekty patriace do rovnakej triedy obrázkov majú spoločné vlastnosti. Požiadavky definujúce klasifikáciu sa môžu líšiť, pretože rôzne situácie si vyžadujú rôzne typy klasifikácií.

Napríklad pri rozpoznávaní anglických písmen sa vytvorí 26 obrázkových tried. Na rozlíšenie anglických písmen od čínskych znakov počas rozpoznávania sú však potrebné iba dve triedy obrázkov.

Najjednoduchším prístupom k rozpoznávaniu vzorov je porovnávanie vzorov. V tomto prípade je v pamäti zariadenia uložená určitá sada obrázkov, jeden z každej triedy obrázkov. Vstupný (rozpoznaný) obrázok (neznámej triedy) sa porovnáva so štandardom každej triedy. Klasifikácia je založená na vopred vybranom kritériu zhody alebo kritériu podobnosti. Inými slovami, ak vstupný obrázok lepšie zodpovedá štandardu i-tej triedy vzorov ako ktorýkoľvek iný štandard, potom sa vstupný obrázok klasifikuje ako patriaci do i-tej triedy vzorov.

Nevýhodou tohto prístupu, t. j. porovnávania so štandardom, je, že v niektorých prípadoch je ťažké vybrať vhodný štandard z každej triedy obrázkov a stanoviť potrebné kritérium zhody.

Pokročilejším prístupom je, že klasifikácia je založená na určitom súbore vybraných meraní vykonaných na vstupných obrázkoch. Predpokladá sa, že tieto vybrané opatrenia, nazývané „vlastnosti“, sú nemenné alebo necitlivé na bežne sa vyskytujúce variácie a skreslenia a majú malú redundanciu.

Špeciálny prípad druhého prístupu „merania znakov“, v ktorom sú štandardy uložené vo forme nameraných znakov a v klasifikátore sa používa špeciálne klasifikačné kritérium (porovnanie).

Funkcie sú definované vývojármi a musia byť invariantné vzhľadom na orientáciu, veľkosť a tvarové variácie objektov.

Najnovšie nápady v rozpoznávaní vzorov. Príklady problémov s rozpoznávaním vzorov

Odoslanie dobrej práce do databázy znalostí je jednoduché. Použite nižšie uvedený formulár

Úvod

1.1 Príbeh rozvoj

3. Všeobecná charakteristika problémov rozpoznávania vzorov a ich typy

Záver

Podobné dokumenty

Prehľad metód identifikácie ľudí na základe obrázkov tváre, berúc do úvahy vlastnosti vizuálneho rozpoznávania

Pomenované po Glazkovej Valentine Vladimirovne VÝSKUM A VÝVOJ METÓD NA KONŠTRUKCIU SOFTVÉROVÝCH NÁSTROJOV NA KLASIFIKÁCIU HYPERTEXTOVÝCH DOKUMENTOV NA VEĽKÉ TÉMY Špecialita 05

Snímka 0 Prehľad bioinformatických úloh súvisiacich s analýzou a spracovaním genetických textov

Motivácia

Logický prístup

Označenia

Pravdepodobnostný prístup

Straty chýb klasifikátora

Podmienené a Bayesovské riziko

Niektoré typické stratové funkcie

Poznámky k notácii

Empirické riziko

Garancie konvergencie. Najjednoduchší prípad

Veta

Myšlienka dôkazu

Praktické výsledky

Záver

Použité knihy

Kapitola 3: Analytický prehľad metód rozpoznávania vzorov a rozhodovania

Teória rozpoznávania vzorov a automatizácia riadenia

Hlavné úlohy adaptívneho rozpoznávania vzorov

Úlohou formalizácie predmetnej oblasti

Úloha vytvoriť tréningovú vzorku

Úloha výcviku rozpoznávacieho systému

Problém zmenšenia rozmeru priestoru funkcií

Úloha rozpoznávania

Problém kontroly kvality rozpoznávania

Adaptačný problém

Problém inverzného rozpoznávania

Problémy klastrovej a konštruktívnej analýzy

Úloha kognitívnej analýzy

Metódy rozpoznávania vzorov a ich charakteristiky

Princípy klasifikácie metód rozpoznávania vzorov

Intenzívne metódy

Metódy založené na odhadoch distribučných hustôt hodnôt znakov

Metódy založené na predpokladoch o triede rozhodovacích funkcií

Booleovské metódy

Lingvistické (štrukturálne) metódy

Rozširujúce metódy

Metóda porovnania s prototypom

k metóda najbližších susedov

Algoritmy na výpočet hodnotení („hlasovanie“)

Kolektívy rozhodovacích pravidiel

Porovnávacia analýza metód rozpoznávania vzorov

Úloha a miesto rozpoznávania vzorov v automatizácii riadenia zložitých systémov

Rozhodovanie o riadiacej činnosti v automatizovanom riadiacom systéme

Rôzne problémy s rozhodovaním

Rozhodovanie ako realizácia cieľa

Rozhodovanie ako odstránenie neistoty (informačný prístup)

Klasifikácia problémov rozhodovania

Jazyky na popis metód rozhodovania

Jazyk kritérií

Jazyk sekvenčnej binárnej voľby

Jazyk zovšeobecnených funkcií výberu

Výber skupiny

Voľba v podmienkach neistoty

Informačná (štatistická) neistota v zdrojových údajoch

Neistota následkov

Považujte tento typ neistoty za vágnu neistotu

O niektorých obmedzeniach optimalizačného prístupu

Odborné metódy výberu

Automatizované systémy na podporu rozhodovania

Ciele vedy o rozpoznávaní vzorov:

Základné definície