Bayesovské siete: definícia, príklady a ako fungujú

Obsah:

Bayesovské siete: definícia, príklady a ako fungujú
Bayesovské siete: definícia, príklady a ako fungujú
Anonim

Presvedčenie, rozhodovacia sieť, Bayesovský (ian) model alebo pravdepodobnostne riadený acyklický grafový model je variantná schéma (typ štatistického modelu), ktorá predstavuje súbor premenných a ich podmienených závislostí prostredníctvom smerovaného acyklického grafu (DAG).

Bayesovská sieť môže napríklad reprezentovať pravdepodobnostné vzťahy medzi chorobami a symptómami. Vzhľadom na to môže byť sieť použitá na výpočet možnosti mať rôzne choroby. Vo videu nižšie môžete vidieť príklad Bayesovskej siete viery s výpočtami.

Image
Image

Efektívnosť

Efektívne algoritmy môžu uskutočňovať odvodzovanie a učenie sa v Bayesovských sieťach. Siete, ktoré modelujú premenné (ako sú rečové signály alebo proteínové sekvencie), sa nazývajú dynamické siete. Zovšeobecnenia Bayesovských sietí, ktoré môžu reprezentovať a riešiť problémy pri neistote, sa nazývajú diagramy vplyvu.

Essence

FormálneBayesovské siete sú DAG, ktorých uzly predstavujú premenné v Bayesovskom zmysle: môžu to byť pozorované hodnoty, skryté premenné, neznáme parametre alebo hypotézy. Pretože je to veľmi zaujímavé.

príklad bayesovskej siete

Vlhknutie trávy môžu spôsobiť dve udalosti: aktívny postrekovač alebo dážď. Dážď má priamy vplyv na používanie zavlažovača (a to, že keď prší, zavlažovač je zvyčajne neaktívny). Túto situáciu možno modelovať pomocou Bayesovskej siete.

Typický vzorec
Typický vzorec

Simulácia

Pretože Bayesovská sieť je úplným modelom pre svoje premenné a ich vzťahy, možno ju použiť na zodpovedanie pravdepodobnostných otázok o nich. Môže sa napríklad použiť na aktualizáciu poznatkov o stave podmnožiny premenných, keď sa pozorujú iné údaje (dôkazové premenné). Tento zaujímavý proces sa nazýva pravdepodobnostná inferencia.

A posteriori poskytuje všeobecne dostatočnú štatistiku pre aplikácie zisťovania pri výbere hodnôt pre podmnožinu premenných. Tento algoritmus teda možno považovať za mechanizmus na automatickú aplikáciu Bayesovho teorému na zložité problémy. Na obrázkoch v článku môžete vidieť príklady Bayesovských sietí viery.

Praktická bayesovská sieť
Praktická bayesovská sieť

Výstupné metódy

Najbežnejšie metódy exaktnej inferencie sú: eliminácia premennej, ktorá eliminuje (integráciou alebo sumáciou) nepozorovateľnénedopytové parametre jeden po druhom pridelením sumy produktu.

Šírenie „stromu“kliknutím, ktorý ukladá výpočty do vyrovnávacej pamäte, aby bolo možné dopytovať veľa premenných naraz a rýchlo šíriť nové dôkazy; a rekurzívne párovanie a/alebo vyhľadávanie, ktoré umožňujú kompromisy medzi priestorom a časom a zodpovedajú efektívnosti eliminácie premenných pri použití dostatočného priestoru.

Všetky tieto metódy majú zvláštnu zložitosť, ktorá exponenciálne závisí od dĺžky siete. Najbežnejšími približnými inferenčnými algoritmami sú eliminácia mini-segmentov, cyklické šírenie presvedčenia, zovšeobecnené šírenie viery a variačné metódy.

Typy sietí
Typy sietí

Networking

Pre úplnú špecifikáciu Bayesovskej siete, a teda úplnú reprezentáciu spoločného rozdelenia pravdepodobnosti, je potrebné špecifikovať pre každý uzol X rozdelenie pravdepodobnosti pre X kvôli rodičom X.

Podmienená distribúcia X jeho rodičmi môže mať akúkoľvek formu. Je bežné pracovať s diskrétnymi alebo Gaussovými rozdeleniami, pretože to zjednodušuje výpočty. Niekedy sú známe len distribučné obmedzenia. Potom môžete použiť entropiu na určenie jedinej distribúcie, ktorá má najvyššiu entropiu vzhľadom na obmedzenia.

Podobne, v špecifickom kontexte dynamickej Bayesovskej siete, podmienená distribúcia pre časový vývoj latentnéhostav je zvyčajne nastavený tak, aby maximalizoval mieru entropie implikovaného náhodného procesu.

Bayesovská sieť dôvery
Bayesovská sieť dôvery

Priame maximalizovanie pravdepodobnosti (alebo neskoršej pravdepodobnosti) je často zložité vzhľadom na prítomnosť nepozorovaných premenných. To platí najmä pre Bayesovskú rozhodovaciu sieť.

Klasický prístup

Klasickým prístupom k tomuto problému je algoritmus maximalizácie očakávaní, ktorý strieda výpočet očakávaných hodnôt nepozorovaných premenných závislých od pozorovaných údajov s maximalizáciou celkovej pravdepodobnosti (alebo neskoršej hodnoty), za predpokladu, že predtým vypočítané očakávané hodnoty sú správne. V podmienkach miernej pravidelnosti tento proces konverguje v maximálnych (alebo maximálne a posteriori) hodnotách parametrov.

Úplnejší bayesovský prístup k parametrom je považovať ich za ďalšie nepozorované premenné a vypočítať úplnú zadnú distribúciu vo všetkých uzloch na základe pozorovaných údajov a potom parametre integrovať. Tento prístup môže byť nákladný a viesť k veľkým modelom, vďaka čomu sú klasické prístupy ladenia parametrov dostupnejšie.

V najjednoduchšom prípade je Bayesovská sieť definovaná odborníkom a potom použitá na vykonanie záverov. V iných aplikáciách je úloha určovania pre človeka príliš náročná. V tomto prípade sa medzi dátami musí naučiť štruktúra Bayesovskej neurónovej siete a parametre lokálnych distribúcií.

Bayesovské siete
Bayesovské siete

Alternatívna metóda

Alternatívna metóda štruktúrovaného učenia využíva optimalizačné vyhľadávanie. To si vyžaduje použitie hodnotiacej funkcie a stratégie vyhľadávania. Bežným bodovacím algoritmom je neskoršia pravdepodobnosť štruktúry danej tréningovými dátami, ako sú BIC alebo BDeu.

Čas potrebný na vyčerpávajúce vyhľadávanie, ktoré vráti štruktúru, ktorá maximalizuje skóre, je superexponenciálny v počte premenných. Stratégia miestneho vyhľadávania vykonáva postupné zmeny na zlepšenie odhadu štruktúry. Friedman a jeho kolegovia uvažovali o použití vzájomnej informácie medzi premennými na nájdenie požadovanej štruktúry. Obmedzujú množinu rodičovských kandidátov na k uzlov a dôkladne ich prehľadávajú.

Zvlášť rýchlou metódou na presné štúdium BN je predstaviť si problém ako optimalizačný problém a vyriešiť ho pomocou celočíselného programovania. Obmedzenia acyklickosti sa pridávajú do celočíselného programu (IP) počas riešenia vo forme rovín rezu. Takáto metóda dokáže zvládnuť problémy až so 100 premennými.

Grafy a siete
Grafy a siete

Riešenie problémov

Na vyriešenie problémov s tisíckami premenných je potrebný iný prístup. Jedným z nich je najprv vybrať jednu objednávku a potom nájsť optimálnu štruktúru BN vzhľadom na toto poradie. To znamená pracovať vo vyhľadávacom priestore možného usporiadania, čo je výhodné, pretože je menšie ako priestor sieťových štruktúr. Potom sa vyberie a vyhodnotí niekoľko zákaziek. Táto metóda sa ukázalanajlepšie dostupné v literatúre, keď je počet premenných obrovský.

Ďalšou metódou je zamerať sa na podtriedu rozložiteľných modelov, pre ktoré sú MLE uzavreté. Potom môžete nájsť konzistentnú štruktúru pre stovky premenných.

Štúdium bayesovských sietí s obmedzenou šírkou troch čiar je nevyhnutné na poskytnutie presnej a interpretovateľnej inferencie, pretože zložitosť najhoršieho prípadu je exponenciálna v dĺžke stromu k (podľa hypotézy exponenciálneho času). Ako globálna vlastnosť grafu však značne zvyšuje zložitosť procesu učenia. V tomto kontexte možno K-strom použiť na efektívne učenie.

Krátka sieť
Krátka sieť

Vývoj

Vývoj Bayesiánskej siete dôvery často začína vytvorením DAG G tak, že X spĺňa lokálnu Markovovu vlastnosť vzhľadom na G. Niekedy je to kauzálny DAG. Odhadujú sa podmienené rozdelenia pravdepodobnosti každej premennej nad jej rodičmi v G. V mnohých prípadoch, najmä ak sú premenné diskrétne, ak je spoločné rozdelenie X súčinom týchto podmienených rozdelení, potom sa X stane Bayesovskou sieťou vzhľadom na G.

Markovova „uzolová deka“je súprava uzlov. Markovova prikrývka robí uzol nezávislým od zvyšku polotovaru uzla s rovnakým názvom a má dostatočné znalosti na výpočet jeho rozloženia. X je Bayesovská sieť vzhľadom na G, ak je každý uzol podmienene nezávislý od všetkých ostatných uzlov vzhľadom na svoj Markovian.deka.

Odporúča: