Pearsonova distribúcia: definícia, aplikácia

Obsah:

Pearsonova distribúcia: definícia, aplikácia
Pearsonova distribúcia: definícia, aplikácia
Anonim

Aký je Pearsonov distribučný zákon? Odpoveď na túto širokú otázku nemôže byť jednoduchá a stručná. Pearsonov systém bol pôvodne navrhnutý na modelovanie viditeľných skreslených pozorovaní. V tom čase bolo dobre známe, ako vyladiť teoretický model tak, aby zodpovedal prvým dvom kumulantom alebo momentom pozorovaných údajov: každé rozdelenie pravdepodobnosti možno priamo rozšíriť tak, aby vytvorilo skupinu mierok polohy.

Pearsonova hypotéza o normálnom rozdelení kritérií

Okrem patologických prípadov môže byť mierka polohy prispôsobená pozorovanému priemeru (prvá kumulácia) a rozptylu (druhá kumulant) ľubovoľným spôsobom. Nebolo však známe, ako zostrojiť rozdelenia pravdepodobnosti, v ktorých by sa šikmosť (štandardizovaná tretia kumulácia) a špičatosť (štandardizovaná štvrtá kumulácia) dala kontrolovať rovnako voľne. Táto potreba sa prejavila pri pokuse prispôsobiť známe teoretické modely pozorovaným údajom,ktorý vykazoval asymetriu.

Vo videu nižšie môžete vidieť analýzu Pearsonovej distribúcie chi.

Image
Image

História

Vo svojej pôvodnej práci Pearson identifikoval okrem normálneho rozdelenia (ktoré bolo pôvodne známe ako typ V) štyri typy distribúcií (očíslované I až IV). Klasifikácia závisí od toho, či sú distribúcie podporované v obmedzenom intervale, na poloosi alebo na celej skutočnej čiare a či boli potenciálne skreslené alebo nevyhnutne symetrické.

V druhom článku boli opravené dve opomenutia: predefinoval rozdelenie typu V (pôvodne to bolo len normálne rozdelenie, ale teraz s inverznou gama) a zaviedol rozdelenie typu VI. Prvé dva články spolu pokrývajú päť hlavných typov Pearsonovho systému (I, III, IV, V a VI). V treťom článku Pearson (1916) predstavil ďalšie podtypy.

Pearsonove distribučné funkcie
Pearsonove distribučné funkcie

Zlepšiť koncept

Rind vynašiel jednoduchý spôsob vizualizácie priestoru parametrov systému Pearson (alebo distribúcie kritérií), ktorý neskôr prijal. Dnes túto metódu používa veľa matematikov a štatistikov. Typy Pearsonových distribúcií sú charakterizované dvoma veličinami, zvyčajne nazývanými β1 a β2. Prvým je štvorec asymetrie. Druhým je tradičná špičatosť alebo štvrtý štandardizovaný moment: β2=γ2 + 3.

Moderné matematické metódy definujú špičatosť γ2 ako kumulanty namiesto momentov, takže pre normálnerozdelenie máme γ2=0 a β2=3. Tu sa oplatí nasledovať historický precedens a použiť β2. Diagram vpravo ukazuje, o aký typ konkrétneho Pearsonovho rozdelenia ide (označené bodkou (β1, β2).

Pearsonova štatistika
Pearsonova štatistika

Mnohé zo skreslených a/alebo nemezokurtických distribúcií, ktoré poznáme dnes, ešte neboli známe začiatkom 90. rokov 19. storočia. To, čo je teraz známe ako beta rozdelenie, použil Thomas Bayes ako zadný parameter Bernoulliho rozdelenia vo svojom článku z roku 1763 o inverznej pravdepodobnosti.

Beta distribúcia sa dostala do popredia vďaka jej prítomnosti v systéme Pearson a až do 40. rokov bola známa ako distribúcia Pearsonovho typu I. Distribúcia typu II je špeciálny prípad typu I, ale zvyčajne sa už nevyčleňuje.

Distribúcia Gamma vznikla z jeho vlastnej tvorby a bola známa ako Normálna distribúcia Pearson Type III predtým, ako získala svoje moderné meno v 30. a 40. rokoch 20. storočia. Dokument z roku 1895 od vedca predstavil distribúciu typu IV, ktorá obsahuje Studentovu t-distribúciu, ako špeciálny prípad, ktorý o niekoľko rokov predchádzal následnému použitiu Williamom Seelym Gossetom. Jeho práca z roku 1901 predstavila distribúciu s inverznou gama (typ V) a beta prvočísla (typ VI).

Iný názor

Podľa Orda vyvinul Pearson základný tvar rovnice (1) na základe vzorca pre deriváciu logaritmu funkcie hustoty normálneho rozdelenia (ktorá dáva lineárne delenie kvadratickýmštruktúra). Mnoho odborníkov sa stále zaoberá testovaním hypotézy o distribúcii Pearsonových kritérií. A dokazuje svoju účinnosť.

Alternatívna Pearsonova distribúcia
Alternatívna Pearsonova distribúcia

Kto bol Karl Pearson

Karl Pearson bol anglický matematik a bioštatistik. Pripisuje sa mu vytvorenie disciplíny matematickej štatistiky. V roku 1911 založil na University College London prvé oddelenie štatistiky na svete a významne prispel k oblasti biometrie a meteorológie. Pearson bol tiež zástancom sociálneho darwinizmu a eugeniky. Bol chránencom a životopiscom Sira Francisa G altona.

Biometria

Karl Pearson bol nápomocný pri vytváraní školy biometrie, ktorá bola konkurenčnou teóriou na opis evolúcie a dedičnosti populácií na prelome 20. storočia. Jeho séria osemnástich článkov „Matematické príspevky k teórii evolúcie“ho ustanovila za zakladateľa biometrickej školy dedičnosti. V skutočnosti Pearson venoval veľa svojho času v rokoch 1893-1904 vývoj štatistických metód pre biometriu. Tieto metódy, ktoré sa dnes široko používajú na štatistickú analýzu, zahŕňajú chí-kvadrát test, štandardnú odchýlku, korelačné a regresné koeficienty.

Pearsonov korelačný koeficient
Pearsonov korelačný koeficient

Otázka dedičnosti

Pearsonov zákon dedičnosti uvádzal, že zárodočná plazma pozostáva z prvkov zdedených od rodičov, ako aj od vzdialenejších predkov, ktorých podiel sa menil podľa rôznych charakteristík. Karl Pearson bol nasledovníkom G altona, a hoci ichpráce sa v niektorých ohľadoch líšili, Pearson použil značné množstvo štatistických konceptov svojho učiteľa pri formulovaní biometrickej školy pre dedičnosť, ako je napríklad zákon regresie.

Pearsonova distribúcia
Pearsonova distribúcia

Funkcie školy

Biometrická škola, na rozdiel od Mendelovcov, nebola zameraná na poskytovanie mechanizmu pre dedičnosť, ale na poskytovanie matematického popisu, ktorý nemal kauzálny charakter. Zatiaľ čo G alton navrhol diskontinuálnu teóriu evolúcie, v ktorej by sa druhy menili skôr veľkými skokmi než malými zmenami, ktoré sa nahromadili v priebehu času, Pearson poukázal na nedostatky v tomto argumente a v skutočnosti použil svoje myšlienky na vytvorenie nepretržitej evolučnej teórie. Mendelovci uprednostňovali nespojitú teóriu evolúcie.

Kým sa G alton zameral najmä na aplikáciu štatistických metód na štúdium dedičnosti, Pearson a jeho kolega Weldon rozšírili svoje úvahy v tejto oblasti, variáciách, koreláciách prirodzeného a sexuálneho výberu.

Typická distribúcia
Typická distribúcia

Pohľad na evolúciu

Pre Pearsona nebola evolučná teória určená na identifikáciu biologického mechanizmu, ktorý vysvetľuje vzorce dedičnosti, zatiaľ čo Mendelovský prístup vyhlásil gén za mechanizmus dedičnosti.

Pearson kritizoval Batesona a ďalších biológov za to, že pri štúdiu evolúcie neprijali biometrické metódy. Odsúdil vedcov, ktorí sa nezamerali naštatistickú platnosť ich teórií s uvedením:

„Skôr ako prijmeme [akúkoľvek príčinu progresívnej zmeny] ako faktor, musíme nielen ukázať jej vierohodnosť, ale, ak je to možné, preukázať jej kvantitatívnu schopnosť.“

Biológovia podľahli „takmer metafyzickým špekuláciám o príčinách dedičnosti“, ktoré nahradili proces zbierania experimentálnych údajov, čo môže vedcom skutočne umožniť zúžiť potenciálne teórie.

štatistický mostík
štatistický mostík

Zákony prírody

Pre Pearsona boli zákony prírody užitočné na vytváranie presných predpovedí a na zhrnutie trendov v pozorovaných údajoch. Dôvodom bola skúsenosť, „že sa určitá sekvencia stala a opakovala v minulosti.“

Identifikácia konkrétneho mechanizmu genetiky teda nebola cenným úsilím pre biológov, ktorí by sa namiesto toho mali zamerať na matematické popisy empirických údajov. To čiastočne viedlo k ostrému sporu medzi biometristami a Mendeliánmi vrátane Batesona.

Po tom, čo Pearson odmietol jeden z Pearsonových rukopisov popisujúcich novú teóriu variácií alebo homotypií potomstva, založili Pearson a Weldon v roku 1902 spoločnosť Biometrika. Hoci biometrický prístup k dedičnosti nakoniec stratil svoju mendelovskú perspektívu, metódy, ktoré v tom čase vyvinuli, sú životne dôležité pre štúdium biológie a evolúcie dnes.

Odporúča: