Neparametrinė statistika yra metodas, leidžiantis daryti statistinę išvadą neatsižvelgiant į pagrindinį pasiskirstymą. Metodas tinka normaliam skirstiniui be jokių prielaidų. Įprastai, taikant metodą, naudojami duomenys, kurie dažnai yra eilės eilės duomenys. Statistikoje eiliniai duomenys yra duomenų tipas, kuriame reikšmės eina natūralia tvarka. Viena žymiausių eilinių duomenų savybių yra ta, kad ji remiasi reitingais, o ne skaičiais.
Neparametrinę statistiką galima palyginti su parametrine statistika. Pastarasis metodas daro aiškias prielaidas apie stebimų duomenų pasiskirstymą ir įvertina pasiskirstymo parametrus naudodamas tuos pačius duomenis.
Santrauka
- Neparametrinė statistika yra metodas, neatsižvelgiant į bet kokį pagrindinį pasiskirstymą darant statistinę išvadą.
- Neparametriniais statistiniais metodais siekiama surasti nežinomą stebimų duomenų pagrindinį pasiskirstymą, taip pat padaryti statistinę išvadą, kai nėra pagrindinio pasiskirstymo.
- Tyrėjams patariama atsižvelgti į neparametrinės statistikos silpnybes, stipriąsias puses ir galimas kliūtis.
Suprasti neparametrinę statistiką
Apsvarstykite duomenis su nežinomais parametrais µ (vidurkis) ir σ2 (dispersija). Nors parametrinė statistika daro prielaidą, kad duomenys buvo gauti iš normalaus pasiskirstymo Normalus pasiskirstymas Normalus pasiskirstymas taip pat vadinamas Gauso arba Gauso pasiskirstymu. Šis platinimo tipas plačiai naudojamas gamtos ir socialiniuose moksluose. Neparametrinė statistika nemano, kad duomenys yra paprastai paskirstyti arba kiekybiniai. Šiuo atžvilgiu ne parametriška statistika būtų įvertinta pati pasiskirstymo forma, o ne individualus µ ir σ2.
Kita vertus, parametrinei statistikai būtų naudojamas imties vidurkis ir imties standartinis nuokrypis, kad būtų galima įvertinti atitinkamai µ ir σ2 vertes. Neparametrinės statistikos modelio struktūra yra išvedama iš stebėtų duomenų, priešingai nei nurodyta a priori. Pats parametras pats parametras reiškia, kad parametrų skaičius ir pobūdis yra lankstus, o ne tai, kad jiems visiškai trūksta parametrų.
Parametrinės statistikos tipai
Yra du pagrindiniai neparametrinių statistinių metodų tipai. Pirmuoju metodu siekiama atrasti nežinomą stebimų duomenų pagrindinį pasiskirstymą, o antruoju metodu bandoma padaryti statistinę išvadą nepaisant pagrindinio paskirstymo.
Branduolio metodai ir histogramos Histograma Diskretiems ar tęstiniams duomenims apibendrinti naudojama histograma. Kitaip tariant, histograma suteikia vaizdinę skaitinių duomenų interpretaciją, parodant duomenų taškų, patenkančių į nurodytą reikšmių diapazoną (vadinamą „šiukšliadėžėmis“), skaičių. Histograma yra panaši į vertikalios juostos diagramą. Tačiau norint nustatyti parametrų vertes pagal pirmą metodą, paprastai naudojama histograma. Priešingai, pastarasis metodas apima hipotezių tikrinimą be faktinių duomenų reikšmių, o labiau pagrįstą duomenų eiliškumu.
Parametriniai statistikos testai paprastai yra lengviau taikomi nei parametriniai, atsižvelgiant į tai, kad nėra populiacijos parametrų prielaidų. Standartinės matematinės hipotezių testavimo procedūros nedaro prielaidų apie tikimybių pasiskirstymą - įskaitant paskirstymo t testus, ženklų testus ir vienos populiacijos išvadas.
Pavyzdžiui, tikrindami hipotezę, kad „yra medianų skirtumas“, du atsitiktiniai kintamieji, X ir Y, apibrėžia du ištisinius pasiskirstymus tarp to, kur atliekama hipotezė, ir sudaromi suporuoti mėginiai. Be bendro pritaikomumo, testui taip pat trūksta kitų testų statistinės galios, atsižvelgiant į tai, kad jis veikia pagal kelias prielaidas.
Parametrinės statistikos pavyzdžiai
Tarkime, kad tyrėjas yra suinteresuotas įvertinti gelta sergančių kūdikių skaičių Kalifornijos valstijoje. Duomenų rinkinio analizė gali būti atliekama imant 5000 kūdikių mėginį. Apskaičiuota visa kitais metais gimusių kūdikių populiacija, gimusi kitais metais.
Antruoju atveju apsvarstykite dvi skirtingų tyrėjų grupes. Jiems įdomu žinoti, ar bendra rinkodara, ar komercinė rinkodara yra siejama su tuo, kaip greitai įmonė įgyja prekės ženklo pozicijas. Darant prielaidą, kad imties dydis pasirenkamas atsitiktinai, jo pasiskirstymas atsižvelgiant į tai, kaip greitai įmonė realizuoja prekės ženklo pozicionavimą Rinkos pozicionavimas Rinkos pozicionavimas reiškia gebėjimą paveikti vartotojų suvokimą apie prekės ženklą ar produktą, palyginti su konkurentais. Galima manyti, kad rinkos tikslas yra normalus. Nepaisant to, negalima daryti prielaidos, kad eksperimentas, įvertinantis įmonės strateginius tikslus rinkos dinamikai spręsti (kuris taip pat lemia prekės ženklo pozicionavimą), įgauna normalų paskirstymą.
Pagrindinė šio reiškinio mintis yra ta, kad atsitiktinai atrinktuose duomenyse gali būti tokių veiksnių kaip rinkos dinamika. Kitu kraštutinumu, jei atsiras tokių veiksnių kaip rinkos segmentas ir konkurencija, įmonės strateginiai tikslai greičiausiai neturės įtakos imties dydžiui. Toks požiūris yra veiksmingas, kai duomenys nėra aiškūs skaitiniu aiškinimu.
Pavyzdžiui, bandymai, ar klientai teikia pirmenybę tam tikram produktui dėl jo maistinės vertės, gali apimti jo rodiklių eiliškumą, kai visiškai sutinkate, sutinkate, abejingi, nesutinkate ir visiškai nesutinkate. Esant tokiam scenarijui, naudingas ne parametras.
Pagrindiniai išsinešimai
Naudojant neparametrinius statistikos metodus atliekant tyrimus, reikia atidžiai įvertinti jo silpnybes, stipriąsias puses ir galimas duobes. Tiesa, kad skirstant duomenis, kai kurtosis ar iškrypimas yra per didelis; rangu pagrįsti neparametriniai bandymai yra veiksmingesni už parametrinius testus.
Nepaisant to, ne visi atvejai, kai, neatsižvelgiant į parametrines prielaidas, mes naudojame ne parametrinę statistiką kaip pakaitinius metodus dėl palyginti mažo pasitikėjimo laipsnio, gauto iš ankstesnės statistikos.
Neparametrinė statistika vertinama, nes ją galima lengvai pritaikyti. Duomenys tampa labiau pritaikomi atliekant įvairius bandymus, nes parametrai nėra privalomi. Dar svarbiau tai, kad statistiką galima naudoti neturint svarbios informacijos, tokios kaip vidurkis, standartinis nuokrypis ar imties dydis. Dėl savybių neparametrinė statistika turi platesnę taikymo sritį, palyginti su parametrine statistika.
Papildomi resursai
Finansai yra oficialus pasaulinio sertifikuoto bankų ir kreditų analitiko (CBCA) ™ CBCA ™ sertifikavimo teikėjas. Atestuota bankų ir kreditų analitikų (CBCA) ™ akreditacija yra pasaulinis kredito analitikų standartas, apimantis finansus, apskaitą, kredito analizę, pinigų srautų analizę. , sandorio modeliavimas, paskolos grąžinimas ir kt. sertifikavimo programa, skirta padėti visiems tapti pasaulinio lygio finansų analitikais. Norėdami toliau siekti karjeros, naudingi toliau nurodyti papildomi finansų ištekliai:
- Finansų pagrindinės statistikos sąvokos Pagrindinės finansų statistikos sąvokos Tvirtas statistikos supratimas yra nepaprastai svarbus, kad padėtų mums geriau suprasti finansus. Be to, statistikos sąvokos gali padėti investuotojams stebėti
- Hipotezių tikrinimas Hipotezių testavimas Hipotezių tikrinimas yra statistinės išvados metodas. Jis naudojamas norint patikrinti, ar teiginys apie populiacijos parametrą yra teisingas. Hipotezės bandymas
- Nominalūs duomenys Nominalūs duomenys Statistikoje nominalūs duomenys (taip pat žinomi kaip nominali skalė) yra duomenų rūšis, naudojama kintamiesiems žymėti nepateikiant jokios kiekybinės vertės
- Neparametriniai testai. Neparametriniai bandymai. Statistikoje ne parametrai yra statistinės analizės metodai, kuriems nereikia paskirstymo, kad būtų įvykdytos būtinos analizuojamos prielaidos.