Atsitiktinis miškas - apžvalga, prognozių modeliavimas, pranašumai

Atsitiktinis miškas yra metodika, naudojama modeliuojant prognozes ir elgesio analizę, ir pagrįsta sprendimų medžiais. Jame yra daug sprendimų medžių, kurie atspindi aiškų duomenų, įvestų į atsitiktinį mišką, klasifikavimą. Atsitiktinėje miško technikoje individualiai atsižvelgiama į atvejus, pasirinkta prognozė yra ta, kuri turi daugumą balsų.

Atsitiktinis miškas 1 pav. Atsitiktinė miško struktūra (šaltinis)

Kiekvienas klasifikacijų medis ima duomenis iš pradinio duomenų rinkinio pavyzdžių. Po to atsitiktinai parenkamos savybės, kurios naudojamos auginant medį kiekviename mazge. Kiekvienas miško medis neturėtų būti genėtas iki pratimo pabaigos, kai prognozė bus pasiekta ryžtingai. Tokiu būdu atsitiktinis miškas leidžia bet kokiems silpnų koreliacijų klasifikatoriams sukurti tvirtą klasifikatorių.

Greita santrauka

  • Atsitiktinis miškas yra apsisprendimų medžių derinys, kurį galima modeliuoti prognozavimui ir elgesio analizei.
  • Sprendimo medžio miške negalima apkarpyti imant mėginius ir todėl pasirenkant prognozes.
  • Atsitiktinė miško technika gali apdoroti didelius duomenų rinkinius, nes ji gali dirbti su daugybe kintamųjų, siekiančių tūkstančius.

Numatymų modeliavimas

Atsitiktinio miško metodas gali sukurti prognozavimo modelius, naudojant atsitiktinius miško regresijos medžius, kurie paprastai nėra genimi, kad būtų galima pateikti tvirtas prognozes. Regresijos medžiuose naudojamas „bootstrap“ mėginių ėmimo metodas, kurio nereikėtų genėti. Optimalūs mazgai imami iš visų medžio mazgų, kad susidarytų optimali skilimo ypatybė.

Atsitiktinės atrankos technika, naudojama renkantis optimalų skilimo požymį, sumažina regresijos medžių koreliaciją, taigi ir dispersiją. Tai pagerina numatomų skirtingų medžių miške galimybes. Mėginių atranka naudojant bootstrap taip pat padidina atskirų medžių savarankiškumą.

Kintama svarba

Kintamieji (ypatybės) yra svarbūs atsitiktiniam miškui, nes iššūkis interpretuoti modelius, ypač biologiniu požiūriu. Naivus požiūris parodo kintamųjų svarbą, suteikdamas svarbą kintamajam pagal jo įtraukimo į imtį visų medžių dažnumą. Tai galima lengvai pasiekti, tačiau tai yra iššūkis, nes poveikis sąnaudų mažinimui ir tikslumo padidėjimui yra nereikalingas.

Permutacijos svarba yra matas, kuris seka prognozavimo tikslumą, kai kintamieji atsitiktinai permuojami iš ne maišelio pavyzdžių. Permutacijos svarbos metodas veikia geriau nei naivus, tačiau yra brangesnis.

Dėl atsitiktinio miško iššūkių, kurie negali pakankamai gerai interpretuoti prognozių iš biologinės perspektyvos, technika remiasi naivumu, vidutiniu priemaišų sumažėjimu ir permutacijos svarbos požiūriu, kad jie galėtų tiesiogiai interpretuoti iššūkius. Šie trys metodai palaiko prognozuojančius kintamuosius su keliomis kategorijomis.

Nuolatinių nuspėjamųjų kintamųjų su panašiu kategorijų skaičiumi atveju, tiek permutacijos svarbos, tiek vidutinio priemaišų sumažėjimo metodai neturi šališkumo. Duomenų gavybos šališkumas Duomenų gavybos šališkumas reiškia prielaidą, kad prekybininkas priskiria įvykiui. rinkoje iš tikrųjų buvo atsitiktinumo rezultatas arba nenumatytas. Kintamas pasirinkimas dažnai būna šališkas. Norint to išvengti, reikia imti mėginį be pakeitimo, o jei naudojamas sąlyginis išvada, reikia taikyti atsitiktinę miško metodiką.

Įstrižiniai atsitiktiniai miškai

Įstrižiniai atsitiktiniai miškai yra unikalūs tuo, kad sprendimuose naudoja įstrižus skilimus vietoje įprastų sprendimų padalijimų mazguose. Įstrižieji miškai rodo daug pranašumų, demonstruodami šias savybes.

Pirma, jie gali atskirti pasiskirstymus koordinačių ašyse, naudodami vieną daugialypį padalijimą, kuris apimtų įprastai reikalingus giliai ašimis išlygintus padalijimus. Antra, jie leidžia sumažinti šališkumą dėl sprendimų medžių dėl suplanuotų apribojimų. Skiriant panašias klases su įstrižais padalijimais, norint, kad būtų lengviau ir efektyviau naudoti įprastinius ašimis išlygintus padalijimus, reikėtų dar dviejų lizdų lygių.

Atsitiktinis miškų klasifikatorius

Atsitiktinis miško klasifikatorius yra prognozavimo medžių rinkinys, kuriame kiekvienas medis priklauso nuo atsitiktinių vektorių, atrinktų atskirai, panašaus pasiskirstymo kaip ir visi kiti atsitiktinio miško medžiai. Iš pradžių sukurtas mašininiam mokymuisi, klasifikatorius įgijo populiarumą nuotolinio stebėjimo bendruomenėje, kur dėl didelio tikslumo jis naudojamas nuotoliniu būdu aptiktų vaizdų klasifikacijoje. Tai taip pat pasiekia reikiamą greitį ir efektyvų parametrų nustatymą procese. Atsitiktinis miško klasifikatorius paleidžia atsitiktinius mėginius, kur parenkama prognozė, surinkusi didžiausią balsą iš visų medžių.

Medžių individualumas yra svarbus visame procese. Kiekvieno medžio individualumas garantuojamas dėl šių savybių. Pirma, kiekviename imties medžio mokyme naudojami atsitiktiniai pradinių mokymo pavyzdžių pogrupiai. Antra, optimalus skilimas parenkamas iš nenugenėtų medžių mazgų atsitiktinai parinktų ypatybių. Trečia, kiekvienas medis auga be ribų ir jo nereikia visiškai genėti.

Atsitiktinių miškų privalumai

Atsitiktiniai miškai pateikia kintamos svarbos įvertinimus, t. Y. Nervinius tinklus. Jie taip pat siūlo geresnį metodą dirbant su trūkstamais duomenimis. Trūkstamos reikšmės pakeičiamos tuo, kad kintamasis rodomas labiausiai tam tikrame mazge. Tarp visų galimų klasifikavimo metodų atsitiktiniai miškai užtikrina didžiausią tikslumą.

Atsitiktine miško technika taip pat galima apdoroti didelius duomenis su daugybe kintamųjų, kurių skaičius siekia tūkstančius. Jis gali automatiškai subalansuoti duomenų rinkinius, kai klasė yra retesnė nei kitų duomenų klasių. Šis metodas taip pat greitai valdo kintamuosius, todėl jis tinka sudėtingoms užduotims atlikti.

Daugiau išteklių

Finansai siūlo finansinio modeliavimo ir vertinimo analitikui (FMVA) ™ FMVA® atestaciją. Prisijunkite prie 350 600 ir daugiau studentų, dirbančių tokiose įmonėse kaip „Amazon“, J. P. Morganas ir „Ferrari“ sertifikavimo programa tiems, kurie nori pakelti savo karjerą į kitą lygį. Norėdami toliau mokytis ir plėtoti savo žinių bazę, ištirkite toliau nurodytus papildomus atitinkamus finansų išteklius:

  • Skerspjūvio duomenų analizė Skerspjūvio duomenų analizė Skerspjūvio duomenų analizė yra skerspjūvio duomenų rinkinių analizė. Apklausos ir vyriausybės įrašai yra keletas įprastų skerspjūvio duomenų šaltinių
  • Klasterių atranka Klasterių atranka Statistikoje klasterių atranka yra atrankos metodas, kai visa tyrimo populiacija yra suskirstyta į išoriškai homogeniškus, bet iš vidaus
  • Normalus pasiskirstymas Normalus pasiskirstymas Normalus pasiskirstymas taip pat vadinamas Gauso arba Gauso pasiskirstymu. Šis platinimo tipas plačiai naudojamas gamtos ir socialiniuose moksluose.
  • Roy's first-first kriterijus Roy's first-first kriterijus Roy's first-first kriterijus yra rizikos valdymo metodas, kurį investuotojai naudoja palygindami ir pasirinkdami portfelį pagal kriterijų, pagal kurį tikimybė

Naujausios žinutės

$config[zx-auto] not found$config[zx-overlay] not found