„Boosting“ - apžvalga, formos, privalumai ir trūkumai, pasirinkimo medžiai

„Boosting“ yra algoritmas, padedantis sumažinti mašininio mokymosi ansamblio dispersiją ir šališkumą. Algoritmai Algoritmai (Algos) Algoritmai (Algos) yra instrukcijų rinkinys, įvestas užduočiai atlikti. Algoritmai yra įvedami siekiant automatizuoti prekybą, kad būtų gaunamas pelnas tokiu dažnumu, kurio neįmanoma parduoti prekybininkui, padeda silpnus besimokančiuosius paversti stipriais. derinant N besimokančiųjų skaičių.

Šaltinis: Sirakornas [CC BY-SA]

„Boosting“ taip pat gali pagerinti mokymosi algoritmų prognozes. Silpnus besimokančius asmenis nuosekliai taiso jų pirmtakai, o proceso metu jie paverčiami stipriais mokiniais.

„Boosting“ formos

Stiprinimas gali būti kelių formų, įskaitant:

1. Adaptyvus stiprinimas („Adaboost“)

„Adaboost“ siekia sujungti kelis silpnus besimokančius ir suformuoti vieną stiprų besimokantįjį. „Adaboost“ koncentruojasi į silpnus besimokančiuosius, kurie dažnai yra sprendimų medžiai, turintys tik vieną skilimą, ir paprastai vadinami sprendimo kelmais. Pirmojo sprendimo „Adaboost“ kelme yra stebėjimai, kurie įvertinami vienodai.

Ankstesnės klaidos ištaisomos, o bet kokiems pastebėjimams, kurie buvo klasifikuojami neteisingai, priskiriamas didesnis svoris nei kitiems pastebėjimams, kuriuose klasifikavimo klaidų nebuvo. „Adaboost“ algoritmai populiariai naudojami regresijos ir klasifikavimo procedūrose. Ankstesniuose modeliuose pastebėta klaida koreguojama pagal svorį, kol bus atliktas tikslus prognozavimas.

2. Gradiento stiprinimas

Gradiento didinimas, kaip ir bet kuri kita ansamblio mašininio mokymosi procedūra, nuosekliai papildo ansamblį nuspėjamaisiais elementais ir seka seką, koreguodama ankstesnius nuspėjamuosius, kad procedūros pabaigoje būtų pasiektas tikslus numatiklis. „Adaboost“ ištaiso savo ankstesnes klaidas, sureguliuodama kiekvieno neteisingo stebėjimo svorį kiekvienoje iteracijoje, tačiau gradiento didinimo tikslas yra pritaikyti naują prognozę likutinėse klaidose, kurias padarė ankstesnis prognozuotojas.

Gradiento pakėlimas naudoja nusileidimą gradientu, kad tiksliai nustatytų iššūkius anksčiau naudotose mokinių prognozėse. Ankstesnė klaida yra išryškinta ir, sujungus vieną silpną besimokantįjį su kitu besimokančiuoju, laikui bėgant klaida žymiai sumažėja.

3. „XGBoost“ (ypatingas gradiento stiprinimas)

„XGBoostimg“ įgyvendina sprendimų medžius su padidintu nuolydžiu, pagerintu našumu ir greičiu. Dėl gradiento padidintų mašinų diegimas yra gana lėtas dėl modelio mokymo, kuris turi atitikti seką. Todėl jiems trūksta mastelio. Mastelio mastelis gali sumažėti tiek finansinėje, tiek verslo strategijoje. Abiem atvejais tai reiškia subjekto sugebėjimą atlaikyti spaudimą dėl jų lėtumo.

„XGBoost“ priklauso nuo modelio našumo ir skaičiavimo greičio. Tai suteikia įvairių pranašumų, tokių kaip lygiagretinimas, paskirstytasis skaičiavimas, talpyklos optimizavimas ir ne pagrindinė kompiuterija.

„XGBoost“ leidžia lygiagrečiai statyti medžius, treniruočių metu naudojant procesoriaus šerdis. Jis taip pat platina skaičiavimus, kai moko didelius modelius, naudodamas mašinų grupes. Išorinis skaičiavimas naudojamas didesniems duomenų rinkiniams, kurie netelpa į įprastą atminties dydį. Talpyklos optimizavimas taip pat naudojamas algoritmams ir duomenų struktūroms optimizuoti turimos aparatūros naudojimą.

Privalumai ir trūkumai

Kaip ansamblio modelį, skatinimas yra lengvai skaitomas ir interpretuojamas algoritmas, todėl jo prognozavimo interpretacijas lengva valdyti. Prognozavimo galimybė yra efektyvi naudojant klonavimo metodus, pvz., „Maišelių maišavimas“ („Bootstrap Aggregation“). Mašinų mokymąsi mašinose daugiausia galima suskirstyti į maišus ir padidinimą. Maišavimo technika yra naudinga ir regresijos, ir statistiniams ar atsitiktiniams miškams, ir sprendimų medžiams. „Boosting“ yra atsparus metodas, kuris lengvai sutramdo per daug pritaikomą.

Vienas iš skatinimo trūkumų yra tai, kad jis yra jautrus pašaliniams rodikliams, nes kiekvienas klasifikatorius privalo ištaisyti pirmtakų klaidas. Taigi metodas yra pernelyg priklausomas nuo pašalinių. Kitas trūkumas yra tas, kad metodo beveik neįmanoma išplėsti. Taip yra todėl, kad kiekvienas vertintojas savo teisingumą grindžia ankstesniais prognozuotojais, todėl procedūrą sunku supaprastinti.

Kas yra pasirinkimo medžiai?

Variantiniai medžiai yra sprendimų medžių pakaitalai. Jie atstovauja ansamblių klasifikatoriams, tuo pačiu išvesti vieną struktūrą. Skirtumas tarp pasirinkimo medžių ir sprendimų medžių yra tas, kad pirmasis apima ir pasirinkimo, ir sprendimo mazgus, o antrasis - tik sprendimo mazgus.

Klasifikuojant egzempliorių reikia jį filtruoti žemyn per medį. Norint pasirinkti vieną iš šakų, reikalingas sprendimo mazgas, o norint pasirinkti visą šakų grupę, reikalingas pasirinkimo mazgas. Tai reiškia, kad naudojant pasirinkimo mazgą gaunami keli lapai, kuriuos reikės sujungti į vieną klasifikaciją, kad būtų galima numatyti. Todėl procese reikia balsuoti, kai balsų dauguma reiškia, kad mazgas buvo pasirinktas kaip šio proceso prognozė.

Pirmiau pateiktas procesas aiškiai rodo, kad pasirinkimo mazgai neturėtų turėti dviejų variantų, nes jie praras balsą, jei negalės rasti konkretaus nugalėtojo. Kita galimybė yra tikimybės vidurkio paėmimas iš įvairių kelių, taikant tokius metodus kaip Bayeso metodas ar nesvertinis vidurkių metodas.

Variantų medžiai taip pat gali būti kuriami modifikuojant esamus sprendimų medžio besimokančiuosius arba sukuriant pasirinkimo mazgą, kuriame yra susieti keli padalijimai. Kiekvienas sprendimų medis, viršijantis leistiną tolerancijos lygį, gali būti paverstas pasirinkimo medžiais.

Daugiau išteklių

Finansai yra oficialus sertifikuoto bankų ir kreditų analitiko (CBCA) ™ CBCA ™ sertifikavimo teikėjas. Sertifikuoto bankų ir kreditų analitiko (CBCA) ™ akreditacija yra pasaulinis kredito analitikų standartas, apimantis finansus, apskaitą, kredito analizę, pinigų srautų analizę sandoros modeliavimas, paskolos grąžinimas ir kt. sertifikavimo programa, skirta visiems paversti pasaulinio lygio finansų analitikais.

Norėdami toliau mokytis ir tobulinti savo žinias apie finansinę analizę, labai rekomenduojame toliau pateiktus papildomus finansų išteklius:

„Fintech“ (finansinės technologijos) „Fintech“ (finansinės technologijos) Terminas „fintech“ reiškia finansų ir technologijų sinergiją, kuri naudojama verslo veiklai ir finansinių paslaugų teikimui gerinti.
Kiekybiniai finansai Kiekybiniai finansai Kiekybiniai finansai yra matematinių modelių ir ypač didelių duomenų rinkinių naudojimas analizuojant finansų rinkas ir vertybinius popierius. Dažniausi pavyzdžiai: 1) išvestinių vertybinių popierių, tokių kaip pasirinkimo sandoriai, kainodara ir 2) rizikos valdymas, ypač susijęs su portfelio valdymu
Spoofing Spoofing Spoofing yra trikdanti algoritminė prekybos praktika, apimanti siūlymus pirkti ar siūlyti parduoti ateities sandorius ir atšaukti pasiūlymus ar pasiūlymus prieš sandorio vykdymą. Šia praktika ketinama sukurti klaidingą paklausos vaizdą arba klaidingą pesimizmą rinkoje.
Programinės įrangos inžinieriaus atlyginimų vadovas Programinės įrangos inžinieriaus atlyginimų vadovas Šiame programinės įrangos inžinieriaus atlyginimų vadove apžvelgiame keletą programinės įrangos inžinieriaus darbo vietų ir jų atitinkamas 2018 m. Vidutines algas. kompiuteriuose naudojamos programinės įrangos testavimas ir vertinimas