Apibendrinti linijiniai modeliai - kursas 3600 rub. nuo Atviras mokymas, mokymai 3 savaites, apie 6 valandas per savaitę, Data 2023 m. lapkričio 29 d.
įvairenybės / / December 01, 2023
Viena iš įprastų tiesinių modelių pritaikymo sąlygų yra stebėjimų nepriklausomumas vienas nuo kito, kuriais remiantis parenkamas modelis. Tačiau praktikoje dažnai pasitaiko situacijų, kai medžiagų surinkimo dizainas yra toks, kad šios sąlygos pažeidimas yra neišvengiamas. Įsivaizduokite, kad nusprendėte sukurti modelį, apibūdinantį ryšį tarp fizinio lavinimo rezultatų ir mokinių IQ testų rezultatų. Norėdami išspręsti šią problemą, keliose institucijose padarėte daugybę pavyzdžių. Ar įmanoma tokius duomenis sujungti į vieną analizę, pastatytą pagal tradicinę schemą? Žinoma ne. Kiekvieno universiteto studentai kai kuriais atžvilgiais gali būti panašūs vienas į kitą. Netgi santykio tarp tiriamų dydžių pobūdis gali būti kiek kitoks. Šio tipo duomenys, kuriuose yra grupės viduje koreliacijos, turėtų būti analizuojami naudojant linijinius mišrius modelius. Parodysime, kad kai kurie prognozuotojai turėtų būti įtraukti į modelį kaip vadinamieji „atsitiktiniai veiksniai“. Sužinosite, kad atsitiktiniai veiksniai gali būti hierarchiškai subordinuoti. Aptarsime, kaip tokius mišrius modelius galima sukurti priklausomiems kintamiesiems, kurie atitinka skirtingus skirstymo tipus. Be to, parodysime, kad atsitiktinė modelio dalis gali būti dar sudėtingesnė – ji gali turėti komponentą, kuris modeliuoja dispersijos elgesį, reaguojant į kovariato įtaką. Kurso pabaigoje rasite projektą, kuriame galėsite praktikuotis kuriant mišrius modelius pasirinkę vieną iš kelių duomenų rinkinių. Remdamiesi šių duomenų analize, galite sukurti ataskaitą pagal atkuriamo tyrimo tradiciją.
Sankt Peterburgo valstybinio universiteto Biologijos fakulteto bestuburių zoologijos katedros docentas, mokslų daktaras.
Moksliniai interesai: jūros bentoso bendrijų struktūra ir dinamika, erdviniai masteliai, sukcesija, tarprūšinis ir tarprūšinis biotinė sąveika, jūrų bestuburių augimas ir dauginimasis, demografinė populiacijų struktūra, mikroevoliucija, biostatistika.
Kursą sudaro 4 moduliai:
1) Įvadas į apibendrintus tiesinius modelius
Apibendrinti tiesiniai modeliai (GLM) leidžia modeliuoti dydžių, kurie neatitinka normalaus pasiskirstymo, elgesį. Kad jūsų pirmieji žingsniai GLM pasaulyje būtų lengvesni, išanalizuosime jų struktūrą pagal GLM pavyzdį normaliai paskirstytiems dydžiams – taip galėsite nubrėžti paraleles su paprastais tiesiniais modeliais. Sužinosite, kas yra nuorodos funkcija, kaip veikia didžiausia tikimybė ir kaip patikrinti GLM hipotezes naudojant Wald testus ir tikimybių santykio testus.
2) Modelio pasirinkimo problema
Šiame modulyje kalbėsime apie metodinius klausimus, susijusius su pastatų modeliais. Modelis yra supaprastintas tikrovės vaizdavimas, o pasirinkimas tarp skirtingų konkuruojančių tokio supaprastinimo metodų yra dažna analitiko užduotis. Šiame modulyje išmoksite palyginti modelius pagal informacinius kriterijus. Aptarsime pagrindinius analizės variantus renkantis modelius ir pakalbėsime apie sunkumus, kylančius dėl paslėptos modelių įvairovės. Galiausiai išmokysime atpažinti pagrindinius modelių pasirinkimo piktnaudžiavimo tipus (duomenų žvejyba, p-hacking).
3) Apibendrinti tiesiniai modeliai duomenims skaičiuoti
Šiame modulyje aptarsime pagrindinius skaičiuojamų dydžių modeliavimo metodus. Pirmiausia aptarsime, kodėl įprasti linijiniai modeliai netinka duomenims skaičiuoti. Suskaičiuojamų paskirstymų savybės padės suprasti skirtumus tarp skaičiuojamų duomenų GLM tipų ir jų diagnostikos ypatybių. Pamatysite veikiančią nuorodos funkciją, kai vizualizuosite GLM prognozes susiejimo funkcijos skalėje ir atsako kintamojo skalėje.
4) Apibendrinti tiesiniai modeliai su dvejetainiu atsaku
Kartais reikia imituoti, ar įvyko koks nors įvykis, ar ne futbolo komanda ar prarado, ar pacientas pasveiko po gydymo, ar ne, ar klientas įsipareigojo pirkti ar ne. Įprasti tiesiniai modeliai netinka tokiems dvejetainiams duomenims (įvykiams su dviem baigtimis) modeliuoti, tačiau tai galima nesunkiai padaryti naudojant apibendrintus tiesinius modelius. Šiame modulyje išmoksite modeliuoti įvykių tikimybes, pateikdami jas kaip šansus. Pažiūrėsime, kaip veikia logit link funkcija ir kaip ją naudojant interpretuojami GLM koeficientai. Galiausiai galėsite praktiškai analizuoti apibendrintus tiesinius modelius su skirtingais skirstiniais, atlikdami duomenų analizės projektą. Šios analizės rezultatai turės būti pateikti kaip ataskaita html formatu, parašyta naudojant rmarkdown/knitr.
• Sužinokite, kokių įgūdžių reikia norint pradėti dirbti su analize ir duomenų mokslu. • Išmokite dirbti su Excel, SQL, Power BI, „Google Data Studio“ duomenis ir parašykite savo pirmąjį kodą programoje Python• Gaukite nuoseklų vadovą ir sužinokite, kaip įeiti į duomenų mokslo sritį ir pasirinkti vaidmenį duomenų moksle
4,4
1 490 ₽