Tiesinė regresija - kursas 4900 rub. nuo Atviras mokymas, mokymai 5 savaites, apie 2 valandas per savaitę, Data 2023 m. lapkričio 29 d.
įvairenybės / / November 29, 2023
Jei koreliacinė analizė leidžia kiekybiškai įvertinti dviejų dydžių ryšio stiprumą ir kryptį, tai regresijos modelių konstravimas suteikia daugiau galimybių. Taikant regresinę analizę, galima kiekybiškai apibūdinti tiriamų dydžių elgseną priklausomai nuo prognozuojamųjų kintamųjų ir gauti naujų duomenų prognozes. Sužinosite, kaip kurti paprastus ir kelis linijinius modelius naudojant R kalbą. Kiekvienas metodas turi savo apribojimų, todėl padėsime suprasti, kokiose situacijose Tiesinė regresija gali būti naudojama ir negali būti naudojama, o mes išmokysime pasirinktų diagnostikos metodų modeliai. Ypatinga vieta kurse skirta giliai regresinės analizės anatomijai: įvaldysite operacijas su matricomis, kurios yra tiesinės regresijos pagrindas, kad būtų galima suprasti sudėtingesnes tiesinės atmainas modeliai.
Jei susiduriate su būtinybe ieškoti ir apibūdinti ryšius tarp tam tikrų reiškinių, kuriuos galima išmatuoti kiekybiškai, tada šis kursas yra gera proga suprasti, kaip veikia paprasta ir daugkartinė tiesinė regresija, sužinoti apie jų galimybes ir apribojimus metodus.
Kursas skirtas tiems, kurie jau yra susipažinę su pagrindiniais duomenų analizės metodais naudojant R kalbą ir sukūrus paprastus .html dokumentus naudojant rmarkdown ir knitr.
Moksliniai interesai: jūros bentoso bendrijų struktūra ir dinamika, erdviniai masteliai, sukcesija, tarprūšinis ir tarprūšinis biotinė sąveika, jūrų bestuburių augimas ir dauginimasis, demografinė populiacijų struktūra, mikroevoliucija, biostatistika.
Kursą sudaro 5 moduliai:
1. Koreliacinė analizė. Paprasta tiesinė regresija
Pradėsime pokalbį apie kiekybinių dydžių ryšių skaitinio apibūdinimo būdus su kovariacijos ir koreliacijos koeficientais, kurie leidžia įvertinti ryšio stiprumą ir kryptį. Tada sužinosite, kokią papildomą informaciją apie ryšius galima gauti sukūrus tiesinį dydžių santykio modelį. Išmoksite interpretuoti regresijos koeficientus ir sužinosite, kada ir kaip linijiniai modeliai gali būti naudojami naujiems duomenims prognozuoti. Šio modulio pabaigoje išmoksite pritaikyti tiesinio modelio lygtį ir nubraižyti ją su patikimumo sritimi.
2. Tiesinių modelių reikšmingumo ir pagrįstumo tikrinimas
Tiesinio modelio sudarymas ir jo lygties užrašymas yra tik pati analizės pradžia. Šiame modulyje išmoksite apibūdinti regresinės analizės rezultatus: kaip patikrinti bendro modelio ar jo koeficientų statistinį reikšmingumą ir įvertinti atitikimo kokybę. Tiesiniai modeliai (tiksliau, jiems naudojami statistiniai testai), kaip ir bet kuris metodas, turi savo apribojimų. Sužinosite, kas yra šie apribojimai ir iš kur jie atsiranda. Grafiniai diagnostikos metodai, kuriuos naudosime, yra universalūs skirtingiems linijiniams modeliams – daugiau praktikos padės priimti sprendimus užtikrinčiau. Kai visa tai suprasite, galite parašyti visą scenarijų R, kad pritaikytumėte, diagnozuotumėte ir pateiktumėte paprastos tiesinės regresijos rezultatus.
3. Trumpas įvadas į tiesinės algebros pasaulį
Šiame modulyje pasinersime į linijinių modelių esmę. Norėdami tai padaryti, turėsite išmokti arba prisiminti tiesinės algebros pagrindus. Aptarsime skirtingus matricų tipus, kaip jas sukurti R ir pagrindines operacijas su jomis. Viso to mums prireiks, kad suprastume, kaip tiesinė regresija veikia iš vidaus. Sužinosite, kas yra modelio matrica, išmoksite parašyti tiesinės regresijos lygtį matricų pavidalu ir rasti jos koeficientus. Savo akimis pamatysite skrybėlių matricą, leidžiančią gauti prognozuojamas reikšmes, ir netgi galėsite ją apskaičiuoti rankiniu būdu. Galiausiai išmoksite apskaičiuoti likutinę dispersiją, dispersijos-kovariacijos matricą ir visa tai panaudoti regresijos pasitikėjimo zonai sukurti. Tada šios žinios padės suprasti sudėtingesnių modelių struktūrą: su diskrečiais prognozėmis, su skirtingu likučių pasiskirstymu, su skirtinga variacijos-kovariacijos matricos struktūra.
4. Daugkartinė tiesinė regresija
Dažniausiai dydžių ryšiai yra sudėtingesni, nei galima apibūdinti naudojant paprastą tiesinę regresiją. Daugkartinė tiesinė regresija naudojama apibūdinti, kaip atsako kintamasis priklauso nuo kelių prognozių. Modelyje atsiradus keliems prognozuotojams, tiesinė regresija turi naują taikymo sąlygą – daugiakolineariškumo nebuvimo reikalavimą. Šiame modulyje išmoksite atpažinti daugiakolineariškumą ir jo išvengti. Galiausiai keliuose modeliuose dažnai yra daugiau kintamųjų, nei galima pavaizduoti plokštumoje, Štai kodėl mes išmokysime jus paprastų technikų, kurios padės sukurti informatyvią grafiką net ir šioje srityje atveju.
5. Linijinių modelių palyginimas
Keli linijiniai modeliai yra tarsi konstravimo rinkinys: sudėtingesnius modelius galima išardyti ir supaprastinti. Sužinosite, kaip įdėtųjų modelių palyginimai, naudojant dalinį F testą, naudojami atskirų prognozių ar numatymo priemonių grupių reikšmingumui patikrinti. Sudėtingesni modeliai geriau apibūdina pirminius duomenis, tačiau pernelyg sudėtinga yra pavojinga, nes tokie modeliai pradeda blogai prognozuoti naujus duomenis. Naudodami dalinius F testus galite supaprastinti modelius palaipsniui pašalindami nereikšmingus prognozes. Supaprastintus modelius lengviau interpretuoti ir pateikti rezultatus. Viską, ką iki šiol sužinojote apie tiesinę regresiją, galite pritaikyti užbaigę duomenų analizės projektą, kur jums reikia teisingai sukurti optimalų kelių tiesinį modelį ir pateikti jo rezultatus ataskaitoje, parašytoje naudojant rmarkdown ir knitr.