Mašininis mokymasis praktikoje - kursas 41 500 rub. iš TVM mokymo centro, mokymai 24 val., Data 2023 m. lapkričio 26 d.
įvairenybės / / December 02, 2023
Kursas sudarytas iš kelių praktinių atvejų, kuriuose yra lentelės su pradiniais duomenimis.
Kiekvienu atveju išgyvename visą mašininio mokymosi projekto gyvavimo ciklą:
duomenų tyrimas, valymas ir paruošimas,
pasirenkant užduočiai tinkamą mokymo metodą (tiesinė regresija regresijai, atsitiktinis miškas klasifikavimui, K vidurkis ir DBSCAN klasterizavimui),
mokymas pasirinktu metodu,
rezultatų įvertinimas,
modelio optimizavimas,
rezultato pristatymas klientui.
Kurso diskusijų dalies metu aptariame studentams kylančias praktines problemas, kurias galima išspręsti taikant aptartus metodus.
Aptariamos temos:
1. Užduoties peržiūra (teorija – 1 val.)
Kokias problemas gerai išsprendžia mašininis mokymasis ir kokias jos bando išspręsti?
Kas atsitiks, jei vietoj duomenų mokslininko pasamdysite šios srities specialistą (tik kūrėją / analitiką / vadybininką), tikėdamiesi, kad jie išmoks.
2. Paruošimas, valymas, duomenų tyrimas (teorija – 1 val., praktika – 1 val.)
Kaip suprasti šaltinio verslo duomenis (ir apskritai aptikti bet kokią tvarką juose).
Apdorojimo seka.
Ką galima ir reikia deleguoti domenų analitikams, o ką geriausia padaryti pačiam duomenų mokslininkui.
Konkrečios problemos sprendimo prioritetai.
3. Klasifikatoriai ir regresoriai (teorija – 2 val., praktika – 2 val.)
Praktinė dalis – gerai įformintos užduotys su paruoštais duomenimis.
Skirtumas tarp užduočių (dvejetainė/nebinarinė/tikimybinė klasifikacija, regresija), užduočių perskirstymas tarp klasių.
Praktinių problemų klasifikavimo pavyzdžiai.
4. Klasterizavimas (teorija – 1 val., praktika – 2 val.)
Kur ir kaip atlikti klasterizavimą: duomenų tyrimas, problemos teiginio tikrinimas, rezultatų tikrinimas.
Kokius atvejus galima redukuoti į grupavimą.
5. Modelio vertinimas (teorija – 1 val., praktika – 1 val.)
Verslo metrika ir techninė metrika.
Klasifikavimo ir regresijos uždavinių metrika, klaidų matrica.
Vidinė ir išorinė klasterizacijos kokybės metrika.
Kryžminis patvirtinimas.
Perkvalifikavimo vertinimas.
6. Optimizavimas (teorija – 5 val., praktika – 3 val.)
Kuo vienas modelis geresnis už kitą: parametrai, savybės, ansambliai.
Nustatymų valdymas.
Funkcijų pasirinkimo praktika.
Įrankių, leidžiančių rasti geriausius parametrus, savybes ir metodus, apžvalga.
7. Diagramos, ataskaitos, darbas su gyvomis užduotimis (teorija – 2 val., praktika – 2 val.)
Kaip aiškiai paaiškinti, kas vyksta: sau, komandai, klientui.
Gražesnių atsakymų į beprasmius klausimus.
Kaip vienoje skaidrėje pateikti trijų terabaitų rezultatų.
Pusiau automatiniai testai, kurių proceso valdymo taškų tikrai reikia.
Nuo tiesioginių užduočių iki pilno MTEP proceso („MTEP praktikoje“) – auditorijos užduočių analizė ir analizė.