Mašininis mokymasis naudojant didžiuosius duomenis – nemokamas Open Education kursas, mokymas 5 savaites, nuo 5 iki 14 valandų per savaitę, Data: 2023 m. gruodžio 3 d.
įvairenybės / / December 08, 2023
Pareigos: Crowd Solution Architect, Neatsy, Inc.
Aukštojoje ekonomikos mokykloje pradėjo dirbti 2017 m. Ji dėsto skaitmeninio raštingumo, teksto analizės ir įrankių bei metodų, skirtų darbui su dideliais tekstinės informacijos kiekiais, kursus. Profesiniai pomėgiai: didžiųjų duomenų analizė Išsilavinimas 2018 Bakalauro laipsnis: Nacionalinis tyrimų universitetas Aukštoji ekonomikos mokykla, specialybė „Taikomoji matematika ir informatika“
1. Duomenų paruošimas mokymui
Šiandien mašininis mokymasis veikia efektyviai, kai turime daug pažymėtų duomenų. Šią savaitę apžvelgsime, kokie duomenų formatai ir žymėjimas egzistuoja ir kaip galima rinkti šį žymėjimą
2. Klasikinių modelių mokymas apie didelius duomenis
Šią savaitę išmoksime treniruoti klasikinius algoritmus (tiesinius modelius ir sprendimų medžius) naudojant didelius duomenis.
3. Rekomenduojamųjų sistemų kūrimas
Pažiūrėsime, kaip galime lygiagretinti klasikinius rekomendacijų sistemose naudojamus algoritmus.
4. Didelės apimties tekstinės informacijos analizė
Panagrinėkime mašininio mokymosi tekstuose problemas. Pakalbėkime apie išankstinį teksto apdorojimą ir kaip gauti struktūrizuotą teksto duomenų atvaizdavimą naudojant tokius modelius kaip word2vec ir BERT.
5. Giliųjų neuroninių tinklų mokymas
Sužinosime, kaip lygiagretinti šiuolaikinių neuroninių tinklų mokymą, kaip viduje veikia Horovod ir Parameter Server, kalbėsime apie mokymąsi „Transfer Learning“.