MLOps - norma 80 000 rub. iš Otus, mokymai 5 mėn., data 2023 m. lapkričio 30 d.
įvairenybės / / November 30, 2023
Įvaldysite visus reikiamus mašininio mokymosi įgūdžius, reikalingus duomenų srautiniam perdavimui ir paskirstytoms aplinkoms. Programa apima reikiamas žinias iš duomenų mokslo ir duomenų inžinerijos sričių, kurios leis apdoroti didelius duomenis ir rašyti paskirstytus algoritmus „Spark“.
Praktikuosite kiekvieną modulį atlikdami namų darbus. Mokymų pabaigoje turėsite baigiamąjį projektą, kuris leis apibendrinti visas įgytas žinias ir papildyti savo portfolio. Tai gali būti atliekama kaip duomenų rinkinio darbo užduočių dalis arba mokymosi projektas, pagrįstas OTUS pateiktais duomenimis.
Kam skirtas šis kursas?
Mašininio mokymosi specialistams arba programinės įrangos inžinieriams, norintiems išmokti dirbti su dideliais duomenimis. Paprastai tokios užduotys egzistuoja didelėse IT įmonėse, turinčiose didelio masto skaitmeninį produktą.
Duomenų mokslininkams, norintiems sustiprinti savo įgūdžius inžineriniais įgūdžiais. Kurso dėka galėsite apdoroti duomenis ir savarankiškai atvaizduoti ML sprendimų rezultatus gamyboje.
Norėdami išmokti, jums reikės pagrindinių duomenų mokslo įgūdžių. Siūlome pasižiūrėti OTUS pateiktus Map of Data Science kursus, kad sužinotumėte reikiamą mokymo lygį.
Tu išmoksi:
- Naudoti standartinius ML konvejerio įrankius paskirstytoje aplinkoje;
- Sukurkite savo blokus ML vamzdynams;
- Pritaikyti ML algoritmus paskirstytoms aplinkoms ir didelių duomenų įrankiams;
- Naudokite „Spark“, „SparkML“, „Spark Streaming“;
- Sukurti srautinio duomenų paruošimo mašininiam mokymuisi algoritmus;
- Užtikrinti kokybės kontrolę visuose ML sprendimų judėjimo į pramonę etapuose.
Specialistų paklausa
Įgūdžiai, kuriuos įvaldysite, yra kuo labiau pritaikyti ir perspektyvesni. Rinkoje atsiranda vis daugiau skaitmeninių produktų, kurių kūrimui reikia dirbti su dideliais duomenimis ir srautų apdorojimu. Jau dabar tokį įgūdžių telkinį ir tam tikrą darbo patirtį turintys specialistai gali pretenduoti į 270 tūkst. rublių Kita tendencija - mokymo ir patvirtinimo procesų automatizavimas, priešingai, tam tikru būdu nuvertina klasikinio duomenų mokslininko darbą. Viskas juda link taško, kai net nespecialistas gali atlikti tinkamumo prognozes. Todėl tie, kurie turi bent paviršutiniškų inžinerinių įgūdžių, jau yra aukščiausios kokybės.
Kurso ypatybės
Daug praktikos dirbant su duomenimis
Platus įgūdžių spektras nuo paskirstyto ML ir srauto duomenų apdorojimo iki gamybos išvesties
Šiuolaikiniai įrankiai ir technologijos: Scala, Spark, Python, Docker
Tiesioginis bendravimas su ekspertais per internetinius seminarus ir „Slack“ pokalbius
4
kursąDalyvauja duomenų mokslo komandos kūrime, kuri teikia funkcionalumą, pagrįstą įmonės gaminių ir paslaugų mašininiu mokymusi. Kaip duomenų mokslininkas, jis dalyvavo kuriant Kaspersky MLAD ir MDR AI Analyst. Į...
Dalyvauja duomenų mokslo komandos kūrime, kuri teikia funkcionalumą, pagrįstą įmonės gaminių ir paslaugų mašininiu mokymusi. Kaip duomenų mokslininkas, jis dalyvavo kuriant Kaspersky MLAD ir MDR AI Analyst. Kaip C++ kūrėjas dalyvavo kuriant MaxPatrol SIEM, daug metų moko dirbti kompiuteriu. mokslo disciplinas MSTU GA. Autorius ataskaitų serijos apie ML, C++, DS projektų valdymą ir vystymą komandos. PC konferencijos C++ Russia narys. Programos vadovas
8
kursaiDaugiau nei 20 metų patirtis vykdant individualius plėtros projektus IT srityje. Dešimtys sėkmingų projektų, įskaitant tuos, kurie vykdomi pagal vyriausybės sutartis. Patirtis kuriant ir diegiant ERP sistemas, atvirojo kodo sprendimus, palaikymą didelės apkrovos aplikacijoms. Kursų mokytojas...
Daugiau nei 20 metų patirtis vykdant individualius plėtros projektus IT srityje. Dešimtys sėkmingų projektų, įskaitant tuos, kurie vykdomi pagal vyriausybės sutartis. Patirtis kuriant ir diegiant ERP sistemas, atvirojo kodo sprendimus, palaikymą didelės apkrovos aplikacijoms. Kursų apie Linux, Kuber, MLOps, DataOps, SolutionArchitect, IaC, SRE dėstytojas, taip pat kurso HighLoad mentorius
1
geraiSpecialistas dirbant su dideliais duomenimis ir mašininiu mokymusi. 8 metus jis dirbo Odnoklassniki.ru. Vadovavo „OK Data Lab“ komandai (laboratorijai, skirta didžiųjų duomenų ir mašinų srities tyrinėtojams...
Specialistas dirbant su dideliais duomenimis ir mašininiu mokymusi. 8 metus jis dirbo Odnoklassniki.ru. Vadovavo „OK Data Lab“ komandai (didžiųjų duomenų ir mašininio mokymosi srities mokslininkų laboratorijai). Didžiųjų duomenų analizė Odnoklassniki tapo unikalia galimybe sujungti teorinį mokymą ir mokslinius pagrindus su realių paklausių produktų kūrimu. Nuo 2019 m. jis dirba „Sberbank“ generaliniu direktoriumi. Veikia kaip masinio personalizavimo skyriaus rekomendacijų sistemų platformos kūrimo klasterio vadovas. 2004 m. baigė Sankt Peterburgo valstybinį universitetą, kuriame 2007 m. apgynė formaliųjų loginių metodų mokslų daktaro laipsnį. Užsakomųjų paslaugų srityje dirbau beveik 9 metus, neprarasdamas ryšio su universitetu ir mokslo aplinka.
Pagrindinis kurso pradžios įvadas
-Tema 1. Gradiento nusileidimo ir linijiniai modeliai
-2 tema. Pagrindinių mašininio mokymosi metodų ir metrikų apžvalga
-3 tema. Darbo su duomenimis evoliucija
-4 tema.Scala programavimo pagrindai
Paskirstyto duomenų apdorojimo technologinis pagrindas
-5 tema. Paskirstytos failų sistemos
-6 tema. Išteklių valdytojai paskirstytose sistemose
-7 tema. Masiškai lygiagrečių ir paskirstytų skaičiavimo sistemų evoliucija
-8 tema. Apache Spark 1 pagrindai
-9 tema. Apache Spark 2 pagrindai
Paskirstyti ML pagrindai
-10 tema. ML algoritmų perkėlimas į paskirstytą aplinką
- Apache Spark tema 11.ML
-12 tema. Savo blokų, skirtų SparkML, kūrimas
-13 tema. Hiperparametrų ir AutoML optimizavimas
Srauto apdorojimas
-14 tema. Srautinio duomenų apdorojimas
-15 tema. Trečiųjų šalių bibliotekos, skirtos naudoti su „Spark“.
-Tema 16. Spark Streaming
-17 tema. Struktūrinis ir nuolatinis srautinis perdavimas „Spark“.
-18 tema. Alternatyvios transliacijos sistemos
Tikslų nustatymas ir rezultatų analizė
-19 tema. ML projekto tikslo nustatymas ir preliminari analizė
-20 tema. Ilgalaikiai ML tikslai, naudojant churn mažinimo užduoties pavyzdį
-Temos 21.A/B testavimas
-22 tema.Papildomos temos
ML rezultatų išvedimas į gamybą
-23 tema. ML sprendimų įvedimo į gamybą metodai
-24 tema. Versijų kūrimas, atkuriamumas ir stebėjimas
-25 tema. Modelių aptarnavimas internetu
-26 tema. Asinchroninio srautinio perdavimo ML ir ETL modeliai
-27 tema. Jei reikia Python
ML Python gamyboje
-28 tema. Gamybos kodas Python. Organizavimo ir pakavimo kodas
-29 tema. REST architektūra: Flask API
-30 tema. „Docker“: struktūra, taikymas, diegimas
-31 tema.Kubernetes, konteinerių orkestruotė
-32 tema. MLOPS įrankiai, skirti Kubernetes: KubeFlow, Seldon Core. Pramonės nevienalyčių sistemų veikimo ypatumai.
-33 tema.Amazon Sagemaker
-Tema 34.AWS ML paslauga
Išplėstinės temos
-35 tema. Neuroniniai tinklai
-36 tema. Paskirstytasis mokymasis ir neuroninių tinklų išvados
-37 tema. Gradiento didinimas ant medžių
-38 tema. Sustiprinimo mokymasis
Projektinis darbas
-39 tema. Temos parinkimas ir projektinio darbo organizavimas
-40 tema. Projektų ir namų darbų konsultavimas
-41 tema.Projektavimo darbų apsauga