Maskinlæring på big data – gratis kurs fra Open Education, opplæring 5 uker, fra 5 til 14 timer per uke, Dato: 3. desember 2023.
Miscellanea / / December 08, 2023
Stilling: Crowd Solution Architect, Neatsy, Inc.
Begynte å jobbe ved Higher School of Economics i 2017. Hun underviser i kurs i digital kompetanse, tekstanalyse og verktøy og teknikker for å arbeide med store mengder tekstinformasjon. Faglige interesser: big data-analyse Utdanning 2018 Bachelorgrad: National Research University Higher School of Economics, spesialitet "Anvendt matematikk og informatikk"
1. Forberede data for trening
I dag fungerer maskinlæring effektivt når vi har store mengder merkede data. Denne uken skal vi se på hvilke dataformater og markering som finnes og hvordan denne markeringen kan samles inn
2. Trening av klassiske modeller på big data
Denne uken lærer vi hvordan du trener klassiske algoritmer (lineære modeller og beslutningstrær) på big data.
3. Byggeanbefalingssystemer
Vi skal se på hvordan vi kan parallellisere klassiske algoritmer som brukes i anbefalingssystemer.
4. Analyse av store mengder tekstinformasjon
La oss vurdere maskinlæringsproblemer på tekster. La oss snakke om tekstforbehandling, og hvordan man får en strukturert representasjon av tekstdata ved hjelp av modeller som word2vec og BERT.
5. Trening av dype nevrale nettverk
Vi vil lære hvordan man kan parallellisere trening av moderne nevrale nettverk, hvordan Horovod og Parameter Server fungerer inne, og snakke om Transfer Learning.