Pārlekt uz galveno saturu

Statistiskā programmēšana un datu pārvaldība

Studiju kursa apraksts

Kursa apraksta statuss:Apstiprināts
Kursa apraksta versija:5.00
Kursa apraksta apstiprināšanas datums:04.09.2023 14:59:47
Par studiju kursu
Kursa kods:SL_108LKI līmenis:7. līmenis
Kredītpunkti:4.00ECTS:6.00
Zinātnes nozare:Matemātika; Varbūtību teorija un matemātiskā statistikaMērķauditorija:Dzīvās dabas zinātnes
Studiju kursa vadītājs
Kursa vadītājs:Andrejs Ivanovs
Studiju kursa īstenotājs
Struktūrvienība:Statistikas mācību laboratorija
Struktūrvienības vadītājs:
Kontaktinformācija:Kapseļu iela 23, 2.stāvs, Rīga, statistikaatrsu[pnkts]lv, +371 67060897
Studiju kursa plānojums
Pilns laiks - 1. semestris
Lekcijas (skaits)12Lekciju ilgums (akadēmiskās stundas)2Kopā lekciju kontaktstundas24
Nodarbības (skaits)12Nodarbību ilgums (akadēmiskās stundas)2Kopā nodarbību kontaktstundas24
Kopā kontaktstundas48
Nepilns laiks - 1. semestris
Lekcijas (skaits)12Lekciju ilgums (akadēmiskās stundas)1Kopā lekciju kontaktstundas12
Nodarbības (skaits)12Nodarbību ilgums (akadēmiskās stundas)2Kopā nodarbību kontaktstundas24
Kopā kontaktstundas36
Studiju kursa apraksts
Priekšzināšanas:
Īpašas priekšzināšanas netiek prasītas, taču kursā būs nepieciešamas datorprasmes un vidusskolas līmeņa algebras zināšanas un tiks izmantoti statistikas jēdzieni.
Mērķis:
Datu analīzes un pārvaldības prasmes ir ļoti svarīgas mūsdienu lietišķajos statistikas pētījumos. Kursa mērķis ir iepazīstināt studentus ar statistikas programmatūras rīkiem, ko izmanto biostatistikas pētījumos: „R” un „Jamovi”. Tādējādi kursa mērķi ir: • iepazīstināt studējošos ar statistisko programmēšanu un datu pārvaldību, izmantojot „R” un „Jamovi” statistikas programmatūru; • sagatavot studējošos darbam ar datoru citos studiju programmas „Biostatistika” kursos.
Tēmu saraksts (pilna laika studijas)
Nr.TēmaĪstenošanas formaSkaitsNorises vieta
1Ievads „R” valodā un „R Studio”. Saskarne, darbplūsma, skripti un kodēšanas pamati. Ievads datu vizualizācijā ar „ggplot”: estētiskās attēlošanas, ģeometriskie objekti un statistiskās transformācijas.Lekcijas1.00datorklase
2Praktisks darbs ar „R” saskarni. Atbildes uz vienkāršiem jautājumiem par datiem, veidojot iebūvēto „R” datu kopu „ggplot2” vizualizācijas.Nodarbības1.00datorklase
3Ievads datu konvertēšanā (pārveidē) ar „dplyr” pakotni: filtrēšana, kārtošana, atlase, jaunu mainīgo izveide un apkopošana. Iepazīstināšana ar „R” projektu darbplūsmu.Lekcijas1.00datorklase
4Dažādas datu transformācijas ar „R” „dplyr” pakotni „R” iebūvētajās datu kopās.Nodarbības1.00datorklase
5Pētnieciskā datu analīze: variācijas un kovariācijas novērtēšana. Statistiskie kopsavilkumi ar kastveida diagrammām. Dažāda veida datu nolasīšana „R”.Lekcijas1.00datorklase
6Praktiska pētnieciskā datu analīze „R”: datu variācija (joslu diagrammas, histogrammas, kastveida diagrammas) un kovariācija (vizualizējot divu mainīgo attiecības). Praktisks darbs ar „readr” pakotni datu lasīšanai.Nodarbības1.00datorklase
7Datu konsekventas organizēšanas principi „R” ar „tidyr” pakotni: datu kopu vākšana un izplatīšana, darbs ar trūkstošām vērtībām. Iepazīšanās ar „R Markdown” atskaišu sistēmu, dažādiem „Markdown” formātiem un matemātisko simbolu rakstīšanas principiem.Lekcijas1.00datorklase
8Reālas datu kopas importēšana un kārtošana. „R Markdown” pārskata sagatavošana.Nodarbības1.00datorklase
9Ievads datu pārvaldībā „R”. Relāciju datu principi: relācijas, atslēgas, savienojumi un piešķiršanas operācijas. Daži izplatīti neskaitlisku mainīgo veidi „R”. Vienlaicīgu operāciju organizēšana ar programmkanāliem.Lekcijas1.00datorklase
10Relāciju datu (t.i., multiplu tabulu) pārvaldība ar „dplyr”. Praktisks darbs ar neskaitlisku mainīgo tipiem „R”: koeficienti, virknes, datumi.Nodarbības1.00datorklase
11Padziļināta „R” programmēšana: savu „R” funkciju rakstīšana, funkciju vektorizācija, izpilde ar nosacījumiem (ja / citādi priekšraksti), cikliem un kartes funkcijām.Lekcijas1.00datorklase
12Funkciju rakstīšanas un programmēšanas elementu vingrinājumi.Nodarbības1.00datorklase
13Datu sagatavošanas pirmais etaps. Datu strukturēšana un sagatavošana „Jamovi” programmai.Lekcijas1.00datorklase
14Praktiskā nodarbība datu strukturēšanā.Nodarbības1.00datorklase
15Datu sagatavošana otrais etaps. Datu attīrīšana, jauno mainīgo radīšana un transformēšana.Lekcijas1.00datorklase
16Praktiskā nodarbība: datu attīrīšana un jauno mainīgo radīšana.Nodarbības1.00datorklase
17Iepazīšanās ar Power Query.Lekcijas1.00datorklase
18Mākslīga intelekta izmantošana datu analīzē.Nodarbības1.00datorklase
19Iepazīšanās ar „Jamovi" programmu. Datu ievade, eksports. R mācīšanas izmantojot „Jamovi".Lekcijas1.00datorklase
20Funkcijas: Filter, Compute, Transform.Nodarbības1.00datorklase
21Praktiskā nodarbība ar funkcijām: Filter, Compute, Transform.Lekcijas1.00datorklase
22Ātra datu izpēte. Datu vizualizācija ar „Jamovi"Nodarbības1.00datorklase
23Darbs grupās. No papīra līdz sagatavotiem datiem.Lekcijas1.00datorklase
24Darbs grupās. No papīra līdz sagatavotiem datiem.Nodarbības1.00datorklase
Tēmu saraksts (nepilna laika studijas)
Nr.TēmaĪstenošanas formaSkaitsNorises vieta
1Ievads „R” valodā un „R Studio”. Saskarne, darbplūsma, skripti un kodēšanas pamati. Ievads datu vizualizācijā ar „ggplot”: estētiskās attēlošanas, ģeometriskie objekti un statistiskās transformācijas.Lekcijas1.00datorklase
2Praktisks darbs ar „R” saskarni. Atbildes uz vienkāršiem jautājumiem par datiem, veidojot iebūvēto „R” datu kopu „ggplot2” vizualizācijas.Nodarbības1.00datorklase
3Ievads datu konvertēšanā (pārveidē) ar „dplyr” pakotni: filtrēšana, kārtošana, atlase, jaunu mainīgo izveide un apkopošana. Iepazīstināšana ar „R” projektu darbplūsmu.Lekcijas1.00datorklase
4Dažādas datu transformācijas ar „R” „dplyr” pakotni „R” iebūvētajās datu kopās.Nodarbības1.00datorklase
5Pētnieciskā datu analīze: variācijas un kovariācijas novērtēšana. Statistiskie kopsavilkumi ar kastveida diagrammām. Dažāda veida datu nolasīšana „R”.Lekcijas1.00datorklase
6Praktiska pētnieciskā datu analīze „R”: datu variācija (joslu diagrammas, histogrammas, kastveida diagrammas) un kovariācija (vizualizējot divu mainīgo attiecības). Praktisks darbs ar „readr” pakotni datu lasīšanai.Nodarbības1.00datorklase
7Datu konsekventas organizēšanas principi „R” ar „tidyr” pakotni: datu kopu vākšana un izplatīšana, darbs ar trūkstošām vērtībām. Iepazīšanās ar „R Markdown” atskaišu sistēmu, dažādiem „Markdown” formātiem un matemātisko simbolu rakstīšanas principiem.Lekcijas1.00datorklase
8Reālas datu kopas importēšana un kārtošana. „R Markdown” pārskata sagatavošana.Nodarbības1.00datorklase
9Ievads datu pārvaldībā „R”. Relāciju datu principi: relācijas, atslēgas, savienojumi un piešķiršanas operācijas. Daži izplatīti neskaitlisku mainīgo veidi „R”. Vienlaicīgu operāciju organizēšana ar programmkanāliem.Lekcijas1.00datorklase
10Relāciju datu (t.i., multiplu tabulu) pārvaldība ar „dplyr”. Praktisks darbs ar neskaitlisku mainīgo tipiem „R”: koeficienti, virknes, datumi.Nodarbības1.00datorklase
11Padziļināta „R” programmēšana: savu „R” funkciju rakstīšana, funkciju vektorizācija, izpilde ar nosacījumiem (ja / citādi priekšraksti), cikliem un kartes funkcijām.Lekcijas1.00datorklase
12Funkciju rakstīšanas un programmēšanas elementu vingrinājumi.Nodarbības1.00datorklase
13Datu sagatavošanas pirmais etaps. Datu strukturēšana un sagatavošana „Jamovi” programmai.Lekcijas1.00datorklase
14Praktiskā nodarbība datu strukturēšanā.Nodarbības1.00datorklase
15Datu sagatavošana otrais etaps. Datu attīrīšana, jauno mainīgo radīšana un transformēšana.Lekcijas1.00datorklase
16Praktiskā nodarbība: datu attīrīšana un jauno mainīgo radīšana.Nodarbības1.00datorklase
17Iepazīšanās ar Power Query.Lekcijas1.00datorklase
18Mākslīga intelekta izmantošana datu analīzē.Nodarbības1.00datorklase
19Iepazīšanās ar „Jamovi" programmu. Datu ievade, eksports. R mācīšanas izmantojot „Jamovi".Lekcijas1.00datorklase
20Funkcijas: Filter, Compute, Transform.Nodarbības1.00datorklase
21Praktiskā nodarbība ar funkcijām: Filter, Compute, Transform.Lekcijas1.00datorklase
22Ātra datu izpēte. Datu vizualizācija ar „Jamovi"Nodarbības1.00datorklase
23Darbs grupās. No papīra līdz sagatavotiem datiem.Lekcijas1.00datorklase
24Darbs grupās. No papīra līdz sagatavotiem datiem.Nodarbības1.00datorklase
Vērtēšana
Patstāvīgais darbs:
• Patstāvīgais darbs ar lekciju materiālu, gatavojoties visām studiju kursa lekcijām. • Patstāvīgi sagatavot piešķirtos 2 datorprojektus, praktizējot kursā apgūtās koncepcijas. Lai izvērtētu studiju kursa kvalitāti kopumā, studentam jāaizpilda studiju kursa novērtēšanas anketa Studējošo portālā.
Vērtēšanas kritēriji:
Novērtējums 10 ballu skalā saskaņā ar RSU Studiju reglamentu: • Divi datoru projekti, kuros jāreģistrējas (viens saistīts ar „R” un viens saistīts ar „Jamovi”): 25% × 2 = 50% • Rakstisks gala eksāmens – 50%.
Gala pārbaudījums (pilna laika studijas):Eksāmens (Rakstisks)
Gala pārbaudījums (nepilna laika studijas):Eksāmens (Rakstisks)
Studiju rezultāti
Zināšanas:• Pārzināt, atlasīt, patstāvīgi izmantot „R” un „Jamovi” programmēšanas pamatprincipus. • Lietot „R” un „Jamovi” datu bāzu pārvaldības principus. • Apgūt un izmantot padziļinātus programmēšanas elementus, piemēram, izpildi ar nosacījumiem, ciklus un pielāgotas funkcijas.
Prasmes:Pēc kursa pabeigšanas studenti spēs: • pārbaudīt dažāda veida datus programmatūrā un organizēt tos analīzes nolūkos; • veikt datu pilnīgu transformāciju un vizualizāciju ar „R” un „Jamovi”; • uzrakstīt un izmantot paši savas R funkcijas, lai automatizētu bieži pildāmus uzdevumus.
Kompetences:Studenti spēs: • kvalitatīvi izmantot „R” un „Jamovi” programmatūru statistiskai analīzei citos biostatistikas kursos; • saprast atšķirības starp „R” un „Jamovi” programmām un izvēlēties piemērotāko konkrētai analīzei; • patstāvīgi uzlabot savas statistiskās programmēšanas prasmes, lai veiktu pētniecisku darbību vai analizētu ar veselību saistītos datus.
Bibliogrāfija
Nr.Atsauce
Obligātā literatūra
1Wickham, H. and Grolemund, G. 2016. R for Data Science. Import, Tidy, Transform, Visualize, and Model Data. O'Reilly.
2Navarro, D. J. and Foxcroft, D. R. 2022. learning statistics with jamovi: a tutorial for psychology students and other beginners. (Version 0.75). DOI: 10.24384/hgc3-7p15.
Citi informācijas avoti
1https://www.statmethods.net/
2https://rstudio.com/resources/cheatsheets/
3https://ggplot2.tidyverse.org/