.
Statistiskā programmēšana un datu pārvaldība
Studiju kursa apraksts
Kursa apraksta statuss:Apstiprināts
Kursa apraksta versija:5.00
Kursa apraksta apstiprināšanas datums:04.09.2023 14:59:47
Par studiju kursu | |||||||||
Kursa kods: | SL_108 | LKI līmenis: | 7. līmenis | ||||||
Kredītpunkti: | 4.00 | ECTS: | 6.00 | ||||||
Zinātnes nozare: | Matemātika; Varbūtību teorija un matemātiskā statistika | Mērķauditorija: | Dzīvās dabas zinātnes | ||||||
Studiju kursa vadītājs | |||||||||
Kursa vadītājs: | Andrejs Ivanovs | ||||||||
Studiju kursa īstenotājs | |||||||||
Struktūrvienība: | Statistikas mācību laboratorija | ||||||||
Struktūrvienības vadītājs: | |||||||||
Kontaktinformācija: | Kapseļu iela 23, 2.stāvs, Rīga, statistikarsu[pnkts]lv, +371 67060897 | ||||||||
Studiju kursa plānojums | |||||||||
Pilns laiks - 1. semestris | |||||||||
Lekcijas (skaits) | 12 | Lekciju ilgums (akadēmiskās stundas) | 2 | Kopā lekciju kontaktstundas | 24 | ||||
Nodarbības (skaits) | 12 | Nodarbību ilgums (akadēmiskās stundas) | 2 | Kopā nodarbību kontaktstundas | 24 | ||||
Kopā kontaktstundas | 48 | ||||||||
Nepilns laiks - 1. semestris | |||||||||
Lekcijas (skaits) | 12 | Lekciju ilgums (akadēmiskās stundas) | 1 | Kopā lekciju kontaktstundas | 12 | ||||
Nodarbības (skaits) | 12 | Nodarbību ilgums (akadēmiskās stundas) | 2 | Kopā nodarbību kontaktstundas | 24 | ||||
Kopā kontaktstundas | 36 | ||||||||
Studiju kursa apraksts | |||||||||
Priekšzināšanas: | Īpašas priekšzināšanas netiek prasītas, taču kursā būs nepieciešamas datorprasmes un vidusskolas līmeņa algebras zināšanas un tiks izmantoti statistikas jēdzieni. | ||||||||
Mērķis: | Datu analīzes un pārvaldības prasmes ir ļoti svarīgas mūsdienu lietišķajos statistikas pētījumos. Kursa mērķis ir iepazīstināt studentus ar statistikas programmatūras rīkiem, ko izmanto biostatistikas pētījumos: „R” un „Jamovi”. Tādējādi kursa mērķi ir: • iepazīstināt studējošos ar statistisko programmēšanu un datu pārvaldību, izmantojot „R” un „Jamovi” statistikas programmatūru; • sagatavot studējošos darbam ar datoru citos studiju programmas „Biostatistika” kursos. | ||||||||
Tēmu saraksts (pilna laika studijas) | |||||||||
Nr. | Tēma | Īstenošanas forma | Skaits | Norises vieta | |||||
1 | Ievads „R” valodā un „R Studio”. Saskarne, darbplūsma, skripti un kodēšanas pamati. Ievads datu vizualizācijā ar „ggplot”: estētiskās attēlošanas, ģeometriskie objekti un statistiskās transformācijas. | Lekcijas | 1.00 | datorklase | |||||
2 | Praktisks darbs ar „R” saskarni. Atbildes uz vienkāršiem jautājumiem par datiem, veidojot iebūvēto „R” datu kopu „ggplot2” vizualizācijas. | Nodarbības | 1.00 | datorklase | |||||
3 | Ievads datu konvertēšanā (pārveidē) ar „dplyr” pakotni: filtrēšana, kārtošana, atlase, jaunu mainīgo izveide un apkopošana. Iepazīstināšana ar „R” projektu darbplūsmu. | Lekcijas | 1.00 | datorklase | |||||
4 | Dažādas datu transformācijas ar „R” „dplyr” pakotni „R” iebūvētajās datu kopās. | Nodarbības | 1.00 | datorklase | |||||
5 | Pētnieciskā datu analīze: variācijas un kovariācijas novērtēšana. Statistiskie kopsavilkumi ar kastveida diagrammām. Dažāda veida datu nolasīšana „R”. | Lekcijas | 1.00 | datorklase | |||||
6 | Praktiska pētnieciskā datu analīze „R”: datu variācija (joslu diagrammas, histogrammas, kastveida diagrammas) un kovariācija (vizualizējot divu mainīgo attiecības). Praktisks darbs ar „readr” pakotni datu lasīšanai. | Nodarbības | 1.00 | datorklase | |||||
7 | Datu konsekventas organizēšanas principi „R” ar „tidyr” pakotni: datu kopu vākšana un izplatīšana, darbs ar trūkstošām vērtībām. Iepazīšanās ar „R Markdown” atskaišu sistēmu, dažādiem „Markdown” formātiem un matemātisko simbolu rakstīšanas principiem. | Lekcijas | 1.00 | datorklase | |||||
8 | Reālas datu kopas importēšana un kārtošana. „R Markdown” pārskata sagatavošana. | Nodarbības | 1.00 | datorklase | |||||
9 | Ievads datu pārvaldībā „R”. Relāciju datu principi: relācijas, atslēgas, savienojumi un piešķiršanas operācijas. Daži izplatīti neskaitlisku mainīgo veidi „R”. Vienlaicīgu operāciju organizēšana ar programmkanāliem. | Lekcijas | 1.00 | datorklase | |||||
10 | Relāciju datu (t.i., multiplu tabulu) pārvaldība ar „dplyr”. Praktisks darbs ar neskaitlisku mainīgo tipiem „R”: koeficienti, virknes, datumi. | Nodarbības | 1.00 | datorklase | |||||
11 | Padziļināta „R” programmēšana: savu „R” funkciju rakstīšana, funkciju vektorizācija, izpilde ar nosacījumiem (ja / citādi priekšraksti), cikliem un kartes funkcijām. | Lekcijas | 1.00 | datorklase | |||||
12 | Funkciju rakstīšanas un programmēšanas elementu vingrinājumi. | Nodarbības | 1.00 | datorklase | |||||
13 | Datu sagatavošanas pirmais etaps. Datu strukturēšana un sagatavošana „Jamovi” programmai. | Lekcijas | 1.00 | datorklase | |||||
14 | Praktiskā nodarbība datu strukturēšanā. | Nodarbības | 1.00 | datorklase | |||||
15 | Datu sagatavošana otrais etaps. Datu attīrīšana, jauno mainīgo radīšana un transformēšana. | Lekcijas | 1.00 | datorklase | |||||
16 | Praktiskā nodarbība: datu attīrīšana un jauno mainīgo radīšana. | Nodarbības | 1.00 | datorklase | |||||
17 | Iepazīšanās ar Power Query. | Lekcijas | 1.00 | datorklase | |||||
18 | Mākslīga intelekta izmantošana datu analīzē. | Nodarbības | 1.00 | datorklase | |||||
19 | Iepazīšanās ar „Jamovi" programmu. Datu ievade, eksports. R mācīšanas izmantojot „Jamovi". | Lekcijas | 1.00 | datorklase | |||||
20 | Funkcijas: Filter, Compute, Transform. | Nodarbības | 1.00 | datorklase | |||||
21 | Praktiskā nodarbība ar funkcijām: Filter, Compute, Transform. | Lekcijas | 1.00 | datorklase | |||||
22 | Ātra datu izpēte. Datu vizualizācija ar „Jamovi" | Nodarbības | 1.00 | datorklase | |||||
23 | Darbs grupās. No papīra līdz sagatavotiem datiem. | Lekcijas | 1.00 | datorklase | |||||
24 | Darbs grupās. No papīra līdz sagatavotiem datiem. | Nodarbības | 1.00 | datorklase | |||||
Tēmu saraksts (nepilna laika studijas) | |||||||||
Nr. | Tēma | Īstenošanas forma | Skaits | Norises vieta | |||||
1 | Ievads „R” valodā un „R Studio”. Saskarne, darbplūsma, skripti un kodēšanas pamati. Ievads datu vizualizācijā ar „ggplot”: estētiskās attēlošanas, ģeometriskie objekti un statistiskās transformācijas. | Lekcijas | 1.00 | datorklase | |||||
2 | Praktisks darbs ar „R” saskarni. Atbildes uz vienkāršiem jautājumiem par datiem, veidojot iebūvēto „R” datu kopu „ggplot2” vizualizācijas. | Nodarbības | 1.00 | datorklase | |||||
3 | Ievads datu konvertēšanā (pārveidē) ar „dplyr” pakotni: filtrēšana, kārtošana, atlase, jaunu mainīgo izveide un apkopošana. Iepazīstināšana ar „R” projektu darbplūsmu. | Lekcijas | 1.00 | datorklase | |||||
4 | Dažādas datu transformācijas ar „R” „dplyr” pakotni „R” iebūvētajās datu kopās. | Nodarbības | 1.00 | datorklase | |||||
5 | Pētnieciskā datu analīze: variācijas un kovariācijas novērtēšana. Statistiskie kopsavilkumi ar kastveida diagrammām. Dažāda veida datu nolasīšana „R”. | Lekcijas | 1.00 | datorklase | |||||
6 | Praktiska pētnieciskā datu analīze „R”: datu variācija (joslu diagrammas, histogrammas, kastveida diagrammas) un kovariācija (vizualizējot divu mainīgo attiecības). Praktisks darbs ar „readr” pakotni datu lasīšanai. | Nodarbības | 1.00 | datorklase | |||||
7 | Datu konsekventas organizēšanas principi „R” ar „tidyr” pakotni: datu kopu vākšana un izplatīšana, darbs ar trūkstošām vērtībām. Iepazīšanās ar „R Markdown” atskaišu sistēmu, dažādiem „Markdown” formātiem un matemātisko simbolu rakstīšanas principiem. | Lekcijas | 1.00 | datorklase | |||||
8 | Reālas datu kopas importēšana un kārtošana. „R Markdown” pārskata sagatavošana. | Nodarbības | 1.00 | datorklase | |||||
9 | Ievads datu pārvaldībā „R”. Relāciju datu principi: relācijas, atslēgas, savienojumi un piešķiršanas operācijas. Daži izplatīti neskaitlisku mainīgo veidi „R”. Vienlaicīgu operāciju organizēšana ar programmkanāliem. | Lekcijas | 1.00 | datorklase | |||||
10 | Relāciju datu (t.i., multiplu tabulu) pārvaldība ar „dplyr”. Praktisks darbs ar neskaitlisku mainīgo tipiem „R”: koeficienti, virknes, datumi. | Nodarbības | 1.00 | datorklase | |||||
11 | Padziļināta „R” programmēšana: savu „R” funkciju rakstīšana, funkciju vektorizācija, izpilde ar nosacījumiem (ja / citādi priekšraksti), cikliem un kartes funkcijām. | Lekcijas | 1.00 | datorklase | |||||
12 | Funkciju rakstīšanas un programmēšanas elementu vingrinājumi. | Nodarbības | 1.00 | datorklase | |||||
13 | Datu sagatavošanas pirmais etaps. Datu strukturēšana un sagatavošana „Jamovi” programmai. | Lekcijas | 1.00 | datorklase | |||||
14 | Praktiskā nodarbība datu strukturēšanā. | Nodarbības | 1.00 | datorklase | |||||
15 | Datu sagatavošana otrais etaps. Datu attīrīšana, jauno mainīgo radīšana un transformēšana. | Lekcijas | 1.00 | datorklase | |||||
16 | Praktiskā nodarbība: datu attīrīšana un jauno mainīgo radīšana. | Nodarbības | 1.00 | datorklase | |||||
17 | Iepazīšanās ar Power Query. | Lekcijas | 1.00 | datorklase | |||||
18 | Mākslīga intelekta izmantošana datu analīzē. | Nodarbības | 1.00 | datorklase | |||||
19 | Iepazīšanās ar „Jamovi" programmu. Datu ievade, eksports. R mācīšanas izmantojot „Jamovi". | Lekcijas | 1.00 | datorklase | |||||
20 | Funkcijas: Filter, Compute, Transform. | Nodarbības | 1.00 | datorklase | |||||
21 | Praktiskā nodarbība ar funkcijām: Filter, Compute, Transform. | Lekcijas | 1.00 | datorklase | |||||
22 | Ātra datu izpēte. Datu vizualizācija ar „Jamovi" | Nodarbības | 1.00 | datorklase | |||||
23 | Darbs grupās. No papīra līdz sagatavotiem datiem. | Lekcijas | 1.00 | datorklase | |||||
24 | Darbs grupās. No papīra līdz sagatavotiem datiem. | Nodarbības | 1.00 | datorklase | |||||
Vērtēšana | |||||||||
Patstāvīgais darbs: | • Patstāvīgais darbs ar lekciju materiālu, gatavojoties visām studiju kursa lekcijām. • Patstāvīgi sagatavot piešķirtos 2 datorprojektus, praktizējot kursā apgūtās koncepcijas. Lai izvērtētu studiju kursa kvalitāti kopumā, studentam jāaizpilda studiju kursa novērtēšanas anketa Studējošo portālā. | ||||||||
Vērtēšanas kritēriji: | Novērtējums 10 ballu skalā saskaņā ar RSU Studiju reglamentu: • Divi datoru projekti, kuros jāreģistrējas (viens saistīts ar „R” un viens saistīts ar „Jamovi”): 25% × 2 = 50% • Rakstisks gala eksāmens – 50%. | ||||||||
Gala pārbaudījums (pilna laika studijas): | Eksāmens (Rakstisks) | ||||||||
Gala pārbaudījums (nepilna laika studijas): | Eksāmens (Rakstisks) | ||||||||
Studiju rezultāti | |||||||||
Zināšanas: | • Pārzināt, atlasīt, patstāvīgi izmantot „R” un „Jamovi” programmēšanas pamatprincipus. • Lietot „R” un „Jamovi” datu bāzu pārvaldības principus. • Apgūt un izmantot padziļinātus programmēšanas elementus, piemēram, izpildi ar nosacījumiem, ciklus un pielāgotas funkcijas. | ||||||||
Prasmes: | Pēc kursa pabeigšanas studenti spēs: • pārbaudīt dažāda veida datus programmatūrā un organizēt tos analīzes nolūkos; • veikt datu pilnīgu transformāciju un vizualizāciju ar „R” un „Jamovi”; • uzrakstīt un izmantot paši savas R funkcijas, lai automatizētu bieži pildāmus uzdevumus. | ||||||||
Kompetences: | Studenti spēs: • kvalitatīvi izmantot „R” un „Jamovi” programmatūru statistiskai analīzei citos biostatistikas kursos; • saprast atšķirības starp „R” un „Jamovi” programmām un izvēlēties piemērotāko konkrētai analīzei; • patstāvīgi uzlabot savas statistiskās programmēšanas prasmes, lai veiktu pētniecisku darbību vai analizētu ar veselību saistītos datus. | ||||||||
Bibliogrāfija | |||||||||
Nr. | Atsauce | ||||||||
Obligātā literatūra | |||||||||
1 | Wickham, H. and Grolemund, G. 2016. R for Data Science. Import, Tidy, Transform, Visualize, and Model Data. O'Reilly. | ||||||||
2 | Navarro, D. J. and Foxcroft, D. R. 2022. learning statistics with jamovi: a tutorial for psychology students and other beginners. (Version 0.75). DOI: 10.24384/hgc3-7p15. | ||||||||
Citi informācijas avoti | |||||||||
1 | https://www.statmethods.net/ | ||||||||
2 | https://rstudio.com/resources/cheatsheets/ | ||||||||
3 | https://ggplot2.tidyverse.org/ |