.
Kategoriju datu analīze
Studiju kursa apraksts
Kursa apraksta statuss:Apstiprināts
Kursa apraksta versija:5.00
Kursa apraksta apstiprināšanas datums:14.03.2024 11:48:07
Par studiju kursu | |||||||||
Kursa kods: | SL_117 | LKI līmenis: | 7. līmenis | ||||||
Kredītpunkti: | 2.00 | ECTS: | 3.00 | ||||||
Zinātnes nozare: | Matemātika; Varbūtību teorija un matemātiskā statistika | Mērķauditorija: | Dzīvās dabas zinātnes | ||||||
Studiju kursa vadītājs | |||||||||
Kursa vadītājs: | Maksims Zolovs | ||||||||
Studiju kursa īstenotājs | |||||||||
Struktūrvienība: | Statistikas mācību laboratorija | ||||||||
Struktūrvienības vadītājs: | |||||||||
Kontaktinformācija: | Baložu iela 14, A korpuss, Rīga, statistikarsu[pnkts]lv, +371 67060897 | ||||||||
Studiju kursa plānojums | |||||||||
Pilns laiks - 1. semestris | |||||||||
Lekcijas (skaits) | 7 | Lekciju ilgums (akadēmiskās stundas) | 2 | Kopā lekciju kontaktstundas | 14 | ||||
Nodarbības (skaits) | 5 | Nodarbību ilgums (akadēmiskās stundas) | 2 | Kopā nodarbību kontaktstundas | 10 | ||||
Kopā kontaktstundas | 24 | ||||||||
Nepilns laiks - 1. semestris | |||||||||
Lekcijas (skaits) | 7 | Lekciju ilgums (akadēmiskās stundas) | 1 | Kopā lekciju kontaktstundas | 7 | ||||
Nodarbības (skaits) | 5 | Nodarbību ilgums (akadēmiskās stundas) | 2 | Kopā nodarbību kontaktstundas | 10 | ||||
Kopā kontaktstundas | 17 | ||||||||
Studiju kursa apraksts | |||||||||
Priekšzināšanas: | • Pārzina varbūtību teoriju un matemātisko statistiku. • Pamatzināšanas „Jamovi” programmatūrā. • Pamatzināšanas datu analīzē. | ||||||||
Mērķis: | Ņemot vērā, ka lielākā daļa statistikas datu ir kategoriāli, kursa mērķis ir norādīt uz šādu datu īpašajām iezīmēm un iemācīt atbilstošās statistiskās analīzes metodes. Kurss galvenokārt koncentrēsies uz metodēm un pielietojumu, zināmā mērā apskatot matemātisko pamatu un metodoloģijas pamatojumu. Statistikas programmatūra „Jamovi” tiks izmantota datorklasēs, kur studenti analizēs lekcijās apskatītās reālās datu kopas, lai savienotu teoriju un praksi un studenti spētu pārliecināti pielietot metodoloģiju praktiskā datu analīzē. | ||||||||
Tēmu saraksts (pilna laika studijas) | |||||||||
Nr. | Tēma | Īstenošanas forma | Skaits | Norises vieta | |||||
1 | Kategoriālu datu būtība. Klasifikācija pēc mērķa un skalas. Pētījumu veidi. Varbūtību sadalījumi. Overdispersion. | Lekcijas | 1.00 | auditorija | |||||
2 | Kategorisku mainīgo kopējais sadalījums. Nosacītais un marginālais sadalījums. Maksimālās ticamības novērtējumi varbūtībām. | Lekcijas | 1.00 | auditorija | |||||
3 | Neatkarība. Atkarības mērs, relatīvais risks, izredzes, izredžu attiecība. 2x2 biežumtabulas. Novērtējumi no biežumtabulas. Nosacītās varbūtības – jutīgums, specifiskums. Patiesi negatīvs, nepatiesi pozitīvs. | Lekcijas | 1.00 | auditorija | |||||
4 | Ievads "Jamovi". Kategoriālu datu vizualizēšana. Sadalījumu salīdzināšana. Biežumtabulas. Nosacītie biežumi. Atkarības mērījumu aprēķināšana. | Nodarbības | 1.00 | datorklase | |||||
5 | Tabulas, kas lielākas par 2 x 2. Ordinālu un nominālu datu atkarības mērījumi. Hipotēze par iedzīvotāju sadalījumu. Hī kvadrāta kritērijs. | Lekcijas | 1.00 | auditorija | |||||
6 | Ordinālu un nominālu datu atkarības mērījumi. Hipotēze par neatkarību un nosacīto neatkarību. | Nodarbības | 1.00 | datorklase | |||||
7 | Lielas izlases gadījums, hipotēze par neatkarību. Hī kvadrāta un iespējamības attiecības kritērijs. Mazas izlases gadījums, Fišera kritērijs. | Lekcijas | 1.00 | auditorija | |||||
8 | Hipotēze par neatkarību un nosacīto neatkarību. | Nodarbības | 1.00 | datorklase | |||||
9 | Multinomiālu biežumu asimptotiskais sadalījums. Ticamības intervāli izredžu attiecībai un relatīvajam riskam. Marginālā sadalījuma viendabīguma pārbaude sapārotu novērojumu gadījumā. | Lekcijas | 1.00 | auditorija | |||||
10 | Atkarības mērījumu intervāla aprēķināšana. Maknemāra tests. | Nodarbības | 1.00 | datorklase | |||||
11 | Binārā iznākuma mainīgā modeļi – loģistiskās regresijas un log lineārie modeļi. Retrospektīvo pētījumu modeļi. Lēmumu koki klasifikācijai. | Lekcijas | 1.00 | auditorija | |||||
12 | Kategoriālu datu modelēšana. Klasificēti dati un neapstrādāti dati. Modelēšana un lēmumu pieņemšanas shēmas. Klasifikācijas kļūda. | Nodarbības | 1.00 | datorklase | |||||
Tēmu saraksts (nepilna laika studijas) | |||||||||
Nr. | Tēma | Īstenošanas forma | Skaits | Norises vieta | |||||
1 | Kategoriālu datu būtība. Klasifikācija pēc mērķa un skalas. Pētījumu veidi. Varbūtību sadalījumi. Overdispersion. | Lekcijas | 1.00 | auditorija | |||||
2 | Kategorisku mainīgo kopējais sadalījums. Nosacītais un marginālais sadalījums. Maksimālās ticamības novērtējumi varbūtībām. | Lekcijas | 1.00 | auditorija | |||||
3 | Neatkarība. Atkarības mērs, relatīvais risks, izredzes, izredžu attiecība. 2x2 biežumtabulas. Novērtējumi no biežumtabulas. Nosacītās varbūtības – jutīgums, specifiskums. Patiesi negatīvs, nepatiesi pozitīvs. | Lekcijas | 1.00 | auditorija | |||||
4 | Ievads "Jamovi". Kategoriālu datu vizualizēšana. Sadalījumu salīdzināšana. Biežumtabulas. Nosacītie biežumi. Atkarības mērījumu aprēķināšana. | Nodarbības | 1.00 | datorklase | |||||
5 | Tabulas, kas lielākas par 2 x 2. Ordinālu un nominālu datu atkarības mērījumi. Hipotēze par iedzīvotāju sadalījumu. Hī kvadrāta kritērijs. | Lekcijas | 1.00 | auditorija | |||||
6 | Ordinālu un nominālu datu atkarības mērījumi. Hipotēze par neatkarību un nosacīto neatkarību. | Nodarbības | 1.00 | baseins | |||||
7 | Lielas izlases gadījums, hipotēze par neatkarību. Hī kvadrāta un iespējamības attiecības kritērijs. Mazas izlases gadījums, Fišera kritērijs. | Lekcijas | 1.00 | auditorija | |||||
8 | Hipotēze par neatkarību un nosacīto neatkarību. | Nodarbības | 1.00 | datorklase | |||||
9 | Multinomiālu biežumu asimptotiskais sadalījums. Ticamības intervāli izredžu attiecībai un relatīvajam riskam. Marginālā sadalījuma viendabīguma pārbaude sapārotu novērojumu gadījumā. | Lekcijas | 1.00 | auditorija | |||||
10 | Atkarības mērījumu intervāla aprēķināšana. Maknemāra tests. | Nodarbības | 1.00 | datorklase | |||||
11 | Binārā iznākuma mainīgā modeļi – loģistiskās regresijas un log lineārie modeļi. Retrospektīvo pētījumu modeļi. Lēmumu koki klasifikācijai. | Lekcijas | 1.00 | auditorija | |||||
12 | Kategoriālu datu modelēšana. Klasificēti dati un neapstrādāti dati. Modelēšana un lēmumu pieņemšanas shēmas. Klasifikācijas kļūda. | Nodarbības | 1.00 | datorklase | |||||
Vērtēšana | |||||||||
Patstāvīgais darbs: | 1. Patstāvīgais darbs ar kursa materiālu, gatavojoties lekcijām pēc plāna. 2. Patstāvīga mājasdarbu izpilde, praktizējot kursā apgūtās koncepcijas. Lai novērtētu studiju kursa kvalitāti kopumā, studentam jāaizpilda studiju kursa novērtēšanas anketa Studējošo portālā. | ||||||||
Vērtēšanas kritēriji: | Novērtējums 10 ballu skalā saskaņā ar RSU Studiju reglamentu: • 2 Patstāvīgi izpildīti mājasdarbi – 50%. • Apmeklētība un aktīva iesaiste praktisko nodarbību laikā – 25%. • Rakstisks gala eksāmens – 25%. | ||||||||
Gala pārbaudījums (pilna laika studijas): | Eksāmens (Rakstisks) | ||||||||
Gala pārbaudījums (nepilna laika studijas): | Eksāmens (Rakstisks) | ||||||||
Studiju rezultāti | |||||||||
Zināšanas: | • Pēc sekmīgas kursa apgūšanas studējošie pārzinās statistiskās analīzes metodoloģijas klāstu, kas pieejams kategoriāliem datiem. Viņi pārzinās un interpretēs lielās, kā arī mazās izlases pārbaudes. • Noteiks kategoriālo datu raksturu; kā izmērīt atkarību starp kategoriskajiem mainīgajiem, pamatojoties uz pētījuma veidu un mainīgo veidu (nominālais vai ordināls). • Studējošie parādīs, kā modelēt binārā iznākuma mainīgo, izmantojot nepārtrauktus vai kategoriskus mainīgos. | ||||||||
Prasmes: | • Studējošie saprot un paskaidro dažāda veida datu vākšanas metožu ietekmi uz biežumtabulas nejaušību. Interpretē biežumtabulas, tās rindu un kolonnu sadalījuma modeļus. • Izskaidro atkarības mērījumus, kas definēti 2 kategorisku mainīgo (relatīvais risks, izredžu attiecība utt.) kopējā sadalījumā, spēj tos interpretēt un aprēķināt. • Prot pārbaudīt datu piemērotību ar pieņemto sadalījuma modeli, prot pārbaudīt kategorisko mainīgo neatkarību. • Prot modelēt kategorisko mainīgo (īpaši bināro) ar citiem mainīgajiem. • Prot patstāvīgi pielietot savas zināšanas darbā ar reāliem datiem. | ||||||||
Kompetences: | • Pēc sekmīgas kursa apgūšanas studējošais būs kompetents lasīt un kritiski novērtēt zinātniskās publikācijas, kuru analīzē izmantoti kategoriāli dati. • Studējošais būs kompetents plānot kategoriālu datu analīzi un analizēt šādus datus. | ||||||||
Bibliogrāfija | |||||||||
Nr. | Atsauce | ||||||||
Obligātā literatūra | |||||||||
1 | Agresti, Alan. Categorical Data Analysis. Wiley, 2012 (or 1990, 2002 editions). | ||||||||
Papildu literatūra | |||||||||
1 | Agresti, Alan. An Introduction to Categorical Data Analysis. Wiley, 2019 (or 1996, 2007 editions). |