.
Daudzdimensiju statistiskā analīze
Studiju kursa apraksts
Kursa apraksta statuss:Apstiprināts
Kursa apraksta versija:4.00
Kursa apraksta apstiprināšanas datums:14.03.2024 11:36:29
Par studiju kursu | |||||||||
Kursa kods: | SL_119 | LKI līmenis: | 7. līmenis | ||||||
Kredītpunkti: | 2.00 | ECTS: | 3.00 | ||||||
Zinātnes nozare: | Matemātika; Varbūtību teorija un matemātiskā statistika | Mērķauditorija: | Dzīvās dabas zinātnes | ||||||
Studiju kursa vadītājs | |||||||||
Kursa vadītājs: | Andrejs Ivanovs | ||||||||
Studiju kursa īstenotājs | |||||||||
Struktūrvienība: | Statistikas mācību laboratorija | ||||||||
Struktūrvienības vadītājs: | |||||||||
Kontaktinformācija: | Kapseļu iela 23, 2.stāvs, Rīga, statistikarsu[pnkts]lv, +371 67060897 | ||||||||
Studiju kursa plānojums | |||||||||
Pilns laiks - 1. semestris | |||||||||
Lekcijas (skaits) | 6 | Lekciju ilgums (akadēmiskās stundas) | 2 | Kopā lekciju kontaktstundas | 12 | ||||
Nodarbības (skaits) | 6 | Nodarbību ilgums (akadēmiskās stundas) | 2 | Kopā nodarbību kontaktstundas | 12 | ||||
Kopā kontaktstundas | 24 | ||||||||
Nepilns laiks - 1. semestris | |||||||||
Lekcijas (skaits) | 6 | Lekciju ilgums (akadēmiskās stundas) | 1 | Kopā lekciju kontaktstundas | 6 | ||||
Nodarbības (skaits) | 6 | Nodarbību ilgums (akadēmiskās stundas) | 2 | Kopā nodarbību kontaktstundas | 12 | ||||
Kopā kontaktstundas | 18 | ||||||||
Studiju kursa apraksts | |||||||||
Priekšzināšanas: | Augstākā matemātika, varbūtība, statistika, lineārie modeļi, pamatzināšanas par „R” programmēšanu. | ||||||||
Mērķis: | Kursa mērķis ir iepazīstināt ar daudzdimensiju datu analīzes rīkiem un koncepcijām, īpašu uzmanību pievēršot lietojumiem ar „R” programmu. | ||||||||
Tēmu saraksts (pilna laika studijas) | |||||||||
Nr. | Tēma | Īstenošanas forma | Skaits | Norises vieta | |||||
1 | Ievads daudzdimensiju analīzē, daudzdimensiju datu kopu piemēri, kovariācija, korelācija, daudzdimensiju normālais sadalījums. Lineārās algebras pamatelementu atkārtošana: determinanti, inversija, īpašvērtības un īpašvektori, dekompozīcijas un kvadrātiskās formas. | Lekcijas | 1.00 | auditorija | |||||
2 | Daudzdimensiju datu vizualizācija ar „R”. Praktiski matricu algebras aprēķini „R”. | Nodarbības | 1.00 | datorklase | |||||
3 | Galveno komponentu (PC) analīze. Ģeometriska pieeja datu matricas izmēra samazināšanai. Galveno komponentu definīcija, interpretācija un secinājumi par tiem. Normalizēti galvenie komponenti. | Lekcijas | 1.00 | auditorija | |||||
4 | Reālu datu piemēra analīze „R”: galveno komponentu aprēķināšana, statistiskās nozīmības noteikšana, grafiku sastādīšana galveno komponentu interpretācijai. | Nodarbības | 1.00 | datorklase | |||||
5 | Faktoranalīze. Ortogonālais faktoru modelis. Faktoru interpretācija. Kopīgo faktoru skaita pārbaude. Salīdzinājums ar galveno komponentu analīzi. | Lekcijas | 1.00 | auditorija | |||||
6 | Faktoru analīze „R”: faktoru modeļa novērtēšana, faktoru skaita pārbaude, diagrammu sastādīšana faktoru interpretācijai. | Nodarbības | 1.00 | datorklase | |||||
7 | Diskriminantu analīze. Klases, iezīmes un klasifikācijas precizitātes mēri. Lineārā un kvadrātiskā diskriminantu analīze. | Lekcijas | 1.00 | auditorija | |||||
8 | Diskriminantu analīze „R”: metožu novērtēšana, interpretācija, salīdzināšana. | Nodarbības | 1.00 | datorklase | |||||
9 | Klasteranalīze. Objektu tuvums, attāluma funkcijas. Dažādi klasterizācijas algoritmi. | Lekcijas | 1.00 | auditorija | |||||
10 | Klasteranalīze „R”: dažādu klasterizācijas algoritmu īstenošana un salīdzināšana. Optimālā klasteru skaita noteikšana. | Nodarbības | 1.00 | datorklase | |||||
11 | Daudzdimensiju lineārā regresija. Daudzdimensiju normālā sadalījuma pārbaude. | Lekcijas | 1.00 | auditorija | |||||
12 | Daudzdimensiju lineārā regresija „R”: novērtēšana, pārbaude un interpretācija. | Nodarbības | 1.00 | datorklase | |||||
Tēmu saraksts (nepilna laika studijas) | |||||||||
Nr. | Tēma | Īstenošanas forma | Skaits | Norises vieta | |||||
1 | Ievads daudzdimensiju analīzē, daudzdimensiju datu kopu piemēri, kovariācija, korelācija, daudzdimensiju normālais sadalījums. Lineārās algebras pamatelementu atkārtošana: determinanti, inversija, īpašvērtības un īpašvektori, dekompozīcijas un kvadrātiskās formas. | Lekcijas | 1.00 | auditorija | |||||
2 | Daudzdimensiju datu vizualizācija ar „R”. Praktiski matricu algebras aprēķini „R”. | Nodarbības | 1.00 | datorklase | |||||
3 | Galveno komponentu (PC) analīze. Ģeometriska pieeja datu matricas izmēra samazināšanai. Galveno komponentu definīcija, interpretācija un secinājumi par tiem. Normalizēti galvenie komponenti. | Lekcijas | 1.00 | auditorija | |||||
4 | Reālu datu piemēra analīze „R”: galveno komponentu aprēķināšana, statistiskās nozīmības noteikšana, grafiku sastādīšana galveno komponentu interpretācijai. | Nodarbības | 1.00 | datorklase | |||||
5 | Faktoranalīze. Ortogonālais faktoru modelis. Faktoru interpretācija. Kopīgo faktoru skaita pārbaude. Salīdzinājums ar galveno komponentu analīzi. | Lekcijas | 1.00 | auditorija | |||||
6 | Faktoru analīze „R”: faktoru modeļa novērtēšana, faktoru skaita pārbaude, diagrammu sastādīšana faktoru interpretācijai. | Nodarbības | 1.00 | datorklase | |||||
7 | Diskriminantu analīze. Klases, iezīmes un klasifikācijas precizitātes mēri. Lineārā un kvadrātiskā diskriminantu analīze. | Lekcijas | 1.00 | auditorija | |||||
8 | Diskriminantu analīze „R”: metožu novērtēšana, interpretācija, salīdzināšana. | Nodarbības | 1.00 | datorklase | |||||
9 | Klasteranalīze. Objektu tuvums, attāluma funkcijas. Dažādi klasterizācijas algoritmi. | Lekcijas | 1.00 | auditorija | |||||
10 | Klasteranalīze „R”: dažādu klasterizācijas algoritmu īstenošana un salīdzināšana. Optimālā klasteru skaita noteikšana. | Nodarbības | 1.00 | datorklase | |||||
11 | Daudzdimensiju lineārā regresija. Daudzdimensiju normālā sadalījuma pārbaude. | Lekcijas | 1.00 | auditorija | |||||
12 | Daudzdimensiju lineārā regresija „R”: novērtēšana, pārbaude un interpretācija. | Nodarbības | 1.00 | datorklase | |||||
Vērtēšana | |||||||||
Patstāvīgais darbs: | 1. Obligātās un papildliteratūras izpēte, lekcijās un nodarbībās apgūto zināšanu paplašināšanai un nostiprināšanai 2. Studējošajiem jāizpilda pieci „R” balstīti mājasdarbi, kas saistīti ar katru no šīm tēmām: a. Galveno komponentu analīze (2. praktiskā nodarbība). b. Faktoranalīze (3. praktiskā nodarbība). c. Diskriminantu analīze (4. praktiskā nodarbība). d. Klasteranalīze (5. praktiskā nodarbība). e. Daudzdimensiju lineārā regresija (6. praktiskā nodarbība). | ||||||||
Vērtēšanas kritēriji: | Novērtējums 10 ballu skalā saskaņā ar RSU Studiju reglamentu: • 5 iesniedzamie mājasdarbi – 70%. • rakstisks eksāmens – 30%. | ||||||||
Gala pārbaudījums (pilna laika studijas): | Eksāmens (Rakstisks) | ||||||||
Gala pārbaudījums (nepilna laika studijas): | Eksāmens (Rakstisks) | ||||||||
Studiju rezultāti | |||||||||
Zināšanas: | Studējošais: • ir ieguvis padziļinātas zināšanas par teorētiskajiem varbūtības jēdzieniem, kas saistīti ar daudzdimensiju analīzi; • ilustrē vizualizācijas paņēmienus, aprakstot daudzdimensiju datus; • novērtē svarīgākās daudzdimensiju metodes, piemēram, galveno komponentu analīzi, faktoranalīzi, klasteranalīzi un diskriminantu analīzi. | ||||||||
Prasmes: | • „R” programmā ievieš atbilstošas daudzdimensiju datu vizualizācijas; • prot patstāvīgi izmantot daudzdimensiju datu analīzes metodes „R” programmā, lai veiktu pētniecisku darbību, vai augsti kvalificētas profesionālas funkcijas. | ||||||||
Kompetences: | • Prot salīdzināt un izprast dažādu daudzdimensiju datu analīzes metožu mērķus un izvēlēties piemērotāko datu kopas analīzei; • Spēj izvirzīt hipotēzes un pieņemt uz analīzi balstītus lēmumus, kas saistīti ar daudzdimensiju datiem. | ||||||||
Bibliogrāfija | |||||||||
Nr. | Atsauce | ||||||||
Obligātā literatūra | |||||||||
1 | W. K. Haerdle Härdle, L. Simar, Applied Multivariate Statistical Analysis. Springer. 2015 | ||||||||
2 | D. Zelterman. Applied Multivariate Statistics with R. Springer, Statistics for biology and health series, 2015 | ||||||||
Papildu literatūra | |||||||||
1 | R. A. Johnson, D.W. Wickern, Applied Multivariate Statistical Analysis, 6th edition. Prentice & Hall, 2007 | ||||||||
2 | T. Hothorn, B. Everitt, An Introduction to Applied Multivariate Analysis with R. Springer, Use R! series, 2011 |