Osrednja naloga

Osrednja metodološka naloga:

  • obseg cca 10-20 strani,
  • naloga obravnava izbrani problem anketne metodologije,
  • tema naloge lahko izhaja iz vsebine programa - torej v okviru najširšega področja anketne metodologije (Groves et al. Survey methodolgy)), lahko nadgrajuje teme iz prejšnjih let, lahko pa študent pride s svojim predlogom.
  • temo osrednje naloge je treba okvirno doreči do 15.5, prvi draft pa predvidoma konec maja. Na koncu se  pripravi tudi 5-10 minutna zaključna predstavitev v juniju,
  • zamudniki lahko zagovarjajo kasneje, načeloma so roki zagovora,ko se naberejo vasj trije študenti

Priporočljivo je (ni pa seveda nujno niti ni vedno izvedljivo) osrednjo nalogo povezati  s siceršnjim delom na magisterij/disertaciji ali z delom na kakem članku.

Nekaj primerov nalog prejšnjih let:.

  • Izberite tri realne in smiselno povezane nominalne spremenljivke, jih po potrebi dihotomizirajte in izvedite EM algoritem, pri čemer za manjkajočo vrednost obravnavate odgovore NE VEM. Dodatno  razvrsite v NE VEM še polovico ena od kategorij prve spremenljivke (NMAR). Ponovite EM algoritem. Ocenite in interprtirajte rezultate.
  • Iz ankete SJM ali podobne ankete izberite sklop spremenljivk (vsaj pet), ki naj bi merile isti teopretični pojem, analizirajte zanesljivost in veljavnost merjenja, interpretirajte potencialne napake v kakovosti merjenja ter predlagajte vsaj tri izboljšave, ki bi lahko izboljšale akovost merjenja.
  • Izberite realno spremenlivko, ki je porazdeljena približno normalno (npr. mnenje na ordinalni skali, dohodek). Odstranite nekaj vrednosti MCAR, MAR (npr. za moške z verjetnostjo P1, za ženske z verjetnostjo P2) in NMAR (npr. censoring in stohastični censoring). Komentirajte posledice, če analizo opravimo samo na opazovanih vrednostih. Kako bi v vsakem od teh primerov reševali problem?

  • Analizirajte delovanje EM algoritma v SPSS programu. Kakšne so predpostavke? Kdaj deluje in kdaj ne deluje? Kakšne so pomankljivosti? Kako deluje v primeru ene spremenljivke,kako v dveh? Generirajte različne množice opazovanih in manjkajočih podatkov in poročajte o njegovem delovanju. Za koliko je precenjena varianca?

  • Izdelajte serijo za trend neodgovorov za anketo o delovni sili za čimdaljše obdobje. Ločite zavrnitve od ostalih neodgovorov. Ocenite potencialno pristranskost pri stopnji brezposelnosti od različnih predpostavkah o brezposelnosti med manjkajočimi enotami. Kateri trije instrumenti bi bili stroškovno najbolj učinkoviti za zmanjšanje MSE?

    Izdelajte serijo trenda neodgovorov za anketo Slovensko javno mnenje za čimdaljše obdobje. Ločite zavrnitve od ostalih neodgovorov. Ocenite potencialno pristranskost pri stopnji brezposelnosti ob različnih predpostavkah o brezposelnosti med manjkajočimi enotami. Kateri trije instrumenti bi bili stroškovno najbolj učinkoviti za zmanjšanje MSE?

  • Izvedite multiple imputacije  s pravilnim bayesianskimi postopkom za simulirano normalno porazdeljeno spremenljivko  z MAR mehanizmom manjkajočih podatkov. Izvedite tudi aproksimativni bootstrat. Evaluairajte rezultate in jih primerjajte s postopkom, ki ne izvede prvega koraka (*VIr: Rubin: MI)! Izvedite še multiple imputacije  z aproksimativnim bayesianskim vstavljanjem. Evaluairajte rezultate!
  • Kritično evaluirajte napake v anketi o potovalnih značilnosti (Priloga*) in koncipirajte izboljšan načrt raziskave.
  • Za vzorec SJM si izmislite poljubne margine za tri kontrolne spremenljivke, izvedite raking in ocenite porast v varianci zaradi uteževanja ter izračunajte smiselnost uteževanja glede na MSE. Kakšni so posledice, če se margine spremenijo? V kakšnih primerihi so razlike večje?
  • V vzorcu SJM (ali v smiselno podobnem primeru) odstranite polovico vseh žensk, med možkimi pa tretjino vseh oseb z srednjo šolo ali več. Nato izvedite raking in poststratifikacijo. Primerjajte rezultate. Ocenite smiselnost uteževanja glede na MSE.
  • Z analizo variance  ali kako drugače ocenite v kakem kompleksnem ali dvostopenjskem vzorcu (npr SJM ) vzorčni učinek za izbrano spremenljivko. Denimo, da poleg tega z uteževanjem zmanjšate pristranstkost za P%, varianco pa povečate za VIF, hkrati pa imate problem z zanesljivostjo merjenja, z učinkom anketarja ter napako procesiranja. Komentirajte problem širine intervala zaupanja oziroma MSE, kjer upoštevate vse možne vire napak in pristranskosti. Določite možne vrednosti za vsako komponento in intepretirajte. Ocenite smiselnost uteževanja.
  • Za simulirano normalno porazdelitev upoštevajte NMAR mehanizem censoriranja podatkovpri določeni točki. Z EM algoritmom ocenite dejansko vrednost. Interpretirajte  (*Vir: Little/Rubin.)
  • V trodimenzionalni multinominalni tabeli, za katero ste že red tem izbrali smiselen loglinearni model, del podatkov označite kot neopazovane (vsaj ena nepopolna margina). Predpostavite MAR in izvedite EM algoritem pri izbranem loglinearnem modelu. Pri tem nas parametri loglinearnega ne zanimajo, saj deleže oziroma verjetnosti posameznih celic ocenimo kar iz modelskih/pričakovanih frekvenc loglinearnega modela v določeni iteraciji. Primerjajte popolne podatke, navaden EM in EM z loglinearnim modelom. Interpretirajte.
  • Za skupino spremenljivk izvedite faktorsko analizo, Lisrel model ali kako drugo multivariatno metodo. Nato unićite del vrednosti MCAR. Vstavite jih z EM algoritmom in z aproksimativnim Bayesovim vstavljanjem. Ocenite ciljni parameter (npr. factor loading, regresijski koeficient ipd) in njegovo varianco. Primerjajte rezultate obeh postopkov s pravimi rezultati in z analizo na popolnih podatkih.
  • Izpeljite oziroma ilustriratje  - izraze, ki so v literaturi izpeljani na splošno, izvedete oziroma aplicirate jih v primeru konkretne porazdelitve - ML ocene za multinominalno spremenljivko za dve konkretni tabeli s popolnimi podatki dimenzije 2x2 in 3x2, pri slednji pa nato še z eno nepopolno margino.
  • Ocenite za izbrano spremenljivko vzorčno varianco v izbrani anketi SJM (priporočljivo nekoliko starejši, iz 90-tih let, kjer so skupine enako velike) analitično (analiza variance) in z enostavnimi replikacijami. Izvedite še postopek bootstrap (R) in jackknife.
  • Simulirajte tri stratume z različnimi varaincami, aritmetičnimi sredinami in stroški anketiranja. Analizirajte učinek optimalne in proporcionalnestratifikacije pri različnih razmerjih vhodnih parametrov. Kdaj ima stratifikacija učinek in kdaj ne?
  • Izpeljite oziroma ilustrirajte zanemarljivost mehanizma mankajočih vrednosti v primer klasičnega statističnega sklepanja in v primeru metode največjega verjetja na primeru nominalne spremenljivke in Bernoulijevega mehanizma,kjer zapišite skupno porazdelitev Pr(Y,R). (Gre zgolj za prirejeno ponovitev izpeljav v gradivu, kjer je naveden primer za normalno porazdelitev.)
  • Zanima nas zadovoljstvo srednješolskih učiteljev z vidiki šolske ureditve. Rezultate bi radi primerjali po spolu, treh starostnih skupinah in petih regijah. Kakšen vzorec bi načrtovali. Kakšen interval zaupanja pričakujemo. Kako velik vzorec bi potrebovali, če gre za enkratno anketo. Kakšen, če bi želeli anketo ponoviti naslednje leto in primerjati ocene? Anketo med podjetji lahko izvedemo po telefonu, pisemsko, osebno ali po internetu. Lahko pa tudi kombinirano. Naredite stroškovni model, simulirajte stroške, napake,  pristranskost in komentirajte rezultate (Vehovar &et al .IJEC).

 

Stran si je ogledalo 3744 obiskovalcev