Nejste přihlášen/a.
Najde se tady někdo kdo se orientuje ve statistice? Moc bych potřebovala poradit jak na bodové a intervalové odhady. Měli jsme si sami vybrat nějaký statistický soubor a počítat u něj různé charakteristiky (marginální, simultanní atd.) To jsem zvládla, ale u těch odhadů jsem se sekla a jsem z toho nešťastná. Na netu jsem našla samou teorii, ale potřebuju to vidět na příkladu, jinak to nepochopím.
Kdyby se našel někdo ochotný a chytrý moc by mi to pomohlo. Ještě bych více specifikovala to zadání.
Díky za odpovědi a doufám
Tak sem s tim.
Nevim, zda tady splnujeme Tvoje kriteria, ale to se nedozvime, dokud to zadani tady nebude...
Díky za odpověď Je to hafo dat v excelu, ale abych to teda popsala.
Jako statistický soubor mám průměrné mzdy v některých odvětvích národního hospodářství v letech 2005 a 2006. Roszah statistického soubour je N= 24.
A zadáno mám - vypočítejte bodové a 95% intervalové odhady střední hodnoty a rozptylu.
Co jsem k tomu našla materiály, tak většinou se to provádí, když mám nějaký náhodný výběr se základního souboru. Prostě nevím jak na to
Tak snad to zvladneme...
Predpokladam, ze teorii vicemene ovladas, proto prejdu takrka rovnou ke vzoreckum. Psat se nejak obsahle s teorii zde neni prakticky mozne, Pokud by si pak potrebovala neco podrobneji vysvetlit, napis.
Nejprve jednoduse neco o (zakladnim) statistickem souboru a vyberu.
Zakladni statisticky soubor je mnozina vsech vyhodnocovanych velicin. V tvem pripade je to vsech 24 prumernych mezd. Vyber (existuji ruzne druhy vyberu), o kterem jsi Ty mluvila, se provadi hlavne v pripade, ze zakladni statisticky soubor je v uvozovkach nekonecny, stale se opakujici nebo jde skutecne o par nahodne vbranych prvku z konecne velikeho souboru. To u Tebe neplati. Ty mas danou jasnou mnozinu hodnot.
Nyni tedy jiz k odhadum.
Bodovy odhad:
Bodovy odhad je takovy odhad, pri nemz se stanovi jedna konkretni stredni hodnota a jeden konkretni rozptyl. Pro kompletnost reseni by se pak mela stanovit jeste statisticka chyba, s jakou jsou nalezene hodnoty spravne.
Stredni hodnota zakladniho statistickeho souboru i nahodneho vyberu je vzdy prosty aritmeticky prumer. To zvladnes spocitat.
Rozptyl (obvykle se znaci s^2) se pak u celeho zakladniho statistickeho souboru urci (bez dlouheho vysvetlovani) dle vztahu 1/N*(suma((xi-X)^2)), kde xi je i-ta hodnota (i=1 az N) a X je aritmeticky prumer ziskany pred chvili. Zde je rozdil od nahodneho vyberu, kde se rozptyl urcuje pomoci mirne odlisneho vztahu 1/(n-1)*(suma((xi-X)^2)). ten ovsem Ty nepouzijes.
Intervalovy odhad:
Intervalovy odhad je takovy, kde hledame intervaly, v nichz se bude nachazet s urcitou pravdepodobnosti stredni hodnota a rozptyl. Neurcime tedy konkretni cislo, ale rekneme, ze se (v Tvem pripade) s 95 procentni pravdepodobnosti nalezaji hledane hodnoty v nejakem ohranicenem intervalu.
Zde je jiz nutne znat teorii rozdeleni pravdepodobnosti.
Opet teorii preskocim a dostaneme se k tomu, ze jelikoz tvuj statisticky soubor obsahuje malo prvku, mene nez 30, nemuzeme pouzit normalove rozdeleni pravdepodobnosti, misto neho pouzijeme rozdeleni Studentovo.
Kdyz tohle vime, muzeme si urcit kvantily (tzv. kriticke hodnoty) Studentova rozdeleni.
95 procentni kvantily jsou pro Studentovo rozdeleni tabelovany a lze je dohledat napr. v matematickych tabulkach. Hodnota bude zhruba 1,72.
Dale si je potreba uvedomit, ze pro stanoveni intervaloveho odhadu stredni hodnoty je treba znat intervalovy odhad rozptylu. A naopak. Ten ovsem nezname. A naopak. Proto se bezne nahrazuje intervalovy rozptyl rozptylem bodovym.
Ten si si jiz stanovila, kdyby ne, tak si ho stanovis nyni. Uz vis, jak na to.
Kdyz tohle vsechno nyni vime, muzeme vypocist hranice, mezi kterymi se 95 procentni pravdepodobnosti naleza hledana stredni hodnota.
Hranice stanovime pro Studentovo rozdeleni jako
X-s/((n)^(1/2))*t ...dolni
X+s/((n)^(1/2))*t ...horni
kde X je aritmeticky prumer vsech hodnot (bodovy odhad stredni hodnoty), s je druha odmocnina z bodoveho odhadu rozptylu, n je pocet velicin, t je kvantil.
A nyni si muzeme stanovit rozptyl. Teorie nam rika, ze budeme pracovat s Pearsonovym rozlozenim. Tzv. Chí-kvadrátem. Opet se jedna o kvantil (kriticke hodnoty), tentokrate ale ziskany z Pearsonova rozdeleni. Jeho hodnoty by meli byt pro 95 procentni odhad opet tabelovane a dohledatelne. Pouze zduraznim, ze se hodnota kvantilu hleda pro n-1 prvku.
A konecne posledni dve rovnice pro intervalovy odhad rozptylu pro zakladni soubor.
(n-1)*(s^2)/(Chí-kvadrát,1-p/2) ...dolní hranice
(n-1)*(s^2)/(Chí-kvadrát,p/2) ...dolní hranice
kde s^2 je bodovy rozptyl a Chí-kvadrát,1-p/2 a Chí-kvadrát,p/2 jsou kriticke hodnoty 95 procentni hladiny vyznamnosti Pearsonova rozdeleni.
Tak zatim tak. Nevim, zda je to z toho pochopitelne a hlavne, zda jsem nekde neudelal nejakou botu, mozna se zapoji jeste Kartaginec, tak hlavne neztracejte hlavu...
Jejda Nevím jak Ti poděkovat. Jsem v práci, takže jsem to zatím přečetla jenom v rychlosti. Tohle by mě mohlo nakopnout. Teorií rozdělení pravděpodobností jsem se už víceméně prokousala, takže z toho výjdu.
Doma (až se vyspím po noční ) to pročtu ještě jednou a zkusím to vyřešit. Dám Ti vědět jak to dopadlo. Určitě budu mít ještě další otázky
Zatím moc moc díky. Je super, že jsou lidi co umí poradit...
Neneseme odpovědnost za správnost informací a za škodu vzniklou jejich využitím. Jednotlivé odpovědi vyjadřují názory jejich autorů a nemusí se shodovat s názorem provozovatele poradny Poradte.cz.
Používáním poradny vyjadřujete souhlas s personifikovanou reklamou, která pomáhá financovat tento server, děkujeme.