Autoři: Marie Báčová, Ing. Zbyněk Novotný, CSc.
Stav: kontrola 2022, vydání 2009
Anotace:
Hlavním cílem pomůcky je poskytnout základní orientaci v obecných pojmech statistiky uživatelům z praxe, kteří se setkávají se statistickou terminologií a problematikou příležitostně. Výklad je proto formulován především pomocí běžně užívaných termínů. Pomůcka uživatele seznamuje zároveň s organizací státní statistické služby.
OBSAH
ÚVOD
Zjednodušeně lze konstatovat, že statistika zkoumá stav a vývoj číselně vyjádřitelných hromadných jevů. Znalosti statistiky, a především metod, s jejichž pomocí lze vyhodnocovat ekonomická data, vývojové tendence a souvislosti ekonomických ukazatelů v podniku i v celém národním hospodářství, patří k základu, bez něhož se neobejde dobrý ekonom či manažer. Statistika je teoretickou disciplínou i praktickou činností. V teorii statistiky jsou náhodnost a neurčitost modelovány pomocí teorie pravděpodobnosti. Statistika jako praktická činnost se zabývá sběrem, zpracováním, rozborem a zveřejňováním dat. Jedním z cílů statistiky je najít „nejlepší“ informace z dostupných dat, proto je někdy také považována za součást teorie rozhodování.
Pojem statistika je v praxi používán v různých významech. Statistiku můžeme definovat jako
- číselnou informaci, která je výsledkem pozorování s cílem charakterizovat předmět pozorování;
- institucionálně organizovanou praktickou činnost (u nás prostřednictvím Českého statistického úřadu a jeho pracovišť) zahrnující zjišťování, zpracování a analýzu sociálně-ekonomických jevů;
- vědní obor, který zkoumá stav a vývoj číselně vyjádřitelných měnlivých a hromadně se vyskytujících jevů, opakujících se v čase a v prostoru. Pro zjišťování individuálních údajů o hromadných jevech, jejich zpracování a hodnocení využívá statistika speciální prostředky a metody. K poznání pravidelností, souvislostí a vývojových tendencí se používá statistická analýza.
Statistika má řadu oborů, k nimž patří zejména
a) Popisná statistika – sleduje stav a vývoj hromadných jevů.
b) Matematická statistika – obor na pomezí popisné statistiky a aplikované matematiky. Soubor postupů a metod pro zpracování hromadných dat založených na induktivním usuzování. Závěry se vyvozují na základě teorie pravděpodobnosti. Poznané pravidelnosti a zákonitosti ve stavu a vývoji hromadných jevů slouží k úsudkům z části na celek, ze zvláštního na obecné, k odhadům budoucího vývoje.
c) Hospodářská statistika – zabývá se popisem a analýzou ekonomických jevů.
d) Demografická statistika – zabývá se popisem a analýzou stavu a pohybu obyvatelstva.
e) Měnová a finanční statistika – soubor statistik, které sestavuje a publikuje Česká národní banka pro potřeby měnové politiky a finanční stability České republiky a pro potřeby Evropského systému centrálních bank. Tyto statistiky monitorují stavy, transakce a u vybraných nástrojů úrokové sazby nebo míry růstu údajů sektorových bilancí finančních institucí. Součástí měnové a finanční statistiky je rovněž statistika finančních trhů.
1 Z HISTORIE STATISTIKY
Za nejstarší statistické dokumenty můžeme označit středověké soupisy majetku, včetně soupisů poddaných. Vůbec nejstarším takovým dochovaným soupisem je soupis majetku litoměřického kostela z roku 1058, který je součástí zakládací listiny knížete Spytihněva II. Ve středověku mají také počátek matriky narození, sňatků a úmrtí; v Čechách se farní matriky běžně dochovaly až od poloviny 17. století. S počátkem novověku pak souvisejí snahy o organizaci státní statistické služby. V roce 1753 byl vydán patent císařovny Marie Terezie o každoročním čítání lidu; první sčítání bylo provedeno v roce 1754 současně a jednotně na celém území habsburské monarchie. Koncepcí a organizací statistických šetření a vytvářením potřebných metodik se koncem 18. století zabýval – s podporou císaře Josefa II. – Josef Antonín rytíř Riegger (1742–1795). První moderní sčítání lidu (populační census) bylo v rakouských zemích provedeno na základě nového zákona z roku 1869 začátkem roku 1870; zachytilo stav ke dni 31. 12. 1869. Sčítání 1869 vytvořilo podmínky pro porovnávání základních demografických údajů od tohoto roku až po současnost. S výsledky sčítání 1869 byla poprvé seznámena veřejnost vydáním speciální šestidílné publikace. Předcházející výsledky soupisů obyvatel byly pokládány, stejně jako výsledky dalších statistických šetření, za tajné či důvěrné.
V roce 1897 byl zřízen Zemský statistický úřad Království českého, který se stal prvním skutečně statistickým úřadem na území dnešní České republiky. Byla v něm soustředěna všechna statistická pracoviště, která do té doby působila v rámci různých ministerstev a dalších institucí. V roce 1909 vyšla první Statistická příručka království Českého, další pak následovala v roce 1913.
V lednu 1919 přijalo Revoluční národní shromáždění zákon č. 49 o organizaci statistické služby, jehož principy odpovídaly zásadám, na kterých je organizována současná státní statistická služba ČR. V roce 1919 byl založen Státní úřad statistický (SÚS) jako nový orgán pověřený celostátními statistickými šetřeními, mezi než patřilo i sčítání lidu. V dubnu 1920 byl přijat nový zákon o sčítání lidu. Sčítání podle nového zákona se uskutečnilo v roce 1921. Další sčítání proběhlo v roce 1930 a po něm až v roce 1950. Pak následovala pravidelná sčítání vždy po deseti letech. Dnes je tak k dispozici až dvousetpadesátiletá řada dat o obyvatelstvu.
2 ORGANIZACE STÁTNÍ STATISTICKÉ SLUŽBY
Základní právní normou upravující státní statistickou službu a její fungování je zákon č. 89/1995 Sb., o státní statistické službě, ve znění pozdějších předpisů. Hlavním orgánem státní statistické služby je Český statistický úřad, který zajišťuje a organizuje sběr, zpracování a publikaci statistických údajů. Koordinuje také sběr a zpracování statistických údajů, které provádějí jednotlivá ministerstva.
Hlavní sídlo Českého statistického úřadu je v nové budově v Praze-Strašnicích. V jednotlivých krajích jsou zřízeny vnitřní organizační jednotky, tzv. krajské správy. ČSÚ pravidelně zveřejňuje velké množství dat. Nejnovější údaje o ekonomickém i sociálním vývoji ČR publikuje formou tzv. Rychlých informací. Úřad také vydává množství publikací včetně Statistické ročenky ČR.
K provádění zákona o státní statistické službě vydává ČSÚ pro jednotlivé roky program statistických zjišťování vyhláškou o Programu statistických zjišťování, kterou vypracovává v součinnosti s ministerstvy a jinými správními úřady. Vyhlášku účinnou pro příslušný rok vydává vždy nejpozději do 30. listopadu předcházejícího roku.
V programu u každého statistického zjišťování uvádí:
- účel příslušného statistického zjišťování a jeho obsah;
- okruh zpravodajských jednotek, které mají pro toto statistické zjišťování zpravodajskou povinnost;
- způsob statistického zjišťování;
- periodicitu a lhůty k poskytnutí údajů;
- orgán provádějící příslušné statistické zjišťování.
Potřebné údaje státní statistická služba získává prostřednictvím zpravodajských jednotek.
Zpravodajskou povinnost zákon o státní statistické službě ukládá zpravodajským jednotkám. Zpravodajskou jednotkou je právnická osoba, organizační složka státu nebo fyzická osoba, od níž se požaduje poskytnutí individuálních údajů pro státní statistické zjišťování (§ 2 písm. i) zákona o státní statistické službě). Zpravodajské jednotky jsou povinny poskytnout požadované individuální statistické údaje včas, úplně, správně a pravdivě pro příslušná statistická zjišťování, uvedená v programu statistických zjišťování pro příslušný rok (§ 2 písm. j) a § 10 odst. 3 zákona o státní statistické službě). Pro jiná statistická zjišťování než ta, která jsou uvedena v programu statistických zjišťování, není stanovena zpravodajská povinnost. Může se pro ně využívat jen dobrovolné poskytování individuálních údajů (§ 11 zákona o státní statistické službě). Náklady spojené se splněním zpravodajské povinnosti, které vzniknou zpravodajské jednotce, nese tato jednotka sama.
Orgány vykonávající státní statistickou službu (ČSÚ a jednotlivá ministerstva a jiné správní úřady) jsou povinny pro provedení statistických zjišťování zaslat zpravodajské jednotce bezplatně tiskopisy, popřípadě technické nosiče informací a poskytnout jí potřebnou metodickou pomoc. Odmítnutí splnění zpravodajské povinnosti není přípustné ani s odvoláním na dodržování obchodního tajemství (§ 15 odst. 3 zákona o státní statistické službě). Pracoviště státní statistické správy má ze zákona povinnost ochraňovat individuální údaje respondentů před zneužitím. Nedodržování zpravodajské povinnosti i porušení ochrany individuálních dat je z uvedeného zákona možné poměrně přísně sankcionovat.
Ustanovení § 26 a § 26a zákona o státní statistické službě určuje, které postupy zpravodajských jednotek jsou správními delikty. Současně u jednotlivých správních deliktů stanoví výši pokuty, která může být zpravodajské jednotce uložena. Právnická nebo podnikající fyzická osoba se jako zpravodajská jednotka dopustí správního deliktu tím, že nesplní svoji zpravodajskou povinnost. Za uvedený správní delikt se uloží pokuta do 100 000 Kč. Odpovědnost právnické osoby za správní delikt zaniká, jestliže správní orgán o něm nezahájil řízení do 3 let, kdy se o něm dozvěděl, nejpozději však do 5 let ode dne, kdy byl spáchán.
Podle zákona o státní statistické službě lze stanovit zpravodajskou povinnost ekonomickým subjektům, nikoliv však fyzickým osobám (občanům), kde je to možné učinit jen zvláštním zákonem. Zákonem se proto upravuje každé sčítání lidu, domů a bytů. Příští sčítání (neboli populační census) bude v roce 2011. Je upraveno právními normami.
- zákonem č. 296/2009 Sb., o sčítání lidu, domů a bytů v roce 2011;
- nařízením Evropského parlamentu a Rady (ES) č. 763/2008 ze dne 9. července 2008 o sčítání lidu, domů a bytů.
K činnosti České statistického úřadu dále patří:
- vydává statistické ročenky a další statistické publikace;
- provádí konjunkturální průzkumy (očekávané tendence ve vývoji ekonomiky, názory podnikatelů i spotřebitelů);
- zpracovává výsledky všech voleb a referend konaných na území ČR;
- publikuje časové řady ekonomických a sociálních ukazatelů;
- organizuje, zpracovává a publikuje výsledky sčítání lidu, domů a bytů;
- spravuje řadu číselníků a klasifikací, zejména odvětvovou klasifikaci ekonomických činností, standardní klasifikaci produkce, klasifikace zaměstnání, klasifikaci územních statistických jednotek a další;
- spravuje registr ekonomických subjektů a registr sčítacích obvodů.
3 EVROPSKÝ STATISTICKÝ SYSTÉM
Evropský statistický systém (ESS) zahrnuje vedle Evropského statistického úřadu (zkrácený název Eurostat) národní statistické úřady, ministerstva, evropské agentury a centrální banky, a to nejen v členských státech EU, ale i na Islandu, v Norsku a Lichtenštejnsku. V rámci ESS má EUROSTAT při harmonizaci statistik řídící úlohu. Svou činnost koordinuje ESS také s mezinárodními organizacemi, jako např. OSN, Organizací pro bezpečnost a spolupráci v Evropě, Mezinárodním měnovým fondem a Světovou bankou.
Evropský statistický úřad sídlí v Lucemburku. Formálně je podřízen Evropské komisi. Připravuje statistická data pro potřeby EU a harmonizuje statistickou metodiku ve všech členských státech. K jeho hlavním úkolům dále patří:
- připravovat makroekonomická data pro Evropskou centrální banku, podporující její měnovou politiku eura;
- připravovat regionální data v klasifikaci NUTS (Statistických územních jednotek), podporující strukturální politiku EU.
4 STATISTICKÉ VELIČINY A POJMY
Poznámka:
Výklad v této kapitole je zaměřen na prezentování základních pojmů užívaných ve statistických publikacích a je určen uživatelům z praxe, kteří se setkávají se statistickou terminologií a problematikou jen občas. Výklad je proto formulován především pomocí běžně užívaných termínů s přihlédnutím k tomu, že uživatelé nemusí být seznámeni s dalšími statistickými pojmy a definicemi. Z rozdílnosti profesní specializace potenciálních uživatelů se výběr uvedených hesel také může jevit někomu jako nadbytečný, jinému naopak jako nedostatečný.
Formulace jsou proto také, zejména v některých případech, zjednodušeny, samozřejmě ne na úkor správnosti. Řazení hesel, také není striktně alfabetické, ale uplatňuje se částečně věcné členění, zejména tam, kde se ukázalo vhodné užít seskupení některých navazujících pojmů. Tomuto záměru je podřízeno rozčlenění do několika oddílů, vč. oddílu, obsahujícího metodický výklad některých pojmů, používaných v publikacích ČSÚ. V zásadě jde o stručnou pomocnou pomůcku, která nemá a nemůže nahradit výkladový slovník nebo výklad statistické problematiky jako takové (např. [3] nebo [4]).
4.1 OBECNÉ POJMY [2, 3, 4, 5]
Báze – z toho bazický soubor, bazické období apod. Znamená základ, ke kterému jsou hodnoty sledovaného souboru porovnávány. Často se s ním lze setkat při časovém porovnání, kdy údaje sledovaného období (sledovaného, bazického roku) se porovnávají s hodnotami zvoleného základního období (sledovaného období), např. stejného měsíce nebo čtvrtletí předchozího, nebo jiného zvoleného roku. Specifičtější význam má termín bazický index (viz), i když i tam jde o vyjádření změny současného stavu v porovnání s bazickým obdobím.
Bod procentní – jednotka, v níž je vyjádřen rozdíl dvou (nebo více) údajů vyjádřených v procentech.
Časová řada – posloupnost věcně a prostorově srovnatelných pozorování (údajů), jež jsou uspořádána z hlediska času ve směru minulost – přítomnost. Analýzou (případně i prognózou) časových řad se rozumí soubor metod, které slouží k popisu těchto řad a případně k předvídání jejich budoucího chování. Časová řada statistických ukazatelů se dělí na:
- časové řady intervalové (např. výše tržeb za jeden měsíc) a okamžikové (stav zásob k určitému okamžiku);
- časové řady dlouhodobé (roční) a krátkodobé (čtvrtletní, měsíční, týdenní aj. periody);
- časové řady naturálních a peněžních ukazatelů.
Data primární – data získávaná bezprostředně statistickým šetřením, data sekundární jsou data převzatá z pramenů (viz též „statistický ukazatel“).
Dedukce – metoda usuzování, postupující od obecného k jedinečnému, ale také od obecného k obecnému nebo od jedinečného k jedinečnému. Opačným postupem usuzování je indukce.
Demografie – se zabývá zkoumáním reprodukce lidských populací a příslušných vztahů a podmínek jejich reprodukce.
Histogram – grafické zobrazení skupinového rozdělení četností. Jde o sloupcový diagram, jehož jednotlivé sloupce tvaru obdélníků svou plochou odpovídají četnostem příslušných intervalů.
Hodnota – míra, kterou je určitá vlastnost „statistického znaku“ obsažena v dané jednotce statistického souboru; každá jednotlivá hodnota se také nazývá pozorováním. Počet hodnot statistického znaku je roven rozsahu statistického souboru, nebo jinými slovy, rozsah souboru se rovná počtu pozorování.
Hodnota odlehlá – hodnota/pozorování, která je extrémně vzdálená od ostatních hodnot pozorovaného jevu.
Index, indexní číslo – poměrná (relativní) míra rozdílu obvykle dvou hodnot statistického ukazatele v čase, v prostoru nebo ve věcném vymezení (podle toho index časový, prostorový, druhový). Index je bezrozměrné číslo, které udává o kolik procent, příp. kolikrát, je jedna hodnota ukazatele větší, nebo menší než druhá. V případě porovnávání hodnotových veličin v měnových jednotkách v běžných cenách jde o změnu nominální, ve stálých, srovnatelných cenách jde o změnu reálnou (eliminující vliv změny cen). Rozdíl dvou indexů vyjadřuje změnu temp růstu/poklesu v procentních bodech.
Je-li období individuálního časového indexu, ke kterému se změna hodnoty ve sledovaném (běžném) období porovnává, stálé (např. objemy produkce za řadu let uspořádané do časové posloupnosti se porovnávají k jednomu zvolenému, tzv. základnímu nebo bazickému roku), mluvíme o bazickém indexu, který je konstruován jako poměr hodnoty veličiny v běžném, sledovaném období (období t) a hodnoty veličiny v základním (nultém) období, tj.
i_{baz} = x_t / x_0, \ resp.\ i_{baz} = x_t / x_0 \cdot 100
např. růst 5 % je v prvním případě vyjádřen jako 1,05; resp. ve druhém případě jako 105 (%).
Jestliže se základní období mění, (např. porovnání ročního objemu produkce k objemu produkce vždy předcházejícího roku), mluvíme o řetězovém indexu (indexu/koeficientu růstu), který je konstruován jako poměr hodnoty veličiny v běžném období (období t) a hodnoty veličiny v období předcházejícím (období t-1), tj.
i_i = x_t / x_{t-1}, \ resp.\ i_{baz} = x_t / x_{t-1} \cdot 100
Podle konstrukce, vzhledem ke stejnorodosti nebo různorodosti měřeného ukazatele, se rozeznává index individuální (viz výše) a index souhrnný. Konstrukci souhrnného indexu lze vyjádřit např. vzorcem:
I = \frac{\sum_{1}^{n}(p_{1,I}:p_{0,I})\cdot p_{0,I}\cdot q_{0,I}}{\sum_{1}^{n}\cdot p_{0,I}\cdot q_{0,I}}
kde je
\sum_1^n \ …\ součet\ n\ produktů;\\ p_{1,i}\ …\ cena\ i-tého\ produktu\ ve\ sledovaném\ období;\\ p_{0,i}\ …\ cena\ i-tého\ produktu\ v\ základním\ období;\\ q_{0,i}\ …\ množství\ i-tého\ produktu\ v\ základním\ období;\\ p_{0,i}q_{0,i}\ …\ stálá\ váha\ (např.\ objem\ produkce,\ tržby\ apod.).
V praxi se používají 4 varianty souhrnného indexu, které se navzájem liší vahami konstruovanými buď z údajů základního nebo běžného nebo jiného období (Laspeyresův, Paascheho, Löweho index) nebo jejich kombinací (Fisherův index jako průměr indexu L. a P.).
Indukce – metoda usuzování, která z individuálních empirických faktů (pozorování) získává další poznatky; tzn., že usuzuje z jedinečného na obecné, z omezeného počtu poznatků na vlastnosti celku, resp. usuzuje na analogii mezi jedním a druhým faktem. Má proto charakter hypotézy.
Indukce statistická – metoda, kdy se poznatky získané ze statistického pozorování určité části (výběrového souboru) přenášejí pomocí metod statistické indukce na celek (na základní soubor).
Pokus náhodný – klasického typu je např. hod mincí nebo kostkou. Pro výsledek náhodného pokusu je charakteristické, že určitý výsledek může, ale nemusí nastat – rozhoduje o tom náhoda. Náhoda je ale objektivně daná, není bezpříčinná, je důsledkem toho, že není možné vzít v úvahu, resp. kontrolovat, všechny podmínky, za nichž určitý proces probíhá. Výsledek náhodného pokusu se nazývá náhodný jev. Číselná veličina, jejíchž hodnot může náhodný jev nabývat, se nazývá náhodná veličina. Jednotlivým hodnotám náhodné veličiny se přiřazuje pravděpodobnost, tj. poměrná četnost, s níž se určitá hodnota při velkém počtu pokusů („počtu rostoucím nad všechny meze“) opakuje. Zákonitostmi, jimiž se řídí hromadné náhodné jevy se zabývá teorie pravděpodobnosti.
Pozorování hromadné – pozorování určitého jevu na souboru objektů. Skládá se z řady individuálních pozorování. Důvodem pro hromadné pozorování je, že příčinné vztahy se neprojevují nutně v každém individuálním případě, v každém individuálním pokusu, ale prosazují se jako zákonitost u souboru jako celku. Hromadné pozorování nahrazuje v některých vědních oborech (např. ekonomie, sociologie apod.) experiment (s vědomím, že nesplňuje všechny předpoklady, za nichž se pokus uskutečňuje, např. stálost všech podmínek, přepokládaných u vědeckého experimentu) (viz též „statistické šetření/zjišťování“).
Pozorování individuální – pozorování kvantitativních nebo kvalitativních znaků u jednotlivých nositelů těchto znaků, v případě statistického pozorování statistických jednotek (viz též „statistické šetření/zjišťování“).
Pozorování úplné, vyčerpávající – zahrnuje všechny jednotky souboru (viz též „statistické šetření/zjišťování“).
Pozorování výběrové – zahrnuje jen jednotky vybrané ze základního souboru podle určitých pravidel a tvořící výběrový soubor, výběr. Výběr se provádí buď náhodně (náhodný, pravděpodobnostní výběr), nebo podle určitého záměru (záměrný výběr). Ve výběrovém souboru se získávají výběrové statistické ukazatele (průměr, rozptyl, korelační ukazatele aj.), z jejichž hodnot se usuzuje s pomocí metod statistické indukce na hodnoty ukazatelů, parametrů základního souboru. Výhodou práce s výběrovým souborem před prací se základním souborem je úspornost (času, nákladů) a nižší pracnost při zpracování i kontrole, někdy také nemožnost práce se základním souborem pro jeho velký rozsah nebo nedosažitelnost jeho prvků. Záporem je, že jeho výsledky mají charakter odhadů, které se nemusí krýt se skutečností, tj. jsou zatíženy výběrovou chybou. (viz též „statistické šetření/ zjišťování“). Odhady parametrů základního souboru z výběrových ukazatelů pomocí metod statistické indukce jsou odůvodněné v případě náhodných výběrů, v případě záměrných výběrů je uplatnění těchto metod přinejmenším diskutabilní.
Pravděpodobnost – náhodného jevu je míra možnosti, že náhodný jev nastane (viz též „pokus náhodný“). Rozlišuje se pravděpodobnost nepodmíněná (jev nastane jen za daných podmínek) a podmíněná (např. jev A nastane nejen za daných podmínek, ale ještě také jen tehdy, nastane-li současně jev B).
Rozdělení četností – je soubor hodnot statistického znaku uspořádaný do rostoucí posloupnosti; každé hodnotě statistického znaku je přiřazena četnost (frekvence), s níž byla pozorována. Četnost je vyjádřena buď absolutně, nebo relativně (podíl z celkového počtu pozorování, tj. z rozsahu souboru). Kromě toho lze jev popsat kumulativními četnostmi, (kumulativním rozdělením četností), absolutními nebo relativními, jež udávají počet jednotek souboru nebo poměrnou část souboru, mající hodnotu znaku menší nebo rovnou dané kumulativní četnosti. Má-li rozdělení jeden vrchol, nazývá se jednovrcholové, unimodální, má-li vrcholů více, jde o rozdělení vícevrcholové, multimodální (např. dvouvrcholové, bimodální rozdělení). Je-li statistický znak spojitý, je třeba konstruovat intervalové rozdělení četností.
Dalšími vlastnostmi rozdělení je šikmost a špičatost. Jsou-li četnosti nízkých hodnot četnější než četnosti vysokých hodnot, je rozdělení zešikmeno doleva (kladné zešikmení, kladná šikmost), v opačném případě jde o zešikmení záporné, záporná šikmost. Podle toho jsou rozdělení souměrná, symetrická a nesouměrná, asymetrická, šikmá, zešikmená. Jednoduchou mírou šikmosti je standardizovaná šikmost dána vzorcem
\alpha = (n^{'} - n^{''})/n
kde je
n^{'}\ …\ počet\ hodnot\ pozorování\ menších\ než\ aritmetický\ průměr;\\ n^{''} … počet hodnot pozorování větších než aritmetický průměr;\\ n\ …\ celkový\ počet\ pozorování,\ rozsah\ souboru.
Pro souměrné rozdělení je hodnota α nulová, při kladném zešikmení je hodnota α kladná a při záporném zešikmení je hodnota α záporná. Čím je absolutní hodnota α vyšší, tím je rozdělení šikmější. Při kladném zešikmení je obvykle hodnota mediánu nižší než hodnota aritmetického průměru, při záporném zešikmení je tomu obráceně.
Příklad:
(Číselné údaje viz níže kvantily)
\alpha = (103 – 97) / 200 = 6 / 200 = 0{,}003
Jinou charakteristikou rozdělení četností je špičatost (exces). Velká špičatost rozdělení značí vysokou koncentraci hodnot v blízkosti středních hodnot, vrchol výrazně vystupuje. Specifickou podobou, užívanou k měření špičatosti, je standardizovaná špičatost.
Rozdělení pravděpodobností (zákon rozdělení náhodné veličiny) – pravidlo přiřazující v souboru uspořádaném podle velikosti hodnot statistického znaku (náhodné veličiny) pravděpodobnost, se kterou bude tato hodnota dosažena (obdoba četnosti v rozdělení četností). U spojitých náhodných veličin nelze zákon rozdělení popsat pravděpodobnostmi přiřazenými jednotlivým hodnotám náhodné veličiny, ale popisuje se tzv. hustotou pravděpodobností (frekvenční funkcí). Součet pravděpodobností nespojité veličiny a plocha vymezená frekvenční funkcí se rovná 1. Základní popis rozdělení představuje distribuční funkce (obdoba kumulativní relativní četnosti v rozdělení četností), která udává pravděpodobnost, že náhodná veličina dosáhne hodnotu menší nebo rovnou zvolené hodnotě. Dále lze rozdělení popsat momentovými charakteristikami, kterými jsou střední hodnota, rozptyl, šikmost a špičatost.
Mezi zákony rozdělení náhodné veličiny má základní postavení tzv. normální rozdělení (Laplaceovo-Gaussovo rozdělení). Jde o symetrické jednovrcholové rozdělení, v grafické podobě charakterizované Gaussovou křivkou hustot pravděpodobností zvonového tvaru s maximem v bodě x = μ (střední hodnota) a pro x → ± ∝ se asymptoticky blíží nule. Lze jím aproximovat řadu zákonů rozdělení náhodných veličin, jestliže výskyt náhodné veličiny je ovlivněn velkým počtem vzájemně nezávislých faktorů, které jsou, i pro svůj velký počet, v podstatě stejně málo významné. Parametry tohoto rozdělení jsou střední hodnota μ a rozptyl σ2. Pro usnadnění výpočtu se normální rozdělení převádí do normované podoby, kde μ = 0 a σ2 = 1.
Řada časová – posloupnost srovnatelných pozorování sledovaného jevu (srovnatelnost je dána věcným a prostorovým vymezením intervalové veličiny: např. objem produkce nebo tržeb stavebních podniků v ČR, nebo okamžikové veličiny: např. počet obyvatel ČR) z různé doby (např. v období 1991–2001) a podle času uspořádaných. Řady veličin hodnotového charakteru, tj. vyjádřené např. v Kč, mohou být oceněny běžnými nebo stálými/srovnatelnými cenami.
Statistická jednotka – objekt, na němž jsou při statistickém pozorování sledovány určité znaky. Vlastnosti statistických jednotek jsou přesně stanoveny a jsou identické. Jde o základní jednotku statistického pozorování/šetření/zjišťování. Informace o statistické jednotce podává zpravodajská jednotka, která může, ale nemusí být totožná s jednotkou statistickou.
Statistické šetření, zjišťování – jeden ze způsobů získávání neznámých dat o hodnotách proměnných veličin statistických jednotek Vyžaduje časové, prostorové a věcné vymezení statistického souboru a proměnných, které jsou předmětem šetření. Za základní členění je možno považovat
- zjišťování úplné, vyčerpávající, které se provádí u všech statistických jednotek relevantních pro dané zjišťování (na základním souboru);
- zjišťování výběrové (viz též „pozorování výběrové“), prováděné u části souboru statistických jednotek (na výběrovém souboru), z jehož výsledků se metodami statistické indukce dělají odhady platné pro celý základní soubor;
- jsou-li jednotky výběrového souboru vybrané náhodně, jde o náhodný výběr (prostý nebo složitější formy), který je tzv. reprezentativním výběrem, umožňujícím provádět odhady hodnot parametrů základního souboru metodami statistické indukce;
- jsou-li vybrány podle určitého záměru, jde o záměrný výběr, který např. spolu s anketou, je tzv. nereprezentativním výběrem.
Statistický soubor – množina statistických jednotek, tj. prvků souboru, na němž se provádí statistické pozorování. Rozlišují se soubory základní a soubory výběrové (viz „pozorování výběrové, statistické šetření“).
Statistický ukazatel – proměnná veličina, která popisuje kvantitativní stránku zkoumaného jevu, definovaného z hlediska věcného, časového a prostorového; čas a prostor také spoluurčují jeho hodnotu. Ukazatele se rozlišují např. na:
- primární, přímo zjišťované (objem produkce, počet zaměstnanců atd.) a sekundární, odvozené (ziskovost, průměrné hodnoty atd.);
- absolutní (primární i sekundární) a relativní (vždy sekundární);
- extenzitní (ukazatele množství) a intenzitní (ukazatele úrovně);
- okamžikové (hodnota k určitému okamžiku, např. počet zaměstnanců, stav zakázek atd.) a intervalové (hodnota za daný interval, např. objem produkce, počet dokončených bytů atd.).
Statistický znak – odraz (obraz) určité vlastnosti, které statistické jednotky nabývají ve stejné nebo v různé míře. Statistický znak nabývající ve statistickém souboru více než jedné hodnoty se nazývá statistická proměnná (veličina), nabývá-li znak jen jedné hodnoty, jde o konstantu. Proměnné veličiny se rozlišují podle různých hledisek např. proměnné:
- slovní (alfabetické, kategoriální, kvalitativní) a číselné (numerické, kvantitativní);
- nominální (jmenné, názvové), ordinální (pořadové) a metrické (měřitelné);
- metrické se dělí jednak na kladné, jednak na kladné i nekladné;
- nabývající jednak jen dvě varianty (alternativní), jednak více variant (množné).
Tempo růstu – vyjadřuje relativní přírůstek/úbytek za stanovené období, tj. poměr hodnoty ukazatele dosažené ve sledovaném období a hodnoty dosažené v období základním. Vyjadřuje se v procentech (= hodnota koeficientu růstu, vyjádřeného řetězovým indexem, zmenšená o 1 a násobená 100; např. řetězový index, koeficient růstu = 1,06, tempo růstu = 6 %), rozdíl temp růstu, je vyjádřen v procentních bodech. Průměrné tempo se stanoví jako geometrický průměr jednotlivých koeficientů růstu (řetězových indexů) zmenšený o 1. Tempo růstu hodnotových veličin (v měnových jednotkách) vyjádřených v běžných cenách vyjadřuje růst nominální, veličin vyjádřených ve stálých (srovnatelných) cenách vyjadřuje růst reálný.
Příklad:
Objem stavební produkce | ||
Období | Mld. Kč, běžné ceny | Mld. Kč, stálé ceny (Ø r. 2000) |
2006 2007 2008 | – 511,0 536,6 | 386,1 411,9 414,3 |
Nominální roční růst 2008/2007: index = 536,6 / 511,0 = 1,050; tempo růstu = 5,0 % | ||
Reálný roční růst 2007/2006: index = 411,9 : 386,1 = 1,067; tempo růstu = 6,7 % 2008/2007: index = 414,3 : 411,9 = 1,006; tempo růstu = 0,6 % | ||
Rozdíl reálných ročních temp růstu v letech 2008 a 2007: 0,6 % – 6,7 % = -6,1 procentního bodu Reálné roční tempo růstu v roce 2008 (2007 = 100 %): 0,6 % : 6,1 % = 9,8 %, tj. pokles 90,2 % Průměrné reálné roční tempo růstu v letech 2007 a 2008: √ (1,067. 1,006) = √ 1,073 = 1,036, tj. 3,6 % |
Teorie odhadu – se zabývá metodami získání nejlepších odhadů neznámých parametrů rozdělení náhodné veličiny z jejích pozorovaných hodnot. Odhady mohou být bodové nebo intervalové.
Testování hypotéz – postupy vedoucí k rozhodnutí o přijetí nebo zamítnutí statistických hypotéz, tj. předpokladů o neznámých parametrech, tvaru rozdělení a jiných vlastnostech základního souboru.
Třídění intervalové – třídění podle velikosti nezávisle proměnné, v níž nezávisle proměnná je uspořádána do skupin, vymezených určitým intervalem její velikosti. Intervaly mohou mít stejnou délku (např. v korelační analýze), délka intervalů může být ale i různá (např. při tzv. typologickém třídění, v němž účelem třídění podle kvantitativního znaku je odhalení kvalitativně odlišných skupin). Při vymezování intervalů je třeba, aby horní hranice předcházejícího intervalu nesplývala s dolní hranicí intervalu následujícího (např. chybně intervaly 0–25, 25–50…; správně 0–24, 25–49,…). Přiřazením četností těmto intervalům vzniká intervalové rozdělení četností.
Verifikace – empirické ověření správnosti teorie nebo hypotézy. Verifikovatelnost je schopnost takového ověření.
Zákon velkých čísel – ve znění Bernoulliho věty říká, že se zvyšováním počtu náhodných nezávislých pokusů se četnost jejich empiricky zjištěných výsledků blíží pravděpodobnosti jejich výskytu. Jiným, obecnějším vyjádřením zákona velkých čísel je věta Čebyševova.
4.2 MÍRY POLOHY, STŘEDNÍ HODNOTY [2, 5]
Kvantily – jsou hodnoty prvků statistického souboru, statistického znaku, které rozdělují statistický soubor na část s hodnotou znaku menší (nebo rovnou) než je hodnota kvantilu a na část s hodnotou větší (nebo stejnou). Nejvýznamnějším kvantilem je medián (viz), dělící soubor na dvě poloviny. Dalšími důležitými kvantily jsou 3 kvartily, dělící soubor na 4 části (dolní kvartil, střední kvartil, tj. medián, a horní kvartil), 9 decilů, dělící soubor na 10 částí, a percentily/centily (99), dělící soubor na 100 částí.
Medián – kvantil dělící statistický soubor na dvě stejné poloviny. Je hodnotou prostřední statistické jednotky statistického souboru uspořádaného vzestupně podle velikosti, nebo jinými slovy, polovina pozorování má hodnotu menší nebo stejnou a polovina hodnotu větší nebo stejnou jako medián. V souboru s lichým počtem členů je hodnota mediánu hodnotou prostředního pozorování, v souboru se sudým počtem členů leží mezi dvěma prostředními pozorováními a je průměrem jejich hodnot. Podobně se postupuje i při určování ostatních kvantilů. Medián v porovnání s aritmetickým průměrem napovídá o symetričnosti, resp. asymetričnosti rozdělení četností (medián je obvykle menší než průměr, je-li rozdělení zešikmeno doleva, kladná šikmost, a je obvykle větší, je-li rozdělení zešikmeno doprava, záporná šikmost).
Příklad:
Proměnné xi | x1 | x2 | x3 | x4 | x5 | X6 | x7 | x8 | x9 |
Hodnota xi = | 1 | 5 | 9 | 13 | 17 | 21 | 25 | 29 | 33 |
Četnost ni = | 10 | 13 | 20 | 60 | 45 | 25 | 15 | 8 | 4 |
Kumul. četnosti | 10 | 23 | 43 | 103 | 148 | 173 | 188 | 196 | 200 |
Medián:1————————————–n100 / n101——————————————33
Xmed = (13+13) / 2 = 13 (= x4)
Kvartily:1—————-n50 / n51—————n100 / n101—————-n150 / n151—————-33
X0,25 = (13 + 13) / 2 = 13 (= x4)X0,75 = (21 + 21) / 2 = 21 (= X6)
Decily: 1—–n20 / n21—–n40 / 41n160 / n161—–n180 / n181—–33
X0,1 = (5 + 5) / 2 = 5 (= x2)X0,8 = (21 + 21) / 2 = 21 (= x6)
X0,2 = (9 + 9) / 2 = 9 (= x3)X0,9 = (25 + 25) / 2 = 25 (= x7) atd.
Modus – prvek statistického souboru s nejvyšší četností pozorování. Podobně jako medián v porovnání s aritmetickým průměrem napovídá o symetričnosti rozdělení četností. Má-li modus zápornou hodnotu, mluví se o antimodu.
Průměr aritmetický – základním ukazatelem úrovně řady hodnot kvantitativního znaku a svou hodnotou tuto úroveň reprezentuje. Je považován za základní střední hodnotu daného souboru.
Průměr aritmetický prostý – dán vzorcem, v němž se rovná součtu všech pozorovaných hodnot dělenému počtem těchto pozorování; všechna pozorování mají stejnou váhu:
X_{ap} = (x_1 + x_2 + ... + x_n)/n = \sum_1^nx_1/n = \sum x/n
kde je
\begin{aligned} X_{ap}\ aritmetický\ průměr\ (prostý)\ veličiny\ x;\\ x_i\ hodnota\ i-tého\ pozorování;\\ n\ rozsah\ souboru\ (počet\ pozorování);\\ \sum\ součet;\\ \sum_1^n\ součet\ prvků\ od\ 1.\ do\ n-tého.\\ \end{aligned}
Průměr aritmetický vážený – vyjadřuje aritmetický průměr, v němž jednotlivá hodnoty proměnné mají rozdílnou váhu (počet pozorování) a tedy vliv na konečnou střední hodnotu.
Průměr aritmetický vážený – vyjadřuje aritmetický průměr, v němž jednotlivá hodnoty proměnné mají rozdílnou váhu (počet pozorování) a tedy vliv na konečnou střední hodnotu.
X_{ap} = (x_1f_1 + x_2f_2 + ... + x_nf_n)/(f_1 + f_2 + ... + f_n) = \sum_1^n x_if_i/\sum_1^nf_i = \sum xf/\sum f
kde je
x_{apv}\qquad vážený\ aritmetický\ průměr\ veličiny\ x;\\ x_i\qquad hodnota\ i-té\ veličiny;\\ f_i\qquad váha\ i-té\ veličiny; Σ f = n;\\ n\qquad rozsah\ souboru\ (počet\ pozorování);\\ \sum\qquad součet;\\ \sum_1^n\qquad součet\ prvků\ od\ 1.\ do\ n-tého.\\
Xapv vážený aritmetický průměr veličiny x;
xi hodnota i-té veličiny;
fiváha i-té veličiny; Σ f = n;
nrozsah souboru (počet pozorování);
součet;
součet prvků od 1. do n-tého.
Příklad:
Proměnné xi | x1 | x2 | x3 | x4 | x5 | x6 | x7 | x8 | x9 |
Hodnota xi = | 1 | 5 | 9 | 13 | 17 | 21 | 25 | 29 | 33 |
Četnost ni = | 10 | 13 | 20 | 60 | 45 | 25 | 15 | 8 | 4 |
Kumul. četnosti | 10 | 23 | 43 | 103 | 148 | 173 | 188 | 196 | 200 |
medián Xmed = 13 (= x4); (průměr hodnoty 100. a 101. pozorování z celkového počtu 200 pozorování uspořádaných do vzestupné posloupnosti podle hodnoty veličiny xi);
modus Xmod = 13 (= x4); (proměnná nabyla z 200 pozorování nejčastěji hodnotu 13) vážený aritmetický průměr Xapv = 15,32 tzn., že
- rozdělení je zešikmeno vlevo (kladná šikmost);
- polovina malých hodnot je na menší části variačního rozpětí;
- většina pozorování nedosáhla hodnoty aritmetického průměru, tj., proměnná nabyla vícekrát podprůměrnou hodnotu;
- Xmed < Xapv.
Průměr geometrický – n-tá odmocnina ze součinu n hodnot pozorovaného znaku
X_{gp} = \sqrt[n]{(x_1\cdot x_2 . . . x_n)} = \sqrt[n]{\prod x_i}
kde je
Xgpgeometrický průměr (prostý);
n-tá odmocnina součinu n prvků pod odmocninou);
nrozsah souboru (počet pozorování);
součin prvků od 1. do n-tého;
xi hodnota i-té veličiny.
Používá se např. při výpočtu průměrného tempa růstu.
x_{hp} = \frac{n}{\sum_1^n 1/x_i}
Průměr harmonický – podíl počtu pozorování a součtu převrácených hodnot pozorovaného znaku:
kde je
Xhp harmonický průměr (prostý);
nrozsah souboru (počet pozorování);
součet prvků od 1. do n-tého;
xi hodnota i-té veličiny.
Vážený harmonický průměr se užívá při konstrukci souhrnných indexů.
Pro průměry, počítané ze stejných kladných hodnot, platí vztah:
xh ≤ xg ≤ xa
tj. aritmetický průměr má z nich nejvyšší hodnotu, harmonický průměr naopak nejmenší, hodnota geometrického průměru leží mezi oběma.
Průměr klouzavý – eliminuje v časových řadách krátkodobé vlivy (např. čtvrtletní klimatické vlivy v ročním období) a vyjadřuje naopak dlouhodobé trendy. Dochází tak k vyrovnání časové řady, a to nahrazením napozorovaných, empirických hodnot hodnotami průměrů těchto napozorovaných hodnot za zvolené období. Délka období, z něhož se průměry počítají závisí na frekvenci „sezónnosti“, jejíž projev chceme eliminovat – nejčastějším případem je vyrovnání sezónnosti během roku, kdy se průměry počítají z 12měsíčních hodnot, přičemž v každém dalším kroku se do souboru dvanácti měsíčních hodnot zařadí hodnota nového měsíce a vypustí hodnota nejstarší, tj. v předchozím kroku 1. měsíce souboru. Kromě prostého klouzavého průměru se užívají různé konstrukce vážených klouzavých průměrů, kde se jednotlivým obdobím přiřazují různé váhy, třeba nejvyšší váha se přiřadí poslednímu, nejaktuálnějšímu období a nejnižší váha prvnímu období.
Průměr podmíněný – průměr hodnot jedné proměnné vázaný určitým předpokladem, podmínkou, o hodnotách druhé proměnné (např. v intervalovém třídění jsou podmíněnými průměry závisle proměnné pro jednotlivé intervaly nezávisle proměnné).
4.3 MÍRY VARIABILITY (MĚNLIVOSTI, MUTABILITY) [2, 4, 5]
Rozpětí, variační rozpětí souboru ■ je dáno rozdílem nejvyšší, maximální a nejnižší, minimální hodnoty. Jde o jednoduchou míru, která je závislá jen na obou extrémních, krajních hodnotách. Analogicky se užívá rozpětí kvantilů (kvartilové r. mezi dolním a horním kvartilem zohledňující 50 % pozorování, decilové r. bez prvního a posledního decilu zohledňující 80 % pozorování, percentilové r. atd.), která vyjadřují rozpětí v intervalu jen mezi zvolenými kvantily a eliminují tak případný možný zkreslující vliv extrémních hodnot ležících mimo oblast vymezenou těmito zvolenými kvantily.
Příklad:
Proměnné xi | x1 | x2 | x3 | x4 | x5 | x6 | x7 | x8 | x9 |
Hodnota xi = | 1 | 5 | 9 | 13 | 17 | 21 | 25 | 29 | 33 |
Četnost ni = | 10 | 13 | 20 | 60 | 45 | 25 | 15 | 8 | 4 |
Kumul. četnosti | 10 | 23 | 43 | 103 | 148 | 173 | 188 | 196 | 200 |
Rozpětí:
1—————————————————–33
xmax – xmin = x9 – x1 = 33 – 1 = 32
Kvartilové rozpětí:
13————————————————–21
X0,75 – X0,25 = x6 – x4x = 21 – 13 = 8
Decilové rozpětí:
5—————————————————–25
X0,9 – X0,1 = x7 – x2 = 25 – 5 = 20
Rozptyl (variance) – aritmetický průměr čtverců (druhých mocnin) odchylek hodnot jednotlivých pozorování od jejich aritmetického průměru. Předností rozptylu proti rozpětí je, že bere do úvahy všechna pozorování. Vysoká hodnota rozptylu signalizuje nestejnorodost, nehomogennost souboru. Rozptyl se obvykle označuje písmenem s2 (s kvadrát) nebo řeckým σ2 (sigma kvadrát). Je možné ho upravit do formy rozdílu „aritmetického průměru čtverců hodnot veličiny x a čtverce jejich aritmetického průměru“ (oba symboly a veličiny, zde x2 a X2, je třeba od sebe odlišovat):
\sigma_x^2 = \frac{\sum_1^n (x_i-X_{ap})^2}{n} = x^2 - X^2
kde je
σx2rozptyl (sigmax kvadrát);
součet prvků od 1. do n-tého;
xi hodnota i-tého pozorování;
Xap aritmetický průměr veličiny x;
n rozsah souboru (počet pozorování);
x2aritmetický průměr čtverců veličiny x;
Xap2čtverec aritmetického průměru veličiny x.
V případě rozptylu z výběrového souboru se mluví o výběrovém rozptylu (značeném obvykle s2), na rozdíl od rozptylu základního souboru (značeném obvykle σ2).
Druhou odmocninou rozptylu je směrodatná odchylka, která má stejnou dimenzi jako pozorované hodnoty. Označuje se obvykle písmenem s nebo σ. Vysoká hodnota směrodatné odchylky, stejně jako rozptylu, signalizuje nestejnorodost zkoumaného souboru.
O dchylka průměrná – aritmetický průměr absolutních hodnot odchylek pozorovaných hodnot proměnné od jejich aritmetického průměru, tj.
d = \frac{\sum_1^n Ix_i - X_{ap}I}{n}
kde význam symbolů ve vzorci je stejný jako v předchozím případě. Průměrná odchylka je vhodná pro měření variability ordinálních, tj. pořadových proměnných.
Variační koeficient – míra variability, v níž se vylučuje absolutní velikost pozorovaných hodnot a lze ji proti užít k porovnání variability různých souborů (vynásobený 100 udává procentní podíl směrodatné odchylky na aritmetickém průměru). Může nabýt libovolnou nezápornou hodnotu. Je konstruován jako poměr směrodatné odchylky k průměru, tj.
V = \sigma : X_{ap}
kde je
V variační koeficient;
σsměrodatná odchylka;
Xaparitmetický průměr.
4.4 REGRESE A KORELACE [2, 3]
Analýza korelační – (z lat. correlatio, tj. souvztažnost, vzájemný vztah) se zabývá měřením těsnosti kvantitativní závislosti mezi dvěma nebo více statistickými proměnnými. Zkoumá vztahy mezi „dvojicemi“ jevů, příčinami a následky. Funkce příčiny a následku není absolutní, ale závisí na podmínkách, podle nichž se tato funkce může také navzájem vyměnit – příčina se změní v následek a naopak. Korelační analýza neověřuje existenci příčinných vztahů. Jejím obsahem je řešení regresního úkolu a zkoumání těsnosti závislosti. Jde-li o dvě proměnné, mluvíme o jednoduché korelační závislosti, jde-li o vztahy mezi více proměnnými (následku více příčin), mluvíme o vícenásobné korelační závislosti. Mírou korelace je v podstatě podíl mezi rozptylem hodnot vypočítaných na základě zvolené regresní funkce a rozptylem pozorovaných hodnot; její výsledek je závislý i na vhodnosti použitého regresního modelu (např. vhodnosti použití lineární regrese pro nelineární vztah). Tyto charakteristiky se nazývají mírami determinace. Jejich druhou odmocninou jsou míry korelace.
Korelace funkcionální – se nepočítá z původních proměnných, ale z jejich funkcí (viz funkcionální regrese). Hodnota korelačního koeficientu v takovém případě nevyjadřuje sílu závislosti, ale lze ho použít pro posouzení spolehlivosti regresního odhadu. Původní hodnoty lze také nahradit přiřazenými pořadovými čísly – mluvíme pak o korelaci pořadových čísel nebo korelaci pořadí.
Korelační index – obecný ukazatel, obecná míra těsnosti korelační závislosti (lineární i nelineární). Je definován (pro korelaci dvou proměnných) jako druhá odmocnina poměru rozptylu nezávisle a závisle proměnné. Teoreticky nabývá hodnoty mezi -1 a +1. Čtverec (2. mocnina) korelačního indexu se nazývá index determinace.
Korelační koeficient – mírou těsnosti korelačního vztahu v případě lineárního vztahu. Je definován jako podíl kovariance sledovaných dvou proměnných a součinu jejich směrodatných odchylek. Teoreticky může nabývat hodnoty od 1 (úplná, funkční závislost), do 0 (nezávislost). Čtverec (2. mocnina) korelačního koeficientu se nazývá koeficient determinace.
Korelační poměr – míra korelace konstruovaná na obdobném logickém principu jako korelační index; lze jej použít jen pro zkoumání tříděných údajů. Není vázán na žádnou regresní funkci a jeho hodnota je větší nebo nanejvýš rovna hodnotě korelačního indexu z týchž pozorování. Nabývá hodnot 0 až 1.
Korelační tabulka – uspořádání četností pozorovaného znaku podle obou kvantitativních znaků, jejichž závislost se zkoumá (např. ve sloupcích nezávisle proměnná, v řádkách závisle proměnná).
Metoda nejmenších čtverců – metoda stanovení (odhadu) parametrů „nejlepší“ regresní přímky, tj. přímky minimalizující součet čtverců odchylek pozorovaných hodnot závisle proměnné od teoretických hodnot vypočtených z rovnice regresní čáry. Lze ji použít pro lineární regresi, příp. také pro některé případy nelineární regrese.
Regrese proměnných – forma závislosti dvou nebo více statistických proměnných. Souhrn postupů a metod pro zkoumání regrese tvoří regresní analýzu. Bývá součástí regresního úkolu korelační analýzy, a to jako nalezení regresních funkcí, pomocí kterých by bylo možné odhadovat průměrné hodnoty závisle proměnné na základě znalosti hodnot nezávisle proměnné. Nejjednodušším typem je lineární regrese, vyjádřená závislostí podmíněných průměrů závisle proměnné na hodnotách nezávisle proměnné lineární funkcí – v grafickém vyjádření přímkou, regresní přímkou (regrese může být lineární svou povahou, nebo může být do lineární formy jen zjednodušena). Záměnou proměnných jako závislé a nezávislé proměnné a zobrazením jejich regrese dostaneme sdružené regresní přímky (z jejich vzájemné polohy lze soudit na těsnost zkoumaného vztahu). Jiným typem je nelineární regrese, kde závislost je vyjádřena některou nelineární funkcí, v grafickém vyjádření jinou čárou než přímkou, regresní čárou (např. parabolou, hyperbolou, exponenciálou, logaritmickou funkcí aj.).
Regrese funkcionální – vznikne, přejdeme-li od závislosti původních proměnných na závislost funkcí těchto proměnných, např. funkce logaritmické.
Regresní funkce – matematická funkce, která je odrazem zákonitostí a která je zbavena nahodilostí spojených s empirickým pozorováním. Je popisem průběhu závislosti dvou nebo více proměnných, vyjadřujícím změnu průměrné hodnoty závislé (vysvětlované) proměnné při změně hodnot nezávislých (vysvětlujících) proměnných.
Regresní koeficient – vyjadřuje v lineární regresi úhel (tangens úhlu), který svírá regresní přímka s osou, na níž je nanesena nezávisle proměnná (tento popis vychází z představy grafického zobrazení regrese). Vyjadřuje relaci mezi přírůstkem (úbytkem) závisle proměnné při jednotkové změně nezávisle proměnné. Tvoří část regresního ukazatele. V případě vícenásobné regrese, tj. regrese 3 a více proměnných, se počítají dílčí (parciální) regresní koeficienty vyjadřující vztah závisle proměnné na jedné z nezávisle proměnných za předpokladu, že ostatní nezávisle proměnné jsou konstantní. Zkušenosti ukazují, že v úlohách z oblasti ekonomiky není vhodné volit příliš mnoho nezávisle proměnných, a to pro obtížnou interpretaci výsledků (dříve i pro složitost a obtížnost výpočtů). Analogicky existuje dílčí (parciální) korelační koeficienty.
Regresní ukazatel – je tvořen dvěma členy: regresním koeficientem a konstantou. Regresní koeficient určuje směrnice regresní přímky (viz „regresní koeficient“), konstanta absolutní hodnotu teoretických hodnot závisle proměnné.
Těsnost korelačního vztahu – vztah je těsný, tj. závislost je silná, jsou-li změny závisle proměnné vysvětlitelné především změnami nezávisle proměnné (proměnných). V tom případě se hodnota míry korelace blíží 1. Jsou-li změny vysvětlitelné z větší míry vedlejšími a nahodilými činiteli, je vztah málo těsný, závislost je slabá a hodnota její míra se blíží 0.
Závislost příčinná (kauzální) – forma závislosti/souvislostí, kdy ve vztahu dvou (nebo více) jevů, pozorovaném v určitém okamžiku, jeden z nich (příčina, vliv, činitel, faktor – nezávisle proměnná, vysvětlující proměnná) nutně vyvolává druhý jev (účinek, následek – závisle proměnná, vysvětlovaná proměnná). V různých okamžicích si mohou příčina a následek vyměnit své místo a nelze proto obecně ve vztahu dvou jevů absolutizovat jeden jako příčinu a druhý jako následek. Většinou v reálné situaci nejde jen o vztah dvou jevů (jedné příčiny a jednoho následku), ale o vztahy mezi množinou příčin a množinou následků – zkoumání závislosti mezi jednou příčinou a jedním následkem je pak jen určitým modelem, zjednodušením, reálné situace.
Charakteristickým rysem příčinné závislosti je to, že se její nutnost prosazuje řadou náhodností. Důsledkem je, že se příčinné závislosti (statistických znaků) projevují jako nutné ve statistickém souboru jako celku, nikoliv ale u jednotlivých statistických jednotek. Projevují se jako volné závislosti statistických znaků, tzv. statistické závislosti. Při pozorování kvantitativních statistických znaků se projevuje statistická závislost tak, že se při změnách kvantitativních hodnot jednoho znaku (příčiny) mění rozdělení četností druhého kvantitativního znaku (následku).
Za jeden z významných jevů příčinné závislosti je časová následnost příčiny a následku, který lze hledat jen mezi jevy, které následují v čase za sebou. Každá časová následnost ale neznamená příčinnou závislost, ale může být výrazem jen zdánlivé závislosti.
Závislost korelační – závislost, kdy změny hodnot jednoho nebo více znaků (jedné nebo více příčin) jsou doprovázeny změnami průměrných hodnot druhého znaku (následku). Pro korelační závislost je charakteristické, že změny jednoho kvantitativního znaku jsou jen volně sdruženy se změnami druhého kvantitativního znaku. Je výrazem volného příčinného vztahu na rozdíl od funkční závislosti, která je výrazem pevného příčinného vztahu, který není ovlivňován náhodou a kde příčině odpovídá bezprostřední následek a kde hodnotě jednoho znaku odpovídá hodnota druhého znaku. Funkční závislost lze proto také považovat za mezní případ korelační závislosti.
4.5 JINÉ VYBRANÉ EKONOMICKÉ POJMY [3, 5]
Ceny běžné – ceny platné ve sledovaném období; vyjadřují aktuální cenovou hladinu. Růst např. produkce apod., vyjádřený v běžných cenách je růstem nominálním, který zahrnuje jak vliv růstu objemu produkce, tak vliv růst cen produktů.
Ceny stálé (srovnatelné) – ceny platné ve zvoleném období (základním) a použité k ocenění i v jiných obdobích (sledovaných). Ocenění ve stálých, srovnatelných cenách tak vyloučí při srovnání údajů z různých časových období vliv změny cen produktů a vyjadřuje tak dynamiku sledovaného jevu, např. růstu objemu produkce, který je reálným růstem).
Deflace – spočívá ve snižování cenové hladiny, mající za následek zvyšování kupní síly peněžní jednotky. Pro vyloučení nežádoucího vlivu růstu běžných cen při statistickém zkoumání se přepočítává nominální hodnota, tj. hodnota v běžných cenách, na reálnou hodnotu ve stálých/srovnatelných cenách. Používá se k tomu cenový index, deflátor a postup se nazývá statistická deflace, deflování.
Domácnost – základní sociální jednotka s cílem společného hospodaření. Přeneseně se užívá i pro osoby bydlící v jednom bytě (bytová domácnost). Odvozeně se účelově konstruují další jednotky, např. cenzová domácnost pro účely sčítání lidu (u nás poprvé použity v roce 1961). Domácnosti jsou jedním z institucionálních sektorů.
Dominantní postavení – umožňuje danému subjektu chovat se nezávisle na ostatních subjektech, např. na ostatních účastnících trhu. Dominantní postavení může být také vyjádřeno kvantitativně, např. percentuálním podílem na relevantním trhu.
Inflace – růst cen vyvolaný zvyšováním oběživa. Dochází při ní ke snížení kupní síly peněžní jednotky. Měří se pomocí indexu spotřebitelských cen, mírou inflace, která je konstruována jako poměr průměru indexů za posledních 12 měsíců a průměru indexů za předchozích 12 měsíců.
Míra nezaměstnanosti – vyjadřuje v procentech počet nezaměstnaných osob z celkového počtu ekonomicky aktivních osob.
Sektory institucionální – ekonomické subjekty národního hospodářství, které sdružují institucionální jednotky stejné ekonomické funkce a v důsledku toho i stejného ekonomického chování. Institucionálními sektory jsou: nefinanční podniky, finanční instituce, vládní instituce, domácnosti a neziskové instituce.
Statistika rodinných účtů – základní zdroj informací o příjmech a výdajích domácností. Zjišťování se provádí metodou pravidelného zápisu veškerých příjmů a výdajů zpravodajských domácností, metodou jednorázového dotazu na výši příjmů a výdajů, popř. kombinací obou postupů. V České republice existuje statistika rodinných účtů od roku 1921. Zpravodajské domácnosti (kterých je více než 3 000) se vybírají na základě záměrného kvótního výběru. Používá se převážně metoda pravidelného zápisu při minimálně roční délce zjišťování u každé zpravodajské domácnosti. Kvótními znaky jsou sociální postavení domácnosti (resp. přednosty domácnosti), výše čistého příjmu na osobu, počet nezaopatřených dětí u domácností ekonomicky aktivních, počet důchodců u domácností důchodců. Na základě statistiky rodinných účtů se stanovují váhy indexu spotřebitelských cen a indexu životních nákladů.
Subjekty ekonomické – subjekty, které ve své činnosti uplatňují racionální ekonomické chování a na jeho základě ekonomické rozhodování. Mezi ekonomické subjekty patří subjekty soukromého sektoru (firmy), subjekty veřejného sektoru a domácnosti.
4.6 CENY A NÁKLADY [1 a, b, f, 3]
Ceny stavebních prací a stavebních děl – (pro výpočet indexů) ceny dohodnuté mezi dodavatelem a odběratelem za práce provedené vlastními pracovníky respondenta na území ČR; zahrnují náklady podle kalkulačního vzorce.
Hodinové zúčtovací sazby HSV, PSV a montážních prací – nezahrnují náklady na materiál a na provoz stavebních strojů a mechanismů.
Indexy cen – souhrnné indexy zjištěné zprůměrováním individuálních indexů reprezentantů pomocí modifikovaného Laspeyresova indexu:
I = \frac{\sum_i^n(p_{1,i}:p_{0,i})\cdot p_{0,i}q_{0,i}}{\sum_i^n p_{0,i}q_{0,i}}
Kde je
součet n prvků;
p1,i cena i-tého reprezentanta ve sledovaném období;
p0,i ceny i-tého reprezentanta v základním období;
p0,iq0,i stálá váha.
Koncept tzv. čistých cenových indexů– cenový index vyjadřující růst cenové hladiny očištěný o kvalitativní a strukturální změny (tzn., že např. v indexu není vyjádřen nárůst cen přímo spojený se změnou technologií a stavebních materiálů).
Index cen průmyslových výrobců – se zjišťuje měsíčně na souboru 5.736 reprezentantů u vybraných zpravodajských jednotek.
Index cen stavebních prací – se zjišťuje čtvrtletně na souboru 142 reprezentantů zjišťovaných u vybraných zpravodajských jednotek.
Index cen tržních služeb – zahrnuje indexy cen tržních služeb v podnikatelské sféře, tj. mezi podnikatelskými subjekty:
- IC nákladní dopravy a skladování – zjišťovaný u vybraných jednotek ve výkazech Ceny řady Dop X 1-12 (S, P, Ř, L) a Sklad 1-12. Ceny jsou sledovány u cca 40 stálých reprezentantů a stálých přepravních vzdáleností.
- IC služeb pošt a telekomunikací – zjišťovaný u vybraných jednotek ve výkazu Ceny Spoj 1-12. Vyjádřeny jsou oddílem 64 SKP.
- IC peněžnictví – zjišťovaný u vybraných jednotek z bankovní sféry ve výkazech Ceny Ban 2-12 za SKP 65.12 a u vybraných jednotek finančního zprostředkování poskytujících finanční leasing ve výkazech Ceny Leas 1-12 za SKP 65.21.
- IC pojišťovnictví – zjišťovaný u vybraných jednotek ve výkazu Ceny Poj 1-12 za SKP 66.03
- IC podnikatelských služeb a služeb v oblasti nemovitostí a pronájmu – zjišťovaný u cca 500 jednotek z výkazů Ceny: Psn 1-12, Pss 1-12, Psa 1-12, Psz 1-12, Psu 1-12,
- Psi 1-12, Psr 1-12 a Pso 1-12 služeb v oddílech OKEČ 71, 72 a 74.
- IC vodného a stočného (odkanalizovaná voda) zjišťovaných šetřením z výkazu Ceny Vod 1-12.
Index spotřebitelských cen – oficiální cenový index vyjadřující růst cenové hladiny za sledované období. Pomocí tohoto indexu se měří inflace. Počítá se jako vážený průměr změn cen u několika set vybraných reprezentantů (výrobky, služby) rozdělených zpravidla do 12 skupin. Změny cen se zjišťují každý měsíc. Váhy jsou odvozeny ze struktury výdajů domácností zaměstnanců, zemědělců, podnikatelů, osob samostatně výdělečně činných a důchodců zjištěných ze statistiky rodinných účtů a doplňkových šetření. Soubor reprezentantů a struktura vah indexu spotřebitelských cen tvoří tzv. spotřební koš.
Index životních nákladů – vyjadřuje, jak se celková změna cenové hladiny promítá do výdajů domácností. Vychází ze stejného souboru reprezentantů jako index spotřebních cen (u domácností důchodců nejsou některé výrobky a služby uvažovány). Částečně odlišný je i váhový systém. Index životních nákladů je koncipován pro jednotlivé sociální skupiny (nikoliv pro průměrnou domácnost), tj. pro domácnosti zaměstnanců celkem, pro domácnosti zaměstnanců v nízkém příjmovém pásmu, pro domácnosti zaměstnanců s dětmi, neúplné zaměstnanecké domácnosti, domácnosti důchodců a domácnosti důchodců v nízkém příjmovém pásmu.
4.7 STAVEBNÍ OHLÁŠENÍ A VYDANÁ POVOLENÍ [1 c]
Budova – nadzemní stavba prostorově soustředěná a navenek převážně uzavřená obvodovými a střešními konstrukcemi.
Byt – místnost nebo soubor místností určené podle rozhodnutí stavebního úřadu k bydlení a schopné tomuto účelu sloužit jako samostatné bytové jednotky. Považují se za ně i samostatné pokoje ve školských ubytovacích zařízeních, domovech pracujícího dorostu a svobodárnách, neobhospodařované obecními úřady.
- Byty zahájené – v domech, jejichž výstavba byla povolena na základě stavebního ohlášení nebo vydaného stavebního povolení.
- Byty dokončené – na něž byl vydán kolaudační souhlas.
Dům bytový – stavba pro bydlení, stavba s převažující funkcí bydlení.
Dům rodinný – stavba pro bydlení odpovídající svým stavebním uspořádáním požadavkům na rodinné bydlení:
- více než polovina podlahové plochy místností a prostorů je určena k bydlení;
- v domě jsou nejvýše 3 samostatné byty;
- dům má 2 nadzemní a 1 podzemní podlaží a podkroví.
Nová výstavba – nová konstrukce, nové stavební dílo.
Odstranění staveb – ve smyslu § 129 zákona č. 183/2006 Sb., o územním plánování a stavebním řádu (stavební zákon), ve znění pozdějších předpisů.
Orientační hodnota staveb – zahrnuje náklady, včetně technologie, v běžných cenách na přípravu, provedení a uvedení stavby do provozu.
Podlahová plocha místností a prostorů – vnitřní nášlapná plocha mezi stěnami v půdorysném průmětu budov.
Podlahová plocha budovy – celková využitelná podlahová plocha budovy. Do této plochy se nezahrnují stavební plochy (plochy nosných, dělicích nebo jiných konstrukcí – sloupy, pilíře, příčky, komíny); funkční plochy pro pomocné využití (plochy zastavěné vyhřívacími a klimatizačními instalacemi nebo elektrickými generátory); komunikační plochy (např. schodiště, výtahy, eskalátory).
Užitková plocha všech bytů – plocha všech obytných i vedlejších místností a plocha příslušenství bytu. Nezapočítává se plocha nebytových prostor.
Za vedlejší místnosti bytu se považují předsíň, neobytná hala, komora, chodba uvnitř bytu, obytná místnost, která má menší podlahovou plochu než 8 m2, menší světlou výšku než 2,5 m (v podkroví menší než 2,3 m), nemá dostatečné přímé denní osvětlení, přímé nebo dostatečně účinné nepřímé větrání, přímé nebo dostatečně účinné nepřímé vytápění a nemá dostatečnou tepelnou a zvukovou izolaci obklopujících konstrukcí, a další neobydlené místnosti určené k tomu, aby byly s bytem společně užívány.
Příslušenství bytu tvoří záchod, koupelna, koupelnový nebo sprchovací kout a spíž.
Stavba k ochraně životního prostředí – stavba
- k ochraně čistoty vod nebo ovzduší;
- k likvidaci nebo využití odpadů;
- k rekultivaci půdy a
- k omezení působení fyzikálních faktorů na životní prostředí.
Stavební ohlášení – se týká jednoduchých staveb podle § 104 odst. 2 písmeno a) až d) zákona č. 183/2006 Sb., o územním plánování a stavebním řádu (stavební zákon), ve znění pozdějších předpisů.
Stavební povolení – stanovení závazných podmínek pro provedení a užívání stavby ve smyslu § 115 zákona č. 183/2006 Sb., o územním plánování a stavebním řádu (stavební zákon), ve znění pozdějších předpisů.
Změna dokončených staveb – zahrnuje
- nástavby zvyšující stavbu;
- přístavby půdorysně rozšiřující stavbu a s ní provozně propojené;
- vestavby, tj. stavební úpravy zachovávající půdorysné a výškové ohraničení stavby.
4.8 STAVEBNÍ ZAKÁZKY [1 d]
Druhy stavebních prací – (viz také stavební práce)
- stavební práce na nové výstavbě, vč. rekonstrukcí a modernizací;
- stavební práce na opravách a údržbě;
- ostatní stavební práce.
Směry výstavby – stavební práce na nové výstavbě (vč. rekonstrukcí a modernizací) v tuzemsku:
- budovy bytové;
- budovy nebytové nevýrobní;
- budovy nebytové výrobní;
- inženýrské stavby;
- vodohospodářské stavby.
Veřejné zakázky – práce, výkony, služby a výrobky sloužící k uspokojování veřejných potřeb, financované zcela nebo z části ze státního rozpočtu, z rozpočtů měst a obcí nebo ze státních fondů.
Zadavatel veřejné zakázky – právnická osoba, která v souladu s platnými předpisy o finančním hospodaření používá veřejné finanční prostředky k financování veřejných zakázek.
Zadavatel soukromé zakázky – všichni ostatní zadavatelé kromě zadavatelů veřejných zakázek, zejména subjekty, jejichž činnost se řídí obchodním zákoníkem.
Zakázka – objem stavebních prací k provedení podle dodavatelských smluv (potvrzený smlouvami) se zadavateli v cenách platných při převzetí zakázky, bez DPH.
- Stav zakázek – hodnota přijatých dosud nezahájených zakázek a hodnota prací zbývající k provedení na rozpracovaných zakázkách; nezahrnuje akce již dokončené, i když nepředané a nevyfakturované.
- Přírůstky zakázek – nově přijaté zakázky během sledovaného období, dodatečné a doplňkové objednávky k dřívějším zakázkám a krátkodobé zakázky ve sledovaném období přijaté a dokončené.
- Storna zakázek – zakázky zrušené během sledovaného období v hodnotě platné v době stornování (bez DPH), včetně dílčích storen.
4.9 STAVEBNICTVÍ [1e, 5]
Manuálně pracující (dělníci) na stavebních pracích ■ osoby bezprostředně provádějící stavební práce nebo bezprostředně provádějící zabezpečující činnosti (např. v dopravě nebo ve skladech plně nebo převážně pro stavební činnost). Zaměstnanci zařazení v Klasifikaci zaměstnání do tříd 71, 72, 81, 83 a 93, kteří pracují ve stavební činnosti podniku.
Mzdy zaměstnanců a dělníků – hrubé nominální mzdy osob, které jsou v pracovním poměru k vykazující jednotce, bez OON. Reálná mzda přihlíží k růstu spotřebitelských cen (index jejího růstu se rovná poměru indexu růstu nominální mzdy a indexu spotřebitelských cen).
Stavební podnik – podnikatelský subjekt s převažující stavební činností.
Stavební práce – zejména práce na výstavbě, přestavbě, rozšíření, obnově, opravách a údržbě stálých nebo dočasných budov a staveb, včetně montážních prací stavebních konstrukcí a hodnoty zabudovaného materiálu a konstrukcí.
- Stavební práce v hodnotě S – hodnota vlastních výkonů ze stavební činnosti vykazující jednotky, vč. zabudovaného materiálu, provedená na základě smlouvy o dodávce pro konečného uživatele (stavebníka), a hodnota příp. poddodávek stavebních prací přijatých od jiných dodavatelů pro splnění smlouvy o dodávce pro konečného uživatele. Nepatří do nich poddodávky stavebních prací vykazující jednotky pro jiné dodavatele nebo realizované mezi závodovými jednotkami vykazující jednotky;
- v tuzemsku – člení se (viz též „Druhy stavebních prací“) na novou výstavbu, vč. rekonstrukcí a modernizací, na opravy a údržbu (pro konečné uživatele, ne na vlastním hmotném investiční majetku) a na ostatní stavební práce (např. pro geologický průzkum, skrývkové práce, demolice [na akcích, kde nebude jiná výstavba], přirážka na inženýrskou činnost [pokud je součástí smlouvy o dodávce stavebních prací]);
- v zahraničí – pro konečného uživatele v zahraničí, vč. přijatých poddodávek od jiných, tuzemských i zahraničních organizací.
- Stavební práce v hodnotě ZSV (základní stavební výroba) jsou práce provedené pracovníky v evidenčním počtu vykazující organizace (práce provedené vlastními pracovníky, vč. produktivní práce učňů), zahrnující i stavební práce na vlastním hmotném investičním majetku.
Mezi hodnotou prací v hodnotě S a ZSV platí vztah:
práce v hodnotě S – přijaté (cizí) poddodávky (C) + vlastní poddodávky pro jiné jednotky (V) = práce v hodnotě ZSV,
tj. S – C + V = ZSV
Stavební produkce – stavební práce provedené stavebními podniky.
Zaměstnanci v evidenčním stavu – stálí a dočasní zaměstnanci v pracovním poměru k vykazující jednotce (zejména bez žen na mateřské dovolené a další mateřské dovolené, osob ve výkonu vojenské služby, učňů a studentů na provozní praxi, bez ohledu na vykonávanou činnost).
4.10 JINÉ [5]
Konjunkturní saldo – rozdíl mezi procentem optimistických odpovědí/očekávání (typu: stav/situace se zlepší) a pesimistických odpovědí/očekávání (typu: stav/situace se zhorší); k odpovědím neutrálním (typu: stav/situace se nezmění) se nepřihlíží. Jeho zjištění je výsledkem konjunkturního průzkumu prováděného u vybraných respondentů, který mívá formu ankety. Odpovědím respondentů bývají přiřazovány váhy odpovídající významu respondenta z hlediska obsahu položené otázky (objem produkce/tržeb nebo podíl na nich, počet zaměstnanců nebo podíl na zaměstnanosti apod.).
LITERATURA
- [1] Publikace ČSÚ 2008, metodické poznámky
- a) Indexy cen stavebních prací, stavebních děl a nákladů stavební výroby
- b) Indexy cen tržních služeb v produkční sféře
- c) Přehled vydaných stavebních ohlášení a povolení
- d) Statistika stavebních zakázek
- e) Stavebnictví
- f) Aktuality ČSÚ
[2] EGERMAYER, F., NOVÁK, I. Regresní a korelační analýza pro ekonomy, Praha: SNTL–SVTL, 1964.
[3] HINDLS, R., HOLMAN, R., HRONOVÁ, S., a kol. Ekonomický slovník, Praha: C. H. Beck, 2003.
[4] CYHELSKÝ, L., KAHOUNOVÁ, J., HINDLS, R., Elementární statistická analýza, Praha: Management Press, 1999.
[5] Jiné prameny