ЗАТВЕРДЖЕНО

Наказ Держкомстату

02.08.2005р.  № 223

 

МЕТОДОЛОГІЧНІ ОСНОВИ ФОРМУВАННЯ ВИБІРКОВИХ СУКУПНОСТЕЙ

ДЛЯ ПРОВЕДЕННЯ ОРГАНАМИ ДЕРЖАВНОЇ СТАТИСТИКИ УКРАЇНИ БАЗОВИХ ДЕРЖАВНИХ ВИБІРКОВИХ ОБСТЕЖЕНЬ НАСЕЛЕННЯ (ДОМОГОСПОДАРСТВ)

 

Анотація

 

В методологічних основах наводяться принципи формування імовірнісних багатоступеневих територіальних вибірок для проведення органами державної статистики України базових вибіркових обстежень населення (домогосподарств): обстеження умов життя домогосподарств, обстеження економічної активності населення та обстеження сільськогосподарської діяльності населення у сільській місцевості (далі - базові вибіркові обстеження населення). Методологічні основи містять опис особливостей формування основи вибірки та її використання для побудови територіальної вибірки.  Наводяться загальні принципи та схема організації робіт з формування вибірок домогосподарств. Документ включає опис методологічних засад щодо актуалізації основи вибірки та проведення контрольних процедур.

Методологічні основи базуються на сучасних наукових розробках з методології та організації проведення вибіркових обстежень населення (домогосподарств), зокрема на досвіді проведення аналогічних обстежень в США, Великій Британії, Польщі, Білорусі та в інших країнах, а також на досвіді проведення Держкомстатом України вибіркових обстежень населення у період з 1999 по 2004 рік.

Методологічні основи підготовлені фахівцями сектору методології соціальної, демографічної статистики та перепису населення Науково-дослідного інституту статистики Науково-технічного комплексу статистичних досліджень Держкомстату України (Гладун О.М., Саріогло В.Г.) спільно з фахівцями департаменту обстежень домогосподарств Держкомстату України (Осипова І.І., Редченко С.О.).

Методологічні основи призначені для використання працівниками  органів державної статистики на державному та регіональному рівнях, міністерствами, іншими органами виконавчої влади, науковими організаціями,  навчальними закладами та іншими користувачами статистичної інформації.

 

Передмова

 

В останні роки вибірковий метод спостережень активно застосовується органами державної статистики України, насамперед у сфері досліджень населення з актуальних соціально-економічних та демографічних проблем. У 1999 році Держкомстатом України були запроваджені на постійній основі два базових державних вибіркових обстеження населення (домогосподарств), а саме: з питань економічної активності населення та з питань умов життя домогосподарств. У 2000 році також на постійній основі було запроваджено третє базове державне вибіркове обстеження – сільськогосподарської діяльності населення у сільській місцевості. Ці базові вибіркові обстеження населення ґрунтуються на міжнародних стандартах та сучасних наукових розробках. Крім того, на одноразовій та періодичній основі органами державної статистики проводяться тематичні вибіркові обстеження населення.

Основним етапом підготовки та проведення будь-якого вибіркового обстеження є визначення принципів формування вибіркової сукупності респондентів (далі – вибірки). Якість планування вибірки та коректність процедур її формування в значній мірі визначають якість результатів вибіркового обстеження, а також адекватність витрат на його проведення. Ці методологічні основи розроблені з метою забезпечення належної якості виконання робіт з планування та формування вибірки з урахуванням наявної інформаційної бази  для проведення державних базових вибіркових обстежень населення.

Методологічні основи базуються на сучасних науково-обґрунтованих принципах проведення вибіркових спостережень, національному та міжнародному досвіді організації аналогічних обстежень. При розробці цього документу були враховані положення діючих законодавчих та нормативних актів, інформаційні потреби органів державного управління та вимоги міжнародних статистичних організацій. Окремі положення розроблені з урахуванням рекомендацій міжнародних експертів: Г.Колтона (США), В.Верми та П.Сміта  (Велика Британія), а також  К.Д’ерфа (Фінляндія).

Методологічні основи можуть бути використані при плануванні та проведенні не тільки базових, але й інших вибіркових обстежень населення (домогосподарств).

1. Загальні положення
1.1. Мета та завдання методологічних основ

Вибіркові обстеження населення є одним з основних джерел отримання інформації для вимірювання багатьох соціально-економічних та демографічних показників.

Базові вибіркові обстеження населення забезпечують отримання інформації щодо соціально-економічних характеристик сектору домогосподарств, необхідних для макроекономічних розрахунків та розрахунків основних показників в галузі сільського господарства, проведення всебічного аналізу рівня життя населення України, моніторингу бідності, комплексної оцінки стану ринку праці у відповідності до міжнародних стандартів та потреб користувачів інформації усіх рівнів. 

Вибіркове обстеження населення здійснюється шляхом планування та реалізації взаємопов’язаних програмно-методологічних, організаційних та технологічних етапів [1, с 15 - 23], а саме:

- визначення мети обстеження, об’єкта та одиниці спостереження;

- розробка програми та етапів спостереження;

- розробка дизайну вибірки;

- визначення необхідного обсягу матеріальних та фінансових ресурсів;

- формування вибірки та контроль її побудови;

- проведення польового етапу обстеження;

- контроль якості роботи статистиків з проведення вибіркових обстежень населення (домогосподарств)[1] (далі – статистики);

- обробка результатів вибіркового обстеження та їх розповсюдження на генеральну сукупність;

- аналіз даних, публікація та поширення результатів.

Окремі етапи вибіркового обстеження за необхідністю можуть бути  апробовані в пілотному обстеженні.

Метою розробки методологічних основ є створення теоретичної бази для  розробки дизайну вибірок для проведення базових вибіркових обстежень населення, розробки відповідних методико-інструктивних матеріалів і визначення принципів організації, проведення та контролю якості робіт з формування вибірок респондентів. Об’єктом дослідження є методологія формування вибіркових сукупностей населення (домогосподарств).

1.2. Визначення термінів1

Відбір з ймовірністю пропорційною розміру - спосіб відбору, при якому ймовірність включення  одиниці до вибірки пропорційна значенню певної характеристики (розміру) одиниці.

Відбір систематичний - спосіб відбору, при якому зі списку одиниць генеральної сукупності відбирають одиниці спостереження з використанням встановленого кроку відбору (інтервалу, через який слід брати для спостереження одиниці (серії) залежно від кількості одиниць (серій), що необхідно відібрати). Початок відбору визначають або з використанням генератору випадкових чисел із номерів одиниць спостереження, які відповідають першому інтервалу, або способом жеребкування, або шляхом розрахунку (наприклад, шляхом ділення кроку відбору на два (якщо одиниці генеральної сукупності у списку не ранжовані за ознакою).

Відбір імовірнісний - відбір, оснований на об’єктивних правилах випадкового відбору, під час якого кожна одиниця сукупності має відомий ненульовий шанс бути включеним до вибірки.

Вибірка багатоступенева - вибірка, процес формування якої відбувається у кілька послідовних ступенів (етапів): на першому ступені з основи вибірки відбираються певні відносно великі одиниці; на другому ступені в середині кожної відібраної на першому ступені одиниці формується своя основа вибірки, з якої відбираються свої одиниці і так далі за кількістю ступенів відбору.

Вибіркова сукупність (вибірка) - сукупність одиниць спостереження, відібраних із генеральної сукупності за певними правилами, які забезпечують репрезентативність вибірки, для проведення статистичного спостереження.

Вибіркове обстеження населення (домогосподарств) - науково-обгрунтований вид несуцільного спостереження, при якому обстежуються не всі одиниці сукупності, а лише певним чином відібрана їх частина, а одиницею спостереження є особа чи домогосподарство.

Вибірковий метод спостереження - науково обґрунтована система правил відбору одиниць і способів характеристики сукупності досліджуваних одиниць, що вивчають. Вибірковий метод спостереження дає змогу розповсюдити висновки, отримані на основі вивчення частини сукупності (вибірки), на всю сукупність (генеральну).

Вторинна територіальна одиниця вибірки (ВТОВ) - територіальна одиниця, яка відібрана на другому ступені формування територіальної вибірки при застосуванні багатоступеневого територіального відбору.

Генеральна сукупність - множина одиниць, характеристики яких необхідно дослідити і щодо яких буде зроблено узагальнення за результатами  вибіркового обстеження.

Дизайн (план) вибірки - організаційно-логічна модель структури вибіркової сукупності та принципи її формування. Якістю плану вибірки в значній мірі визначається репрезентативність вибіркової сукупності, отриманої за визначеними у плані правилами.

Ймовірність – число, яке характеризує ступінь можливості настання певної події. Розраховується як відношення кількості випадків настання події до всіх можливих варіантів.

Обсяг вибірки - кількість одиниць у вибірковій сукупності. Необхідний для забезпечення репрезентативності та належної якості результатів вибіркового обстеження обсяг вибірки розраховують в залежності від способу відбору та типу вибірки. Величина обсягу вибірки залежить від варіації досліджуваних ознак та припустимої похибки вибірки.

Одиниця відбору - одиниця генеральної сукупності чи їх група, або одиниця основи вибірки, яка має ймовірність бути включеною до вибірки при реалізації процедури відбору.

Одиниця вибірки - одиниця відбору, яка увійшла до складу вибірки.

Основа вибірки - упорядкований певним чином перелік, список одиниць відбору. При використанні багатоступенового відбору на кожному ступені формується своя основа вибірки.

Одиниця спостереження - первинна одиниця, від якої мають бути одержані необхідні статистичні дані. Вибір одиниці спостереження залежить від мети та конкретних умов проведення спостереження.

Первинна територіальна одиниця вибірки (ПТОВ) - територіальна одиниця, яка відібрана на першому ступені формування територіальної вибірки при застосуванні багатоступеневого територіального відбору.

Репрезентативність - властивість вибіркової сукупності повно та адекватно відображати основні характеристики генеральної сукупності.

Ротація - заміна частини діючої вибіркової сукупності (або для окремих вибіркових обстежень – її повна заміна) за розробленими схемами при проведенні чергових раундів вибіркового обстеження, яке проводиться на постійній основі.

Статистична вага – 1) кількість одиниць генеральної сукупності, які репрезентує (представляє) одна одиниця вибірки; 2) величина, обернена до ймовірності відбору одиниці вибірки.

Стратифікація - поділ генеральної сукупності (або її частини) на групи, однорідні за певною ознакою.

Територіальна вибірка - відібрані за певною процедурою територіальні одиниці, на яких  проводиться вибіркове обстеження.

Територіальна одиниця – адміністративно-територіальна одиниця України (наприклад: міста, селища міського типу, райони, сільради, тощо) або локальна територія, створена в межах адміністративно-територіальної одиниці (наприклад: переписні відділи, інструкторські дільниці, створені для проведення Всеукраїнського перепису населення; виборчі дільниці; території, що обслуговуються поштовими відділеннями, тощо).

Технічне завдання на формування вибірки - офіційно затверджені основні параметри вибіркової сукупності та вимоги до її формування відповідно до мети дослідження.


[1] З моменту вступу в дію Змін до чинного Класифікатора професій ДК 003-95 щодо внесення нової професійної назви фахівець з інтерв'ювання” вважати фахівцем з інтерв'ювання.

1 При підготовці цього підрозділу використані матеріали, викладені у термінологічному словнику “Вибіркове спостереження” [2].

2. Загальна схема  та принципи організації робіт з формування вибірки

Метою формування вибірки є визначення за спеціально розробленими науково-обгрунтованими процедурами частини генеральної сукупності, обстеження якої дозволяє отримати репрезентативну та надійну інформацію щодо досліджуваних в обстеженні (цільових) характеристик генеральної сукупності.

Загальний порядок проведення робіт з формування вибіркових сукупностей населення складається з наступних етапів:

1. Визначення вимог до вибірки відповідно до цілей  обстеження.

2. Аналіз інформаційних джерел для формування вибірки.

3. Розрахунок обсягу вибіркової сукупності.

4. Розробка технічного завдання на формування вибірки.

5. Розробка дизайну вибірки.

6. Реалізація робіт з формування вибірки.

7. Актуалізація основи вибірки.

8. Контроль формування вибіркової сукупності та актуалізації основи вибірки.

Визначення цілей базового вибіркового обстеження населення та відповідних вимог до формування вибірки здійснюється галузевим департаментом Держкомстату України, який відповідає за загальну методологію обстеження. Цей підрозділ також здійснює розробку технічного завдання на формування вибірки за участю підрозділу з організації та координації вибіркових обстежень населення Держкомстату України.

Аналіз інформаційних джерел для формування вибірки базового вибіркового обстеження населення, розрахунок обсягу вибіркової сукупності, розробка дизайну вибірки, реалізація робіт з формування вибірки, пов’язаних з відбором первинних територіальних одиниць вибірки (див. стор.20) та розрахунок ймовірностей відбору здійснюються підрозділом з організації та координації вибіркових обстежень населення Держкомстату України за участю галузевого підрозділу, який відповідає за загальну методологію обстеження.

Визначення вимог до формування вибірки та розробка технічного завдання, як правило, мають  ітераційний характер, оскільки організаційні та фінансові обмеження можуть призвести до неможливості задоволення всіх вимог, висунутих на початку робіт.

Реалізація робіт з формування вибірки (крім  відбору первинних територіальних одиниць вибірки (див.стор.20)), актуалізація основи вибірки та контроль якості цих робіт здійснюються на регіональному рівні. Підрозділ з організації та координації вибіркових обстежень населення Держкомстату України здійснює централізовану розробку методико-інструктивних матеріалів, методологічне, організаційне та технологічне забезпечення цих робіт.

3. Визначення вимог до вибірки відповідно до цілей вибіркового обстеження

При визначенні вимог до вибірки необхідно враховувати особливості, обумовлені цілями обстеження. Нижче наведено перелік та зміст основних вимог до вибірки, які необхідно визначити для розробки технічного завдання та ефективного дизайну вибірки.

3.1. Вимоги щодо представлення у вибірці територіальних одиниць відповідно до адміністративно-територіального устрою України

Визначення вимог до представлення у вибірці територіальних одиниць відповідно до адміністративно-територіального устрою України при плануванні базових вибіркових обстежень населення є обов’язковим. Наприклад, вимогою може бути обов’язкове представлення у вибірці  Автономної Республіки Крим, всіх областей, міст Києва та Севастополя, тощо.

У випадках обмеженого доступу до окремих населених пунктів або недоцільності з об’єктивних причин проведення в них обстеження можуть бути введені певні обмеження щодо їх  включення у вибірку. Наприклад, до вибірки базових вибіркових обстежень недоцільно включати населені пункти, розташовані на територіях радіологічного забруднення, віднесених до зони відчуження (І зона) та зони безумовного (обов’язкового) відселення (ІІ зона) внаслідок катастрофи на Чорнобильській АЕС.

3.2. Вимоги до надійності результатів вибіркових обстежень населення

При плануванні вибіркового обстеження слід визначити надійність, з якою необхідно отримати оцінки основних показників для національного рівня та рівня окремих адміністративно – територіальних одиниць. В якості кількісної характеристики надійності оцінок показників використовується коефіцієнт варіації вибіркових оцінок. Для державного рівня оцінки показників вважаються надійними при значеннях коефіцієнту варіації не більше 5%, для регіонального – не більше10%.

Від необхідного рівня надійності оцінок основних показників залежить обсяг вибіркової сукупності. При визначенні надійності слід враховувати квадратичну залежність між коефіцієнтом варіації та обсягом вибірки (див. п.5). Наприклад, щоб підвищити надійність (тобто зменшити коефіцієнт варіації) утричі, обсяг вибіркової сукупності необхідно збільшити у дев’ять разів.

3.3. Вимоги до строку дії територіальної вибірки

На етапі планування вибіркового обстеження визначається строк дії територіальної вибірки з урахуванням необхідності проведення визначеної кількості запланованих вибіркових обстежень у відібраних територіальних одиницях, а також особливостей організації мережі статистиків. Наприклад, для базових вибіркових обстежень населення строк дії територіальної вибірки визначено п¢ять років.

Строк дії територіальної вибірки враховується при визначенні  мінімального розміру територіальних одиниць для забезпечення мінімально необхідної кількості одиниць відбору для проведення визначеної кількості обстежень протягом визначеної кількості років.

3.4. Початкове навантаження на одного статистика

Початкове навантаження (кількість одиниць спостереження, які підлягають обстеженню одним статистиком протягом визначеного на етапі планування проміжку часу) є характеристикою, яка використовується для організації роботи статистиків та формування територіальної вибірки.

При визначенні навантаження слід враховувати всі компоненти витрат часу статистика, а саме:

- підготовчі роботи (самопідготовка, підготовка до інтерв’ю);

- проведення опитування в домогосподарствах та збір іншої інформації, передбаченої програмою вибіркового обстеження;

- час, необхідний, щоб дістатись до респондента (транспортом, пішки);

-перевірка, кодування (якщо це передбачено функціональними обов’язками в частині окремих вибіркових обстежень) та здавання анкет в територіальні органи статистики;

- навчання тощо.

Тривалість проведення інтерв’ю (опитування) визначається в пілотному обстеженні, або на підставі фактичних витрат часу (якщо обстеження проводилось раніше).

При формуванні територіальної вибірки початкове навантаження на статистика враховується:

- при визначенні порогу саморепрезентативності (див. формулу (7));

- при визначенні мінімального розміру територіальної одиниці (див. формулу (9)).

3.5. Вимога щодо врахування очікуваного коефіцієнта відповідей

Для забезпечення обстеження заданої кількості одиниць спостереження і зменшення впливу відмов респондентів від участі в обстеженні на результати при формуванні вибірки слід враховувати очікуваний коефіцієнт відповідей. Цей коефіцієнт використовується для визначення кількості одиниць спостереження, яку необхідно відібрати, для обстеження теоретично розрахованої кількості одиниць спостереження.

Очікуваний коефіцієнт відповідей розраховується за формулою:

 

krr = cf  / c ,                                (1)

 

де krr – коефіцієнт відповідей;

cf – кількість одиниць спостереження (осіб, домогосподарств), які прийняли участь в обстеженні;

c - кількість одиниць спостереження, які були відібрані для участі в обстеженні.

Очікуваний коефіцієнт відповідей визначається за даними аналогічних попередніх вибіркових обстежень (за їх наявністю), за результатами пілотних обстежень або за експертними оцінками. Очікуваний коефіцієнт відповідей використовується при визначенні обсягу вибіркової сукупності (див. п.5) та мінімального розміру територіальної одиниці (див.  п.8.1.2).

3.6. Схема ротації одиниць вибірки

Для підвищення якості результатів вибіркових обстежень населення, які проводяться на постійній основі,  застосовується спеціальна процедура – ротація одиниць вибірки, тобто їх планова заміна за спеціально визначеними схемами. Ротація одиниць вибірки забезпечує покращення якості даних за рахунок зниження навантаження на респондентів, оскільки останні перебувають в обстеженні визначений схемами час (певну кількість періодів обстеження). Крім того, ротація респондентів забезпечує більш надійне вимірювання ступеню зміни оцінок показників.

В базових вибіркових обстеженнях населення застосовується два типи ротації одиниць вибірки: повна та часткова. Повна ротація передбачає одночасну заміну всіх одиниць вибірки, часткова – заміну частини одиниць відповідно до встановленої схеми.

Для здійснення часткової ротації вибіркова сукупність розбивається на групи одиниць вибірки – ротаційні групи. Ротаційні групи  відбираються з використанням спеціальних процедур як окремі підвибірки. Алгоритм заміни ротаційних груп для обстеження регламентується методологією обстеження і обов’язково  визначається у технічному завданні на формування вибірки.

Застосування часткової ротації в цілому збільшує кількість обстежених одиниць вибірки за певний період. У зв’язку з цим, ротацію слід враховувати при визначенні кількості одиниць вибірки, яку необхідно відібрати на рік, а також мінімального розміру територіальної одиниці (див. відповідно п.5 та п.8.1.2).

Розробка ефективної схеми ротації передбачає необхідність здійснення спеціальних досліджень, що обумовлює доцільність залучення експертів з відповідних питань.

3.7. Додаткові вимоги

Додаткові вимоги до формування вибірки передбачають забезпечення можливості використання вибірки для проведення одноразових тематичних додаткових обстежень, можливості розширення вибірки в окремих регіонах або інші вимоги. Ці вимоги враховуються при плануванні та реалізації етапів формування вибірки, зокрема при визначенні мінімального розміру територіальних одиниць.

У випадку формування вибірки для проведення декількох обстежень, може бути визначена вимога щодо обмеження на участь в обстеженнях одних і тих самих одиниць вибірки. Наприклад, якщо два обстеження планується  проводити в одній територіальній одиниці і визначене обмеження на участь в обстеженнях одних і тих самих одиниць вибірки, то мінімальний розмір територіальної одиниці розраховується як сума мінімальних розмірів, необхідних для проведення кожного з цих обстежень.

У випадку формування вибірки для проведення декількох обстежень, окремо визначаються вимоги до формування вибіркової сукупності кожного обстеження. Ці вимоги враховуються при визначенні навантаження на статистика та мінімального розміру територіальної одиниці тощо.

4. Аналіз інформаційних джерел для формування вибірки

Визначальною умовою розробки ефективного дизайну та формування основи вибірки є дослідження та вибір найбільш придатних інформаційних джерел, які повинні містити інформацію щодо територіального розміщення одиниць генеральної сукупності та характеристики цих одиниць, необхідні для формування вибіркової сукупності. Інформація, яка використовується при формуванні основи вибірки, повинна задовольняти наступним вимогам:

- повнота;

- якість;

- актуальність.

Вимога щодо повноти інформації означає, що необхідні для відбору характеристики є в наявності у визначеному джерелі для всіх без виключення одиниць генеральної сукупності.

Вимога щодо якості означає, що дані, наявні у визначеному інформаційному джерелі, відповідають реальному стану генеральної сукупності, отримані з офіційних джерел та користуються довірою фахівців.

Вимога щодо актуальності означає, що інформація, яка використовується при формуванні основи вибірки, за часом повинна бути максимально наближена до моменту проведення робіт з формування вибірки.

Для здійснення конкретного ступеню відбору повинна використовуватись інформація з одного джерела. Для формування багатоступеневої вибірки на різних ступенях відбору може використовуватись інформація з різних джерел.

Основа вибірки для проведення базових вибіркових обстежень населення потенційно може формуватися з використанням даних з різних джерел, зокрема:

- переписів населення (щодо розміщення та чисельності населення по кожній адміністративно-територіальній одиниці);

- демографічної статистики (щодо розміщення та чисельності населення по окремих адміністративно – територіальних одиницях);

- сільськогосподарських переписів;

- погосподарського обліку;

- картографічних матеріалів;

- поділу території країни на виборчі дільниці та чисельності виборців в них при проведенні виборчих кампаній;

- поділу території країни на поштові відділення та чисельності населення, що обслуговується ними;

- баз даних окремих міністерств та відомств з інформацією про все населення або окремі його групи (реєстр населення, податковий реєстр, тощо).

Розробка дизайну та формування основи вибірки  для діючих базових вибіркових обстежень населення здійснюється з використанням даних демографічної статистики, перепису населення, погосподарського обліку. Формування щорічних вибіркових сукупностей для базових вибіркових обстежень населення здійснюється з використанням основи вибірки, інформаційна база якої обов’язково повинна бути актуалізована безпосередньо перед початком процедур відбору.

На окремих етапах формування вибіркової сукупності може виникати необхідність використання персоніфікованої інформації щодо одиниць генеральної сукупності. У цих випадках працівники органів державної статистики зобов’язані дотримуватися вимог щодо забезпечення конфіденційного характеру цих даних, який гарантується Законами України “Про державну статистику” та “Про інформацію”. 

5. Розрахунок обсягу вибіркової сукупності

 Одним з визначальних етапів планування вибіркового обстеження та формування вибірки є розрахунок обсягу вибіркової сукупності, необхідного для задоволення встановлених вимог. Від обсягу вибірки залежить якість результатів спостереження і вартість обстеження. Занадто великий обсяг вибірки призводить до невиправданих витрат та неефективного використання коштів, а недостатній обсяг вибірки – до незадовільної якості результатів обстеження.

Обсяг вибірки визначається з урахуванням наступних факторів:

- вимог щодо надійності оцінок основних показників, які будуть розраховуватися за даними обстеження;

- обсягу фінансових коштів, які виділені для проведення обстеження;

- навантаження та кількість статистиків, які будуть проводити обстеження.

Обсяг вибірки визначається у наступній послідовності робіт [3].

1) Встановлюються вимоги щодо якості оцінок основних показників (див. п.3.2).

2) Розраховується обсяг вибірки.

У випадках необхідності отримання надійних оцінок для середніх значень показників, обсяг вибірки зі складним дизайном розраховується за формулою:

 

,                                  (2)

 де  n - обсяг вибірки;

- дисперсія, яка характеризує варіацію значень показника по одиницях вибірки, побудованої із застосуванням способу простого випадкового відбору;

CV  - коефіцієнт варіації вибіркових оцінок, визначений у вимогах до формування вибірки;

 - оцінка очікуваного середнього значення показника;

 deff  - дизайн-ефект (відношення дисперсії оцінки показника, який вимірюється у вибірковому спостереженні, для реального дизайну вибірки, до дисперсії оцінки цього показника за припущенням побудови вибірки за принципом простого випадкового відбору):

де  - дисперсія вибіркових оцінок показника  для реального дизайну вибірки;

      - дисперсія вибіркових оцінок показника  за припущенням побудови вибірки за принципом простого випадкового відбору.

Значення коефіцієнту варіації встановлюється відповідно до вимог щодо якості оцінки показника. Дизайн – ефект, дисперсія для простого випадкового відбору та оцінка середнього значення показника визначаються за даними аналогічних попередніх вибіркових обстежень (за їх наявністю), за результатами пілотних обстежень або за експертними оцінками. Наприклад, за рекомендаціями міжнародних експертів, які здійснювали консультаційну допомогу органам державної статистики України з питань впровадження базових вибіркових обстежень умов життя домогосподарств та економічної активності населення,  значення дизайн – ефекту встановлено на рівні 2,5, з урахуванням досвіду проведення аналогічних обстежень в інших країнах. 

 У випадках необхідності отримання надійних оцінок для показників часток та сумарних значень, обсяги вибірок зі складним дизайном розраховуються за формулами, аналогічними формулі (2), але оцінка середнього значення () замінюється відповідно на значення частки або сумарного значення:

,                  (4)

 де  - оцінка очікуваного значення частки;

,                (5)

де - загальна кількість одиниць генеральної сукупності;

  - оцінка очікуваного сумарного значення показника.

У випадках визначення у вимогах декількох показників, для яких необхідно отримати надійні оцінки, обсяг вибіркової сукупності розраховується для кожного з них за формулами (2), (4) або (5). Максимальне з отриманих значень є загальним підсумковим обсягом вибірки.

У випадку визначення у вимогах необхідності отримання надійних оцінок показників для окремих частин вибіркової сукупності, наприклад, для регіонального рівня, обсяг вибірки розраховується для кожного регіону окремо. Сума обсягів вибірок по усіх регіонах є загальним підсумковим обсягом вибірки по Україні.

3) Обсяг вибіркової сукупності коригується, якщо визначені вимоги врахування очікуваного коефіцієнту відповідей.

Розрахунок обсягу вибірки з урахуванням очікуваного коефіцієнту відповідей здійснюється за наступною формулою:

                                                .                                                  (6)

Розрахований для заданої надійності оцінок показників обсяг вибіркової сукупності порівнюється з фінансовими та інституційними можливостями органів державної статистики щодо забезпечення проведення вибіркового обстеження. З цією метою визначається необхідна кількість статистиків, які мають проводити польовий етап обстеження, інших працівників, які будуть забезпечувати розробку та аналіз результатів, а також розраховується необхідний обсяг фінансових витрат. У випадку недостатності можливостей та коштів для забезпечення проведення обстеження за визначених умов, необхідно здійснити коригування вимог, наприклад, у напрямі зменшення надійності оцінок показників. Після цього розраховується новий обсяг вибіркової сукупності і процедура порівняння з можливостями здійснюється повторно. Таким чином, процедура визначення обсягу вибірки є ітераційною, яка завершується після узгодження всіх вимог до вибірки з фінансовими та інституційними можливостями органів державної статистики. 

6. Розробка технічного завдання на формування вибірки

 Технічне завдання на формування вибірки узагальнює підсумки попередніх етапів визначення та узгодження усіх вимог до вибірки та впливає на організацію робіт щодо побудови вибіркової сукупності та на технологічний процес проведення обстеження та розповсюдження його результатів не генеральну сукупність.

Технічне завдання офіційно узгоджується з усіма зацікавленими підрозділами органів державної статистики центрального рівня і затверджується в установленому порядку.

Зміст технічного завдання включає такі основні розділи:

- мета вибіркового обстеження;

- генеральна сукупність;

- одиниця спостереження (з визначенням обмежень щодо представлення у вибірці окремих груп одиниць спостереження);

- строк дії територіальної вибірки та вибірки одиниць спостереження;

- вимоги щодо представлення у вибірці територіальних одиниць відповідно до адміністративно-територіального устрою України;

- наявність та схема ротації одиниць спостереження;

- інформаційні джерела для формування вибірки;

- тип вибірки, способи та одиниці відбору;

- вимоги щодо надійності оцінок основних показників, що вимірюються у вибірковому спостереженні;

- обсяг вибірки;

- початкове навантаження на одного статистика з проведення обстежень населення;

- очікуваний коефіцієнт відповідей респондентів;

- додаткові вимоги.

У випадку формування вибірки для одночасного проведення декількох вибіркових обстежень, вищенаведені положення визначаються для кожного з обстежень.

Мета вибіркового обстеження населення – визначення певних аспектів соціально-економічних явищ або соціо-демографічних характеристик населення, які планується досліджувати. Відповідно до мети визначається одиниця спостереження – домогосподарство або особа.

При визначенні одиниць спостереження та одиниць відбору слід мати на увазі, що можливі випадки, коли ці одиниці не співпадають. Наприклад, при визначенні в якості одиниці відбору домогосподарства, одиницею спостереження відповідно до мети обстеження може бути окрема особа, яка є членом домогосподарства.

Вимоги щодо представлення у вибірці територіальних одиниць відповідно до адміністративно-територіального устрою України можуть включати: необхідність забезпечення представлення у вибірці Автономної Республіки Крим, всіх областей, міст Києва та Севастополя; за необхідністю – інших адміністративно-територіальних одиниць, наприклад, обласних центрів, районів, районів у містах, тощо.

Завдання щодо визначення типу вибірки та способів відбору можуть передбачати необхідність застосування багатоступеневої вибірки з визначенням способу відбору на кожному ступені, зокрема систематичного відбору з ймовірністю пропорційною розміру, простого випадкового відбору та ін.

Вимоги щодо надійності оцінок основних показників, що вимірюються у вибірковому спостереженні, визначаються для національного рівня обов’язково, а за необхідністю - у розрізі окремих соціально-економічних груп або для різних територіальних рівнів.

Враховуючи особливості проведення опитувань населення вимоги щодо початкового навантаження на одного статистика з проведення обстежень населення та очікуваного коефіцієнта відповідей респондентів визначаються в розрізі типів місцевості проживання домогосподарств.

Форма технічного завдання наведена у додатку А. 

7. Розробка дизайну вибірки

Після затвердження технічного завдання здійснюється розробка дизайну вибірки - організаційно-логічної моделі структури вибіркової сукупності та принципів її формування. На цьому етапі також опрацьовуються зміст та послідовність всіх процедур формування вибірки.

При розробці дизайну вибірки необхідно враховувати обмеження та умови, які визначаються технічним завданням.

Разом з тим, дизайн вибірки має враховувати не тільки принципи формування вибірки, а й особливості інших етапів проведення вибіркового обстеження, зокрема, вимоги діючого програмного забезпечення з обробки даних. Наприклад, необхідність парної кількості територіальних одиниць для аналізу надійності оцінок показників в програмних пакетах, які реалізують реплікаційні алгоритми.

Нижче наведені основні методологічні підходи до розробки дизайну територіальних вибірок для базових вибіркових обстежень населення:

1) Визначення обмежень щодо охоплення вибірковим обстеженням адміністративно-територіальних одиниць України.

2) Стратифікація генеральної сукупності.

3) Визначення типу вибірки і способів відбору.

7.1. Визначення обмежень щодо охоплення вибірковим обстеженням адміністративно-територіальних одиниць України

На початку формування територіальної вибірки визначаються адміністративно-територіальні одиниці України, які не повинні або не можуть бути обстежені з об’єктивних причин. Обмеження щодо територіального охоплення відображаються у технічному завданні та враховуються  при реалізації процедур відбору та обробки результатів обстеження.

7.2. Стратифікація генеральної сукупності

Формування вибіркових сукупностей для проведення базових вибіркових обстежень населення передбачає застосування на початковому етапі відбору стратифікації генеральної сукупності.  Стратифікація здійснюється з метою адекватного відображення у вибірці основних особливостей адміністративно-територіального поділу країни, а також для забезпечення відбору домогосподарств з більш однорідних за основними характеристиками груп [3 - 6].

Для реалізації цієї мети генеральна сукупність розподіляється на страти, які відповідають регіонам України. У межах цих страт, відповідно до вимог конкретних обстежень, можуть бути виділені субстрати. Наприклад, в обстеженні економічної активності населення та в обстеженні умов життя домогосподарств виділяються три субстрати - міські населені пункти з чисельністю населення 100 тис. осіб і більше („великі” міста), міські населені пункти з чисельністю населення менше 100 тис. осіб („малі” міста) та сільська місцевість. Поділ страт на субстрати забезпечує потреби щодо отримання інформації за типами місцевості (міська, сільська), а також надає можливість врахувати різні умови роботи статистиків з проведення вибіркових обстежень населення в різних за розміром та за типами населених пунктах (різні витрату часу на проїзд, різне навантаження), різні  інформаційні джерела, необхідні для відбору територіальних одиниць, одиниць спостереження, тощо.

Обсяг вибірки розподіляється між стратами та субстратами пропорційно їх розміру, наприклад, чисельності населення. Такий підхід забезпечує самозваженість вибірки (однакову частку відбору по стратах та субстратах), що обумовлює ефективне вимірювання значної кількості показників базових вибіркових обстежень населення.

7.3. Визначення типу вибірки

У відповідності до встановлених вимог до вибірки, визначаються особливості її формування: основа вибірки, кількість ступенів відбору, способи відбору на кожному ступені та ін.

За типом вибірка може бути одноступеневою або багатоступеневою.

Формування одноступеневої вибірки здійснюється в один етап - шляхом безпосереднього відбору одиниць генеральної сукупності. При базових вибіркових обстеженнях населення, які проводяться шляхом відвідування домогосподарств, як правило, не доцільно використання одноступеневих вибірок. Це пов¢язано з тим, що такий тип вибірки:

- потребує основи вибірки, яка містила б перелік всіх одиниць  генеральної сукупності (наприклад, повний перелік домогосподарств (населення) із зазначенням їх адрес);

- призводить до значного розосередження одиниць спостереження по території, що обстежується, та збільшення витрат часу та фінансових ресурсів, необхідних для проведення обстеження.

Формування багатоступеневої вибірки здійснюється у кілька послідовних етапів, кількість яких залежить від наявної інформаційної бази, організаційних можливостей органів державної статистики та трудомісткості робіт з формування вибірки. На різних ступенях відбору можуть визначатися різні одиниці відбору, а також використовуватись різні інформаційні джерела.

В якості одиниць відбору можуть визначатися:

- об’єкти адміністративно – територіального устрою країни (наприклад, області, міста, селища міського типу, райони, міські, селищні та сільські ради, окремі села)

- локальні території, визначені за певним принципом (наприклад, виборчі дільниці; переписні відділи, інструкторські та лічильні дільниці, створені для проведення перепису населення; території, які обслуговуються одним поштовим відділенням, тощо);

- об’єкти господарської діяльності (підприємства, організації, установи, фермерські господарства, тощо);

- домогосподарства;

- конкретні особи.

Визначення одиниці відбору на конкретному етапі залежить від наявності інформації, необхідної для проведення відбору. У зв’язку з цим, на початку робіт слід визначити тип локальних територій, по яких можливо отримати основу вибірки для проведення одного чи декількох етапів відбору, а на останньому етапі – провести безпосередньо відбір одиниць спостереження.

При розробці етапів формування вибірки визначають мінімально необхідну кількість ступенів відбору, що сприяє:

1) скороченню обсягів робіт щодо формування вибіркової сукупності;

2) зменшенню похибки вибірки, оскільки кожен додатковий етап відбору, як правило, впливає на похибку вибірки у бік її збільшення [див., наприклад, 4, с.28; 7, с. 30].

На вибір  типу вибірки також впливає організаційна структура мережі статистиків. Так, особливістю організації мережі статистиків в органах державної статистики України є проживання статистиків у межах тих адміністративно-територіальних одиниць, в яких вони проводять базові вибіркові обстеження населення.

Результати аналізу наявних інформаційних джерел, вимог до формування вибірок для проведення базових вибіркових обстежень населення та організації роботи мережі статистиків обумовили необхідність застосування багатоступеневої вибірки. При цьому, в обстеженнях умов життя домогосподарств та економічної активності населення вибірка є триступеневою, а в обстеженні сільськогосподарської діяльності населення - двоступеневою. Алгоритм формування триступеневої вибірки включає наступні основні етапи:

- відбір одиниць першого ступеню – адміністративно-територіальних одиниць (за прийнятою термінологією - первинних територіальних одиниць вибірки, скорочено - ПТОВ);

- відбір одиниць другого ступеню - локальних територій (за прийнятою термінологією - вторинних територіальних одиниць вибірки, скорочено - ВТОВ);

- відбір одиниць третього ступеню – домогосподарств (або осіб).

Метою відбору ПТОВ є отримання переліку адміністративно-територіальних одиниць (міських (селищних) рад, міст, селищ міського типу, районів), в яких будуть проводитись базові вибіркові обстеження населення. Метою відбору ВТОВ є отримання переліку локальних територій в межах ПТОВ (інструкторських дільниць в міській місцевості, сільських рад в сільській місцевості), в яких на третьому етапі будуть відбиратися одиниці  третього ступеню.

Доцільність формування та відбору ВТОВ обумовлена необхідністю оптимізації роботи статистиків шляхом формування та відбору в межах одиниць першого ступеню, які мають велику за розміром площу, менших локальних територій, по яких існує необхідна для відбору інформація щодо населення.

На різних ступенях відбору відповідно до визначених одиниць відбору та наявних інформаційних джерел можуть бути різні основи вибірки. Наприклад, при відборі ПТОВ і ВТОВ основу вибірки становить перелік  відповідних територіальних одиниць та їх окремі ознаки - характеристики (наприклад, код відповідно до Класифікатора одиниць адміністративно-територіального устрою України (КОАТУУ), чисельність населення або кількість домогосподарств); при відборі домогосподарств основою вибірки є повний список їх адрес по відповідній територіальній одиниці.

В окремих випадках, коли деякі територіальні одиниці складаються з певної кількості населених пунктів, припустимим є поділ таких територіальних одиниць на окремі частини (групи населених пунктів) з подальшим їх послідовним обстеженням. Ця процедура фактично є додатковим ступенем відбору, який реалізується в межах окремих територіальних одиниць. Наприклад, сільські ради можуть включати декілька сільських населених пунктів, транспортне сполучення між якими ускладнене. У цьому випадку, з метою забезпечення ефективної роботи статистика, формуються групи сільських населених пунктів з урахуванням їх територіального розташування. Після цього визначається послідовність (випадковим чином) обстеження груп протягом строку дії територіальної вибірки. Відбір домогосподарств здійснюється в межах кожної сформованої групи сільських населених пунктів.

У випадку стратифікації генеральної сукупності,  формування вибірки проводиться всередині кожної страти.

7.4. Визначення способів відбору

На різних ступенях відбору відповідно до цілей вибіркового обстеження та наявних інформаційних джерел можуть бути різними способи відбору. Основні способи здійснення відбору наступні:

- простий випадковий;

- систематичний;

- систематичний з ймовірністю пропорційною розміру.

Одиниці вибірки  можуть мати однакові ймовірності відбору, або різні.

Для базових вибіркових обстежень одиниці вибірки мають різні ймовірності відбору, які є пропорційними розміру територіальної одиниці . Такі ймовірності є результатом застосування відбору з ймовірністю, пропорційною розміру (probability proportional to size, скорочено – PPS). У якості розміру може виступати чисельність населення або кількість домогосподарств територіальної одиниці, розмір площі землі домогосподарств, тощо.

Ймовірності відбору можуть визначатися з урахуванням необхідності реалізації інших спеціальних вимог вибіркового обстеження. Наприклад, вимоги щодо можливості отримати надійні оцінки показників щодо населення, яке проживає на території, площа і загальна чисельність мешканців якої невеликі і, відповідно, ймовірність того, що буде відібрана достатня для забезпечення необхідного рівня надійності кількість домогосподарств по цій території, є малою.

Для формування ефективної багатоступеневої вибірки при наявності територіальних одиниць неоднакового розміру у випадку, коли величина досліджуваної ознаки не корельована з розміром територіальної одиниці, рекомендованим до застосування є спосіб відбору з ймовірністю, пропорційною розміру.

При проведенні вибіркових обстежень умов життя домогосподарств та економічної активності населення для відбору територіальних одиниць (міст, районів, сільських рад, сіл, переписних ділянок тощо) в якості розміру у статистичній практиці найбільш поширені показники чисельності населення або кількості домогосподарств, оскільки ці характеристики достатньо надійні та спостерігаються (особливо в частині чисельності населення) на постійній основі.

Виходячи з вищенаведеного, при формуванні вибіркових сукупностей для проведення цих двох базових вибіркових обстежень населення на першому та другому ступенях доцільно застосовувати відбір з ймовірністю, пропорційною розміру, а в якості розміру територіальної одиниці використовувати показник чисельності населення (або кількості домогосподарств).

Для проведення вибіркового обстеження сільськогосподарської діяльності населення у сільській місцевості відбір як територіальних одиниць (сільських рад), так і домогосподарств, здійснюється пропорційно розміру певної характеристики щодо виробничого потенціалу домогосподарств, в якості якої використовується площа землі домогосподарств. Причому, розмір територіальної одиниці визначається як сума площ землі домогосподарств даної територіальної одиниці.

Основна перевага способу відбору з імовірністю пропорційною розміру полягає в тому, що для багатоступеневих вибірок він дозволяє забезпечити однакову загальну імовірність відбору одиниць вибірки останнього ступеню за умови їх рівномірного розподілу по територіальних одиницях різного розміру.

На окремих етапах формування вибірки після упорядкування одиниць відбору за певним визначеним принципом, безпосередньо відбір здійснюється із застосуванням систематичного відбору.

8. Реалізація  робіт з формування вибірки

 Реалізація робіт з формування вибірки здійснюється у кілька послідовних етапів із застосуванням процедур, визначених при розробці дизайну вибірки. Зокрема, формування вибірки для базових вибіркових обстежень здійснюється у три етапи, а саме: відбір первинних територіальних одиниць вибірки, відбір вторинних територіальних одиниць вибірки, відбір домогосподарств.

8.1. Відбір первинних територіальних одиниць вибірки

Етап відбору первинних територіальних одиниць вибірки складається з таких робіт: визначення порогу саморепрезентативності, визначення мінімального розміру територіальної одиниці, відбір несаморепрезентативних територіальних одиниць, розрахунок ймовірностей відбору первинних територіальних одиниць. 

8.1.1. Визначення порогу саморепрезентативності

 При проведенні вибіркового обстеження, з одного боку,  кожна одиниця вибіркової сукупності репрезентує певну кількість елементів генеральної сукупності. З іншого боку, статистик має певне навантаження щодо кількості одиниць вибіркової сукупності, яку він повинен обстежити. Таким чином, визначена кількість одиниць вибіркової сукупності, яку опитує один статистик, репрезентує визначену кількість елементів генеральної сукупності. Ця кількість елементів генеральної сукупності називається порогом саморепрезентативності, який у разі застосування методу відбору PPS є критерієм визначення територіальних одиниць, що обов¢язково мають бути відібрані до територіальної вибірки, тобто включені до територіальної вибірки з імовірністю, що дорівнює одиниці. Такі територіальні одиниці називаються саморепрезентативними. Несаморепрезентативні територіальні одиниці відбираються із застосуванням способу систематичного відбору з імовірністю пропорційною розміру та включаються до територіальної вибірки з імовірністю, меншою одиниці.

При формуванні територіальної вибірки для проведення базових вибіркових обстежень населення кількість територіальних одиниць, яку необхідно відібрати, невідома. У зв’язку з цим, поріг саморепрезентативності визначають на основі обсягу вибірки n та заданої кількості домогосподарств, що обстежуються одним статистиком (навантаження статистика), за умови повного завантаження одного статистика при обстеженні даної територіальної одиниці. Поріг саморепрезентативності визначається за наступною формулою:

nP =  ,                                   (7)

де nP  - поріг саморепрезентативності;

N – обсяг генеральної сукупності;

n - обсяг вибіркової сукупності;

m – початкове навантаження статистика.

Одиницею вибіркової сукупності при проведенні вибіркових обстежень населення є домогосподарство або особа. Обсяг генеральної сукупності, обсяг вибірки та навантаження статистика можуть визначатися як кількістю домогосподарств, так і чисельністю населення.  У другому випадку для розрахунку порогу саморепрезентативності у формулу (7) слід ввести додатковий множник - середній розмір домогосподарства: 

 =  ,                    (8)  

де mf  - середній розмір домогосподарства (осіб).

Середній розмір домогосподарства у міських населених пунктах може бути отриманий з підсумків перепису населення або з даних попередніх вибіркових обстежень, а по сільській місцевості – з вищезгаданих джерел, а також з даних Погосподарського обліку. Доцільність застосування у розрахунках порогу саморепрезентативності показника чисельності населення полягає також у наявності надійних даних демографічної статистики щодо чисельності населення практично усіх адмінінстративно-територіальних одиниць, що дозволяє застосовувати останні для удосконалення процедур розповсюдження результатів вибіркових обстежень на генеральну сукупність.

Приклад  розрахунку  порогу  саморепрезентативності  наведено  у додатку В.

У випадку використання однієї територіальної вибірки для проведення декількох вибіркових обстежень, розрахунок порогу саморепрезентативності слід проводити для вибіркового обстеження з найбільшим навантаженням на одного статистика.

У випадках встановлення вимоги щодо різного навантаження статистика у саморепрезентативних та несаморепрезентативних населених пунктах (районах),  слід передбачити розрахунок порогу саморепрезентативності з урахуванням цієї вимоги. 

8.1.2. Визначення мінімального розміру територіальної одиниці

При формуванні вибіркових сукупностей для проведення базових вибіркових обстежень населення визначена вимога щодо проведення вибіркового обстеження на певній територіальній одиниці  протягом кількох років. У зв’язку з цим, слід визначити мінімальний розмір територіальної одиниці відбору.

Мінімальний розмір територіальної одиниці може бути розрахований за двома підходами в залежності від схеми ротації одиниць вибірки.

У випадку повної щорічної ротації одиниць вибірки розрахунок базується на навантаженні статистика і проводиться за формулою:

 

nmin = m × t ,                                                           (9)

 

де nmin  - мінімальний розмір територіальної одиниці (кількість домогосподарств або осіб);

m – початкове навантаження на статистика;

t – кількість років перебування територіальної одиниці у вибірці.

У випадку часткової ротації одиниць вибірки мінімальний розмір територіальної одиниці розраховується з урахуванням встановленої схеми ротації. За умови використання у вибірковому обстеженні часткової ротації одиниць вибірки необхідно виділяти два періоди: впровадження схеми ротації (зазвичай, перший рік) та підтримка схеми ротації (наступні роки). Це пояснюється тим, що у період впровадження схеми ротації необхідно відібрати більше одиниць вибірки, ніж у наступні періоди.

Мінімальний розмір територіальної одиниці з врахуванням схеми ротації розраховується за формулою:

 

nmin = nІ + nТ ×  (t - 1) ,                                       (10)

 

де nІ  – кількість одиниць вибірки (домогосподарств або осіб), необхідних у перший рік запровадження схеми ротації;

nТ – кількість одиниць вибірки, необхідних у наступні роки функціонування схеми ротації.

Нижче наведений приклад розрахунку мінімального розміру територіальної одиниці з урахуванням схеми ротації, для проведення вибіркового обстеження економічної активності населення у 2004 – 2008 роках. 

При плануванні обстеження була визначена вимога щодо застосування схеми ротації 3-9-3, яка передбачає участь домогосподарства в обстеженні протягом 3 місяців поспіль, потім на 9 місяців ці домогосподарства тимчасово вибувають з обстеження , а після цього обстежуються ще 3 місяці поспіль (див. додаток Б). Програмою обстеження економічної активності населення передбачено щомісячне опитування домогосподарств, а обробка результатів здійснюється на квартальній основі. У зв’язку з цим, був визначений квартальний обсяг вибірки - nq.

Кількість окремих ротаційних груп домогосподарств, які приймуть участь в обстеженні у першому кварталі першого року впровадження схеми ротації, підраховується на основі інформації додатка Б. Це групи з номерами 1, 2, 3, 4, 5, 13, 14, 15, 16, 17, тобто всього 10 груп. Відповідно, обсяг однієї ротаційної групи становить:  n(1) = nq  / 10.

Кількість ротаційних груп домогосподарств, які приймуть участь в обстеженні у перший рік впровадження схеми ротації, становить 26. Відповідно, необхідна річна кількість одиниць спостереження становить:
nІ = 26 n(1), або nІ = 2,6  nq (з використанням показника квартального обсягу вибірки).

У наступні роки до обстеження відповідно до схеми ротації залучається щомісячно тільки одна нова ротаційна група домогосподарств, а інші п¢ять – це групи, які були відібрані і приймали участь в обстеженні раніше. Щорічна кількість нових одиниць спостереження становить: nТ = 12 n(1),  або nТ = 1,2nq. 

Для забезпечення надійності функціонування територіальної вибірки протягом визначеної кількості років доцільно збільшити мінімальний розмір територіальної одиниці шляхом додавання резервного року. При повній щорічній ротації одиниць спостереження використовується формула:

 

nmin = m × ( t +1) ,                                      (11)

 

а при розрахунках мінімального розміру територіальної одиниці з урахуванням схеми ротації - наступна формула:

 

nmin = nІ + nТ ×  t.                                            (12)

 

Наведена процедура унеможливить негативний вплив змін, які можуть відбутися  протягом терміну експлуатації територіальної вибірки, а також дозволить забезпечити більш тривалий термін її експлуатації у випадку можливої затримки  введення нової територіальної вибірки.

Якщо у вимогах до формування вибірки був визначений очікуваний коефіцієнт відповідей, мінімальний розмір територіальної одиниці коригується за формулою: 

.                                                                (13)

У випадку проведення в одній територіальній одиниці декількох вибіркових обстежень, мінімальний розмір територіальної одиниці визначається сумою мінімальних розмірів, розрахованих для кожного з цих обстежень незалежно від можливого спільного використання для обстежень частин вибірок.

Територіальні одиниці, відібрані на першому ступені відбору, мають достатній розмір для проведення вибіркового обстеження протягом кількох років. Проблема визначення мінімального розміру територіальної одиниці більш актуальна для локальних територій, які відбираються на другому ступені відбору (ВТОВ).  

8.1.3. Відбір несаморепрезентативних територіальних одиниць

У випадках необхідності відбору територіальних одиниць, розмір яких менше порогу саморепрезентативності, такі територіальні одиниці визначаються як несаморепрезентативні, і включаються до вибірки з ймовірністю, пропорційною їх розміру.

Несаморепрезентативні територіальні одиниці вибираються з дотриманням наступної вимоги: одна така одиниця репрезентує групу територіальних одиниць, сума розмірів яких дорівнює порогу саморепрезентативності.

Процедура відбору несаморепрезентативних територіальних одиниць складається з наступних основних етапів:

- упорядкування несаморепрезентативних територіальних одиниць;

- визначення кількості територіальних одиниць, які необхідно відібрати;

- визначення кроку відбору та першої територіальної одиниці для відбору;

- відбір наступних територіальних одиниць.

Нижче наведено зміст зазначених етапів.

а) Упорядкування несаморепрезентативних територіальних одиниць

У межах кожної субстрати ( міська та сільська місцевість) складається впорядкований певним чином перелік несаморепрезентативних територіальних одиниць. Нижче наведені можливі принципи впорядкування:

- за значенням певної ознаки (характеристики) територіальної одиниці;

- за географічним принципом (принцип „географічного серпантину”);

- за абеткою відповідно до назви територіальної одиниці;

- за іншим принципом.

Останні два варіанти можуть бути застосовані при формуванні вибірки способом простого випадкового відбору.

При формуванні територіальної вибірки для проведення базових вибіркових обстежень населення застосовується спосіб систематичного відбору з ймовірністю пропорційною розміру з попередньою стратифікацією генеральної сукупності, що вимагає упорядкування територіальних одиниць за певним принципом.

Упорядкування за ознакою (наприклад, чисельністю населення) передбачає наявність помітних розбіжностей явищ, що досліджуються, в одиницях різного розміру. Метою цього типу упорядкування є включення до вибірки як одиниць великого, так і одиниць малого розміру. Разом з тим, упорядкування за принципом „географічного серпантину” (див. рис. 1) задовольняє вимозі рівномірного з географічної точки зору розміщення по території одиниць вибірки.

Виходячи з вищенаведеного, при формуванні вибіркових сукупностей для проведення базових вибіркових обстежень населення для етапу відбору несаморепрезентативних ПТОВ в межах кожної страти слід скласти перелік територіальних одиниць, ранжований в порядку зменшення чисельності населення (або в порядку збільшення чисельності населення). Райони слід упорядковувати не за ознакою (наприклад, чисельністю населення), а за принципом „географічного серпантину”. Такий підхід забезпечить краще охоплення території регіону (області), а також дозволить врахувати природно-кліматичні особливості різних частин регіону, що важливе при вивченні виробництва сільськогосподарської продукції в домогосподарствах. Застосування принципу „географічного серпантину” обов’язково передбачає використання картографічного матеріалу. За відсутністю карт можуть використовуватися карти-схеми, але на них повинно витримуватися географічне розміщення об’єктів відносно один одного. Важливою умовою є необхідність однакової географічної орієнтації всіх карт у межах області та країни. Враховуючи, що всі карти, які виробляються спеціалізованими підприємствами, мають орієнтацію „південь-північ”, аналогічну орієнтацію слід використовувати при проведенні серпантину. Серпантин слід проводити з лівого верхнього кута на схід, після досягнення краю карти необхідно робити поворот, потім вести серпантин із сходу на захід паралельно попередній лінії. Обов’язковою вимогою при проведенні серпантину є відсутність “порожніх проходів”, тобто при одному проході лінія має пройти щонайменше через одну територіальну одиницю. Територіальні одиниці за порядком проходження лінії включаються до списку.

 

Рис. 1. Впорядковування територіальних одиниць вибірки за принципом „географічного серпантину”

 

Приклад упорядкування територіальних одиниць за розміром та за принципом „географічного серпантину” наведено у додатку Г.

б) Визначення кількості територіальних одиниць, які необхідно відібрати

Кількість несаморепрезентативних ПТОВ, які необхідно відібрати у кожній субстраті, визначається діленням загальної чисельності населення всіх несаморепрезентативних територіальних одиниць кожної субстрати на поріг саморепрезентативності, який визначається за формулою (7) або за формулою (8). Результатом практично в усіх випадках є дробове число, яке необхідно округлити до цілого числа. Кількість несаморепрезентативних територіальних одиниць, яку необхідно відібрати, розраховується за формулою: 

                      d=/nP=,                                  (14)

де d – кількість несаморепрезентативних територіальних одиниць, яку необхідно відібрати;

 –  кількість домогосподарств у конкретній субстраті;

- чисельність населення у конкретній субстраті;

Після округлення кількості несаморепрезентативних територіальних одиниць до цілого значення, визначається величина інтервалу (крок) відбору.

в) Визначення кроку відбору та першої одиниці для відбору

Крок відбору - це результат ділення загального значення ознаки, визначеної в якості основи для ранжування (наприклад, чисельності населення) у несаморепрезентативних територіальних одиницях області (району) на число одиниць, які необхідно відібрати.

Якщо несаморепрезентативні територіальні одиниці відранжовані за чисельністю населення, крок відбору h розраховується за формулою: 

h =/d  .                                                (15)

г) Відбір першої територіальної одиниці вибірки

Перед початком відбору до переліку несаморепрезентативних територіальних одиниць вносяться дані щодо накопичених значень ознаки, визначеної в якості основи для ранжування (чисельності населення відповідних територіальних одиниць).

Початок відбору (перша відібрана несаморепрезентативна територіальна одиниця) визначається шляхом множення кроку відбору на випадкове число:

 

h1 = h *  nс  ,                                                  (16)

 

де h1  - значення для здійснення відбору першої територіальної одиниці;

nс - випадкове число (визначається за допомогою генератору випадкових чисел і приймає значення від 0 до 1).

Отриманий результат розрахунку порівнюється з накопиченими чисельностями у переліку територіальних одиниць. Територіальна одиниця,  накопиченому значенню ознаки якої відповідає результат, є першою одиницею вибірки.

д) Відбір наступних територіальних одиниць вибірки

Всі наступні територіальні одиниці визначаються шляхом додавання кроку відбору до накопиченого значення ознаки, розрахованого для відбору попередньої територіальної одиниці:

hi+1 = hi +  h .                                               (17)

 

Ілюстрація розрахунку  d,  h,  h1 ,  hi+1 наведена у додатку Г.

Результати відбору з використанням двох принципів упорядкування територіальних одиниць свідчать, що територіальні одиниці, розмір яких близький до кроку відбору, мають високу ймовірність бути відібраними за кожним з цих принципів упорядкування. 

8.1.4. Розрахунок ймовірностей відбору ПТОВ

 Після відбору ПТОВ розраховується ймовірність їх відбору.

У зв’язку з тим, що при формуванні територіальної вибірки для проведення базових вибіркових обстежень населення застосовується спосіб відбору з ймовірностями, пропорційними розміру, надалі наведені методологічні підходи до розрахунків ймовірностей відбору на прикладі цього способу.

Припустимо, що характеристикою розміру є кількість домогосподарств, територіальної одиниці. Населення всіх територіальних одиниць складається з N  домогосподарств, з яких необхідно відібрати  n домогосподарств, з дотриманням однакової ймовірності відбору (f = n / N) для кожного домогосподарства. Це один з основних принципів, який покладено в основу способу відбору PPS.

Припустимо, що все населення проживає в D територіальних одиницях, з яких треба відібрати d одиниць. Відповідно, кількість домогосподарств, які мають бути відібрані в кожній територіальній одиниці вибірки, дорівнює в середньому b = n / d.

Якщо Ma є розміром територіальної одиниці a (у даному випадку – кількістю домогосподарств в територіальній одиниці), і M =  є сумою розмірів усіх територіальних одиниць D у генеральній сукупності, то ймовірність відбору територіальної одиниці a, пропорційна її розміру, становитиме:

  =                                               (18)

 Наявність коефіцієнту d у формулі (18) визначає, що територіальні одиниці з розміром Ma, рівним чи більшим певного порогового значення, рівного / d, мають ймовірність відбору, рівну чи більшу одиниці. Відповідно, ці територіальні одиниці відбираються з 100% визначеністю, тобто з імовірністю, що дорівнює одиниці.

У зв’язку з тим, що на даному етапі однією з вимог до формування територіальної вибірки для проведення базових вибіркових обстежень населення є проведення обстеження сільськогосподарської діяльності населення в сільській місцевості в усіх районах України, останні включаються до вибірки з ймовірністю, яка дорівнює одиниці. 

8.2. Відбір вторинних територіальних одиниць вибірки

а) Формування ВТОВ

Для формування ВТОВ необхідно мати картографічний матеріал (карти, карти-схеми, плани), який повинен містити географічне відображення меж утворень локальних територіальних одиниць, на основі яких формуються ВТОВ. Розмір кожної ВТОВ повинен бути не меншим розрахованого мінімального розміру територіальної одиниці відбору nmin. Якщо розмір  локальної території більший, ніж nmin, то вона визначається як ВТОВ; якщо розмір менший, ніж nmin, то необхідно здійснити об’єднання локальних територій, які географічно знаходяться поруч, поки не буде забезпечена мінімально необхідний розмір (чисельність населення (домогосподарств)).

б) Упорядкування ВТОВ

Упорядкування ВТОВ при проведенні відбору доцільно здійснювати за принципом “географічного серпантину”. Застосування цього принципу дозволяє враховувати особливості одиниць спостереження відповідно до їх географічного розміщення. Наприклад, у містах існують райони, які відповідно до специфіки заселення та подальшого формування в побуті мають назви “робочі”, “студентські”, “привілейовані” тощо. У сільській місцевості, де в якості ВТОВ виступають сільські ради, а особливості господарювання та розташування господарств населення залежать від природно – кліматичних умов, принцип “географічного серпантину” дозволяє краще, ніж упорядкування територіальних одиниць відповідно чисельності населення, врахувати особливості, притаманні сільському населенню.

в) Відбір ВТОВ

Відбір ВТОВ здійснюється з використанням аналогічних процедур, які застосовуються при відборі ПТОВ.

г) Розрахунок ймовірностей відбору територіальних одиниць другого ступеню

Ймовірність відбору ВТОВ розраховується за формулою:

Pb  =   ,                                                (19)

 де b -  кількість ВТОВ, які необхідно відібрати;

Мb  -  кількість домогосподарств у ВТОВ b;

 - загальна кількість домогосподарств у всіх ВТОВ 

8.3. Відбір домогосподарств

а) Упорядкування домогосподарств

Упорядкування домогосподарств здійснюється у межах відібраних ВТОВ. Вибір способу упорядкування залежить від наявної інформаційної бази і має  особливості у міських поселеннях та в сільській місцевості. Спосіб упорядкування повинен бути однаковим у всіх ВТОВ в межах певної страти.

У міських поселеннях, незалежно від джерела інформації щодо адрес домогосподарств (матеріали перепису населення, дані виборчих дільниць, дані поштових відділень, тощо), упорядкування здійснюється у наступному порядку: спочатку впорядковуються за абеткою назви вулиць, потім - у порядку зростання номери будинків, потім – у порядку зростання номери квартир. Якщо у квартирі проживає декілька домогосподарств, вони впорядковуються за прізвищами власників особових рахунків (за абеткою).

У сільській місцевості найбільш доцільним для використання джерелом інформації щодо домогосподарств є погосподарський облік. Для зменшення обсягу робіт з формування вибірки списки адрес домогосподарств доцільно складати у тому ж порядку, як вони записані у книгах.

Для формування вибіркових сукупностей можуть бути використані інші джерела інформації щодо адрес домогосподарств. За умови наявності декількох інформаційних джерел, доцільно серед них визначити для використання більш повні за обсягом, а також більш актуальні за часом створення.

Перед початком відбору домогосподарств обов’язково здійснюється актуалізація складених списків адрес, яка унеможливлює або мінімізує негативний вплив можливих змін, які відбуваються як у межах ВТОВ (наприклад, знесення будинків, стихійне лихо тощо), так і безпосередньо серед домогосподарств.

Домогосподарствам в упорядкованих списках по кожній ВТОВ вказуються порядкові номери починаючи з одиниці.

б)Проведення відбору домогосподарств

Відбір домогосподарств проводиться способом систематичного відбору номерів домогосподарств з упорядкованих списків адрес. Приклад проведення процедури систематичного відбору наведено при розгляді відбору несаморепрезентативних територіальних одиниць (міст).

У зв’язку із застосуванням генератора випадкових чисел, результати розрахунків кроку відбору, першого та наступних номерів відібраних домогосподарств, становлять дробові числа, які слід округлити за правилами арифметики до  певної кількості цифр після коми. Ця кількість цифр залежить від кількості домогосподарств, яку необхідно відібрати, і визначається умовою забезпечення всім домогосподарствам з основи вибірки однакової можливості бути відібраними. Для здійснення процедури відбору слід визначення номерів відібраних домогосподарств здійснювати на основі цілої частини згаданого дробового числа незалежно від значення дробової частини (тобто без округлення). Наприклад, при округленні до двох знаків після коми, незалежно від того, становить розрахунковий номер домогосподарства для відбору 74,00; 74,18; 74,50; 74,61 або 74,99, до вибірки включається домогосподарство, яке у списку відповідає номеру 74. Цей підхід унеможливлює при відборі одиниць вибірки вихід за межі списку домогосподарств у випадку проведення округлення за правилами арифметики.

в) Розрахунок ймовірностей відбору одиниць третього ступеню

Останнім етапом формування вибіркової сукупності є розрахунок ймовірностей відбору та базових ваг для кожної відібраної одиниці спостереження. Ймовірність відбору характеризує шанс конкретного домогосподарства бути відібраним.

Ймовірність відбору домогосподарств розраховується за формулою:

Pс  =    ,                                                    (20)  

де сb  - кількість домогосподарств, які необхідно відібрати у ВТОВ b.

Розрахунок загальної ймовірності відбору для методу трьохступеневого відбору здійснюється за наступною формулою:

= n/N  = f.                        (21)  

Якщо на першому та другому ступенях відбору застосовуються однакові одиниці виміру розміру в ідеальному випадку повинна виконуватися умова Ma = , однак ця умова  не є необхідною. Задовільною є умова Ma » .

Відповідно до формули (21) визначається кількість домогосподарств , які слід відібрати в кожній територіальній одиниці Ma. Формула (20) визначає теоретичні ймовірності відбору одиниць вибіркової сукупності на останньому ступені. Загальна теоретична ймовірність відбору розраховується як добуток ймовірностей відбору на кожному етапі.

Загальна теоретична ймовірність відбору певного і – го домогосподарства з вибіркової сукупності розраховуються за формулою:

 

Pi = Pa Pb Pс  .                                                                                           (22)

 

Разом з тим, у зв’язку з необхідністю забезпечити певні визначені вимоги, на практиці ймовірності відбору домогосподарств неоднакові. Наприклад, однією з таких вимог є необхідність забезпечити рівне навантаження статистиків в межах однакових типів територіальних одиниць.

Фактичні ймовірності відбору домогосподарств несуттєво відрізняються від значень, отриманих за формулою (22).  

9. Актуалізація основ  вибірки 

Діюча в органах державної статистики України система організації вибіркових обстежень населення (домогосподарств) передбачає формування територіальної вибірки на термін п’ять років. Відповідно, перший та другий етапи формування вибірки також здійснюються з такою ж періодичністю. У зв’язку з цим, а також враховуючи низьку ймовірність виникнення ситуації, коли необхідно замінити у територіальній вибірці обстежуваний міський населений пункт або район, актуалізацію основ територіальної вибірки першого та другого ступенів відбору протягом зазначених п’яти років проводити недоцільно.

У випадках знесення житлових будинків або їх руйнування через стихійне лихо на території обстежуваної ВТОВ, необхідність її заміни виникнути може. Разом з тим, для таких випадків також недоцільно робити актуалізацію, оскільки як для етапів відбору нових міських населених пунктів  та районів, так і для етапу відбору ВТОВ слід користуватися діючою основою територіальної вибірки. Це пов’язано з необхідністю застосування для розрахунків ймовірностей відбору (формули (18), (19)) єдиної інформаційної бази для усіх адміністративно – територіальних одиниць.

Разом з тим, у зв’язку зі змінами, які постійно відбуваються на відібраних територіях, і призводять до певної невідповідності списків адрес домогосподарств їх реальному стану, актуалізацію цих списків необхідно здійснювати перед кожним формуванням вибіркової сукупності домогосподарств. Актуалізація списків адрес домогосподарств є однією з основних засад, які забезпечують якісне функціонування вибіркової сукупності домогосподарств протягом всього строку дії територіальної вибірки.

Метою процедури актуалізації списків адрес домогосподарств, які є основою для формування нової вибіркової сукупності домогосподарств, є підвищення якості списків шляхом внесення до них змін, які відбулися протягом останнього року.

Інформаційною базою для проведення актуалізації списків адрес домогосподарств є:

- списки адрес домогосподарств, які були складені для попереднього відбору;

- дані погосподарських книг, які ведуться у сільських (селищних) радах;

- дані житлово-експлуатаційних контор (по будинках місцевих рад); квартирних відділів підприємств, організацій, установ (по відомчих будинках); правлінь кооперативів (по кооперативних будинках); домовласників (по будинках, що належать громадянам на правах особистої власності, і якщо дані по них відсутні у житлових конторах);

- відомості статистиків щодо змін, які відбулися на територіях, на яких ними проводиться вибіркове обстеження.

Актуалізація здійснюється статистиками, працівниками підрозділів з організації та координації вибіркових обстежень населення регіональних управлінь статистики, іншими працівниками місцевих органів державної статистики. Результати актуалізації узагальнюються підрозділами з організації та координації вибіркових обстежень населення регіональних управлінь статистики у спеціальному звіті, який надсилається відповідному підрозділу Держкомстату. 

10. Контроль формування вибіркової сукупності та актуалізації основи для вибірки  

Метою проведення контролю формування вибіркової сукупності та актуалізації основи для вибірки є перевірка правильності дотримання методично – інструктивних матеріалів та коректності реалізації всіх процедур відбору. Контроль є обов’язковим етапом формування вибіркової сукупності.

Контроль реалізації процедур формування вибірки полягає у перевірці коректності дотримання всіх положень, викладених у методично – інструктивних матеріалах. Для проведення цього типу контролю повинні бути розроблені спеціальні інструктивні матеріали.

Іншим напрямом цього типу контролю є математична перевірка правильності формування вибірки домогосподарств, яка складається з наступних етапів:

1) розраховується статистична вага кожного  домогосподарства -величина, обернена до ймовірності відбору відповідного домогосподарства:

 

Wi = 1 / Pi                                                            (23)

 

2) підсумовуються статистичні ваги всіх відібраних домогосподарств;

3) отриманий підсумок повинен дорівнювати обсягу генеральної сукупності:

 

                                                              (24)

Контроль актуалізації основи вибірки полягає у перевірці правильності дотримання інструктивних матеріалів щодо процедури актуалізації. Цей тип контролю здійснюється шляхом математичної перевірки звітних даних щодо актуалізації, а також шляхом виїзду в регіональні управління статистики та перевірки матеріалів актуалізації на місцях.

Наведені типи контролю проводяться працівниками підрозділів з організації та координації вибіркових обстежень населення територіальних органів державної статистики та працівниками відповідних підрозділів Держкомстату. Здійснення обох типів контролю необхідно проводити у стислі терміни безпосередньо після реалізації відповідних етапів формування вибірки або актуалізації основи. За результатами контролю необхідно здійснити виправлення помилок.

 

ДЖЕРЕЛА

 

1. Статистика: Підручник / С.С. Герасименко, А.В.Головач, А.М. Еріна та ін.; За наук. ред. С.С.Герасименка. – 2-ге вид., перероб і доп. – К.: КНЕУ, 2000. – 467с.

2. Вибіркове спостереження: Термінологічний словник. – К.: НТК статистичних досліджень, 2004. – 140 с.

3. Кокрен У. Методы выборочного исследования. - М.: Статистика, 1976. - 440с.

4. Kish L. Survey sampling.- Wiley Classics Library Edition Published, 1995.- 643p.

5. Бокун Н.Ч., Чернышова Т.М. Методы выборочных обследований: Учебно-справочное пособие. – Мн.: НИИ статистики Республики Беларусь, 1997. – 416с.

6. Еріна А.М. Організація вибіркових обстежень: Навчальний посібник. – К.: КНЕУ, 2004. – 127 с.

7. Дружинин Н.К. Выборочный метод и его применение в социально – экономических исследованиях. – М.: Статистика, 1970. – 104 с.

8. Черняк О.І. Техніка вибіркових досліджень. – К.: МІВВЦ, 2001. – 248 с.

9. Пархоменко В.М. Методи вибіркових обстежень: Навчальний посібник. – К.: 2001. – 148 с.

10. Чернышова Т.М. Теоретические и практические основы выборки для обследования бюджетов домашних хозяйств: учебно-методическое пособие. – М.: МИПК учета и статистики, 2000. – 160 с.

11. Kalton G. Introduction to Survey Sampling. Newbury Park: SAGE Publications Inc., 1983. – 96 p. 

12. Йейтс Ф. Выборочный метод в переписях и обследованиях. – М.: Статистика, 1965. – 433 с.

13. Sampling Surveys of Current Interest (Fourteenth Report). Statistical Papers (Series C, №15). United Nations, Statistical Office. – N.Y., 1982. – 420 p.

14. Розробка та впровадження методології формування вибіркової сукупності для обстеження бюджетів домашніх господарств, її ротації та розповсюдження результатів на генеральну сукупність” / Науковий звіт НДІ статистики Держкомстату України за 1998 рік.

15. Методологічні положення щодо формування вибіркової сукупності для обстеження доходів і витрат домашніх господарств України. / Науковий звіт НДІ статистики Держкомстату України. –К.: 1998.

16. Гладун О.М. Розробка та впровадження в Україні  нової методології формування вибіркової сукупності домашніх господарств для проведення соціально - економічних обстежень // Щорічник наук. праць „Проблеми статистики”. –К.: НДІ статистики Держкомстату України. – 1999. - №1, с. 28 - 32.

17. Verma V. Workshop on Labor Force Surveys  for CIS Countries and the Baltic States run by the International Labor Office, Bureau of Statistics hosted by State Statistics Committee of Ukraine (Kyiv, 14-19 September 1998). Part Three: sample design, data evalution, field operations.

18. Lehtonen R., Pahkinen E.J. Practical Methods for Design and Analysis of Complex Surveys. - Revised edition 1996. - 344p.

19. Silvestrov D.S., Silvestrova E.D. Elselvier’s Dictionary of Statistical Terminology. –Amsterdam: Elselvier, 1995. – 496 p.

20. Колтон Г. Структура выборки для проведения обследования домашних хозяйств на Украине // Отчет Госкомстату Украины. 1998. – 20 с.

21. Мартини А. Структура и проведение нового Обследования домашних хозяйств на Украине // Отчет Госкомстату Украины. 1997. – 22 с.; 1998а. – 32 с.; 1998б. – 28 с.

22. Василевская Н.С., Єпихина А.В., Кисенкова Т.Н., Соболева Н.Н. Организация выборочного статистического наблюдения за сельскохозяйственной деятельностью хозяйств населения. Учебно-методическое пособие. –М.:МИПК учета и  статистики. 2001. –88с.

 

Додаток А

 

ТЕХНІЧНЕ ЗАВДАННЯ на формування вибірки

 

1. Мета вибіркового обстеження.

2. Генеральна сукупність.

3. Одиниця спостереження.

3.1 Обмеження щодо представлення у вибірці окремих груп одиниць спостереження.

4. Інформаційні джерела для формування вибірки.

5. Строк дії територіальної вибірки та вибірки одиниць спостереження.

6.Вимоги щодо представлення у вибірці територіальних одиниць відповідно до адміністративно – територіального устрою України.

7. Наявність та схема ротації одиниць спостереження.

8. Тип вибірки, спосіб та одиниці відбору.

9. Вимоги щодо надійності оцінок основних показників, що вимірюються у вибірковому спостереженні (державний рівень, регіональний рівень).

10. Додаткові вимоги до формування вибірки (наприклад, метод формування територіальної вибірки повинен враховувати можливість її розширення в окремих регіонах тощо). 

11.

Обсяг вибіркової сукупності з урахуванням визначених вимог (домогосподарств):

 

- на рік

 

- на квартал

 

- на місяць

12.

Початкове навантаження на одного статистика з проведення обстежень населення (домогосподарств на місяць).

 

-  у саморепрезентативних містах

 

-  у несаморепрезентативних містах

 

-  у сільській місцевості

13.

Очікуваний коефіцієнт відповідей респондентів, %

 

-  у саморепрезентативних містах

 

-  у несаморепрезентативних містах

 

-  у сільській місцевості

14. Інші додаткові вимоги.

 

 Додаток Б

 

Схема ротації домогосподарств при проведенні обстеження економічної активності населення у 2004 – 2008 роках

 

Перший рік обстеження

Наступні роки обстеження

11

12

1

2

3

4

5

6

7

8

9

10

11

12

1

2

3

4

5

6

7

8

9

10

11

12

1

1

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

2

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

3

3

3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

4

4

4

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

5

5

5

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

6

6

6

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

7

7

7

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

8

8

8

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

9

9

9

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

10

10

10

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

11

11

11

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

12

12

12

 

 

 

 

 

 

 

 

 

 

 

 

13

13

13

 

 

 

 

 

 

 

 

 

13

13

13

 

 

 

 

 

 

 

 

 

 

 

 

14

14

14

 

 

 

 

 

 

 

 

 

14

14

14

 

 

 

 

 

 

 

 

 

 

 

 

15

15

15

 

 

 

 

 

 

 

 

 

15

15

15

 

 

 

 

 

 

 

 

 

 

 

 

16

16

16

 

 

 

 

 

 

 

 

 

16

16

16

 

 

 

 

 

 

 

 

 

 

 

 

17

17

17

 

 

 

 

 

 

 

 

 

17

17

17

 

 

 

 

 

 

 

 

 

 

 

 

18

18

18

 

 

 

 

 

 

 

 

 

18

18

18

 

 

 

 

 

 

 

 

 

 

 

 

19

19

19

 

 

 

 

 

 

 

 

 

19

19

19

 

 

 

 

 

 

 

 

 

 

 

 

20

20

20

 

 

 

 

 

 

 

 

 

20

20

20

 

 

 

 

 

 

 

 

 

 

 

 

21

21

21

 

 

 

 

 

 

 

 

 

21

21

21

 

 

 

 

 

 

 

 

 

 

 

 

22

22

22

 

 

 

 

 

 

 

 

 

22

22

22

 

 

 

 

 

 

 

 

 

 

 

 

23

23

23

 

 

 

 

 

 

 

 

 

23

23

23

 

 

 

 

 

 

 

 

 

 

 

 

24

24

24

 

 

 

 

 

 

 

 

 

24

24

24

 

 

 

 

 

 

 

 

 

 

 

 

25

25

25

 

 

 

 

 

 

 

 

 

25

25

 

 

 

 

 

 

 

 

 

 

 

 

 

26

26

26

 

 

 

 

 

 

 

 

 

26

 

 

 

 

 

 

 

 

 

 

 

 

 

 

27

27

27

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

28

28

28

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

29

29

29

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

30

30

30

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

31

31

31

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

32

32

32

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

33

33

33

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

34

34

34

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

35

35

35

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

36

36

36

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

37

37

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

38

 

Додаток В

Приклад розрахунку порогу саморепрезентативності

 

Вихідна інформація:

обсяг генеральної сукупності  N = 17 609 000 домогосподарств;

обсяг вибіркової сукупності n = 31 800 домогосподарств;

навантаження статистика m = 72 домогосподарства;

середній розмір домогосподарства mf  = 2,62 осіб.

Поріг саморепрезентативності (nP ):

 

nP =   =    × 72 × 2,62 » 104500 осіб.

                                      

Таким чином, територіальні одиниці (міста (міськради), ) з населенням n ³ 104,5 тис. осіб визначаються як саморепрезентативні і відповідно включаються у вибірку з ймовірністю, рівною одиниці.

 

Додаток Г

Приклад упорядкування територіальних одиниць за розміром та за принципом „географічного серпантину” , а також реалізації процедури відбору територіальних одиниць

Вихідні дані:

У певному підшарі з загальною чисельністю населення 454 тис. осіб заходяться 7 територіальних одиниць:

A (чисельність населення – 30 тис. осіб);

B (чисельність населення – 80 тис. осіб);

C (чисельність населення – 50 тис. осіб);

D (чисельність населення – 100 тис. осіб);

E (чисельність населення – 104 тис. осіб);

F (чисельність населення – 70 тис. осіб);

G (чисельність населення – 20 тис. осіб).

Територіальне розміщення цих одиниць наведено на рис. 1.

Впорядкуємо ці територіальні одиниці за двома принципами:

1) ранжуванням за зменшенням чисельності населення (табл. Г.1);

2) „географічного серпантину” (табл. Г.2).

 

Таблиця Г.1 – Приклад упорядкування територіальних одиниць за розміром(чисельністю населення)

Територіальна одиниця

Чисельність населення(тис. осіб)

Накопичена чисельність населення (тис. осіб)

Значення чисельності населення для відбору (тис. осіб)

E

104

104

82,4

D

100

204

195,9

B

80

284

 

F

70

354

309,4

C

50

404

 

A

30

434

422,9

G

20

454

 

Всього

454

х

 

 

Таблиця Г.2 – Приклад упорядкування територіальних одиниць за принципом „географічного серпантину”

Територіальна одиниця

Чисельність населення (тис. осіб)

Накопичена чисельність населення (тис. осіб)

Значення чисельності населення для відбору (тис. осіб)

A

30

30

 

B

80

110

82,4

C

50

160

 

D

100

260

195,9

E

104

364

309,4

F

70

434

422,9

G

20

454

 

Всього

454

х

 

Визначення кількості несаморепрезентативних територіальних одиниць, які необхідно відібрати

Вихідні дані для умовного прикладу наведені вище, а також у додатку В:

поріг саморепрезентативності nP » 104,5 тис. осіб;

чисельність населення у субстраті (у вищенаведених несаморепрезентативних територіальних одиницях) N = 454 тис. осіб.

Кількість несаморепрезентативних територіальних одиниць, яку необхідно відібрати (d):

d =  N  /  nP d =  454 000  /  104 500 = 4,344 » 4.

Таким чином, слід відібрати 4 територіальні одиниці із 7.

Визначення кроку відбору

Відповідно з даними попереднього прикладу (N = 454 тис. осіб, d = 4),  крок відбору становить ( h): 

h = N  /  d  =  454 000  /  4 = 113,5 тис. осіб.

Визначення першої несаморепрезентативної територіальної одиниці для відбору

Вихідні дані:

випадкове число nс = 0,725669;

крок відбору h = 113,5 тис. осіб.

Значення для відбору першої територіальної одиниці( h1):

h1  = h *  nс  = 113 500 * 0,725669 = 82 363, 4  » 82,4 тис. осіб.

Отримане значення порівнюється з накопиченими чисельностями населення у переліку територіальних одиниць. Територіальна одиниця,  накопиченому значенню чисельності якої відповідає результат, є першою територіальною одиницею вибірки. У таблиці 1 - це територіальна одиниця E, у таблиці 2 – B.

Відбір наступних несаморепрезентативних територіальних одиниць

Всі наступні територіальні одиниці визначаються шляхом додавання кроку відбору до накопиченої чисельності населення, розрахованої для відбору попередньої територіальної одиниці:

hi+1 = hi +  h .

Приклад відбору територіальних одиниць за даними таблиць 1 та 2:

h2 = h1 +  h = 82,4 + 113,5 = 195,9;

h3 = h2 +  h = 195,9 + 113,5 = 309,4;

h4 = h3 +  h = 309,4 + 113,5 = 422,9.

 Таким чином, у випадку упорядкування територіальних одиниць за розміром (ранжування за зменшенням чисельності населення), будуть відібрані територіальні одиниці E, D, F та A (табл. 1); у випадку упорядкування за принципом „географічного серпантину” – B, D, E та F (табл. 2).