ЗАТВЕРДЖЕНО

Наказ Держкомстату

05.06.2008р.  № 178

 

 МЕТОДОЛОГІЧНІ ПОЛОЖЕННЯ З ПІДГОТОВКИ СТАНДАРТНИХ ЗВІТІВ
ЩОДО ЯКОСТІ РЕЗУЛЬТАТІВ ДЕРЖАВНИХ ВИБІРКОВИХ ОБСТЕЖЕНЬ НАСЕЛЕННЯ (ДОМОГОСПОДАРСТВ)

Методологічні положення визначають засади підготовки для користувачів звітів щодо якості результатів державних вибіркових обстежень населення, що проводяться Державним комітетом статистики України. Цей документ містить опис загальних принципів вимірювання якості статистичної продукції, основні правила щодо формування змісту програм та побудови звітів щодо якості, а також рекомендації щодо застосування систем показників – індикаторів якості, методів їх визначення та необхідних для цього інформаційних джерел.

Методологічні положення підготовлені на основі документів Євростату  з питань системи звітування щодо якості статистичної продукції, розроблених протягом 2002-2005 років, та матеріалів методичного характеру, опублікованих за результатами впровадження зазначених рекомендацій у роботу національних статистичних служб країн європейської спільноти, зокрема, у Великій Британії.

Підготовка методологічних положень здійснена за підтримки проекту „Допомога Державному комітету статистики України” Міністерства у справах міжнародного розвитку Сполученого Королівства Великої Британії та Північної Ірландії. Крім того, окремі дослідження  методологічного характеру були виконані в рамках наукової тематики Інституту демографії та соціальних досліджень НАН України.

Методологічні положення призначені для використання працівниками органів державної статистики, міністерствами, іншими органами законодавчої та виконавчої влади, науковими організаціями та навчальними закладами, іншими користувачами даних державних вибіркових обстежень населення (домогосподарств).

Методологічні положення підготовлені фахівцями Інституту демографії та соціальних досліджень НАН України Саріогло В.Г., Терещенко Г.І., Лисою О.В. за участю директора департаменту обстежень домогосподарств Держкомстату України Осипової І.І.

ПЕРЕДМОВА

 Забезпечення якості статистичної продукції – один з основних напрямів сучасного етапу розвитку загальноєвропейської та багатьох національних статистичних систем. Це зумовлено як необхідністю більш повного задоволення потреб користувачів усіх рівнів у достовірних, своєчасних і зрозумілих даних, так і задачами стандартизації, гармонізації та оптимізації процесів підготовки статистичних даних.     

Головною метою розроблення цих методологічних положень є забезпечення методологічної бази для запровадження в органах державної статистики України звітів щодо якості за результатами вибіркових обстежень населення (домогосподарств). Ця робота призначена сприяти забезпеченню користувачів різного рівня адекватною інформацією щодо якості результатів вибіркових обстежень, а також створенню інформаційно – аналітичної бази для дослідження напрямів подальшого розвитку цих статистичних спостережень для поліпшення їх якості.

При підготовці методологічних положень використані офіційні рекомендації Євростату з питань звітування щодо якості статистичної продукції та відповідні регламенти Офісу національної статистики Сполученого Королівства Великої Британії та Північної Ірландії.

Методологічні положення складаються з семи розділів.

У першому розділі наведені основні визначення та терміни, які застосовуються у сфері аналізу питань якості статистичної продукції, в т.ч. – у галузі вибіркових обстежень населення (домогосподарств).

У другому розділі розглядаються основні принципи вимірювання якості статистичної продукції, зміст окремих вимірів та характеристики якості, рекомендовані Євростатом, а також надано огляд особливостей  вимірювання якості результатів  вибіркових обстежень населення (домогосподарств).

         Система звітів щодо якості, розроблена згідно з рекомендаціями Євростату, а також стисла характеристика окремих типів цих звітів за призначенням та побудовою розглянута у третьому розділі.

Четвертий розділ висвітлює особливості звітування за окремими вимірами якості: надані системи характеристик якості по кожному виміру для використання у всіх вибіркових обстеженнях населення.

П'ятий розділ присвячено питанням формування першого типу звіту – “Базового звіту щодо якості”. Розглянуто призначення цього звіту, його зміст та особливості надання користувачам.  

У шостому розділі наведено рекомендації з підготовки другого типу звіту - “Підсумкового звіту щодо якості”. Надано характеристику цього звіту, наведено опис його програми з акцентом на специфіку вибіркових обстежень населення (домогосподарств).

У сьомому розділі надано стислий опис третього типу звітів – “Повного звіту щодо якості”.

Методологічні положення містять приклади складання базового та підсумкового звітів щодо якості для вибіркового обстеження умов життя домогосподарств.

Цей документ призначений для використання фахівцями органів державної статистики, користувачами, науковцями та освітянами.

Напрямок вимірювання якості статистичної продукції продовжує інтенсивно розвиватися як у міжнародних, так і в національних статистичних службах, у тому числі і в системі органів державної статистики України. У зв’язку з цим наведені методологічні положення доцільно розглядати як першу версію, яка в подальшому буде переглядатися відповідно до розвитку галузі вибіркових обстежень населення (домогосподарств) та загальних підходів до питань вимірювання якості статистичної продукції. Слід підкреслити, що не всі розглянуті в цьому документі характеристики якості можуть бути адекватно визначені на основі існуючого на сьогоднішній день в Україні методологічного та інформаційного забезпечення. Разом з тим проблемні з точки зору вимірювання характеристики якості, а також індикатори якості, розроблені Євростатом для перспективного застосування в майбутньому,  наведені у даних методологічних положеннях для забезпечення повноти загальної концепції побудови системи звітів щодо якості та з метою визначення стратегічних напрямів удосконалення моніторингу якості для більш повного задоволення потреб користувачів.

  1. ОСНОВНІ ВИЗНАЧЕННЯ ТА ТЕРМІНИ*

При здійсненні аналізу питань якості статистичної продукції вибіркових обстежень населення (домогосподарств) застосовуються такі скорочення та термінологія.

Відносна стандартна похибка (коефіцієнт варіації) дає уявлення про ступінь статистичної однорідності результатів при багаторазовому застосуванні процедур вибіркового обстеження однакового дизайну вибірки (реплікацій). Визначається як відношення величини стандартної похибки вибірки до середнього значення показника. Вимірюється у відсотках. Чим менша величина коефіцієнта варіації, тим менше результати за різними реплікаціями відрізняються один від одного, тобто дані більш надійні.

Дизайн (план) вибірки – організаційно-логічна модель структури вибіркової сукупності та принципи її формування. Якістю плану вибірки в значній мірі визначається репрезентативність вибіркової сукупності, отриманої за визначеними у плані правилами.

Дизайн-ефект  – міра відносної статистичної ефективності певного дизайну вибірки у порівнянні з простою випадковою вибіркою (відношення дисперсії вибіркових оцінок показника для реального дизайну вибірки, до дисперсії оцінки цього показника, отриманої за допомогою простого випадкового відбору).

Дисперсія вибіркових оцінок (вибіркова дисперсія) середній квадрат відхилень оцінок показника за всіма можливими вибірками даного дизайну (реплікаціями) від середнього значення оцінки за всіма вибірками.

Доступність характеризує фізичні умови, за  якими користувачі можуть отримати статистичні дані: способи та місця отримання даних, процедури замовлення, час, необхідний для виконання замовлень, політика ціноутворення, існуючі маркетингові умови (авторське право та ін.), формати, в яких дані можуть бути надані користувачам (паперові носії, електронні носії, СD-ROM, Інтернет та ін.), наявність макро- та мікроданих тощо.

Зміщення – різниця між очікуваною величиною оцінки (тобто середнім із реплікацій) та дійсним значенням показника для всієї сукупності. Особливість зміщення полягає в тому, що воно являє собою постійну складову частину похибки, яка при численній сукупності не зменшується із збільшенням обсягу вибірки, тоді як випадкова похибка вибірки із збільшенням обсягу вибірки в середньому  зменшується. До основних причин зміщення належить: процедура невипадкового відбору під час формування вибірки; залежність спрямованого відбирання від будь-якої ознаки, пов'язаного з тими властивостями одиниць, які служать об'єктом вивчення; свідоме чи ненавмисне зміщення при утворенні випадкової вибірки (тобто порушення випадкового відбору); свідома заміна (процес збору відомостей) одних одиниць іншими; неповне охоплення обстеженням отриманої вибірки; неправильне застосування способів обчислення оцінок. Визначають як різницю середнього значення оцінок у разі повторних випробувань (спостережень) і оцінюваної величини.

Надійність (точність) – ступінь близькості розрахованих оцінок показників до дійсних (точних) значень показників.

Невибіркові похибки – це похибки, пов’язані з сутністю первинної інформації (відповідей) або її навмисним викривленням по окремих ознаках (елементах) сукупності з вини інтерв’юера або респондента.

Порівнянність спрямована на вимірювання впливу відмінностей у статистичних концепціях та визначеннях, які застосовуються, на співставність статистичних даних за географічними районами, негеографічними доменами або у часі. Це ступінь, з яким розбіжності між статистичними даними пояснюються розбіжностями між дійсними значеннями статистичних характеристик. 

Похибка надохоплення - це похибка, пов’язана з неможливістю ідентифікувати одиниці, представлені в основі вибірки більше одного разу, або одиниці, які не входять до генеральної сукупності.

Похибка недоохоплення – виникає в результаті неможливості включити окремі одиниці в основу вибірки. Це веде до недопредставлення у вибірці груп або частин генеральної сукупності.

Похибки невідповідей – виникають за рахунок відмови респондента давати відповідь на окремі запитання і зумовлюють відсутність значень ознаки по окремих елементах вибіркової сукупності. Похибки невідповідей  можуть не лише збільшувати дисперсію ознаки, а й призводити до зміщення оцінок показників за рахунок відсутності у вибірці елементів генеральної сукупності  з можливо значно відмінними від середніх значень характеристиками.

Похибка вибірки – частина розбіжності між істинним значенням статистичного показника та його значенням, розрахованим за вибіркою, яка зумовлена застосуванням саме несуцільним характером спостереження.

Похибка вимірювання – різниця між розрахунковим значенням показника, що характеризує явище, і дійсним його значенням. У залежності від причини виникнення і законів зміни похибок розрізняють:

1) промахи, чи грубі похибки, – похибки, що носять суб'єктивний характер. Вони допускаються особами, що виконують вимірювання, в результаті їх недостатньої кваліфікації чи внаслідок недбалості. До промахів відносяться похибки спостереження і реєстрації. Промахи звичайно легко розпізнати: результати спостережень, що містять їх, різко відрізняються від інших значень;

2) систематичні – похибки, постійні за величиною і знаком, змінюються за деякими законами. Похибка систематична є наслідком дії постійних факторів, що діють в одному напрямку за певним законом. Вони можуть виникнути через неправильний вимірювальний інструмент. У разі виявлення факторів, що викликають систематичну похибку, і розрахунку її величини, вона може бути усунена проведенням відповідних виправлень у результатах вимірів; 

3) випадкові похибки, що є наслідком дії великої кількості чинників, ефекти дії яких настільки незначні, що їх не можна виділити і врахувати окремо. Сумарний ефект дії цих чинників є причиною відхилу результату виміру від справжнього значення показника. Випадкова похибка має імовірнісний характер і розглядається як випадкова величина. 

Похибка моделювання  характеризує частину різниці між оцінкою показника та дійсним його значенням, яка пояснюється використанням статистико-математичних моделей для розрахунку оцінок. Похибки моделювання можуть бути систематичними і випадковими.

Похибка обробки характеризує частину різниці між оцінкою показника та дійсним його значенням, яка пояснюється використанням різноманітних процедур обробки даних (введення даних, кодування, редагування, імпутація тощо). Похибки обробки можуть бути систематичними і випадковими.

Похибка реєстрації (кодування) характеризує розбіжність між зафіксованим при статистичному спостереженні значенням ознаки в одиниці спостереження і дійсним її значенням, що є результатом неправильної, помилкової реєстрації (запису) відповіді на запитання статистичної форми (анкет опитування вибіркового обстеження). Розрізняють похибки реєстрації випадкові та систематичні. Перші виникають через збіг випадкових обставин і,  як правило, при великому числі спостережень не роблять істотного впливу на результати його (через урівноваження похибок, що виникають у протилежних напрямках). Систематичні похибки – це неточності реєстрації, що виникають за певних обставин і постійно діють протягом процесу статистичного спостереження в одному напрямку (мають однакову тенденцію або до збільшення, або до зменшення значення), тому величина показника у підсумку по спостереженню буде включати накопичену похибку. 

Пунктуальність характеризує проміжок часу між запланованою та фактичною датами підготовки даних. Наприклад, запланованою датою може бути дата, відображена у затверджених планах виконання робіт, анонсована або узгоджена з користувачами тощо.

Релевантність – ступінь, з яким статистичні дані відповідають поточним та потенційним потребам користувачів. Релевантність також стосується питань повноти розробки всіх необхідних статистичних даних, а також ступеня відповідності потребам користувачів концепцій, визначень, класифікацій і т.д., що використовуються;

Своєчасність характеризує інтервал часу між моментом (періодом), у який відбувалося явище або процес, що описують статистичні дані, та датою готовності (надання) цих даних.

Стандартна похибка – середньоквадратичне відхилення вибіркових оцінок показника від значення показника для генеральної сукупності. 

Узгодженість – ступінь, з яким дані, отримані з різних джерел, можуть адекватно комбінуватись, інтегруватись та використовуватись для різних цілей. Зміст цього виміру полягає в тому, що статистичні дані, що характеризують одне й те саме явище, але отримані за результатами різних обстежень (обстежень різного типу і періодичності), можуть бути не повністю узгодженими, оскільки основані на різних методологічних підходах, класифікаціях тощо. 

Ясність характеризує інформаційне середовище даних: наявність та якість метаданих, що надаються зі статистичними даними (текстова інформація, пояснення, документація та ін..), ілюстрації (графіки, карти, схеми та ін.), наявність пояснень щодо якості даних (включаючи обмеження у використанні); ступінь додаткового супроводу даних статистичними органами.        

 

*При підготовці глосарія використано терміни, наведені у [14].  

 

2. ЗАГАЛЬНІ ПОЛОЖЕННЯ. ОСНОВНІ ПРІНЦИПИ ВИМІРЮВАННЯ ЯКОСТІ СТАТИСТИЧНОЇ ПРОДУКЦІЇ ТА НАДАННЯ ІНФОРМАЦІЇ  ЩОДО ЯКОСТІ КОРИСТУВАЧАМ

 

Забезпечення належної якості статистичної продукції визначено пріоритетним напрямом на сучасному етапі розвитку світової статистичної спільноти. В статистичних системах країн Європейського союзу Статистичною комісією ООН, Євростатом розроблені документи, що регламентують вимоги до якості статистичних даних (зокрема стосовно результатів вибіркових обстежень населення), до методів забезпечення якості, рекомендують програми та зміст звітної документації щодо якості даних для користувачів та фахівців статистики тощо [1-5]. На їх основі відповідні документи розробляються і в національних статистичних службах   [1, 7 - 12]

Протягом останніх років регулярно проводяться міжнародні конференції з питань якості статистичних даних, що виробляються як органами статистики, так і міністерствами, відомствами, банківськими установами та іншими організаціями. При цьому, як правило, проблематика якості даних офіційної статистики розглядається окремо.

На сьогодні в міжнародній практиці не існує загальноприйнятого універсального визначення цього поняття. Загалом концепція якості найчастіше характеризується як "прийнятність" або "відповідність меті" в плані потреб користувачів. Раніше в міжнародній статистичній практиці якість визначалася виключно точністю та своєчасністю даних. Такий підхід до цього поняття часто зустрічається і зараз серед більшості національних користувачів. Разом з тим некоректно вважати якісними дані, які є точними та своєчасними, але до них немає прозорого доступу, вони не відповідають необхідним концепціям або не мають опису методологічних засад, за якими вони були розроблені. Таким чином, поняття якості статистичної продукції є багатовимірним та комплексним.

Підходи до змісту поняття "якості" постійно вдосконалюються на основі досягнень статистичної методології, насамперед, у напрямах більш ефективного і адекватного використання статистичної інформації і більш повного задоволення потреб користувачів. Враховуючи, що різні користувачі мають різні потреби, надзвичайно важливим є визначення діапазону характерних ознак, які у підсумку можуть бути використані для визначення ступеню відповідності статистичних даних критеріям якості користувачів.

Виміри якості характеризуються системою показників, зміст яких суттєво залежить від галузі статистики. Здійснення оцінки окремих аспектів якості статистичних даних також має численні особливості та значною мірою залежить від призначення та способу використання статистичних даних, методів збирання та обробки інформації тощо.

2.1. Якість даних: цілі вимірювання

 Вимірювання якості статистичних даних необхідне, насамперед, для забезпечення адекватності використання цих даних внутрішніми (всередині статистичної системи) та зовнішніми користувачами. Вони потребують доступу до показників якості для свідомого розуміння як переваг, так і обмежень, які відносяться до конкретних даних, для відповідного використання останніх. 

Інші, не менш важливі, напрями застосування інформації щодо якості даних – це оптимізація процесів вироблення інформації у напрямку забезпечення максимальної їх ефективності. 

Впровадження у практичну діяльність виробників інформації, зокрема органів державної статистики, сучасних міжнародних підходів до визначення якості даних вимагає наступних актуальних акцентів у їх роботі. По-перше, передбачається, що виробники статистичних даних повинні гарантувати, що всі прийнятні вимоги користувачів щодо якості даних задоволені. По-друге, фінансове забезпечення виробництва інформації має визначатися з урахуванням необхідності забезпечення встановленого рівня якості даних. По-третє, виробники статистичних даних повинні сконцентрувати свої зусилля на впровадженні та удосконаленні найбільш ефективного методологічного та методичного забезпечення, які дозволяють отримати максимально якісні дані з найменшими витратами.

Оптимізація процесу виробництва статистичної продукції на основі результатів аналізу якості може бути проілюстрована циклом якості Деминга-Шварта: план, захід, перевірка, впровадження (рис. 1).

Рис. 1. Цикл якості Деминга-Шварта

 

У відповідності з цим підходом за результатами контролю якості етапів виробництва статистичної продукції виявляються „вузькі” місця, розробляється план усунення недоліків або поліпшення якості, розробляються та реалізуються відповідні заходи, перевіряються результати, фіксуються і впроваджуються найбільш ефективні рішення. Далі процес циклічно повторюється по мірі надходження нової інформації щодо якості, зокрема щодо виявлених недоліків, зміни потреб користувачів, розвитку методології тощо.     

Висока якість статистичних даних суттєво сприяє підвищенню авторитету статистичних систем серед користувачів різних рівнів та в суспільстві в цілому.

  2.2. Основні виміри якості, рекомендовані Євростатом

 Для офіційної статистики на сучасному етапі Євростатом рекомендовані такі основні виміри якості статистичної продукції [2 – 4]:

1) Релевантність – ступінь, за яким статистичні дані відповідають поточним та потенційним потребам користувачів. Релевантність також стосується питань повноти розробки всіх необхідних статистичних даних, а також ступеня відповідності потребам користувачів концепцій, визначень, класифікацій і т.д., які використовуються;

2) Надійність (точність) – ступінь близькості розрахованих оцінок показників до дійсних (точних) значень показників;

3) Своєчасність та пунктуальність.  Своєчасність характеризує інтервал часу між моментом (періодом), у який відбувалося явище або процес, що описують статистичні дані, та датою готовності (надання) цих даних.

Пунктуальність характеризує проміжок часу між запланованою та фактичною датами підготовки даних. Наприклад, запланованою датою може бути дата, відображена у затверджених планах виконання робіт, анонсована або узгоджена з користувачами тощо.

4) Доступність та ясність. Доступність характеризує фізичні умови, за  якими користувачі можуть отримати статистичні дані: способи та місця отримання даних, процедури замовлення, час, необхідний для виконання замовлень, політика ціноутворення, існуючі маркетингові умови (авторське право та ін.), формати, в яких дані можуть бути надані користувачам (паперові носії, електронні носії, СD-ROM, Інтернет та ін.), наявність макро- та мікроданих тощо.

Ясність характеризує інформаційне середовище даних: наявність та якість метаданих, що надаються зі статистичними даними (текстова інформація, пояснення, документація та ін..), ілюстрації (графіки, карти, схеми та ін.), наявність пояснень щодо якості даних (включаючи обмеження у використанні); ступінь додаткового супроводу даних статистичними органами.        

5) Порівнянність спрямована на вимірювання впливу відмінностей у статистичних концепціях та визначеннях, які застосовуються, на співставність статистичних даних за географічними районами, негеографічними доменами або у часі. Це ступінь, з якою розбіжності між статистичними даними пояснюються розбіжностями між дійсними значеннями статистичних характеристик. 

6) Узгодженість – ступінь, з яким дані, отримані з різних джерел, можуть адекватно комбінуватись, інтегруватись та використовуватись для різних цілей. Зміст цього виміру полягає в тому, що статистичні дані, що характеризують одне й те саме явище, але отримані за результатами різних обстежень (обстежень різного типу і періодичності), можуть бути не повністю узгодженими, оскільки основані на різних методологічних підходах, класифікаціях тощо. 

Виміри якості не є незалежними, а певним чином взаємопов’язані. Ці взаємозв’язки  мають різний вплив на забезпечення якості статистичних даних: позитивний, коли удосконалення одного виміру якості супроводжується поліпшенням інших, та, навпаки, негативний, коли удосконалення одного виміру якості  не може  здійснитися без погіршення другого. Прикладом може слугувати взаємозв’язок  між надійністю та своєчасністю, коли результати, отримані з високою надійністю, але з суттєвим запізненням, можуть бути взагалі не потрібні користувачам. Однобічне поняття якості статистичних даних як лише високої їх надійності завжди буде недостатнім. При здійсненні заходів щодо поліпшення якості статистичних показників необхідно обов'язково враховувати існуючі об'єктивні залежності та визначати пріоритети, оскільки, наприклад, не завжди скорочення термінів обробки можливе одночасно з підвищенням  надійності показників.   Виміри якості, таким чином, створюють систему, що вимагає відповідного системного підходу до визначення показників для їх характеристики.

Рекомендації Євростату щодо підготовки для користувачів інформації з якості даних саме і передбачають розробку та впровадження системи показників для характеристики кожного з наведених вимірів якості, а також опрацювання методології вимірювання цих показників для застосування у всіх галузях статистики.

2.3. Уніфікована система показників щодо якості статистичної продукції

У сучасних міжнародних дослідженнях проблем якості різними групами аналітиків рекомендується загалом біля 150 характеристик та показників, що можуть бути використані для оцінки якості статистичних даних.

У даний час Євростат здійснює розробку уніфікованої системи показників якості по усіх її вимірах, яка призначена, головним чином, для виробників статистичної продукції Європейського Союзу і забезпечує можливість порівняння якості статистичних продуктів різних галузей статистики та моніторингу її зміни у часі. Ці показники розроблені за умови їх максимальної інформативності стосовно конкретного виміру якості, тому зазначена система включає обмежену кількість показників. Система стандартних показників якості, рекомендована Євростатом у 2005 році [2, 6], наведена у табл. 1. Показники якості рекомендовано розрізняти за типом: основні показники (у табл. 1 позначені “1”), допоміжні показники (“2”) та експериментальні показники (показники для можливого майбутнього застосування – “3”).

 

Таблиця 1

Стандартні показники якості статистичної продукції, рекомендовані Євростатом для відображення у звітах щодо якості для будь-яких статистичних спостережень 

Показник

Тип (1 – основний; 2- допоміжний; 3 – експериментальний)

Вимір якості

1

2

3

4

1

R1. Індекс задоволеності користувачів

R2. Частка доступних результатів статистичних спостережень

3

1

Релевантність

2

A1. Коефіцієнт варіації

A2. Рівень участі респондентів в обстеженні (зважений та незважений)

A3. Рівень відповідей респондентів по основних показниках (зважений та незважений)

A4. Рівень імпутації

A5. Рівень надохоплення та помилкової класифікації

A6. Рівень географічного недоохоплення

A7. Середня величина уточнення даних (середня з абсолютних розмірів змін показників за попередніми та остаточними даними)

1

2

2

2

2

1

1

Надійність (точність)

3

T1. Пунктуальність графіку публікації

T2. Проміжок часу між закінченням звітного періоду та датою отримання перших результатів

T3. Проміжок часу між закінченням звітного періоду та датою отримання кінцевих результатів

1

1

1

Своєчасність та пунктуальність

4

AC1. Кількість поширених та/або проданих публікацій

AC2. Кількість відвідувань баз даних

AC3. Рівень повноти метаданих для опублікованих результатів

1

1

3

Доступність та ясність

5

C1. Довжина зіставних часових рядів

C2. Кількість зіставних часових рядів

C3. Рівень відмінностей концепцій та методів від європейських норм

C4. Асиметрія для показників дзеркальної статистики

1

1

3

1

Порівнянність

6

CH1. Частка показників, що задовольняють вимогам для їх використання в якості джерел для інших статистичних продуктів   

3

Узгодженість

 

Основні показники якості безпосередньо характеризують той чи інший її вимір. Наприклад, коефіцієнт варіації (відношення величини стандартної похибки вибіркових оцінок до середнього значення показника) є прямим індикатором виміру „Надійність”, а пунктуальність графіка публікації (часовий лаг між запланованою та фактичною датами надання результатів користувачам) - виміру „Своєчасність та пунктуальність”.  

Допоміжні показники якості характеризують якість опосередковано, непрямо. Наприклад, безпосередньо визначити величину зміщення оцінок показників, зумовленого відмовами респондентів від обстеження, на практиці майже неможливо, оскільки це потребує значних витрат ресурсів на спеціальні дослідження. Разом з тим величина рівня участі респондентів в обстеженні (або рівня відмов від обстеження) є прийнятним показником, що надає уявлення щодо можливої величини такого зміщення.     

Зазначені у табл. 1 показники якості рекомендується розраховувати один раз на рік або частіше (щоквартально, щомісячно), якщо це можливо. Окремі з наведених вище показників не можуть бути розраховані для всіх статистичних продуктів без виключення. Для кожної галузі статистики застосовується своя система основних показників якості.    

Слід відмітити, що перелік стандартних показників якості, рекомендованих Євростатом, може бути доповнений іншими характеристиками та показниками, визначеними з досвіду роботи з користувачами та виходячи з внутрішніх потреб національної статистичної системи.

2.4. Особливості вимірювання якості результатів вибіркових обстежень населення (домогосподарств)

Визначення якості результатів вибіркових обстежень населення, що враховує основні її виміри, доцільно сформулювати наступним чином. Якісні результати вибіркових обстежень населення (домогосподарств) – це отримані у встановлені строки надійні дані щодо характеристик генеральної сукупності, які з максимальною повнотою відповідають потребам користувачів, узгоджені з наявними якісними даними з інших джерел і доступні для використання.

Для забезпечення комплексного характеру досліджень питань якості результатів вибіркових обстежень поряд з показниками якості, що будуються як кількісні величини, доцільно наводити також якісні характеристики. У цих рекомендаціях вони позначаються терміном “характеристики якості”.   

Державні вибіркові обстеження населення (домогосподарств), як і будь–які інші вибіркові спостереження, мають чітко визначену послідовність етапів (див. рис. 2), кожен з яких впливає на якість кінцевих результатів. Це зумовлює необхідність забезпечення потенційних можливостей для аналізу впливу як кожного етапу окремо, так і всіх етапів у комплексі для забезпечення оптимальності всього процесу вибіркового обстеження.

 

Рис. 2. Узагальнена схема процесу вибіркового обстеження населення

    

Таким чином, для поглибленого аналізу питань якості результатів вибіркових обстежень та більш повного розуміння її складових важливо ідентифікувати основні показники, характеристики якості та джерела похибок у розрізі основних етапів проведення таких несуцільних спостережень.

Дослідження питань якості результатів вибіркових обстежень населення (домогосподарств) порівняно з іншими галузями статистики має суттєві особливості, пов'язані як з несуцільним характером таких спостережень, так і з різноманітними проблемними аспектами опитування населення, можливим вагомим суб'єктивним фактором впливу (як з боку респондентів, так і працівників, що проводять опитування), а також зі складністю обробки даних, яка передбачає багатоетапність та застосування різних методів для оцінювання показників, у т.ч. – на основі різних зовнішніх джерел по відношенню до конкретного обстеження даних.  

 3. ТИПИ ЗВІТІВ ЩОДО ЯКОСТІ СТАТИСТИЧНОЇ ПРОДУКЦІЇ: ПРИЗНАЧЕННЯ ТА ОСНОВНІ ПРИНЦИПИ ПОБУДОВИ 

У процесі досліджень питань якості статистичних даних, зокрема результатів вибіркових обстежень населення (домогосподарств), визначальним моментом є належне інформування користувачів щодо основних характеристик якості інформації. Звітування щодо якості Євростат визначає як підготовку та поширення на регулярній або нерегулярній основі спеціальних звітів, які містять інформацію щодо якості організації обстежень та їх результатів.

Звітування щодо якості не тільки забезпечує ефективне використання користувачами статистичних даних, а й сприяє поліпшенню взаємних відносин між користувачами та виробниками даних, дозволяє користувачам більш точно визначати свої потреби. З іншого боку, звіти щодо якості дозволяють статистичним службам здійснювати системний аналіз якості даних та сприяють подальшому удосконаленню методологічного та методичного забезпечення, в т.ч. у галузі вибіркових обстежень населення (домогосподарств).   

Стандартизація звітів щодо якості статистичної продукції в національних статистичних системах країн європейської спільноти розпочалася відповідно до рекомендацій Євростату, що були прийняті у 2002 році  за результатами шостого засідання робочої групи Євростату з оцінки якості статистики у  Люксембурзі [2 - 4]). У травні 2005 року за результатами сьомого засідання робочої групи Євростату з оцінки якості статистики у Люксембурзі рекомендації щодо основних показників та характеристик якості були оновлені [5].

Згідно з вищезазначеними рекомендаціями Євростату виділяють такі напрями звітування щодо якості статистичної продукції [2]:

1. Звіт для внутрішніх користувачів, у якому подається деталізована інформація щодо якості в обсязі, необхідному для ефективного використання результатів обстежень усередині статистичної установи. Цей звіт призначений для фахівців, які використовують результати обстежень для виробництва іншої статистичної продукції.   

2.  Звіт для зовнішніх користувачів, у якому подається основна, найбільш вагома інформація щодо якості, яка необхідна для адекватного використання результатів обстежень зовнішніми користувачами. Цей звіт призначений для широкого кола користувачів, які можуть мати лише базові знання зі статистики чи математики або бути фахівцями (зокрема науковцями) в окремих галузях статистики.

3. Повний звіт щодо якості, у якому інформація щодо якості подається у найбільш розгорнутому, деталізованому та повному вигляді. Цей звіт призначений для внутрішнього використання керівництвом статистичної установи та фахівцями найвищого рівня, експертами, консультантами, які відповідають за якість статистичної продукції або мають відношення до планування та проведення вибіркових обстежень. Повний звіт щодо якості містить максимально деталізовану систему показників та характеристик якості, а також відповідні аналітичні матеріали. У цьому звіті має наводитися опис процедур вимірювання показників та характеристик якості. Повний звіт розробляється за результатами певного циклу обстежень, наприклад, для щорічних вибіркових обстежень - один раз у 3–5 років. Цей звіт призначений у першу чергу допомагати удосконалювати методологічні основи обстежень, обґрунтовано планувати та впроваджувати зміни в організації та технології їх проведення. 

Зміст кожного звіту має містити показники та характеристики основних вимірів якості, але з різним ступенем деталізації.

Національні статистичні служби на основі зазначених рекомендацій розробляють свої системи звітів з якості. Наприклад, враховуючи диференціацію зовнішніх користувачів за рівнем потреб щодо інформації з якості, в Офісі Національної Статистики Великої Британії (ОНС) встановлені два основні типи регулярних звітів щодо якості для зовнішніх користувачів [7 - 12]:

• базова інформація щодо якості – стисла інформація щодо якості, яка супроводжує усі публікації результатів статистичних спостережень;

• підсумковий звіт щодо якості – більш детальна інформація щодо якості, яка містить також опис питань методологічного характеру. Цей звіт публікується окремо від результатів обстеження, а також розміщується на Інтернет-сторінці. 

Крім того, в ОНС передбачається періодична (один раз на декілька років) підготовка повних звітів щодо якості для менеджерів вищого рівня, з можливістю надання певним користувачам доступу до окремих розділів цих звітів.

За результатами опрацювання документів Євростату з питань звітування щодо якості статистичної продукції та з урахуванням міжнародного досвіду розробки систем звітів щодо якості в національних статистичних системах інших країн, для використання в органах державної статистики України розроблена  наступна система звітів щодо якості результатів вибіркових обстежень населення (домогосподарств) та принципів їх побудови:

• Базовий звіт щодо якості.

Базовий звіт щодо якості – це динамічна (поточна) інформація щодо основних характеристик якості результатів вибіркового обстеження, яка оновлюється для кожної публікації результатів і публікується (поширюється) разом з нею. Обсяг базової інформації, як правило, не має перевищувати однієї - двох сторінок. Базовий звіт щодо якості має уніфікований стандартний формат та зміст як для зовнішніх, так і для внутрішніх користувачів. Цей звіт може містити посилання на основні джерела більш детальної інформації щодо якості результатів обстеження (сторінки Інтернету, де розміщено підсумковий звіт щодо якості, методологічні  та методичні документи з питань обстеження та ін.).

 • Підсумковий звіт щодо якості.

 Підсумковий звіт щодо якості – більш детальна інформація щодо якості, яка містить опис змін методів, що застосовуються у вибірковому обстеженні, або методів вимірювання якості. Обсяг такого звіту має складати близько 5–15 сторінок. Цей звіт публікується окремо від результатів обстеження, а також розміщується на Інтернет-сторінці. Підсумковий звіт щодо якості може готуватися у двох форматах: в уніфікованому стандартному форматі для зовнішніх та внутрішніх користувачів, а також за запитами окремих користувачів (зовнішніх або внутрішніх) - у розширеному за окремими вимірами якості форматі. Оскільки вибіркові обстеження населення (домогосподарств), які проводять органи державної статистики України, мають річні цикли для аналізу даних, і протягом цього часу методологія обстеження не змінюється, доцільно підсумкові звіти щодо якості готувати в уніфікованому форматі з щорічною періодичністю.  

 • Повний звіт щодо якості.

Зміст повного звіту щодо якості відповідає рекомендаціям Євростату. Цей звіт має уніфікований стандартний формат та зміст як для зовнішніх, так і для внутрішніх користувачів. Цей звіт орієнтований на внутрішніх користувачів та зовнішніх користувачів, які мають відношення до питань стратегічного планування  та поглиблених досліджень якості результатів вибіркових обстежень. Для задоволення потреб інших категорій зовнішніх користувачів їм можуть бути надані окремі розділи (їх частини) повного звіту щодо якості шляхом вибору найбільш придатних вимірів та характеристик якості в залежності від обстеження, рівня користувачів та їх потреб. 

 Звіти щодо якості в цілому будуються за такою стандартною програмою:

1. Загальна частина (включає визначення поняття якості результатів вибіркових обстежень населення (домогосподарств), необхідність врахування  користувачами інформації щодо якості для ефективного використання результатів).

2. Основні виміри якості та їх характеристики.

2.1. Релевантність.

2.2. Надійність.

2.3. Своєчасність та пунктуальність.

2.4. Доступність та ясність.

2.5. Порівнянність.

2.6. Узгодженість.

3. Висновки (наводяться основні тези щодо загальної характеристики та тенденцій щодо якості результатів обстеження).

При підготовці програми звіту щодо якості результатів конкретного вибіркового обстеження населення (домогосподарств) по кожному з вимірів наводяться показники та характеристики якості та їх зміст, значення для основних результатів, за необхідністю у підсумковому та обов'язково у повному звіті – алгоритми розрахунків показників якості, методологічні коментарі та зауваження. Залежно від типу конкретних звітів окремі виміри якості можуть бути відсутні.

При розгляді питання періодичності підготовки звітів щодо якості було враховано, що можливість їх підготовки передбачає проведення певного циклу вибіркових обстежень. Наприклад, найбільш стислі базові звіти, що містять лише необхідну інформацію у дуже лаконічній формі, готуються за результатами кожного обстеження і надаються одночасно з результатами обстеження (щомісячно, щоквартально, щорічно). Більші за обсягом та змістом підсумкові звіти можуть бути підготовлені лише на основі результатів декількох обстежень (наприклад, щорічно для щомісячних та щоквартальних обстежень). Повні звіти готуються з використанням масивів даних за певний період проведення вибіркових обстежень, у т.ч. – на основі результатів спеціально проведених досліджень з питань якості окремих етапів обстеження, опитувань користувачів тощо. У зв'язку з цим підготовка кінцевих варіантів таких звітів можлива за період 3-5 років проведення обстеження, хоча окремі їх розділи мають починати формуватись безпосередньо після початку обстеження. Ці звіти готуються (або актуалізуються) відповідно до найбільшого циклу проведення обстеження за встановленою методологією (періоду між змінами методології обстеження, дизайну вибірки, зокрема, територіальної, суттєвих змін методології обробки даних та ін.).

На рівні регіонів звіти щодо якості результатів конкретного вибіркового обстеження населення (домогосподарств) можуть готуватися за скороченою програмою кожного з типів звітів, з використанням основних характеристик вимірів якості по регіону (за відсутності інформації - по країні в цілому) та містити посилання на відповідні звіти щодо якості національного рівня.

 4. ОСНОВНІ ПОКАЗНИКИ ТА ХАРАКТЕРИСТИКИ ВИМІРІВ ЯКОСТІ 

Комплексний підхід до підготовки інформації щодо якості даних для представлення у відповідних звітах передбачає розробку системи показників та характеристик якості по кожному її виміру для використання у всіх вибіркових обстеженнях населення і, потенційно, у всіх галузях державної статистики, а також – визначення методології вимірювання цих показників, опрацювання, затвердження та впровадження в практичну діяльність необхідних методичних та нормативних документів.

Інформація щодо якості дозволяє користувачам статистичних даних визначати як переваги, так і обмеження щодо їх використання.

Нижче наведені основні показники та характеристики вимірів якості, які потенційно можуть наводитися у звітах щодо якості результатів вибіркових обстежень населення (домогосподарств).

4.1. Релевантність

Релевантність – це ступінь, з яким статистичні дані відповідають поточним та потенційним потребам користувачів. Релевантність також стосується питань повноти розробки всіх необхідних статистичних даних, а також ступеня відповідності потребам користувачів концепцій, визначень, класифікацій і т.д., які використовуються.

Статистична інформація є релевантною, якщо вона відповідає потребам користувачів. У зв'язку з цим у даному розділі звітів щодо якості наводяться матеріали, що характеризують основних користувачів конкретного вибіркового обстеження, а також відповідність даних їх потребам. Надаються коментарі щодо використання узгоджених на національному та/або міжнародному рівнях визначень, стандартів, методології тощо.

Характеристики релевантності важко однозначно відокремити від характеристик по деяких інших вимірах якості. При звітуванні з питань релевантності, насамперед, слід надавати інформацію щодо корисності результатів обстеження для користувачів та ступеню використання результатів ними. Важливим аспектом релевантності є ступінь відповідності показників, що вимірюються за результатами обстеження, цільовим показникам, що планувалось оцінити при організації вибіркового обстеження.

Звітування щодо релевантності дозволяє отримати уявлення про ступінь відхилення інформації, що виробляється органами статистики за результатами вибіркових обстежень населення, від потреб користувачів. Зазначене відхилення може бути зумовлено як динамічністю соціальних процесів, так і певними об'єктивними обставинами, зокрема співвідношенням результатів та необхідних витрат. Оцінювання рівня відповідності результатів обстежень потребам користувачів та ступеня задоволення потреб користувачів може здійснюватись за допомогою різних засобів. Одним з найкращих підходів є проведення відповідних опитувань користувачів. Серед інших методів можуть застосовуватися непрямі оцінки, тобто суміжні показники, які опосередковано характеризують задоволеність користувачів (обсяги продажу публікацій, кількість отриманих від користувачів запитів на надання інформації, питань, скарг і т.д.). 

У звітах можуть бути наведені такі показники та характеристики релевантності:

- опис мети вибіркового обстеження, класифікація та опис користувачів;

- опис потреб основних користувачів (за групами користувачів), протиріч між потребами окремих користувачів та опис встановлених пріоритетів;

- результати аналізу відхилень у концепціях та визначеннях, які використовуються користувачами;

- посилання на документи, де міститься інформація з більш детальним описом потреб користувачів, якщо такі матеріали є;

- характеристика відповідності результатів вибіркового обстеження потребам основних користувачів;

- характеристики ступеня задоволеності користувачів, насамперед, за основними групами користувачів, головні причини неповного задоволення потреб користувачів;

- кількісна характеристика недоступних для користувачів результатів вибіркового обстеження у порівнянні з запланованим (потрібним) обсягом доступної інформації;

- опис причин недоступності потрібної інформації та перспектив вирішення даної проблеми;

- опис проведених заходів із забезпечення релевантності;

- опис результатів оцінки задоволеності користувачів, а також планів та заходів, що будуть здійснені для поліпшення задоволеності їх потреб; 

- кількісна характеристика обсягів поширених матеріалів або звернень користувачів до публікацій, підготовлених за результатами вибіркового обстеження в електронній та паперовій формах; 

- кількість звернень до відповідних Web - сторінок, де розміщені матеріали вибіркового обстеження, та завантажень доступних масивів даних обстеження.

Для характеристики релевантності Євростатом розробляються та впроваджуються такі стандартні показники якості статистичної продукції (табл. 1):

-  індекс задоволеності користувачів (R1). Цей показник пропонується визначати щорічно. Оскільки користувачі на національному рівні не співпадають з користувачами на міжнародному, зокрема, європейському рівні, пропонується визначати індекси задоволеності в розрізі окремих груп користувачів. У майбутньому Євростат планує започаткувати обстеження задоволеності користувачів на європейському рівні. Для усіх рівнів перед розрахунком цих показників необхідно здійснити такі підготовчі кроки: розробити класифікацію користувачів вибіркового обстеження шляхом їх об'єднання в невелику кількість груп (доцільно виділити біля  5 основних груп);  здійснити ранжування груп користувачів відповідно до їх важливості; здійснити систематизацію та аналіз методів, що використовуються для вимірювання ступеня задоволеності користувачів за їх групами для опису процедур оцінювання у відповідних звітах щодо якості. З метою оцінювання задоволеності користувачів рекомендується проводити їх опитування на щорічній основі, з використанням ротації, за якої кожен рік обстежуватимуться різні групи користувачів.

Кількісне значення індекса задоволеності для певної групи користувачів визначається як інтегральний показник на основі оцінок користувачами основних аспектів якості результатів вибіркового обстеження (з використанням певної шкали, наприклад, від 1 до 100 для кожної з оцінок та, відповідно, і для індексу задоволеності), зважених за ступенем важливості кожного з аспектів. За таких умов індекс задоволеності може бути розрахований за формулою:

 

,                                          (4.1)

 

де  - оцінка -го аспекта якості, ;
 - нормоване вагове значення  для -го коефіцієнта,   .

- частка доступних результатів вибіркового обстеження (R2). Цей показник визначає співвідношення кількості наданих користувачам показників, розрахованих за результатами конкретного обстеження, до кількості показників, що необхідно було надати. Одночасно у звітах вказуються причини, що не дозволили опублікувати (надати) всі потрібні користувачам результати.

Нижче наведені деякі приклади практичної реалізації у звітах щодо якості окремих з наведених вище характеристик релевантності.

         Приклад формулювання мети обстеження.

 

 

Приклад короткого опису основних користувачів (2-3 за значимістю).

 

 

Приклад детальної класифікації користувачів (табл. 2).

 

 

Приклад надання характеристики щодо обсягів поширення результатів обстеження серед користувачів.

 

 4.2. Надійність

Надійність (точність) – ступінь близькості розрахованих оцінок показників до дійсних (точних) значень показників.

З точки зору статистичної методології оцінка певного показника за результатами вибіркового обстеження є надійною, якщо вибіркові оцінки, побудовані на базі всіх можливих вибірок однакового дизайну та обсягу, сконцентровані біля дійсного значення показника. Висока їх концентрація, тобто надійність, бажана тому, що в окремому процесі побудови вибірки та розрахунку оцінки показника існує лише деяка імовірність наблизитись до його дійсного значення. 

Достовірна надійність оцінювання будь-якого показника за даними вибіркового обстеження, не може бути визначена абсолютно точно, оскільки на практиці процедура відбору реалізується лише один раз, і дійсні значення показників невідомі. Таким чином, при обробці даних вибіркових обстежень надійність лише оцінюється.

У табл. 3 наведено класифікацію основних факторів, що впливають на надійність даних вибіркових обстежень. Надійність визначається двома групами похибок – похибками вибірки та невибірковими похибками.

Проблема забезпечення надійності даних пов’язана не лише з необхідністю отримання адекватної інформації за результатами вибіркового обстеження. Не менш важливими є такі аспекти, як виправданість, оптимальність витрат фінансових ресурсів на проведення обстеження.

 

Таблиця 3

Класифікація похибок, що визначають рівень надійності оцінювання показників за результатами вибіркових обстежень населення

Типи похибок

Опис похибки

Головні наслідки при оцінюванні показників

Похибки вибірки

Дисперсія вибіркових оцінок

Випадкова похибка

Невибіркові

Охоплення

Пропуски у переліках територіальних одиниць

Систематична похибка

Невірні межі територіальних одиниць

Застаріла основа вибірки домогосподарств

Помилки при відборі територіальних одиниць та домогосподарств

Вимірювання

Похибки в інструментарії (анкетах, запитальниках) обстеження

Низька якість результатів у цілому

Похибки у підготовці персоналу, який залучений до розробки програм обстеження та обробки результатів

Похибки у навчанні  персоналу, який проводять опитування домогосподарств

Систематична похибка

Похибки у графіках роботи працівників, які проводять опитування домогосподарств

Зміщення відповідей респондентів

Проста дисперсія відповідей респондентів

Випадкова похибка

Корельована  дисперсія відповідей респондентів

Систематична та випадкова похибки

Обробки

Похибки кодування

Систематична та випадкова похибки

Похибки редагування

Похибки введення даних в ПЕОМ

Похибки програмування

Пов’язані з відсутністю відповідей

Відмови респондентів від інтерв’ю

Недосяжні респонденти

Відсутні вдома респонденти

Систематична та випадкова похибки

Моделювання

Похибки моделювання при оцінюванні показників на основі статистико - математичних моделей

Систематична та випадкова похибки

      

         Похибки вибірки

Головним джерелом похибок вибірки є специфіка вибіркових обстежень, яка полягає в обстеженні лише спеціально відібраної частини генеральної сукупності, тобто власне дизайн вибірки. Основними показниками похибок вибірки при оцінюванні показників за результатами вибіркових обстежень населення є дисперсія вибіркових оцінок, стандартна похибка, коефіцієнт варіації та гранична похибка.

Оцінку дисперсії, отриману за різними можливими вибірками певного дизайну, називають дисперсією вибіркових оцінок, або вибірковою дисперсією.

Дисперсія вибіркових оцінок визначається за формулою:

 

,                                 (4.2)

 де  – оцінка показника по вибірці , ;  – середнє значення вибіркових оцінок показника,  (символ  визначається як середнє значення показника для сукупності); H – кількість вибірок.

Похибка вибірки розраховується як стандартна похибка SE на підставі величини оцінки дисперсії значень показника за формулою:

.                                        (4.3)

 Для вибірок зі складним дизайном величина  може бути розрахована на основі класичної формули для оцінки дисперсії ознаки y при простому випадковому відборі :

,                                     (4.4)

де  – дисперсія ознаки по одиницях вибірки;  – обсяг вибірки; deff – дизайн-ефект.

Коефіцієнт варіації  (або відносна стандартна похибка вибірки ) розраховується за формулою:

 %.                                       (4.5)

Величина коефіцієнту варіації часто використовується як показник придатності даних для аналізу. Так, наприклад, якщо £ 5%, то оцінка вважається точною, якщо 5%<£10% – оцінка є придатною для кількісного аналізу, але її точність недостатньо висока, якщо 10%££ 25% – оцінка придатна лише для якісного аналізу і її слід використовувати обережно. Наведені граничні значення величини коефіцієнту варіації в цілому відповідають міжнародним вимогам, але ці рівні не мають "обов'язкового" характеру, оскільки в інших країнах іноді публікують дані, для яких  досягає 30 % і навіть 40 %.

Гранична похибка вибірки  розраховується на підставі стандартної похибки вибірки за формулою (для 0,95 довірчої ймовірності):

 

                                         (4.6)

Гранична похибка вибірки використовується для побудови довірчих границь оцінок (границь довірчих інтервалів). Наприклад, для побудови нижньої  та верхньої  довірчих границь інтервальної оцінки середнього значення використовуються формули:

 

= - LSE;     =+ LSE.                      (4.7)

Різниця між середнім значенням вибіркових оцінок показника  та дійсним значенням  визначається зміщенням та позначається як :

 .                                      (4.8)

За наявністю зміщення для визначення статистичної надійності оцінки показника використовується середньоквадратична похибка , що визначається формулою:

.                           (4.9)

 

Таким чином, середньоквадратична похибка складається з дисперсії вибіркових оцінок та квадрату зміщення. Для визначення дисперсій, стандартних похибок та величини дизайн-ефекту для вибірок зі складним дизайном використовуються спеціалізовані методи розрахунків.

У звітах щодо якості можуть наводитись наступні показники та характеристики похибок вибірки:        

- інформація про використання незміщених або зміщених оцінок; величини зміщення вибіркових оцінок для основних показників;

- величини  (або  у випадку застосування зміщених оціночних функцій) для оцінювання основних показників;

- коментарі щодо рівня (інтервалів) величини  для оцінок показників, що не віднесені до основних;

- посилання на документи та/або масиви даних з детальною інформацією щодо величин ;

- величини стандартних похибок, дизайн-ефектів та довірчих інтервалів для основних показників;

- стислий опис дизайну вибірки, застосованих методів відбору та контрольних процедур на кожному етапі формування вибірки;

         У залежності від типу звіту щодо якості обсяги та детальність інформації по зазначених показниках та характеристиках можуть суттєво розрізнюватись. Прикладом надання користувачам відповідної інформації різного ступеня деталізації є відповідні методологічні пояснення, наведені у статистичних бюлетенях за результатами державних вибіркових обстежень [17 - 19] та в Методиці розрахунку характеристик надійності оцінювання показників за результатами вибіркового обстеження населення (домогосподарств) з питань економічної активності [20].

- стислий опис методології процедур оцінювання показників, оцінки дисперсії вибіркових оцінок, відповідних характеристик надійності та контролю цих робіт;

 В якості прикладу такого опису з певним ступенем наближення можуть бути прийняті загальні положення методики [20].           

- стислий опис програмного забезпечення та основних його функціональних можливостей, що використовуються для розрахунку характеристик надійності результатів вибіркових обстежень; 

Прикладом такого опису може бути матеріал наведений у [20]:

        

 

У звітах щодо якості, крім зазначеної інформації, доцільно додавати "некількісні" характеристики, такі як попередження користувачів, що при використанні оцінок показників необхідно враховувати похибки вибірки тощо.

Для характеристики  надійності в частині похибок вибірки Євростатом розробляється та впроваджується відповідний стандартний показник якості статистичної продукції (табл.1):

- Коефіцієнт варіації (А1). Цей показник пропонується визначати як на поточній основі (щомісячно, щоквартально), так і щорічно.

Необхідно зазначити, що для зручності використання оцінки показників за значенням коефіцієнта варіації (за рівнем надійності) доцільно розподіляти на категорії. Наприклад, виділити п’ять категорій: якщо коефіцієнт варіації вибіркових оцінок показника приймає значення до 5%, то показник відноситься до групи “А”, тобто до групи показників з високим рівнем надійності, 6–10%  – до групи “Б”  з достатнім рівнем надійності, 11 – 15% - до групи “В” з задовільним рівнем надійності, 16 - 25% - до групи  “Г”  з низьким рівнем надійності (дані придатні лише для якісного аналізу), більше 25% - до групи “Д” з незадовільним рівнем надійності.

Приклади надання інформації щодо величин коефіцієнтів варіації для обстеження економічної активності населення та сільськогосподарської діяльності населення в сільській місцевості наведені у додатку А (див. також [18, 19]), для ОУЖД – у додатку Б (див. також [20])

Невибіркові похибки

Основними джерелами невибіркових похибок є неповне охоплення генеральної сукупності, відмови респондентів від обстеження або від відповіді на окремі запитання, похибки вимірювання, похибки обробки даних обстеження, похибка моделей при оцінюванні показників тощо.

Похибки охоплення

Похибки охоплення виникають при порушенні ймовірнісності вибірки, коли генеральна сукупність неповністю або некоректно представлена в основі вибірки. Похибки охоплення виникають за таких умов:

- окремі одиниці генеральної сукупності відсутні в основі вибірки (відсутні одиниці не мають жодного шансу бути обраними у будь-яку вибірку - недоохоплення);

- окремі одиниці в основі вибірки не відповідають ознакам формування генеральної сукупності (результатом цього є надохоплення, якщо такі одиниці не можуть бути ідентифіковані та вилучені після відбору);

- деякі одиниці генеральної сукупності з’являються більш ніж один раз в основі вибірки («дуплікація», дублювання).

У багатоступеневій вибірці похибки охоплення можуть виникнути на будь-якому ступені.

Так, за міжнародною практикою, список територіальних одиниць в основі вибірки, як правило, повний. Однак суттєва похибка охоплення може виникнути при визначенні меж територіальних одиниць.

Крім того, списки адрес у цілому змінюються більш динамічно, ніж списки територіальних одиниць, а списки домогосподарств, що проживають за певними адресами, більш динамічно, ніж списки адрес, помешкань чи інших одиниць.

Найбільш серйозна проблема із списками, які використовуються в основі вибірки, стосується недоохоплення. Надохоплення також може траплятися, хоча й не так часто, як недоохоплення. Надохоплення виникає, якщо:

а) деякі одиниці зустрічаються у списку більше одного разу (дублювання записів у списках одиниць);

б) одиниці, не охоплені обстеженням, включаються, але не ідентифікуються як такі, і вилучаються під час обробки результатів обстеження;

в) включаються одиниці за межами вибірки.

Дублювання може бути проблемою, коли та ж сама одиниця може з’являтися під різними назвами чи за іншими ідентифікаторами.

У звітах щодо якості можуть наводитися такі показники та характеристики похибок охоплення:

- опис ступеня охоплення (територія, населення), тип і величина виявлених похибок охоплення (похибки надохоплення та недоохоплення, в т.ч. – географічного);

- зазначення похибок охоплення, що були враховані при оцінюванні показників, характеристик надійності та методів, які для цього використовувались;

- короткий опис впливу на результати обстеження неврахованих похибок охоплення;

- опис основних заходів, застосованих для виявлення похибок охоплення;

- опис методології побудови основи вибірки, включаючи джерела інформації, строки створення та строки останньої актуалізації;

- опис похибок, виявлених в основі вибірки.

Крім указаних характеристик, іноді доцільно наводити (або послатися на відповідний розділ звіту щодо якості) також опис генеральної та досліджуваної сукупності, результати їх порівняння в цілому (на національному рівні) і на рівні значних підсукупностей (наприклад, на рівні регіонів).

         Слід зазначити, що похибки охоплення головним чином визначаються якістю підготовки та актуальністю основи вибірки.

         Для характеристики надійності в частині невибіркових похибок охоплення Євростатом розробляються та впроваджуються такі  стандартні показники якості статистичної продукції (табл.1):

- рівень надохоплення та помилкової класифікації (А5). Рекомендується розраховувати показник рівня помилкових включень одиниць, як кількість одиниць, помилково включених до основи вибірки, віднесену до загальної кількості одиниць в основі вибірки, а також показник рівня помилкової класифікації одиниць в основі вибірки, як відношення кількості помилково класифікованих (але придатних для обстеження) одиниць до загальної кількості одиниць в основі вибірки, що підлягають обстеженню. Ці показники пропонується визначати на поточній основі (щомісячно, щоквартально, щорічно) у відповідності з процедурами актуалізації та використання основ вибірки;

- рівень географічного недоохоплення (А6). Визначається Євростатом для європейського рівня як частка зваженої оцінки цільової сукупності неохоплених країн (регіонів) у зваженій оцінці цільової сукупності усіх країн (регіонів).  Цей показник визначається Євростатом головним чином на поточній основі (щомісячно, щоквартально), коли дані по окремих країнах (регіонах) надходять із запізненням або дані по них виявляються непридатними для аналізу. 

 Похибки вимірювання

Похибки вимірювання виникають на етапі збору інформації від респондентів і призводять до того, що зафіксовані значення ознак відрізняються від дійсних значень.

         Основні джерела виникнення похибок вимірювання такі:

- інструментарій обстеження. Персоналом, який залучений до розробки програм обстеження, можуть бути допущені похибки при розробці інструментарію обстеження: помилки в анкетах, окремих формах, запитальниках, у формулюванні окремих запитань. Крім того, помилки у засобах, що використовуються при зборі інформації, можуть призводити до хибних записів або неузгодженостей у відповідях респондентів;

- респонденти. З різних причин респонденти можуть надавати хибні відповіді (ефекти забування, втрати уваги в ході інтерв’ю, акумуляції (схильність опитаних зазначати цифри, кратні 5 або 10) та округлення цифр, заниження (приховування) доходів, ефекти впливу статі, віку, освіти  і т.д.);

- працівники, які проводять опитування респондентів (фахівці з інтерв’ювання). Ці працівники можуть свідомо чи несвідомо впливати на відповіді респондентів. Факторами впливу можуть бути вік, стать фахівця з інтерв’ювання, його рівень освіти та особливості усвідомлення ним програми обстеження чи окремих запитань, певне коригування ним порядку запитань у ході опитування, застосування різних специфічних або незрозумілих для респондентів слів у ході роз'яснень.

         Для зменшення величини похибок вимірювання застосовуються спеціальні процедури при розробці дизайну анкети та при навчанні фахівців з інтерв’ювання.

         Похибки вимірювання звичайно важко оцінити за результатами окремого обстеження без спеціальних додаткових процедур – застосування різних варіантів інструментарію при пробних (пілотних) обстеженнях, проведення додаткових (дублюючих) обстежень різними фахівцями з інтерв’ювання на різних вибірках домогосподарств, отримання окремих характеристик респондентів, наприклад статево-вікової структури населення, з додаткових джерел тощо. 

         У звітах щодо якості доцільно наводити такі показники та характеристики похибок вимірювання:

- опис технології збору даних, інструментарію обстеження, методичних та інструктивних матеріалів для персоналу, який розробляє програму обстеження та проводить опитування респондентів;

- опис основних ідентифікованих похибок вимірювання, визначення ступеня їх впливу на оцінки основних показників;

-  оцінка обсягу редагування значень основних ознак, пов'язаних з похибками вимірювання;

- опис методів та процедур, що були використані для виявлення похибок вимірювання та оцінки їх впливу;

- повідомлення для користувачів щодо врахування похибок вимірювання при оцінюванні показників та визначенні характеристик їх надійності, опис процедур, що були використані для цього;

- оцінка можливого впливу на результати обстеження похибок вимірювання, що не були враховані при оцінюванні показників;

- опис результатів аналізу причин виникнення похибок вимірювання;

- опис процедур, які були застосовані для зменшення похибок вимірювання, включаючи розробку та тестування запитальників, навчання фахівців з інтерв’ювання, контролю їх роботи (включаючи опис результатів контролю) тощо.

         Крім зазначених характеристик похибок вимірювання у звітах щодо якості можуть наводитись такі показники, як:

- оцінки розбіжностей оцінок основних показників  внаслідок використання різних методів збору даних;

- частки респондентів, які мали труднощі з відповідями на основні запитання;

- частки нестандартних відповідей, що вимагають коригування;

- частки приблизних відповідей по основних запитаннях;

- оцінка частки дисперсії відповідей, що зумовлена впливом фахівців з інтерв’ювання тощо.

Похибки обробки

Похибки оброки складаються з похибок кодування, похибок введення даних в ПЕОМ, похибок редагування та імпутації даних і похибок програмування, що виникають при автоматизації відповідних процедур обробки даних. Ці похибки за природою та проявом аналогічні похибкам вимірювання, оскільки полягають в тому, що на певному етапі підготовки даних до аналізу замість дійсних первинних значень ознак з’являються їх хибні значення.

Для виявлення та врахування похибок обробки застосовують такі методи, як перекодування анкет, подвійне введення анкет в ПЕОМ, паралельне застосування різних методів імпутації для компенсації недоотриманої інформації, використання альтернативних засобів автоматизації робіт тощо. Ці процедури, як і для випадку дослідження похибок вимірювання, можуть призвести до помітного зростання вартості обстеження.

         У звітах щодо якості доцільно наводити такі показники та характеристики похибок обробки:

- опис основних процедур обробки даних;

- опис процедур контролю первинних даних та результатів цього контролю;

- опис основних ідентифікованих похибок обробки, визначення ступеню їх впливу на оцінки основних показників, зокрема, похибок кодування та введення даних в ПЕОМ тощо;

- характеристика методів, процедур та моделей, що були використані для виявлення похибок обробки та оцінки їх впливу;

- повідомлення для користувачів щодо врахування похибок обробки при оцінюванні показників та визначенні характеристик їх надійності, опис процедур, що були використані для цього;

- оцінка можливого впливу на результати обстеження похибок обробки, що не були враховані при оцінюванні показників;

- опис аналізу причин виникнення похибок обробки;

- опис процедур зважування; опис якості системи ваг; порівняння оцінок основних показників до і після зважування;

- опис процедур, які були застосовані для зменшення похибок обробки, включаючи навчання кодувальників та операторів, удосконалення програм введення (сканування) та контролю інформації, удосконалення алгоритмів редагування та імпутації тощо;

-  оцінка загального обсягу редагування та імпутації значень основних ознак та ін.

         Для характеристики  надійності в частині невибіркових похибок обробки Євростатом розробляються та впроваджуються такі  стандартні показники якості статистичної продукції (табл.1):

- рівень імпутації (А4). Цей показник рекомендується розраховувати для окремих основних показників обстеження. Визначається як показник незваженого рівня імпутації (відношення кількості імпутованих значень певної ознаки Х до загальної кількості значень цієї ознаки), так і показник зваженого рівня імпутації (відношення зваженої суми імпутованих значень до загальної зваженої суми всіх значень). Ці показники пропонується визначати як на поточній основі (щомісячно, щоквартально), так і щорічно;

- середня величина уточнення даних (A7) – середня з абсолютних значень змін показників за попередніми та остаточними даними. Ці показники пропонується визначати як на поточній основі (щомісячно, щоквартально), так і щорічно

 Похибки, пов’язані з відсутністю відповідей

Різні вибіркові обстеження населення (домогосподарств) характеризуються різними рівнями участі (відмов) респондентів. Значний вплив на рівень відмов респондентів мають такі фактори, як час та зусилля, який вимагається від респондента для надання інформації, зміст та структура запитальника, порядок запитань, тривалість інтерв’ю, рівень складності запитань, рівень підготовки фахівців з інтерв’ювання (загальний та до окремого обстеження); вибір потрібного респондента; місце проведення інтерв’ю; інтерес до предмета обстеження (як респондента, так і фахівця з інтерв’ювання); рівень авторитетності організації, що проводить обстеження та ін. На мотивацію респондента впливають індивідуальні (об’єктивні та суб’єктивні) характеристики фахівця з інтерв’ювання – стать, вік, рівень освіти, комунікабельність, доброзичливість, наполегливість тощо, їхні погляди та очікування. Індивідуальні характеристики фахівців з інтерв’ювання впливають, насамперед, на рівень участі домогосподарств в обстеженні, а погляди та очікування фахівців з інтерв’ювання можуть вплинути на респондентів при наданні відповідей на окремі запитання. Для зменшення негативного впливу фахівців з інтерв’ювання на якість інформації розробляються спеціальні заходи (удосконалення програм запитальників, проведення тематичних цільових навчань фахівців з інтерв’ювання тощо).

Іншим сучасним підходом до вирішення проблеми недоотримання інформації є спеціальна робота з домогосподарствами (особами), які відмовилися від обстеження. До таких спеціальних заходів відносяться додаткове фінансування обстеження одиниць, від яких важко отримати інформацію, збір інформації за такими одиницями з додаткових джерел, збільшення частки відбору для таких груп респондентів та ін. Статистична цінність інформації, отриманої від таких одиниць, часто суттєво вища, ніж цінність інформації, отриманої від інших одиниць.

Разом з тим користувачі статистичними даними вибіркових обстежень мають розуміти, що існує інформація, відсутність якої неможливо компенсувати ніякими заходами.

Проблема компенсації відмов домогосподарств та осіб від участі в обстеженнях є суттєвою, коли рівні відмов відрізняються серед різних груп одиниць. Для її вирішення необхідно проводити спеціальні заходи, які мають запобігти суттєвим викривленням результатів обстежень.

Для аналізу похибок, пов'язаних з відсутністю відповідей респондентів в обстеженні, застосовується показник рівня участі респондентів в обстеженні.

Рівень участі в обстеженні домогосподарств і осіб  (незважений) обчислюється як відношення кількості обстежених домогосподарств (осіб) до кількості відібраних домогосподарств (осіб), які підлягали обстеженню:

 

           (4.10)

 

При проведенні розрахунків необхідно приділити особливу увагу коректному визначенню знаменника у формулі (4.10). Він повинен враховувати тільки тих з відібраних домогосподарств (осіб), які підлягали обстеженню (тих, які взяли участь, відмовилися від участі в обстеженні, і тих, яких не вдалося застати вдома). При визначенні знаменника не враховуються нежитлові, пусті, неіснуючі, недоступні адреси, що могли бути враховані як реальні адреси при формуванні вибірки завдяки неналежній актуальності основи вибірки, помилкам або з інших причин.

Величина  розраховується за основними групами одиниць, які визначаються при стратифікації генеральної сукупності за такими ознаками, як регіон, тип місцевості тощо.

Важливо відмітити, що величина  може розраховуватись по сукупності одиниць, які мають різні статистичні ваги. У цьому випадку рівень участі доцільно обчислювати як відношення зваженої кількості опитаних домогосподарств (осіб) до зваженої кількості домогосподарств (осіб), які підлягають обстеженню.

При аналізі якості інформації доцільно розраховувати також таку характеристику, як, наприклад, коефіцієнт адресного охоплення – відношення кількості відібраних адрес, за якими проживають домогосподарства, до загальної кількості відібраних адрес.

Основним наслідком відмов від обстеження є можливе викривлення структури вибіркової сукупності у порівнянні зі структурою генеральної сукупності, тобто порушення принципу репрезентативності вибірки (див. приклад у табл. 2). Для виявлення похибок репрезентативності використовують можливість порівняння структури генеральної сукупності і структури вибірки за певними показниками.

Для зменшення негативного впливу похибок, пов’язаних з відсутністю відповідей, застосовують методи максимізації відповідей, методи імпутації пропущених, недійсних і неузгоджених відповідей, методи зважування з метою компенсації відсутності відповідей.

У звітах щодо якості доцільно наводити такі показники та характеристики похибок, пов’язаних з відсутністю відповідей:

- зважені та незважені рівні участі домогосподарств (осіб) в обстеженнях по основних групах домогосподарств (осіб) та по окремих запитаннях для основних ознак (після реалізації всіх заходів зі збору даних – повторних відвідувань домогосподарств, отримання інформації з інших джерел тощо);

- опис застосованих методів імпутації та рівні імпутації даних по основних показниках (ці характеристики за своєю сутністю є аналогічними для похибок обробки та похибок, пов’язаних з відсутністю відповідей; у публікаціях найчастіше наводять загальний рівень імпутації, який розраховується на основі обох зазначених складових);

-  повідомлення для користувачів щодо методів урахування рівня участі одиниць в обстеженні, що були застосовані при оцінюванні показників та визначенні характеристик надійності за результатами вибіркового обстеження;

- оцінка розбіжності основних характеристик респондентів і нереспондентів, визначення ймовірної систематичної помилки, пов'язаної з відсутністю відповідей, по основних групах одиниць;

 

- повідомлення для користувачів щодо імовірного впливу відсутності відповідей (що не були враховані при обробці та редагуванні даних або враховані не повністю) на оцінки основних показників та характеристики їх надійності;

- аналіз основних причин невідповідей респондентів;

- опис методів, що були застосовані для отримання інформації по одиницях, що відмовилися від участі в обстеженні – повторні відвідування, використання інформації з зовнішніх джерел, а також наведення оцінки надійності інформації, отриманої на основі цих методів;

- повідомлення для користувачів щодо заходів, що були реалізовані для зменшення рівня відмов.

Для характеристики надійності в частині невибіркових похибок,  пов’язаних з відсутністю відповідей, Євростатом розробляються та впроваджуються такі стандартні показники якості статистичної продукції (табл.1):

- рівень участі респондентів в обстеженні (зважений та незважений) (А2).

- рівень відповідей респондентів по основних показниках (зважений та незважений) (A3).

Ці показники пропонується визначати як на поточній основі (щомісячно, щоквартально), так і щорічно.

         Приклад надання користувачам інформації щодо рівня участі домогосподарств в обстеженні наведено далі.

 

Похибки моделювання

У теперішній час у міжнародній та національній статистичній практиці різноманітні статистичні моделі все більше використовуються при обробці даних вибіркових обстежень населення (домогосподарств) та оцінюванні показників за їх результатами. Зокрема, це моделі обробки нестандартних значень показників, спеціальних коригувань даних, калібрації статистичних ваг, оцінювання показників на основі регресійних моделей або композиційних методів, застосування методів сезонних коригувань, реплікаційні моделі оцінювання характеристик надійності та ін. Будь-яка модель потребує обґрунтування доцільності її застосування, аналізу її валідності (правильності), адекватності тощо.  

При використанні будь-яких моделей у процесах обробки первинних даних та оцінювання показників за результатами вибіркового обстеження в звітах щодо якості доцільно наводити такі показники та характеристики:

- опис моделей, їх призначення та обґрунтування доцільності їх використання;

-  опис процедур побудови моделей, оцінка якості додаткових по відношенню до обстеження даних, що були використані при реалізації цих процедур;

-  пояснення щодо надійності оцінок показників, розрахованих за результатами обстеження, з урахуванням невизначеності, що вноситься припущеннями при побудові моделей; 

- аналіз можливого впливу на оцінки показників та характеристики їх надійності неврахованих наслідків застосування моделей.

4.3. Своєчасність та пунктуальність 

Своєчасність характеризує інтервал часу між моментом (періодом), у який відбувалося явище або процес, що описують статистичні дані, та датою готовності (надання) цих даних.

Пунктуальність характеризує проміжок часу між запланованою та фактичною датами підготовки даних. Наприклад, запланованою датою може бути дата, відображена у затверджених планах виконання робіт, анонсована або узгоджена з користувачами дата тощо.

Своєчасність і пунктуальність характеризуються часовими інтервалами і датами, але вони надають опис різних процесів. Своєчасність результатів обстеження відображає проміжок часу між датою закінчення підготовки даних (датою надання їх користувачам) і датою (періодом) реалізації події, явища або процесу, які описують дані. Чим коротший цей період, тим вище своєчасність.  Пунктуальність характеризує проміжок часу між фактичною датою надання даних користувачам і визначеною датою, на яку їх потрібно було надати, з посиланням на дати, анонсовані в офіційних документах, наприклад у плані державних статистичних спостережень. Офіційні терміни надання інформації недоцільно порушувати у будь – яку сторону, оскільки це може призвести до порушення планів користувачів щодо використання інформації.

Своєчасність і пунктуальність накладають певні обмеження на період доступності для користувачів інформації обстежень, що проводяться на постійній основі. Щомісячні дані обстежень повинні бути доступні лише певний, спеціально визначений період часу (наприклад, певну кількість місяців) після оприлюднення. Це необхідно для мінімізації витрат ресурсів на супровід органами державної статистики неактуальної інформації і витрат часу користувачів на пошуки потрібних актуальних даних. Цей період встановлюється на основі спеціального дослідження потреб користувачів. Аналогічні терміни встановлюються для щоквартальних та річних даних.

         У звітах щодо якості доцільно наводити такі показники та характеристики своєчасності та пунктуальності:

- посилання на існуючі офіційні документи щодо графіка поширення даних та періодичності розробки результатів обстеження;

- середня своєчасність даних (характеристика середнього інтервалу часу, необхідного для підготовки даних);

- періодичність надання даних і середня свіжість (актуальність) даних (свіжість даних  для обстежень, що проводяться на періодичній основі, вимірюється на основі періоду підготовки даних () та циклу обстежень , . Якщо дані обробляються чотири місяці, а тривалість щоквартального обстеження 3 місяці, то через чотири місяці після певного циклу обстежень свіжість даних буде дорівнювати , через п’ять місяців , далі вона буде знижуватись з кожним місяцем до мінімального значення , а потім з’являться нові дані, свіжість яких буде знову    і т. д.);

 - відсоток даних, випущених з запізненням (оцінюється на основі термінів, вказаних в офіціальних документах, угодах тощо);

- проміжок часу між одержанням замовлення користувачів щодо підготовки даних (для нестандартних запитів) та датою їх надання;

- опис потреб основних користувачів щодо своєчасності даних, опис ступеня задоволення цих потреб;

- середня затримка у наданні даних користувачам, що оцінюється у відповідних одиницях: кількість днів, робочих днів, тижнів тощо;

- максимальне фактичне запізнення у наданні даних;

- опис причин запізнення у наданні даних: недостаток ресурсів, технічні проблеми тощо.

Для вимірювання  своєчасності та пунктуальності Євростатом рекомендовані такі стандартні показники та характеристики якості статистичної продукції (табл.1):

- пунктуальність графіку публікації (T1). Розраховується як різниця між фактичною та запланованою датами публікації.

- проміжок часу між кінцем періоду (датою) обстеження та датою отримання попередніх результатів (T2). Розраховується як різниця між датою випуску попередніх результатів та  датою обстеження.

- проміжок часу між кінцем періоду обстеження та датою отримання кінцевих результатів (Т3). Розраховується як різниця між датою випуску кінцевих результатів та датою обстеження.

Ці показники пропонується визначати як на поточній основі (щомісячно, щоквартально), так і щорічно.

В якості прикладу показників своєчасності доцільно навести інформацію щодо проміжку часу між закінченням певного періоду обстеження умов життя домогосподарств та датою публікації результатів цього обстеження.

 

 

Іншим прикладом інформації такого роду, що надається користувачам, могла би бути наступна.

 

4.4. Доступність та ясність

Доступність характеризує фізичні умови, за наявності яких користувачі можуть отримати доступ до статистичних даних: способи та місця отримання даних, процедури замовлення, час, необхідний для виконання замовлень, політика ціноутворення, існуючі маркетингові умови (авторське право та ін.), формати, в яких дані можуть бути надані користувачам (паперові носії, електронні носії, Інтернет та ін.), наявність макро- та мікро-даних тощо.

Ясність характеризує інформаційне середовище даних: наявність та якість метаданих, що надаються зі статистичними даними (текстова інформація, пояснення, документація та ін..), ілюстрації (графіки, карти, схеми та ін.), наявність пояснень щодо якості даних (включаючи обмеження у використанні); ступінь додаткового супроводу даних статистичними органами.        

 Доступність і ясність характеризують простоту і легкість, з якою користувачі можуть отримати результати обстеження, що їх цікавлять, використовуючи для цього прості і зрозумілі процедури, отримуючи дані в зручній для використання формі, в межах прийнятного для користувача періоду часу, з відповідним інформаційним супроводом та допомогою. Це, в свою чергу, забезпечує можливість оптимального використання даних.

Проблеми забезпечення конфіденційності результатів вибіркових обстежень деякою мірою обмежують доступність. Таким чином, органи державної статистики для кожного обстеження мають визначити та забезпечити певну оптимальну доступність, тобто найбільшу можливу доступність даних за умови дотримання принципу конфіденційності інформації.

Ясність характеризується якістю метаданих, які готуються за результатами вибіркового обстеження. Обсяг документації, що супроводжує результати обстежень, повинен бути адекватним для забезпечення можливості правильної інтерпретації і цільового використання користувачами результатів обстежень.

 У звітах щодо якості наводяться такі показники та характеристики доступності та ясності:

- інформування користувачів щодо доступності статистичних даних через Інтернет-сайт, інші засоби електронної комунікації, опис засобів пошуку й навігації для даних, до яких забезпечено електронний доступ;

- інформування користувачів щодо випуску статистичних даних за заздалегідь оголошеним графіком з доступом для всіх користувачів в один і той же час;

- опис умов доступу до даних: канали (Інтернет, електронна пошта, інформаційна служба органів державної статистики, бібліотеки, інформаційні агенції тощо), формати, підтримка, маркетингові умови, можливі обмеження, існуючі угоди щодо супроводу і т.п.;

- опис процедур оформлення вимог доступу до неопублікованих даних;

- опис додаткової інформації (документація, в т.ч. щодо методології та програми обстеження, пояснення, якісні обмеження тощо), надання контактів для одержання більш детальної інформації, включаючи технічну інформацію;

- опис методології та алгоритмів побудови системи вихідних показників, опис моделей (якщо використовуються);

- опис можливої подальшої допомоги, послуг з супроводу даних, доступних для користувачів (коментарі, включаючи текстовий аналіз, графіки, карти й т.п.;

- опис зворотного зв'язку з користувачем.

Відповідно до рекомендацій Євростату у звітах також  надаються  такі стандартні показники якості статистичної продукції в частині доступності та ясності (табл.1):

- Кількість розповсюджених та/або проданих публікацій (АС1). Цей показник може легко компілюватися для різних засобів передачі інформації: (1) публікації (Статистичний щорічник, місячні бюлетені, інформаційні бюлетені); (2) дискети; та (3) CD-диски.

- Кількість відвідувань баз даних (AC2).

- Рівень повноти метаданих для опублікованих результатів (AC2). Цей показник відображає ступінь доступності для користувачів метаданих обстеження, тобто завершеність метаданих, оприлюднених для певної статистичної області, теми. Показник має розраховуватися як рівень придатності (наприклад, 2-повністю, 1 – частково, 0 – непридатний) аспектів метаданих, включених до шаблону метаданих, та ділитися на загальну кількість доцільних (релевантних) аспектів, для яких метадані повині бути підготовлені.

 

Рівень повноти метаданих =                              (4.11)

де (j) – аспект метаданих, що розглядається,

Наведені показники доступності та ясності пропонується визначати як на поточній основі (щомісячно, щоквартально), так і щорічно.

В якості прикладу характеристик доступності даних, отриманих за результатами обстеження економічної активності населення  може бути наступна інформація.

 
4.5. Порівнянність

 Порівнянність спрямована на вимірювання впливу відмінностей у статистичних концепціях та визначеннях, які застосовуються, на співставність статистичних даних за географічними районами, негеографічними доменами або у часі. Це ступінь, з яким розбіжності між статистичними даними пояснюються розбіжностями між дійсними значеннями статистичних характеристик. 

 Порівнянність характеризує відносну якість результатів обстежень. Порівнянність даних може бути визначена, лише якщо визначені інші дані (отримані на основі іншого стандарту (класифікації) або для іншої території, групи населення тощо). Властивість порівнянності даних є результатом дії цілого ряду чинників. Органи державної статистики не можуть мати заздалегідь інформацію щодо порівнянь, в яких результати обстежень будуть використовуватись, а також щодо чинників, що впливатимуть на кожне порівняння. У зв'язку з цим дані повинні супроводжуватись  інформацією, яка допоможе будь-якій зацікавленій стороні в оцінці порівнянності даних у кожній конкретній ситуації

Основні фактори, що визначають порівнянність певних показників, оцінених за результатами обстежень, можуть бути об’єднані у дві групи: концепції обстеження та методологія вимірювання.

Група концепцій вибіркового обстеження включає такі елементи, як система показників (їх зміст, визначення), одиниці спостереження, цільова та генеральна сукупність, основа вибірки, звітній період та періодичність обстежень, об’єкт спостереження, географічне охоплення, стандарти, що використовуються, та ін. 

Група методології включає дизайн вибірки, спосіб збору даних, процедури обробки даних, процедури оцінювання показників та ін.

Розрізнюють такі основні аспекти порівнянності результатів вибіркових обстежень:

- географічна порівнянність;

- порівнянність у часі;

- порівнянність між доменами (групами населення, видами діяльності тощо);

- комбінаційна порівнянність.

Порівнянність у географічному аспекті розглядається для випадків, коли аналогічні за концепціями та методологією обстеження проводяться різними організаціями по різних територіях (країнах).

Порівнянність у часі аналізується, коли одне і те саме (за основними концепціями та методологією) обстеження організується та проводиться у різні періоди часу.

Порівнянність між доменами розглядається для випадків, коли аналогічні характеристики для різних доменів вимірюються в одному або у різних обстеженнях, які проводяться однією організацією.  

Комбінаційну порівнянність розглядають, коли реалізуються комбінації різних окремих аспектів порівнянності.       

У звітах щодо якості мають бути наведені такі показники та характеристики порівнянності:

а) щодо географічної порівнянності:

- стислі описи всіх концепцій, визначень, понять і методів, які можуть впливати на порівнянність результатів вибіркових обстежень населення;

- опис відмінностей між національними визначеннями, стандартами та міжнародними, в т.ч. європейськими стандартами у сфері вибіркових обстежень населення. Кількісна (бажано) оцінка ефекту кожної відомої різниці між цими стандартами, опис причин відхилень. Посилання на міжнародні нормативні документи, які містять стандарти або рекомендації.

- результати аналізу розбіжностей результатів обстежень для випадків здійснення порівнянь між певними регіонами;

 б) щодо порівнянності у часі:

- опис динамічних рядів, в т.ч. – за минулі роки (періоди), а також опис усіх розривів у динамічних рядах; 

- повідомлення користувачів щодо обстежуваного періоду, в якому відбулися зміни, що призвели до розриву часових рядів вибіркового обстеження. Необхідно відмітити основні можливі причини розривів: зміни концепцій та/або методології у часі (адаптація обстеження до реальності, гармонізація з міжнародними стандартами тощо);    

- опис розбіжностей у концепціях, визначеннях, класифікаціях та методології обстеження до та після розриву;

- оцінка величини впливу змін на результати обстежень, бажано у кількісному вимірі;

в) щодо порівнянності між доменами:

- детальний опис розбіжностей у визначеннях для кожного обстеження або домена (адміністративно – територіальної одиниці, соціально – економічної групи населення тощо);

- опис методів збору інформації – одне й те ж саме обстеження, різні обстеження, використання даних із зовнішніх джерел та ін.;

- описи цільової та генеральної сукупностей для кожного з обстежень, методів формування вибірок, одиниці відбору тощо;

- опис відмінностей у класифікаціях, статистичній методології, методах обробки даних і т.п.;

- оцінка величини впливу змін на результати обстежень, бажано у кількісному вимірі.

Відповідно до рекомендацій Євростату у звітах також  надаються  такі стандартні показники та характеристики якості статистичної продукції в частині порівнянності (табл.1):

- довжина зіставних часових рядів (С1). Цей показник визначається як кількість років (кварталів, місяців) від останнього розриву в часовому ряді певного показника. Якщо в часовому ряді розривів не було, то показник розраховується як кількість років (кварталів, місяців) з початку часового ряду. Показник рекомендується розраховувати щорічно;

- кількість зіставних часових рядів (С2). Цей показник є додатковим до С1 і може бути розрахований для множини показників. Показник рекомендується розраховувати щорічно;

- рівень відмінностей концепцій та методів від Європейських норм (С3). Планується Євростатом для використання в майбутньому за інформацією по країнах щодо наявності відмінностей концепцій та методів, що використовуються при отриманні певної інформації (для певного джерела інформації), від Європейських норм [6]. При розрахунку цього індикатора для кожної країни встановлюється значення індикатора наявності відмінностей концепцій та методів . Цей індикатор  приймає значення „0” (відмінності відсутні) якщо концепції та методи повністю гармонізовані з відповідними нормативними документами Євростату.

Індикатор   для і - го джерела інформації для певної країни  визначається за формулою:

                      (4.12)

Наявність та ступінь вищезгаданих відмінностей концепцій та методів для конкретного джерела визначається експертним шляхом.

Рівень відмінностей концепцій та методів від Європейських норм  розраховується за формулою:

,                                                                       (4.13)

де - загальна кількість джерел інформації у певній країні

Рівень відмінностей   може розраховуватися також по всій сукупності країн (регіонів), що порівнюються за формулою:

,                                          (4.14)

де j – країна (регіон);  - загальна кількість країн (регіонів);

  - асиметрія для показників дзеркальної статистики (С4). Цей показник відображає невідповідність між оцінками показників, що характеризують певні процеси (міграцію, товарообіг тощо) з одного та іншого боку кордону для пар країн. Значення показника асиметрії для країни дорівнює сумі абсолютних  різниць оцінок певного показника для цієї країни та всіх інших країн. Показник має розраховуватися щорічно.

Прикладом повідомлення користувачів щодо змін, які могли призвести до розриву часових рядів окремих показників в обстеженні умов життя домогосподарств, є така інформація:

 

4.6. Узгодженість

Узгодженість – ступінь, з яким дані, отримані з різних джерел можуть адекватно комбінуватись, інтегруватись та використовуватись для різних цілей. Зміст цього виміру полягає в тому, що статистичні дані, що характеризують одне й те саме явище, але отримані за результатами різних обстежень (обстежень різного типу і періодичності), можуть бути не повністю узгодженими, оскільки основані на різних методологічних підходах, класифікаціях тощо. 

Узгодженість даних вибіркового обстеження населення з іншими (зовнішніми) даними передбачає можливість їх обґрунтованого комбінування, інтеграції, об’єднання з цими даними на основі відповідних статистичних методів і для різних використань. Узгодженість даних відображає проблему можливості порівняння (комбінування) показників, що характеризують, як правило, однакові або дуже близькі цільові сукупності, але отримані на основі різних джерел даних. На відміну від цього, порівнянність характеризує можливість порівняння показників, що розраховані за результатами обстеження для різних цільових сукупностей (підсукупностей).       

Статистичні дані, отримані з одного джерела, наприклад, за результатами певного вибіркового обстеження, є, як правило, узгодженими і можуть надійно комбінуватись. Дані, отримані з різних джерел, наприклад, за результатами різних обстежень населення, зокрема, які проводяться з різною періодичністю тощо, не є повністю узгодженими.

Для вирішення питання щодо узгодженості даних певного вибіркового обстеження з зовнішніми даними необхідно мати два (як мінімум) набори даних і відповідні метадані.

При наданні результатів вибіркових обстежень населення користувачам необхідно оцінювати певні типи узгодженості даних у наступних стандартних ситуаціях:

1) Узгодженість між попередніми і остаточними даними. Застосовується в окремих вибіркових обстеженнях населення у випадках надання користувачам попередніх даних (наприклад, у вигляді експрес-інформації), які отримуються на основі спрощених процедур контролю та обробки даних, не на всій вибірці і т.п. Це може призводити до неповної узгодженості попередніх і остаточних даних (насамперед, у сенсі точності (надійності) і деталізації). Аналіз узгодженості такого типу та відповідне інформування користувачів проводиться після отримання остаточних даних обстеження.

2) Узгодженість між річними і квартальними (або місячними) даними. У випадках, коли для отримання квартальних (місячних) даних обстеження використовуються інші (або дещо відмінні) методологічні підходи, ніж для річних даних, доцільно провести аналіз ступеня узгодженості цих даних та надати відповідну інформацію користувачам.

3) Узгодженість між оцінками певних соціально-економічних явищ або процесів, отриманих за результатами застосування різних підходів до їх вимірювання. Оцінка узгодженості даного типу необхідна для запобігання (та пояснення) ситуацій, коли користувачі мають оперувати суттєво різною (або навіть суперечною) інформацією щодо певних явищ та процесів.            

Прикладом такої ситуації можуть бути характеристики зайнятості на підприємствах за даними вибіркового обстеження домогосподарств з питань економічної активності населення та за даними обстеження підприємств або дані щодо рівня безробіття за методологією МОП та інформації адміністративних реєстрів державної служби зайнятості.

 

4) Узгодженість між джерелами інформації та продуктами. Аналіз цього типу узгодженості застосовується для даних, які використовуються в якості джерел для інших статистичних продуктів. Наприклад, інформація вибіркових обстежень населення використовується для обчислення показників національних рахунків, обсягів виробництва окремих галузей економіки тощо.

В якості прикладу узгодженості між джерелами інформації можуть бути використані дані щодо узгодженості оцінок доходів та витрат домогосподарств за результатами обстеження умов життя домогосподарств та визначені в системі національних рахунків.

 

Для всіх вищезазначених ситуацій у звітах щодо якості статистичної продукції необхідно наводити характеристики ступеня узгодженості показників, опис розбіжностей оцінок показників та явищ або процесів, пояснення щодо причин неузгодженості (різниць у концепціях, методології тощо).

Зокрема, у звітах щодо якості наводяться такі показники та характеристики узгодженості:

а) щодо узгодженості між попередніми та остаточними даними, отриманих за результатами певного обстеження:

- графік переглядів даних, інформування користувачів щодо даних, які підлягають перегляду, і переглянутих даних, опис причин необхідності проведення переглядів;

- порівняння оцінок основних показників за попередніми та остаточними даними, опис причин розбіжностей;

- інформування користувачів (за можливістю) щодо похибок для попередніх та остаточних даних за основними типами (похибки вибірки, похибки охоплення, похибки від не відповідей, похибки вимірювання, похибки обробки, та похибки моделювання);

- пояснення та інші коментарі для відмінностей, які можна вважати суттєвими.

б) щодо узгодженості між річними і квартальними (або місячними) даними, отриманих за результатами певного обстеження:

- порівняння річних та проміжних оцінок показників, розрахованих на основі річних масивів інформації;

- інформування користувачів щодо відмінностей у концепціях та методології, якщо відмінності поточних та річних оцінок показників повністю не пояснюються характеристиками точності.

в) щодо узгодженості даних по однакових сукупностях (доменах) отриманих з різних джерел інформації:

- порівняння оцінок основних показників, отриманих за даними обстеження з наявними близькими за змістом даними з інших джерел, з урахуванням рівня надійності, з яким ці показники оцінюються;

- наведення відмінностей у концепціях та методології, які застосовуються в різних обстеженнях;

- наведення оцінки частки показників, що використовуються як джерела для інших статистичних продуктів.

Крім того, у звітах щодо якості наводиться інформація, що визначає будь-які відомі оцінки з інших джерел. Здійснюється порівняння оцінок показників з аналогічними даними з інших джерел, надаються результати аналізу причин розбіжностей.

Надаються рекомендації користувачам щодо інших статистичних даних, які розробляються на погодженій основі.

Надаються рекомендації користувачам щодо інших статистичних даних, які розробляються на непогодженій основі.

Для опублікованих оцінок, що використовуються як джерела для інших продуктів, надається інформація, що характеризує оцінки й причини будь-яких розбіжностей.

Відповідно до рекомендацій Євростату у майбутньому у звітах також  мають надаватися такий стандартний показник узгодженості статистичної продукції (табл.1):

- частка показників, що задовольняють вимогам їх використання в якості джерел для інших статистичних продуктів (CH1). Показник має розраховуватися щорічно. Процедура розрахунків складається з таких етапів:  визначення найбільш важливого статистичного продукту та інших продуктів (в ранжованому за значимістю переліку), джерелом для обчислення яких слугують дані певного обстеження (вторинне використання); визначення вимог для такого використання даних обстеження за такими факторами, як генеральна сукупність, одиниці спостереження, визначення змінних, звітний період, частота обстежень, стандартні класифікації тощо); аналіз відповідності вимогам по кожному релевантному фактору за наступною нижченаведеною схемою [6].

Групи показників обстеження розподіляються за статистичними продуктами, упорядкованими за їх значимістю (див. табл. 8).

 

Таблиця 8

Приклад побудови таблиці за статистичними продуктами (вторинне використання результатів обстеження) та факторами для системи індикаторів  

Номер статистичного продукту

Номер групи показників

Фактор

Фактор

...

Фактор

1

1

0

1

 

1

2

1

0

 

1

...

...

...

...

...

0

0

 

0

Номер статистичного продукту

Номер групи показників

Фактор

Фактор

...

Фактор

2

1

1

0

 

1

...

...

...

...

...

0

0

 

0

...

...

...

...

...

...

Номер статистичного продукту

Номер групи показників

Фактор

Фактор

...

Фактор

U

1

0

1

 

1

...

...

...

...

...

1

0

 

1

 

Основні фактори  (генеральна сукупність, одиниці спостереження тощо) записуються у графах таблиці. Для певної групи показників індикатор  фактору  (, – кількість статистичних продуктів; , – кількість факторів) приймає значення „1”, якщо група показників відповідає вимогам для даного статистичного продукту відповідно до цього фактора, та значення „0”, якщо вимога не виконується. При цьому рівень відповідності вимогам для конкретного статистичного продукту та фактора визначається, як правило, експертним шляхом.

Частка груп показників певного статистичного продукту , що відповідають вимогам фактора  розраховується за формулою:

,                                         (4.15)

 

де  кількість груп показників статистичного продукту ;  - перший фактор статистичного продукту и.

Індикатор   для фактора  статистичного продукту и для групи показників n визначається за формулою:

 

Частка груп показників статистичного продукту , що відповідає вимогам всіх  факторів розраховується за формулою:

 

,                                                        (4.16)

 

де

 

Загальна частка показників, що задовольняють вимогам для їх використання в якості джерел для інших статистичних продуктів, може бути розрахована як:

 

.                                           (4.17)

 

Слід зазначити, що у багатьох країнах, в тому числі і в Україні,  досвіду надання користувачам інформації на постійній основі по абсолютній більшості зазначених показників та характеристик якості немає. Таким чином, актуальними є питання оцінки можливості визначення відповідних індикаторів якості на основі існуючої в державній статистиці України інформації, ступеня потреб національних користувачів у відповідній інформації, а також інституційних можливостей органів державної статистики.   

4.7. Ключові індикатори якості результатів вибіркових обстежень населення для публікації у звітах щодо якості

 У відповідності з розглянутими підходами до визначення основних аспектів якості та враховуючи методологічні рекомендації Євростату, встановлена система показників та характеристик якості результатів державних вибіркових обстежень населення, які є обов’язковими для відображення у підсумковому, повному та частково у базовому звітах щодо якості, що надаються користувачам. Тобто для застосування в органах державної статистики України розроблена система ключових індикаторів якості. Передбачається, що зазначена система забезпечить користувачів основною інформацією щодо якості результатів вибіркових обстежень населення, надасть органам державної статистики можливість реалізації ефективного моніторингу якості цих результатів та порівняння якості результатів різних вибіркових обстежень населення (див. табл. 9).

На відміну від стандартних показників якості статистичної продукції, рекомендованих Євростатом для відображення у звітах щодо якості для будь-яких статистичних спостережень, які призначені головним чином для виробників статистичної продукції, ці ключові індикатори спрямовані на задоволення інформаційних потреб щодо якості результатів вибіркових обстежень населення більш широкого кола користувачів.

Зміст та підходи до вимірювання ключових індикаторів якості за вимірами якості наведені у відповідних підрозділах даного розділу.

 

Таблиця 9.

Ключові індикатори якості результатів державних вибіркових обстежень населення в Україні  для відображення у  звітах щодо якості

Індикатор якості

Вимір якості

Частота вимірювання

1

2

3

4

1

Характеристика відповідності результатів вибіркового обстеження потребам основних користувачів

Релевантність

Для певного циклу обстеження (бажано щорічно)

2

Рівень участі респондентів в обстеженні за основними групами одиниць (зважений та незважений)

Надійність

Для кожного раунду обстеження

3

Рівень відповідей респондентів по основних показниках

Надійність

Для кожного раунду обстеження

4

Рівень імпутації по основних показниках

 

Надійність

Для кожного раунду обстеження

5

Оцінки стандартних похибок та коефіцієнтів варіації по основних показниках

Надійність

Для кожного раунду обстеження

6

Проміжок часу між закінченням періоду (датою) обстеження та датою отримання результатів

Своєчасність та пунктуальність

Для кожного раунду обстеження

7

Кількість поширених публікацій (у друкованому та електронному вигляді)

Доступність та ясність

Для певного циклу обстеження (бажано щорічно)

8

Інформація щодо узгодженості визначень та стандартів, які характеризують результати конкретного вибіркового обстеження населення, з національними та міжнародними стандартами

Порівнянність

Для певного циклу обстеження (бажано щорічно)

9

Частка показників, що використовуються як джерела для інших статистичних продуктів

Узгодженість

Для певного циклу обстеження (бажано щорічно)

10

Результати порівняння оцінок основних показників, отриманих за даними обстеження з наявними близькими за змістом даними з інших джерел

Узгодженість

Для кожного раунду обстеження

 5. БАЗОВИЙ ЗВІТ ЩОДО ЯКОСТІ

Головна мета підготовки цього типу звіту – інформування користувачів щодо підсумків аналізу якості поточних результатів вибіркового обстеження.  Ця інформація публікується як частина результатів обстеження і має бути мінімальною за обсягом (наприклад, 0,5–1,0 сторінки), але може містити і обмежену кількість таблиць та рисунків, які, відповідно, призводять до певного зростання обсягу звіту [7-9].

Базовий звіт щодо якості містить динамічні дані щодо якості результатів обстеження, тобто інформацію, яка безпосередньо залежить від результатів поточного вибіркового обстеження (стандартні похибки вибірки, рівні участі в обстеженнях тощо). Для надання користувачам більш детальних коментарів  щодо оцінок якості за окремими її вимірами у Базовому звіті щодо якості наводяться посилання на відповідні частини Підсумкового звіту щодо якості.

Базовий звіт щодо якості складається з трьох частин:

1) Опис основних аспектів, які відрізняють дану публікацію (наприклад, пояснення щодо нових запитань, класифікацій, особливостей застосованих методів, зокрема, щодо калібрації статистичних ваг, а також підстав для їх застосування). За відсутністю таких питань ця частина може бути відсутня.

2) Посилання на WEB-сторінку, де міститься відповідний Підсумковий звіт щодо якості, та стисле викладення його змісту.

3) Найбільш важливі питання щодо якості, основні показники та характеристики якості, включаючи попередження для користувачів щодо можливості помилкової інтерпретації даних; динаміка основних показників та характеристик якості для окремих вимірів, якщо їх фактичні значення відхиляються від нормальних (очікуваних) значень.

Основні показники та характеристики якості для третьої частини цього звіту наведені нижче. Ключові індикатори якості виділені курсивом.

1) Надійність

У цьому розділі наводяться:

- Оцінки стандартних похибок та коефіцієнтів варіації по основних показниках для декількох найбільш важливих показників обстеження. За можливістю значення характеристик надійності наводять поряд зі значеннями показників. У випадках недостатньої надійності оцінок окремих показників наводиться стислий опис причин цього. 

При підготовці звіту показники якості ранжуються, а результати аналізу якості можуть бути наведені для зручності користувачів, як вже зазначалось раніше, з використанням певної шкали (категорій якості).

- Рівень участі респондентів в обстеженні (зважений та незважений);

- Рівень відповідей респондентів по основних показниках (зважений та незважений);

- Рівень імпутації по основних показниках;

- Оцінка впливу імпутованих значень на рівні оцінок основних показників;

- Рівень редагування для основних показників.

Якщо окремі з зазначених характеристик неприйнятні для конкретного обстеження, можуть використовуватись інші аналогічні характеристики.

Крім того, необхідно окремо відмічати виявлені особливості зміни показників та характеристик у порівнянні з попередньою публікацією, наприклад, зниження, у порівнянні з очікуваним, рівня участі респондентів в обстеженні та аналіз причин цього явища.   

2) Своєчасність та пунктуальність

У цьому розділі наводяться:

- Проміжок часу між закінченням періоду (датою) обстеження та датою отримання результатів (попередніх або кінцевих);

Доцільно навести посилання на графік публікацій, графік розміщення даних на WEB-сайті або інші офіційні документи щодо термінів (дат) поширення результатів обстеження.

3) Узгодженість

У цьому розділі порівнюються окремі показники, отримані за результатами вибіркового обстеження, з наявними близькими за змістом даними з інших джерел. За необхідністю наводять стислі пояснення розбіжностей.

6. ПІДСУМКОВИЙ ЗВІТ ЩОДО ЯКОСТІ  

Основною метою цього звіту є відображення статичної інформації, що характеризує якість даних, яка не залежить від результатів поточного обстеження, а визначається методами  його проведення, технологією, процедурами обробки даних і визначення показників та характеристик якості [7-10, 12].

Підсумковий звіт щодо якості та Базовий звіт щодо якості доповнюють один одного. За наявності змін у зазначених методах та процедурах цей звіт оновлюється одночасно з підготовкою публікації результатів обстеження і, відповідно, одночасно з підготовкою Базового звіту щодо якості. Підсумковий звіт має містити визначення всіх основних вимірів якості. Обсяг підсумкового звіту може становити в середньому від 5 до 15 сторінок (в окремих випадках і більше) залежно від складності конкретного обстеження.

Підсумковий звіт щодо якості має публікуватись окремо від результатів конкретного обстеження та розміщуватися на WEB-сайті. Доступ до цього звіту має бути забезпечений з будь-якого сайту, де наведені результати обстеження.

Підсумковий звіт щодо якості складається з двох основних частин:

1) Огляд підсумків аналізу питань якості, структурованих за шістьма вимірами, що рекомендовані Євростатом;

2) Огляд методів, що застосовуються у вибірковому обстеженні населення (домогосподарств).

 6.1. Підсумки аналізу питань якості  

Зміст, основні показники та характеристики якості для цієї частини звіту наведені нижче. Ключові індикатори якості виділені курсивом.

На початку кожної частини звіту, яка надає інформацію щодо конкретного виміру якості, наводиться стисла редакція визначення безпосередньо самого виміру.

1) Релевантність

Ступінь відповідності результатів обстеження потребам користувачів за змістом та охопленням

У цьому розділі наводяться:

- Характеристика напрямів використання результатів обстеження та основних користувачів. Відмічаються невідповідності або обмеження щодо використання результатів цими користувачами. Наприклад, зазначається неможливість використання даних для міжнародних порівнянь у разі неузгодженості класифікацій та визначень, необхідність спеціального контролю рівня надійності даних при їх використанні на регіональному рівні або для окремих груп населення та ін.

 - Характеристика відповідності результатів вибіркового обстеження потребам основних користувачів. Ця інформація надається за підсумками опитувань користувачів. Наводяться також відомі розбіжності між потребами основних користувачів щодо рівнів повноти та деталізації даних і фактичними рівнями повноти та деталізації результатів обстеження.

- Основні концепції та класифікації, що застосовуються в обстеженні.

- Інформація щодо узгодженості визначень та стандартів, які застосовуються у конкретному обстеженні, з національними та міжнародними стандартами.

Надається характеристика основних концепцій, визначень та класифікацій, що були використані для отримання результатів, наприклад, класифікація типів домогосподарств, концепції визначення поняття "домогосподарство". Це забезпечує користувачів інформацією для визначення ступеня відповідності результатів обстеження їх потребам. У випадках розбіжностей застосованих характеристик, визначень, класифікацій з існуючими стандартами наводиться аналіз причин цього стану.

 - Частка доступних результатів обстеження.

Частка доступних результатів обстеження визначає співвідношення кількості наданих користувачам показників до кількості показників, що передбачалось надати за результатами обстеження. Відмічаються  причини, що не дозволили опублікувати всі результати.

2) Надійність

Близькість оцінок показників, отриманих за результатами вибіркового обстеження, до  дійсних значень показників.

  У цьому розділі наводяться:

- Характеристика основних джерел похибок, що впливають на рівень надійності результатів обстеження.

Надається характеристика вибіркових та невибіркових похибок (похибок охоплення, похибок вимірювання, похибок обробки, похибок від відмов та похибок від припущень при оцінюванні показників на основі моделей). У цьому звіті необхідно наводити мінімум технічних деталей, в основному слід звертати увагу на інформуванні користувачів щодо існуючих джерел похибок у конкретному обстеженні. Також доцільно описати заходи, що були застосовані для зменшення величини систематичної похибки (зміщення) оцінювання показників, наприклад, вказати щодо застосування процедур коригування статистичних ваг для зменшення впливу відмов від обстеження тощо. Доцільно додати посилання на інформацію (за її наявністю) щодо вимірювання величини зміщення оцінок основних показників, яку отримують для державних вибіркових обстежень, що проводяться на постійній основі, шляхом реалізації спеціальних одноразових досліджень.

-  Рівень надохоплення та помилкової класифікації;

- Рівень географічного недоохоплення;

- Середня величина уточнення даних (середньої абсолютної зміни показників за попередніми та остаточним даними);

- інформація щодо існування процедур уточнення оцінок показників (для випадків практики опублікування попередніх даних);

- інформація щодо запланованих заходів з підвищення рівня надійності оцінювання показників.        

Доцільно навести також посилання на Базові звіти щодо якості, в яких розміщені показники надійності (коефіцієнти варіації, рівні участі, рівні редагування даних тощо).

3) Своєчасність та пунктуальність

Своєчасність характеризує інтервал часу між періодом обстеження та  датою опублікування результатів обстеження. 

Пунктуальність характеризує проміжок часу між запланованою та фактичною датами опублікування результатів

У цьому розділі наводяться:

- Пунктуальність графіку публікації;

Цей показник визначається як проміжок часу між фактичною та запланованою датами публікації результатів обстеження.    

- Проміжок часу між закінченням періоду (датою) обстеження та датою отримання перших результатів;

- Проміжок часу між закінченням періоду (датою) обстеження та датою отримання кінцевих результатів;

У цьому звіті також слід наводити характеристику (обґрунтування) запланованих та фактичних дат надання даних користувачам та ступеня відповідності результатів обстеження потребам користувачів щодо своєчасності результатів, враховуючи період обстеження. Відмічається ступінь відповідності досягнутих рівнів своєчасності та пунктуальності міжнародним стандартам та рекомендаціям, за можливістю надається інша додаткова інформація щодо своєчасності результатів обстеження, наприклад, перспективні плани щодо зміни періоду обстеження або скорочення термінів обробки даних.   

4) Доступність та ясність

Доступність характеризує простоту доступу користувачів до результатів обстеження, відображає формати, в яких дані доступні користувачам, способи та місця отримання даних, процедури замовлення та наявність допоміжної інформації. Ясність характеризує наявність та якість метаданих, що надаються зі статистичними даними, ілюстрацій та пояснень щодо якості даних (включаючи обмеження у використанні).      

У цьому розділі надається контактна інформація для отримання більш детального опису даних, вказуються формати, способи представлення результатів (наприклад, статистичні публікації на паперових та електронних носіях, файли мікроданих, WEB-публікації та ін.).

Для характеристики цього виміру якості використовуються такі показники:

- Кількість поширених та/або проданих публікацій;

- Кількість відвідувань баз даних;

- Рівень повноти метаданих для опублікованих результатів.

Рівень повноти метаданих характеризує ступінь завершеності та доступності для користувачів метаданих (методологічних, методичних матеріалів, класифікацій, технічної документації тощо), що відносяться до результатів обстеження.

Для забезпечення ясності слід навести посилання на розміщення спеціально розроблених у різних форматах рекомендацій, керівництв та різноманітних тематичних допоміжних матеріалів для користувачів, на інші матеріали методологічного та методичного характеру, а також вказати плани щодо майбутніх змін методології та стисло описати сутність цих змін. 

5) Порівнянність

Ступінь, за яким дані можуть порівнюватись у часі та за територіями або групами респондентів.

У цьому розділі наводяться попередження користувачів щодо обмежень можливості порівняння даних обстеження у часі або за групами респондентів. Причинами цього може бути зміна методології обстеження або дизайну вибірки. Вказується довжина часових рядів, що забезпечують можливість порівнянь показників.

Для характеристики цього виміру якості використовуються такі показники:

- Інформація щодо узгодженості визначень та стандартів, які характеризують результати обстеження, з національними та міжнародними стандартами.

Доцільно також навести посилання на відповідні стандарти, норми та рекомендації.         

-  Довжина зіставних часових рядів;

- Кількість зіставних часових рядів;

- Рівень відмінностей концепцій та методів від європейських норм.

6) Узгодженість

Ступінь з якою дані, отримані з різних джерел або на основі різних методів, але які характеризують одне й те саме явище, є подібними. 

У цьому розділі слід наводити опис особливостей оцінки ступеня узгодженості даних з різних джерел, пояснення різниці в оцінках аналогічних або близьких за змістом  показників. Особлива увага має приділятися випадкам помилкового трактування користувачами певних даних як подібних, в той час як ці дані характеризують різні сукупності одиниць спостереження, базуються на різних концепціях тощо. 

Для характеристики цього виміру якості використовується такий показник:

- Частка показників, що використовуються як джерела для інших  продуктів;   

Одночасно наводиться інформація, що характеризує ці показники, а також вказуються причини будь-яких розбіжностей з оцінками з інших джерел.

Взаємозалежність вимірів якості

 Доцільна констатація тієї обставини, що виміри якості не є незалежними, вони взаємопов’язані і створюють систему, що вимагає відповідного комплексного підходу до забезпечення належної якості результатів обстежень.

Додатково у цій частині Підсумкового звіту може надаватися інформація щодо взаємозв’язку між окремими вимірами якості, наприклад, між надійністю та своєчасністю. Однобічне поняття якості результатів обстеження як лише високої надійності завжди буде недостатнім для забезпечення їх якості. Так, результати, отримані з високою надійністю, але з суттєвим запізненням, можуть бути взагалі непотрібні користувачам. У зв'язку з цим важливим моментом взаємодії виробників певної статистичної продукції та користувачів є визначення конкретних напрямів покращання якості з урахуванням існуючих об'єктивних залежностей: наприклад, підвищувати надійність оцінювання або скорочувати терміни обробки даних.

У цій частині може наводитися інформація щодо методологічних та технологічних обмежень у забезпеченні вищих рівнів надійності оцінок показників або у скороченні термінів обробки результатів обстежень. Зазначаються напрями удосконалення методології оцінювання показників, підвищення ступеня узгодженості результатів обстежень з наявною зовнішньою інформацією або технології обробки даних, обґрунтовується доцільність (або недоцільність) оцінювання окремих показників та показників по окремих розрізах (у відповідь на замовлення з боку користувачів). Особливо відмічаються випадки недоцільності оцінювання показників по окремих розрізах із застосуванням спеціальних методів та процедур, якщо це може призвести до погіршення характеристик надійності, своєчасності або порівнянності, непропорційного до ступеня покращення характеристик релевантності або узгодженості та ін. (див. також додаток В).

6.2. Огляд методів, що застосовані у вибірковому обстеженні

Зміст цієї частини звіту передбачає надання стислих описів:    

– основних методів, що використовуються для отримання результатів, а також надання пояснень щодо доцільності використання саме цих методів. Обсяг цього опису може бути зменшений за рахунок посилань на інші документи методологічного та методичного характеру, зокрема, на Повний звіт щодо якості;

– характеристики генеральної сукупності та за необхідністю - опису розбіжностей між одиницями спостереження та одиницями, що досліджуються;

– дизайну вибірки, основи вибірки, методів збирання та обробки даних, процедур контролю тощо;

– процедур оцінювання показників, зокрема принципів побудови системи статистичних ваг, їх калібрації, сезонних коригувань результатів обстеження, інших методичних та технологічних процедур;

– процедур вимірювання якості результатів обстеження;

– методів вимірювання ступеня задоволення потреб основних користувачів та ін.

    7. ПОВНИЙ ЗВІТ ЩОДО ЯКОСТІ

Повний звіт з якості містить опис максимально можливої кількості показників та характеристик якості результатів конкретного обстеження по всіх вимірах якості. У цьому звіті також надаються матеріали щодо методів та процедур визначення показників та характеристик якості, а також розміщуються спеціальні аналітичні матеріали щодо якості. Інформація, що має бути наведена як у Повному звіті, так в інших типах звітів щодо якості для конкретного обстеження, в окремих частинах певною мірою дублюється, оскільки у звітах висвітлюються з різним ступенем деталізації одні й ті ж самі виміри якості. У Повному звіті інформація повинна бути найбільш детальною, розгорнутою та повною, з обов’язковим наведенням переліку та визначень основних термінів.

Обсяг Повного звіту залежить від обсягу наявної інформації щодо якості результатів обстеження.

Повні звіти готуються один раз на 3-5 років проведення обстеження. Ці звіти готуються відповідно до найбільшого циклу обстеження, тобто періоду між змінами методології обстеження, дизайну вибірки, зокрема, територіальної, суттєвих змін методології обробки даних та ін.

Формат та повнота надання цього звіту конкретним користувачам може мати певні відмінності залежно від потреб внутрішніх та зовнішніх користувачів.

Характеристики та показники якості, які потенційно можуть бути використані для підготовки Повного звіту щодо якості та інших звітів наведені у розділі 4 цього документу. Ці переліки характеристик та показників розроблені на основі рекомендацій Євростату, досвіду підготовки таких звітів в ОНС Великобританії та з урахуванням практики підготовки методологічних коментарів щодо якості даних обстеження умов життя домогосподарств та економічної активності населення.

         Повний звіт щодо якості повинен розроблятися у двох варіантах: для надання зовнішнім користувачам та для „внутрішнього” використання. Останній має містити певну інформацію найбільш деталізованого рівня, призначену для експертів з питань якості та менеджерів з планування та методології обстеження, і забезпечує можливість поглибленого аналізу якості результатів обстеження та удосконалення його програми.

Звіт складається з двох основних частин:

а) характеристики та показники якості за її вимірами (планові та позапланові), що визначаються за результатами обстеження, та опис відповідних процедур;

б) вся додаткова інформація щодо якості, що характеризує результати обстеження (результати зовнішнього оцінювання окремих аспектів обстеження, оцінки міжнародних та національних експертів, наявна достовірна інформація щодо використання даних користувачами для порівнянь, моделювання та прогнозування). 

ПЕРЕЛІК ПОСИЛАНЬ 

1. Kasprzyk D, Giesbrecht L. Reporting Sources of Error in U.S. Federal Government Surveys//Journal of Official Statistics, Vol.19, No. 4, 2003. – pp.343-363.

2. Methodological documents handbook "How to make a quality report". - Eurostat, Luxembourg, 2003. – 111p.

3. Methodological documents. Standard report. - Eurostat, Luxembourg, 2003. –  19 p.

4. Methodological documents. Glossary. - Eurostat, Luxembourg, 2003. –  10 p.

5. National Household Survey Capability Programme. Non-sampling Errors in Household Surveys: Sources, Assessment and Control. Preliminary version / United Nations Department of Technical Co-Operation for Development and Statistical Office, New York, 1982.

6.  Quality in Statistics. Standard quality indicators. - Eurostat, Luxembourg, 2005. – 28 p.

7.  Darnbrough, J. Summary Quality Report and Basic Quality Information templates for Social Surveys – October 2005. Quality Measurement and Reporting Project on NGROUP1. National Statistics, 2006. – 8 P.

8.  Guidelines for measuring statistical quality. Version 3.0, Office of National Statistics, London, 2006. – 79 P.

9.  Birch J., Latest Key Quality Measures Table. Quality Measurement and Reporting Project on NGROUP1. National Statistics, 2005. – 2 P.

10. Summary Quality Report for Labor Market Data Releases, 2006. – 5 P.

11. Labor Force Survey Performance and Quality Monitoring Report September-November 2005. National Statistics, 2005. – 22 P.

12. Summary Quality Report for Gross Domestic Product (GDP) Data Releases, 2006 – 9 P.

13. Вибіркове спостереження: Термінологічний словник. – К.: НТК статистичних досліджень, 2004. – 140 с.

14. Biemer P.P., Lyberg L.E. Introduction to Survey Quality. -  Wiley-Interscience, 2003.- 402 p.

15. The European Statistical Law. Council Regulation 322/97 of 17 Feb. 1997.

16. Council Regulation (EC) N° 577/98 of 9 March 1998 (OJ L77/3 14.3.1998) (LFS)

17. Витрати і ресурси домогосподарств України у 2005 році (за даними вибіркового обстеження умов життя домогосподарств України). Статистичний збірник. – Київ, Державний комітет статистики України, 2006. – 417 с.

18. Економічна активність населення України 2005.Статистичний збірник. – Київ, Державний комітет статистики України, 2006. – 210 с.

19. Основні сільськогосподарські характеристики домогосподарств у сільській місцевості в 2006 році. Статистичний бюлетень. – Київ, Державний комітет статистики України, 2006. – 73 с.

20. Методологічні положення зі статистики. Вип. 2, т. 2/ Держ. ком. Статистики України. – К.: ІВЦ Держкомстату України, 2006. – 568 с.

Додаток А

 

Приклади надання інформації щодо величин коефіцієнтів варіації при оцінюванні показників за результатами державних вибіркових обстежень економічної активності населення та сільськогосподарської діяльності домогосподарств у сільській місцевості

 

Таблиця А1.

Оцінки надійності показника рівня зайнятості  населення у віці 15-70 років за статтю та місцем проживання у 2005 році

 

Рівень зайнятості населення у віці 15-70 років, у %

Стандартна похибка вибірки (SE), у %

Гранична похибка вибірки, (LSE), у %

Коефіцієнт варіації (CV), у %

І квартал

 

 

 

 

Усього

55,88

0,36

0,71

0,65

у тому числі:

 

 

 

 

Жінки

51,28

0,44

0,85

0,85

Чоловіки

61,03

0,49

0,96

0,81

Міське населення

55,71

0,47

0,91

0,83

Сільське населення

56,24

0,54

1,06

0,97

ІI квартал

 

 

 

 

Усього

57,81

0,33

0,65

0,57

у тому числі:

 

 

 

 

Жінки

53,52

0,36

0,71

0,68

Чоловіки

62,62

0,45

0,88

0,71

Міське населення

56,05

0,43

0,84

0,77

Сільське населення

61,85

0,47

0,92

0,76

ІII квартал

 

 

 

 

Усього

59,99

0,39

0,75

0,64

у тому числі:

 

 

 

 

Жінки

55,30

0,39

0,76

0,71

Чоловіки

65,27

0,50

0,98

0,77

Міське населення

57,93

0,50

0,98

0,86

Сільське населення

64,70

0,54

1,05

0,83

ІV квартал

 

 

 

 

Усього

57,13

0,36

0,70

0,63

у тому числі:

 

 

 

 

Жінки

52,44

0,46

0,90

0,88

Чоловіки

62,38

0,47

0,92

0,75

Міське населення

56,30

0,44

0,86

0,78

Сільське населення

59,01

0,60

1,17

1,02

В середньому за рік

 

 

 

 

Усього

57,70

0,27

0,53

0,47

у тому числі:

 

 

 

 

Жінки

53,14

0,27

0,54

0,51

Чоловіки

62,83

0,34

0,66

0,54

Міське населення

56,50

0,34

0,67

0,61

Сільське населення

60,45

0,41

0,79

0,67

 

 Таблиця А2.

Оцінки середнього розміру площі землі домогосподарств за регіонами за результатами обстеження сільськогосподарської діяльності населення в сільській місцевості у 2006 році

 

Середній розмір площі землі домогосподарств, га

, га

 %

Україна

1,36

0,035

2,57

Автономна Республіка Крим

1,31

0,183

14,01

Вінницька

0,84

0,042

4,97

Волинська

1,75

0,100

5,73

Дніпропетровська

1,63

0,203

12,45

Донецька

1,71

0,296

17,27

Житомирська

0,96

0,039

4,07

Закарпатська

0,97

0,056

5,77

Запорізька

2,28

0,372

16,31

Івано-Франківська

0,98

0,071

7,23

Київська

0,68

0,074

10,83

Кіровоградська

1,87

0,113

6,03

Луганська

1,66

0,371

22,34

Львівська

1,16

0,039

3,38

Миколаївська

2,75

0,292

10,63

Одеська

1,52

0,090

5,91

Полтавська

1,30

0,216

16,68

Рівненська

1,23

0,077

6,24

Сумська

1,04

0,092

8,86

Тернопільська

1,59

0,112

7,04

Харківська

1,58

0,508

32,20

Херсонська

4,34

1,741

40,10

Хмельницька

0,90

0,061

6,81

Черкаська

0,81

0,058

7,12

Чернівецька

1,04

0,077

7,41

Чернігівська

0,99

0,169

17,11

 

Додаток Б

Проект

БАЗОВИЙ ЗВІТ ЩОДО ЯКОСТІ  РЕЗУЛЬТАТІВ ВИБІРКОВОГО ОБСТЕЖЕННЯ УМОВ ЖИТТЯ ДОМОГОСПОДАРСТВ

(приклад для публікації результатів за ІV квартал 2006 року)

 Мета підготовки базового звіту – надання інформації щодо підсумків аналізу якості поточних результатів вибіркового обстеження.  Цей звіт містить головним чином динамічні дані щодо якості результатів, тобто інформацію, яка безпосередньо характеризує результати поточного циклу обстеження (похибки вибірки, рівні участі домогосподарств тощо).

Відмінності квартальних публікацій за результатами обстеження умов життя домогосподарств (ОУЖД) у 2006 році полягають в тому, що, порівняно  з  попередніми  роками, з І кварталу 2006р. введено інформацію щодо кількості домогосподарств, які користувалися послугами Інтернету вдома, з метою гармонізації програми обстеження до системи показників Євростату. 

НАДІЙНІСТЬ

 За результатами ОУЖД у IV кварталі 2006 року розраховані такі характеристики надійності, як граничні похибки вибірки та коефіцієнти варіації для оцінок середньомісячних значень показників: "Грошові доходи", "Грошові витрати", "Сукупні витрати" та "Сукупні ресурси" по Україні в цілому, за типами місця проживання (великі та малі міста, сільська місцевість), за регіонами та економічними районами. Методичні аспекти розрахунків характеристик надійності наведені у Підсумковому звіті щодо якості. Результати розрахунків характеристик надійності оцінок зазначених показників наведені далі у табл. 1-12.

Представлені у таблицях дані свідчать, що отримані оцінки показників є точними для рівня України. Величина коефіцієнта варіації приймає максимальне значення 1,37% для показника “Сукупні ресурси”. Таким чином, оцінка цього показника є надійною (значення коефіцієнту варіації менше 5%). Величина граничної похибки вибірки складає 46,68 грн., тобто з ймовірністю 95% величина показника “Сукупні ресурси” у генеральній сукупності приймає значення в інтервалі 1685,79 – 1779,15 грн.

Дані по домогосподарствах великих, малих міст та сільської місцевості на рівні України також є достатньо точними. Найбільшого значення величина коефіцієнту варіації досягає для показника “Сукупні ресурси” по домогосподарствах, які проживають у великих містах – 2,52%.

Для регіонального рівня в цілому точність оцінок показників, що розгля- даються, є задовільною. Для Автономної Республіки Крим, Донецької, Запорізької, Івано-Франківської, Київської, Луганської, Полтавської, Сумської, Тернопільської, Харківської та Хмельницької областей величина коефіцієнту варіації для всіх показників не перевищує 5%, тобто їх оцінки є надійними. По інших регіонах коефіцієнт варіації майже по усіх показниках не перевищує 10%, крім Чернівецької області по показнику “Грошові доходи”, міста Києва – по показнику “Сукупні ресурси” та міста Севастополя – по показниках “Грошові витрати” та “Сукупні витрати”, де величина коефіцієнту варіації перевищує 10%, тобто їх оцінки придатні головним чином для якісного аналізу. В цілому дані обстеження можуть бути використані для статистичного аналізу на регіональному рівні.

 

Таблиця 1

Характеристика якості оцінки середньомісячного значення показника "Грошові доходи" за результатами обстеження умов життя домогосподарств у IV кварталі 2006 року

 

Грошові доходи домогосподарств за місяць, грн.

Гранична похибка вибірки (LSE), грн.

Коефіцієнт варіації (CV),%

Україна

1539,12

25,02

0,83

Міста (>100 тис.чол.)

1796,44

39,11

1,11

Міста (<100 тис.чол.)

1405,80

38,29

1,39

Сільська місцевість

1294,45

39,32

1,55

 

Таблиця 2

Характеристика якості оцінки середньомісячного значення показника "Грошові витрати" за результатами обстеження умов життя домогосподарств у IV кварталі 2006 року

 

Грошові витрати домогосподарств за місяць, грн.

Гранична похибка вибірки (LSE), грн.

Коефіцієнт варіації (CV),%

Україна

1317,49

33,55

1,30

Міста (>100 тис.чол.)

1609,27

64,94

2,06

Міста (<100 тис.чол.)

1184,87

28,72

1,24

Сільська місцевість

1024,66

38,69

1,93

 

Таблиця 3

Характеристика якості оцінки середньомісячного значення показника  "Сукупні витрати" за результатами обстеження умов життя домогосподарств у IV кварталі 2006 року

 

Сукупні витрати домогосподарств за місяць, грн.

Гранична похибка вибірки (LSE), грн.

Коефіцієнт варіації (CV),%

Україна

1484,59

33,62

1,16

Міста (>100 тис.чол.)

1702,66

64,98

1,95

Міста (<100 тис.чол.)

1336,52

29,14

1,11

Сільська місцевість

1306,24

41,59

1,62

 

Таблиця 4

Характеристика якості оцінки  середньомісячного значення показника "Сукупні ресурси" за результатами обстеження умов життя домогосподарств у IV кварталі 2006 року

 

Сукупні ресурси домогосподарств за місяць, грн.

Гранична похибка вибірки (LSE), грн.

Коефіцієнт варіації (CV),%

Україна

1732,47

46,68

1,37

Міста (>100 тис.чол.)

1934,39

95,72

2,52

Міста (<100 тис.чол.)

1559,56

39,21

1,28

Сільська місцевість

1596,98

44,78

1,43

 

Таблиця 5

Характеристика якості оцінки середньомісячного значення показника "Грошові доходи" за результатами обстеження умов життя домогосподарств у IV кварталі 2006 року  за регіонами

Регіон

Грошові доходи домогосподарств за місяць, грн.

Гранична похибка вибірки (LSE), грн.

Коефіцієнт варіації (CV),%

 Автономна Республіка Крим  

1471,85

110,81

3,84

  Вінницька

1319,74

81,29

3,14

  Волинська

1281,00

169,81

6,76

  Дніпропетровська

1576,64

139,83

4,52

  Донецька

1612,21

99,13

3,14

  Житомирська

1381,72

174,01

6,43

  Закарпатська

1956,49

250,40

6,53

  Запорізька

1502,73

95,99

3,26

  Івано-Франківська

1621,36

126,89

3,99

  Київська

1441,73

127,88

4,53

  Кіровоградська

1159,28

127,23

5,60

  Луганська

1382,07

116,04

4,28

  Львівська

1645,74

108,67

3,37

  Миколаївська

1655,71

211,41

6,51

  Одеська

1468,48

175,23

6,09

  Полтавська

1273,21

63,50

2,54

  Рівненська

1576,14

89,07

2,88

  Сумська

1225,66

69,64

2,90

  Тернопільська

1279,30

82,30

3,28

  Харківська

1583,60

95,13

3,06

  Херсонська

1441,36

211,14

7,47

  Хмельницька

1388,62

122,52

4,50

  Черкаська

1358,92

125,54

4,71

  Чернівецька

1607,88

318,67

10,11

  Чернігівська

1253,39

114,54

4,66

  м.Київ

2445,13

180,64

3,77

  м.Севастополь

1957,61

294,88

7,69

 

 Таблиця 6

Характеристика якості оцінки середньомісячного значення показника "Грошові витрати" за результатами обстеження умов життя домогосподарств у IV кварталі 2006 року за регіонами

Регіон

Грошові витрати домогосподарств за місяць, грн.

Гранична похибка вибірки (LSE), грн.

Коефіцієнт варіації (CV),%

  Автономна Республіка  Крим  

1331,55

102,05

3,91

  Вінницька

1306,43

128,17

5,01

  Волинська

953,33

112,93

6,04

  Дніпропетровська

1388,46

164,96

6,06

  Донецька

1275,71

90,89

3,63

  Житомирська

1150,01

192,08

8,52

  Закарпатська

1613,88

203,39

6,43

  Запорізька

1287,54

95,47

3,78

  Івано-Франківська

1544,39

126,56

4,18

  Київська

1071,75

89,18

4,25

  Кіровоградська

1027,93

96,58

4,79

  Луганська

1050,95

75,61

3,67

  Львівська

1440,08

143,16

5,07

  Миколаївська

1554,71

263,04

8,63

  Одеська

1229,35

123,92

5,14

  Полтавська

1097,92

98,63

4,58

  Рівненська

1161,31

128,46

5,64

  Сумська

1023,03

67,19

3,35

  Тернопільська

1199,86

99,44

4,23

  Харківська

1257,77

113,77

4,62

  Херсонська

1261,32

218,97

8,86

  Хмельницька

1244,45

116,25

4,77

  Черкаська

1179,33

127,48

5,51

  Чернівецька

1306,79

174,72

6,82

  Чернігівська

1151,62

132,92

5,89

  м.Київ

2265,91

423,10

9,53

  м.Севастополь

1837,48

424,36

11,78

 

 Таблиця 7

Характеристика якості оцінки середньомісячного значення показника  "Сукупні витрати" за результатами обстеження умов життя домогосподарств у IV кварталі 2006 року за регіонами

Регіон

Сукупні витрати домогосподарств за місяць, грн.

Гранична похибка вибірки (LSE), грн.

Коефіцієнт варіації (CV),%

  Автономна Республіка Крим  

1388,10

101,45

3,73

  Вінницька

1520,99

126,31

4,24

  Волинська

1240,97

127,32

5,23

  Дніпропетровська

1510,95

168,67

5,70

  Донецька

1380,11

95,28

3,52

  Житомирська

1329,38

204,57

7,85

  Закарпатська

1941,91

219,30

5,76

  Запорізька

1461,21

111,99

3,91

  Івано-Франківська

1806,58

132,60

3,74

  Київська

1248,62

93,65

3,83

  Кіровоградська

1217,24

103,20

4,33

  Луганська

1154,31

79,88

3,53

  Львівська

1617,41

144,93

4,57

  Миколаївська

1751,52

264,72

7,71

  Одеська

1351,20

133,93

5,06

  Полтавська

1351,59

123,96

4,68

  Рівненська

1452,82

127,97

4,49

  Сумська

1252,70

72,18

2,94

  Тернопільська

1444,96

129,69

4,58

  Харківська

1430,54

119,07

4,25

  Херсонська

1412,45

235,07

8,49

  Хмельницька

1441,32

130,01

4,60

  Черкаська

1388,73

141,19

5,19

  Чернівецька

1468,88

175,91

6,11

  Чернігівська

1346,51

133,06

5,04

  м.Київ

2364,46

412,31

8,90

  м.Севастополь

1926,69

425,94

11,28

 

 Таблиця 8

Характеристика якості оцінки  середньомісячного значення показника "Сукупні ресурси" за результатами обстеження умов життя домогосподарств у IV кварталі 2006 року за регіонами

Регіон

Сукупні ресурси домогосподарств за місяць, грн.

Гранична похибка вибірки (LSE), грн.

Коефіцієнт варіації (CV),%

 Автономна Республіка Крим  

1535,44

116,71

3,88

  Вінницька

1565,62

101,15

3,30

  Волинська

1577,57

189,61

6,13

  Дніпропетровська

1720,98

145,21

4,30

  Донецька

1708,86

100,78

3,01

  Житомирська

1560,58

195,97

6,41

  Закарпатська

2322,77

251,87

5,53

  Запорізька

1681,53

101,41

3,08

  Івано-Франківська

1901,66

127,45

3,42

  Київська

1619,87

126,22

3,98

  Кіровоградська

1366,32

192,11

7,17

  Луганська

1506,96

119,87

4,06

  Львівська

1847,61

122,59

3,39

  Миколаївська

1877,51

219,24

5,96

  Одеська

1609,31

184,40

5,85

  Полтавська

1518,00

84,02

2,82

  Рівненська

1867,50

56,58

1,55

  Сумська

1468,80

84,67

2,94

  Тернопільська

1535,05

117,12

3,89

  Харківська

1752,47

98,63

2,87

  Херсонська

1642,44

262,03

8,14

  Хмельницька

1606,79

143,54

4,56

  Черкаська

1546,86

131,75

4,35

  Чернівецька

1771,79

331,77

9,55

  Чернігівська

1490,11

139,06

4,76

  м.Київ

2800,39

584,23

10,64

  м.Севастополь

2040,16

299,51

7,49

По економічних районах отримані оцінки згаданих основних показників є більш надійними, ніж для рівня регіонів. Величина коефіцієнту варіації по всіх показниках не перевищує 5%, крім Центрального економічного району по показниках “Грошові витрати”, “Сукупні витрати” та “Сукупні ресурси”.

Таблиця 9

Характеристика якості оцінки середньомісячного значення показника  "Грошові доходи" за результатами обстеження умов життя домогосподарств  у  IV кварталі 2006 року  за економічними районами

 

Економічний район

Грошові доходи домогосподарств за місяць, грн.

Гранична похибка вибірки (LSE), грн.

Коефіцієнт варіації (CV),%

  Східний

1414,71

51,84

1,87

  Донецький

1530,58

76,17

2,54

  Придніпровський

1481,67

83,21

2,87

  Причорноморський

1523,41

84,17

2,82

  Подільський

1332,78

57,47

2,20

  Центральний

1888,92

95,40

2,58

  Карпатський

1691,40

85,60

2,58

  Поліський

1369,18

72,31

2,69

 

Таблиця 10

Характеристика якості оцінки середньомісячного значення показника "Грошові витрати" за результатами обстеження умов життя домогосподарств  у  IV кварталі 2006  року  за економічними районами

Економічний район

Грошові витрати домогосподарств за місяць, грн.

Гранична похибка вибірки (LSE), грн.

Коефіцієнт варіації (CV),%

  Східний

1159,78

64,12

2,82

  Донецький

1195,99

64,76

2,76

  Придніпровський

1295,93

94,93

3,74

  Причорноморський

1352,58

79,73

3,01

  Подільський

1260,57

72,37

2,93

  Центральний

1653,75

204,38

6,31

  Карпатський

1475,45

80,19

2,77

  Поліський

1113,79

77,41

3,55

 

Таблиця 11

Характеристика якості оцінки середньомісячного значення  показника "Сукупні витрати" за результатами обстеження умов життя домогосподарств у IV кварталі 2006  року за економічними районами

Економічний район

Сукупні ресурси домогосподарств за місяць, грн.

Гранична похибка вибірки (LSE), грн.

Коефіцієнт варіації (CV),%

  Східний

1368,61

70,17

2,62

  Донецький

1300,03

67,87

2,66

  Придніпровський

1444,77

98,57

3,48

  Причорноморський

1472,03

82,56

2,86

  Подільський

1476,59

76,14

2,63

  Центральний

1802,01

199,67

5,65

  Карпатський

1697,98

82,37

2,48

  Поліський

1344,18

81,40

3,09

 

Таблиця 12

Характеристика якості оцінки середньомісячного  значення показника "Сукупні ресурси" за результатами обстеження умов життя домогосподарств у IV кварталі 2006 року  за економічними районами

Економічний район

Сукупні ресурси домогосподарств за місяць, грн.

Гранична похибка вибірки (LSE), грн.

Коефіцієнт варіації (CV),%

  Східний

1621,98

56,81

1,79

  Донецький

1637,25

77,85

2,43

  Придніпровський

1646,89

89,90

2,79

  Причорноморський

1663,13

90,96

2,79

  Подільський

1571,89

70,37

2,28

  Центральний

2151,89

280,43

6,65

  Карпатський

1935,91

90,23

2,38

  Поліський

1612,89

81,68

2,58

Зведена інформація щодо придатності оцінок вищенаведених основних показників ОУЖД для використання за рівнем надійності наведена у табл. 13.  Для зручності використання оцінки показників розподілені на п’ять категорії за рівнем надійності. Якщо коефіцієнт варіації вибіркових оцінок показника приймає значення до 5% включно, то показник відноситься до групи “А”, тобто до групи показників з високим рівнем надійності, 6–10%  – до групи “Б”  з достатнім рівнем надійності, 11 – 15% - до групи “В” з задовільним рівнем надійності, 16 - 25% - до групи  “Г”  з низьким рівнем надійності   (дані придатні лише для якісного аналізу), більше 25% - до групи “Д” (дані мають незадовільний рівень надійності).

Таблиця 13

Категорії надійності оцінок середньомісячних величин основних показників за результатами ОУЖД у ІV кварталі 2006  року

 

Грошові доходи

Грошові витрати

Сукупні витрати

Сукупні ресурси

Україна

А

А

А

А

Міста (>100 тис.чол.)

А

А

А

А

Міста (<100 тис.чол.)

А

А

А

А

Сільська місцевість

А

А

А

А

Регіони:

 

 

 Автономна Республіка Крим  

А

А

А

А

  Вінницька

А

Б

А

А

  Волинська

Б

Б

Б

Б

  Дніпропетровська

А

Б

Б

А

  Донецька

А

А

А

А

  Житомирська

Б

Б

Б

Б

  Закарпатська

Б

Б

Б

Б

  Запорізька

А

А

А

А

  Івано-Фpанківська

А

А

А

А

  Київська

А

А

А

А

  Кіpовогpадська

Б

А

А

Б

  Луганська

А

А

А

А

  Львівська

А

Б

А

А

  Миколаївська

Б

Б

Б

Б

  Одеська

Б

Б

Б

Б

  Полтавська

А

А

А

А

  Рівненська

А

Б

А

А

  Сумська

А

А

А

А

  Тернопільська

А

А

А

А

  Харківська

А

А

А

А

  Херсонська

Б

Б

Б

Б

  Хмельницька

А

А

А

А

  Черкаська

А

Б

Б

А

  Чернівецька

Б

Б

Б

Б

  Чернігівська

А

Б

Б

А

  м.Київ

А

Б

Б

В

  м.Севастополь

Б

В

В

Б

Економічні райони:

 

 

 

 

  Східний

А

А

А

А

  Донецький

А

А

А

А

  Придніпровський

А

А

А

А

  Причорноморський

А

А

А

А

  Подільський

А

А

А

А

  Центральний

А

Б

Б

Б

  Карпатський

А

А

А

А

  Поліський

А

А

А

А

В обстеженні у ІV кварталі 2006р. взяли участь 10499 домогосподарств (81,6% відібраних адрес без урахування нежилих приміщень). Рівень участі в обстеженні сільських домогосподарств (93,7%) перевищував відповідний показник по міських  (75,9%). Найвищий рівень участі домогосподарств в обстеженні у IV кварталі 2006р. був у Закарпатській (98,1%), Чернігівській (96,6%), Волинській (96,0%), Рівненській (95,2%), Чернівецькій (95,1%) та Вінницькій (94,7%) областях, найнижчий – у м. Києві (55,7 %), в Одеській області (56,7%) та у м. Севастополі (67,2%). У більшості областей цей показник становив від 71,1% до 93,2%.

Дані щодо участі домогосподарств в обстеженні за підсумками четвертого квартального інтерв’ю наведені у табл. 14.

 Таблиця 14

Кількість відібраних домогосподарств та рівні участі в обстеженні

 

Кількість домогосподарств, що підлягали обстеженню (без урахування нежилих приміщень)

Рівень участі домогосподарств в обстеженні, незважений, %

Із загальної кількості відібрано адрес по регіонах:

 

 

Автономна Республіка Крим

500

87,8

Вінницька

453

94,7

Волинська

299

96,0

Дніпропетровська

973

77,4

Донецька

1 168

71,1

Житомирська

360

86,7

Закарпатська

315

98,1

Запорізька

528

81,6

Івано-Франківська

325

93,2

Київська

434

82,0

Кіровоградська

340

89,4

Луганська

699

78,3

Львівська

610

92,3

Миколаївська

343

90,4

Одеська

675

56,7

Полтавська

469

86,8

Рівненська

294

95,2

Сумська

329

92,4

Тернопільська

278

87,8

Харківська

755

76,0

Херсонська

358

85,8

Хмельницька

377

84,6

Черкаська

413

88,1

Чернівецька

244

95,1

Чернігівська

385

96,6

м.Київ

814

55,7

м.Севастополь

128

67,2

 

В ОУЖД щорічно спостерігається тенденція зниження рівня участі домогосподарств в обстеженні протягом річного циклу обстеження, який складається з Основного інтерв’ю (проводиться під час першого контакту з відібраними респондентами) та чотирьох квартальних обстежень (див. рис.1). При цьому, як видно з даних, наведених на рис.2, за період 2000-2006рр. рівень  участі домогосподарств в обстеженні в цілому підвищувався.

 

Рис.1. Частка домогосподарств, які прийняли участь в обстеженні протягом 2006р. (після виключення нежилих приміщень)

 

Рис.2. Частка  домогосподарств, які прийняли участь в обстеженні у IV кварталі 2000-2006рр. (після виключення нежилих приміщень)

 

Одночасно зі збільшенням частки відібраних домогосподарств, які прийняли участь в ОУЖД, протягом 2000-2006рр. спостерігається також тенденція до зменшення рівня відмов від участі в обстеженні (див. рис. 3). Це пояснюється позитивним впливом заходів з навчання працівників, які проводять опитування домогосподарств, з питань сприяння підвищенню участі респондентів в обстеженні, а також вдосконаленням системи контролю роботи цих працівників.

 

 

Рис. 3. Зміна частки  домогосподарств, які не прийняли участь в обстеженні у IV кварталі, протягом 2000-2006рр. за причинами

 

Аналогічна тенденція щодо зменшення частки домогосподарств які не прийняли участь в обстежені спостерігається для всіх типів місцевості (табл.15, 16).

 

Таблиця 15

Частка  домогосподарств, які відмовились від участі в обстеженні у IV кварталі

 

2000 р.

2001 р.

2002 р.

2003 р.

2004 р.

2005 р.

2006 р.

Велике місто

26,1

24,6

24,7

21,3

22,0

20,2

17,5

Мале місто

12,9

10,6

9,7

8,8

7,8

7,2

6,3

Сілська місцевість

7,4

5,6

5,3

4,0

3,5

2,4

2,2

 

Таблиця 16

Частка  домогосподарств, які не прийняли участь в обстеженні з інших причин (стан здоров'я, від'їзд тощо)

 

2000 р.

2001 р.

2002 р.

2003 р.

2004 р.

2005 р.

2006 р.

Велике місто

9,0

12,5

11,4

11,6

13,0

12,3

13,6

Мале місто

7,9

9,8

10,1

9,2

8,2

7,2

6,8

Сілська місцевість

6,2

6,9

6,3

5,2

5,1

4,4

4,1

 Рівень імпутації (рівень заповнення пропущених значень ознак) по основних показниках є незначним і не перевищував декількох відсотків. При цьому, наприклад, по показнику „Витрати на оплату послуг” він складав 1,7%, а по показнику „Витрати на продукти харчування” – 1,6%.

 

СВОЄЧАСНІСТЬ ТА ПУНКТУАЛЬНІСТЬ

Період між закінченням четвертого квартального обстеження у 2006 році та датою публікації бюлетеня за його результатами складає 18 тижнів. Доступ до публікацій та інших матеріалів, в т.ч. мікроданих, які готуються за результатами ОУЖД, надається одночасно для всіх категорій користувачів.

Графік публікацій наведено на сайті Держкомстату (www.ukrstat.gov.ua). 

УЗГОДЖЕНІСТЬ

Однією з характеристик узгодженості показників, розрахованих за результатами ОУЖД та за даними інших джерел інформації, є результати співставлення показників заробітної плати, визначених у системі національних рахунків (СНР) та в ОУЖД (табл. 17). Результати порівняння зазначених показників свідчать, що співвідношення їх величин  не перевищує 115,7 % (у ІІІ кварталі ця величина становила 103,5 %).

 

Таблиця 17

Порівняння оцінок окремих показників за результатами ОУЖД та за даними СНР 

Показник

ІV кв. 2006 р.

Співвідношення показників, %

Заробітна плата в середньому за місяць на одного члена домогосподарства, грн. (ОУЖД)

334,0

 115,7

Заробітна плата за виключенням податку з доходів найманих працівників та обов’язкових внесків на соцстрах у середньому за місяць на одну особу, грн. (СНР)

386,4

Різниця величин наведених показників пояснюється розбіжністю методологічних засад їх вимірювання (джерела інформації, методи та методики  обчислення тощо).

Більш детальна інформація щодо методологічного забезпечення вимірювання якості результатів ОУЖД наведена у Підсумковому звіті щодо якості цього обстеження. В зазначеному звіті наводиться також коротка характеристика основних методів, що застосовуються на різних етапах проведення ОУЖД.

Додаток В

Проект

ПІДСУМКОВИЙ ЗВІТ ЩОДО ЯКОСТІ  РЕЗУЛЬТАТІВ ВИБІРКОВОГО ОБСТЕЖЕННЯ УМОВ ЖИТТЯ ДОМОГОСПОДАРСТВ

 

ПЕРЕДМОВА

           Мета підготовки підсумкового звіту - надання інформації, що характеризує якість даних, яка не залежить від результатів конкретного циклу обстеження умов життя домогосподарств (ОУЖД), а визначається його методологією, процедурами обробки даних та оцінювання показників тощо. У цьому звіті характеристики якості результатів ОУЖД наводяться за основними вимірами якості, рекомендованими Євростатом. 

1. ПІДСУМКИ АНАЛІЗУ ЯКОСТІ

 

1.1. Релевантність

 Релевантність – це ступінь, з яким статистичні дані відповідають поточним та потенційним потребам користувачів. Релевантність також стосується питань повноти розробки всіх необхідних статистичних даних, а також ступеня відповідності потребам користувачів концепцій, визначень, класифікацій і т.д., які використовуються

Явище, що спостерігається

Життєвий рівень населення: структура доходів та витрат домогосподарств, умови проживання населення, диференціація рівня добробуту, соціально-демографічні характеристики домогосподарств тощо 

Періодичність

Щоквартально з 1999 року

Дизайн вибірки

Щоквартально обстежується близько 10,5 тисяч неінституційних домогосподарств. Застосовується повна щорічна ротація вибірки домогосподарств. Територіальна вибірка діє протягом 5 років, і побудована як імовірнісна, стратифікована, багатоступенева, з використанням механізму відбору територіальних одиниць з імовірністю, пропорційною розміру

Основа вибірки

У міських поселеннях – матеріали Всеукраїнського перепису населення 2001 року, у сільській місцевості – матеріали Погосподарського обліку в розрізі адміністративно – територіального поділу. Основа вибірки домогосподарств щорічно актуалізується перед реалізацією процедури відбору

Обробка даних

Регіональний рівень:  введення в ПЕОМ первинних даних обстеження.

Центральний рівень: основні етапи обробки даних: чищення, редагування, імпутація, агрегування  даних з різних інструментів обстеження, формування зведених масивів даних для подальшого розрахунку показників 

Оцінювання показників

Розраховуються прямі оцінки показників для генеральної сукупності із застосуванням системи статистичних ваг, побудованих для врахування імовірностей відбору домогосподарств, рівнів участі  респондентів в обстеженні та узгодження результатів обстеження з якісною зовнішньою інформацією

 Обстеження умов життя домогосподарств здійснюється на постійній основі, базується на загальноприйнятих міжнародних стандартах і відповідає сучасній соціо-демографічній та економічній ситуації в Україні. Це комплексне дослідження, яке об’єктивно відображає вплив на життєвий рівень домогосподарств основних процесів соціально-економічного розвитку України. Результати обстеження мають потужний аналітичний потенціал.

Програма обстеження включає систему показників, яка враховує зміни, пов’язані з переходом економіки до ринкових відносин, та нову технологію збору та розробки отриманої інформації, що значно розширює можливості щодо проведення комплексного аналізу даних.

Основною метою ОУЖД є забезпечення інформаційної бази для комплексного дослідження рівня матеріального добробуту різних соціальних груп населення України.

Цілі проведення обстеження:

- отримання характеристики рівня життя населення в цілому та окремих соціальних груп;

- спостереження за диференціацією населення за рівнем добробуту;

- визначення структури фактичних витрат населення, необхідної для здійснення розрахунків індексу споживчих цін;

- визначення соціо-демографічних характеристик домогосподарств у періоди між переписами населення;

- забезпечення інформаційної бази для досліджень бідності, ефективності та адресності заходів щодо соціального захисту найбільш вразливих верств населення та інших актуальних питань.

Дані обстеження широко використовуються на національному, міжнародному та регіональному рівнях. Основні користувачі інформації ОУЖД на центральному рівні: комітети Верховної Ради України, Адміністрація Президента України, Кабінет Міністрів України, міністерства, відомства, інші органи центральної виконавчої влади, профспілки, громадські організації, наукові установи, навчальні заклади, бібліотеки, міжнародні організації та ін. Результати й аналітичні матеріали обстеження використовуються також у засобах масової інформації, підприємцями та громадськістю. Основні результати обстеження наводяться на Інтернет-сторінках Держкомстату України та регіональних управлінь статистики.

Ступінь відповідності результатів ОУЖД потребам користувачів оцінювався шляхом обговорень та анкетних опитувань, які здійснювалися під час проведення нарад. Основною метою цих опитувань було визначення думки користувачів щодо сучасного стану, перспектив розвитку цього статистичного спостереження та ступеню релевантності його результатів. За даними останнього такого опитування, яке проводилося серед учасників наради "Обстеження умов життя домогосподарств: аналітичні можливості, проблеми та перспективи" у липні 2005 року  близько двох третин респондентів в цілому оцінили сучасну програму та систему показників обстеження як "дуже добре", або "добре", решта користувачів вважала їх задовільними.  

1.2. Надійність

Надійність (точність) – ступінь близькості розрахованих оцінок показників до дійсних (точних) значень показників.

Надійність даних ОУЖД визначається дією багатьох факторів, які призводять до виникнення двох груп похибок – похибок вибірки та невибіркових похибок. Головним джерелом похибок вибірки є специфіка вибіркових обстежень, яка полягає в обстеженні лише спеціально відібраної частини генеральної сукупності, а також власне дизайн вибірки. Характеристиками похибок вибірки при оцінюванні показників за результатами вибіркових обстежень населення є стандартна похибка, гранична похибка та коефіцієнт варіації оцінювання основних показників.

Основними джерелами невибіркових похибок є неповне охоплення генеральної сукупності, відмови респондентів від обстеження або від відповіді на окремі запитання, похибки вимірювання, похибки обробки даних обстеження, похибка моделювання при оцінюванні показників тощо.

Для підвищення рівня надійності та зменшення можливого негативного впливу окремих джерел похибок на різних етапах ОУЖД реалізується система різноманітних заходів, серед яких: щорічна актуалізація списків адрес домогосподарств для відбору, навчання фахівців з інтерв’ювання та контроль якості їх роботи, контроль якості всіх етапів обробки даних ОУЖД, застосування процедур імпутації відсутніх даних та коригування статистичних ваг для зменшення впливу відмов від обстеження тощо.

Результати розрахунків характеристик надійності наводяться у Базовому звіті щодо якості результатів ОУЖД за відповідний раунд обстеження.

1.3. Своєчасність та пунктуальність

Своєчасність характеризує інтервал часу між моментом (періодом), у який відбувалося явище або процес, що описують статистичні дані, та датою готовності (надання) цих даних.

Пунктуальність характеризує проміжок часу між запланованою та фактичною датами підготовки даних. Наприклад, запланованою датою може бути дата, відображена у затверджених планах виконання робіт, анонсована або узгоджена з користувачами дата тощо)

Своєчасність і пунктуальність характеризуються часовими інтервалами і датами, але вони надають опис різних процесів. Своєчасність результатів обстеження відображає проміжок часу між датою закінчення підготовки даних (датою надання їх користувачам) і датою (періодом) реалізації події, явища або процесу, які описуються даними. Чим коротший цей період, тим вище своєчасність.  Пунктуальність характеризує проміжок часу між фактичною датою надання даних користувачам і визначеною датою, на яку їх потрібно було надати, з посиланням на дати, анонсовані в офіційних документах, наприклад, у плані державних статистичних спостережень.

Часові інтервали підготовки тематичних публікацій за результатами ОУЖД наведені у табл. 1.

 

 

Таблиця 1

Інтервали часу між закінченням періоду обстеження та датою отримання результатів (ОУЖД, 2006 р.)

 

         Статистичні бюлетені та збірники

Проміжок часу між закінченням періоду обстеження та датою публікації, тижні

Соціально-демографічні характеристики домогосподарств України (щорічний збірник)

28

Витрати і ресурси домогосподарств України (щорічний збірник)

26

Витрати і ресурси домогосподарств України (квартальний бюлетень)

18

Стан здоров’я населення (щорічний збірник)

20

Наявність в домогосподарствах товарів тривалого користування (щорічний збірник)

20

Самооцінка домогосподарствами України рівня своїх доходів (щорічний збірник)

21

Одночасно з підготовкою матеріалів для публікацій результатів ОУЖД готуються файли мікроданих, які надаються користувачам з дотриманням встановлених умов щодо збереження конфіденційності даних.

Крім того, з встановленою періодичністю за матеріалами результатів ОУЖД готуються економічні доповіді з питань витрат і ресурсів домогосподарств за І квартал, І півріччя та за 9 місяців, які надаються користувачам у визначеному порядку та розміщуються на сайті Держкомстату. Інтервал часу між закінченням періоду обстеження та датою підготовки відповідної доповіді становить 18 – 19 тижнів.  

Графік підготовки публікації результатів ОУЖД, який затверджений планом державних статистичних спостережень, дотримується.        

1.4. Доступність та ясність

Доступність характеризує фізичні умови, за наявності яких користувачі можуть отримати доступ до статистичних даних: способи та місця отримання даних, процедури замовлення, час, необхідний для виконання замовлень, політика ціноутворення, існуючі маркетингові умови (авторське право та ін.), формати, в яких дані можуть бути надані користувачам (паперові носії, електронні носії, Інтернет та ін.), наявність макро- та мікроданих тощо.

Ясність характеризує інформаційне середовище даних: наявність та якість метаданих, що надаються зі статистичними даними (текстова інформація, пояснення, документація та ін..), ілюстрації (графіки, карти, схеми та ін.), наявність пояснень щодо якості даних (включаючи обмеження у використанні); ступінь додаткового супроводу даних статистичними органами.

Результати ОУЖД надаються користувачам в паперовому вигляді (публікації - бюлетені та збірники), електронному вигляді, а також у вигляді мікрофайлів (файлів мікроданих), тобто детальних знеособлених індивідуальних підсумків обстеження по кожному домогосподарству. Користувачам доступна вся інформація, що отримується за результатами обстеження, але з урахуванням обмежень, пов’язаних з дотриманням вимог забезпечення конфіденційності первинної інформації. Таким чином, проблеми забезпечення конфіденційності результатів деякою мірою обмежують доступність даних ОУЖД. Разом з тим Держкомстатом України забезпечено оптимальну, тобто найбільшу можливу доступність даних ОУЖД з дотриманням принципу конфіденційності інформації.

Контакти для отримання додаткової інформації щодо результатів обстеження, відповідного методико – методологічного забезпечення, а також  довідок щодо умов поширення результатів ОУЖД такі:

адреса: 01023, м.Київ, МСП, вул. Шота Руставелі, 3

телефони: 234-01-34, 235-31-22, 234-32-13, 287-12-11

факс: 235-37-39

електронна пошта: [email protected];

[email protected]

[email protected]

в Інтернеті:http://www.ukrstat.gov.ua

Щорічно за результатами обстеження готуються такі публікації:

•    статистичні збірники: “Соціально-демографічні характеристики домогосподарств України”, "Витрати і ресурси домогосподарств України” (окремі публікації в цілому за рік, в розрізі регіонів (27) та економічних районів (8)), “Самооцінка населенням стану здоров’я  та рівня доступності окремих видів медичної допомоги”, “Наявність в домогосподарствах товарів тривалого користування”, “Самооцінка домогосподарствами України рівня своїх доходів”

•    статистичні бюлетені: "Витрати і ресурси домогосподарств України” (щоквартально).

Повний перелік видань результатів ОУЖД та стислий опис їх змісту наведено в щорічній публікації Держкомстату України "Каталог статистичних видань" та на сайті в Інтернеті: 

http://ukrstat.org/control/uk/localfiles/display/druk/katalog/kat_u/cat17_u.htm

Наприкінці усіх публікацій наведені методологічні пояснення щодо програми ОУЖД, оцінки якості даних, а також  методичні пояснення щодо основних термінів та системи показників. Відповідно до діючого порядку у паперовому вигляді згідно з затвердженими реєстрами готується певна кількість публікацій, які надаються безкоштовно органам законодавчої, виконавчої влади, профспілкам, профільним науковим установам та навчальним закладам, а також у бібліотеки за обов'язковим переліком розсилки.

Основні підсумки обстеження також містяться в аналітичних доповідях, що періодично публікуються у щомісячному статистичному бюлетені Держкомстату “Соціально-економічне становище в Україні”, розсилаються основним користувачам та знаходяться на сайті Держкомстату України за адресою: http://ukrstat.org/control/uk/localfiles/display/operativ/oper_new.html#amid.

Кількість поширених за реєстрами на центральному рівні у 2006 році публікацій (бюлетенів, збірників та доповідей) наведена у табл. 2.

  

Таблиця 2.

Кількість публікацій, підготовлених за результатами ОУЖД та поширених у 2006 році

Статистичні бюлетені та збірники

примірників

Соціально-демографічні характеристики домогосподарств України у 2006 році

90

Витрати і ресурси домогосподарств України у 2005 році

100

Витрати і ресурси домогосподарств України у І кв. 2006 р.

80

Витрати і ресурси домогосподарств України у ІІ кв. 2006 р.

75

Витрати і ресурси домогосподарств України у ІІІ кв. 2005 р.

81

Витрати і ресурси домогосподарств України у ІV кв. 2005 р.

80

Самооцінка населенням стану здоров’я  та рівня доступності окремих видів медичної допомоги

75

Наявність в домогосподарствах товарів тривалого користування

72

Самооцінка домогосподарствами України рівня своїх доходів

85

Доповіді

 

Соціально-демографічні характеристики домогосподарств України у 2006 році

40

Витрати і ресурси домогосподарств України у І кв. 2006 р.

31

Витрати і ресурси домогосподарств України у І півріччі 2006 р.

30

Витрати і ресурси домогосподарств України за 9 міс. 2005 р.

30

Соціально-економічне становище домогосподарств Україні у 2005 році

50

Самооцінка населенням стану здоров’я  та рівня доступності окремих видів медичної допомоги

25

Самооцінка домогосподарствами України рівня своїх доходів

20

На регіональному рівні здійснюється видання аналогічних публікацій.

Крім того, підсумки обстеження наводяться у “Статистичному щорічнику України” та у короткому статистичному довіднику "Україна у цифрах".

На сайті Держкомстату України (http://www.ukrstat.gov.ua/) для користувачів також доступні основні результати ОУЖД в динаміці та відповідні методологічні пояснення за наступними напрямами:

- Витрати та ресурси домогосподарств (1999-2006рр.)

- Характеристика домогосподарств (1999-2007рр.)

- Структура сукупних витрат домогосподарств (1999-2006рр.)

- Структура сукупних ресурсів домогосподарств (1999-2006рр.)

- Розподіл населення за рівнем середньодушових сукупних витрат (1999-2006рр.)

- Диференціація життєвого рівня населення (1999-2006рр.)

- Споживання продуктів харчування в домогосподарствах (1999-2006рр.)

- Наявність у домогосподарствах окремих товарів тривалого користування (2000-2006рр.)

Методологічні та методичні аспекти організації ОУЖД та обробки його результатів більш детально викладені у відповідних методологічних документах [1].
Окремі методологічні положення наведені також на сайті Держкомстату України за адресою: http://ukrstat.org/control/uk/localfiles/display/metod_polog/titul.html#sod

Мікродані обстеження надаються користувачам у вигляді мікрофайлів. Можлива підготовка мікрофайлів як по домогосподарствах, так і по членах домогосподарств. Одночасно з мікрофайлами надається їх опис. Мікрофайли доступні користувачам на спеціальних умовах.

Умови поширення результатів ОУЖД, як і надання іншої статистичної інформації, наведені на сайті Держкомстату України за адресою: http://ukrstat.org/control/uk/localfiles/display/work/unsi.htm.

1.5. Порівнянність

Порівнянність спрямована на вимірювання впливу відмінностей у статистичних концепціях та визначеннях, які застосовуються, на співставність статистичних даних за географічними районами, негеографічними доменами або у часі. Це ступінь, з яким розбіжності між статистичними даними пояснюються розбіжностями між дійсними значеннями статистичних характеристик.

Порівнянність даних є результатом дії цілого ряду чинників. Основні чинники, що визначають порівнянність певних показників, оцінених за результатами обстежень, можуть бути об’єднані у дві групи: концепції обстеження та методологія вимірювання.

Група концепцій вибіркового обстеження включає такі елементи, як система показників (їх зміст, визначення), одиниці спостереження, генеральна сукупність, основа вибірки, звітний період та періодичність обстежень, географічне охоплення, міжнародні та національні стандарти, що застосовуються в обстеженні тощо. 

Група методології включає дизайн вибірки, методи збору та обробки даних,  оцінювання показників та ін.

Порівнянність даних значною мірою залежить від мети співставлення і, таким чином, не може бути гарантовано заздалегідь виробниками даних. При здійсненні порівнянь результатів обстеження за географічними районами, доменами або у часі слід мати на увазі наступне.

ОУЖД проводиться Держкомстатом України з 1 січня 1999 року. Разом з тим, починаючи з 2004 року, обстеженням охоплені мешканці усіх гуртожитків (сімейних, студентських тощо). У 1999-2003 роках обстежувалися лише мешканці сімейних гуртожитків.

Починаючи з 2002 року, статті споживчих грошових та сукупних витрат розроблені з урахуванням міжнародної класифікації індивідуального споживання за цілями (COICOP–HBS)1, рекомендованої Євростатом.

У новій територіальній вибірці на 2004-2008 роки представлена значно більша кількість територій: усі 490 районів (без районів у містах) проти 190 - у вибірці 1999-2003 років, усі міста з чисельністю 80 тисяч осіб і більше (у попередній територіальній вибірці - усі міста з чисельністю 100 тисяч осіб і більше). Всього для проведення обстеження у 2004-2008 роках відібрано 225 міст (у 1999-2003 роках - 195). Обсяг щорічної вибірки домогосподарств для обстеження умов їх життя зріс з 12534 до 12977. Мережа працівників, які проводять обстеження населення (домогосподарств), становить, починаючи з 2004 року, 966 осіб (у 1999-2003 роках - 510 осіб).

Методологія ОУЖД, основні визначення та концепції, які застосовуються в цьому обстеженні, відповідають прийнятим у міжнародній статистичній практиці вимогам та стандартам.

При здійсненні порівнянь результатів обстеження слід враховувати необхідність здійснення спеціального контролю рівня надійності даних (коефіцієнти варіації, граничні похибки вибірки) при їх використанні на регіональному рівні або для окремих груп населення та ін.

1.6. Узгодженість

Узгодженість – ступінь, з яким дані, отримані з різних джерел можуть адекватно комбінуватись, інтегруватись та використовуватись для різних цілей. Зміст цього виміру полягає в тому, що статистичні дані, що характеризують одне й те саме явище, але отримані за результатами різних обстежень (обстежень різного типу і періодичності), можуть бути не повністю узгодженими, оскільки основані на різних методологічних підходах, класифікаціях тощо. 

Узгодженість даних ОУЖД з іншими (зовнішніми) даними передбачає можливість їх обґрунтованого комбінування, інтеграції, об’єднання з цими даними на основі відповідних статистичних методів і для різних використань. Узгодженість даних відображає проблему можливості порівняння (комбінування) показників, що характеризують, як правило, однакові або дуже близькі цільові сукупності, але отримані на основі різних джерел даних.

Статистичні дані за результатами різних раундів ОУЖД є, в цілому, узгодженими і можуть надійно комбінуватись.

Для вирішення питання щодо узгодженості даних ОУЖД із зовнішніми даними необхідно мати два масиви даних (мікродані або агреговані на певному рівні), що характеризують одне й те саме явище, та метадані, що відповідають зазначеним даним (опис концепцій, визначень, класифікацій, методологічного та методичного забезпечення та ін.).

Основні концепції та визначення, що використовуються в ОУЖД, у цілому узгоджені з аналогічними концепціями та визначеннями, що застосовуються в системі національних рахунків та в таких галузевих статистиках, як демографічна статистика, статистика праці, соціальна статистика, статистика сільського господарства, цін, торгівлі, послуг. Приклади порівнянь окремих показників, оцінених за результатами  ОУЖД та за даними інших статистик, наведені у Базовому звіті щодо якості за відповідний період.

Методологія формування вибірок та оцінювання показників ОУЖД у цілому узгоджена з обстеженнями економічної активності населення та обстеженням сільськогосподарської діяльності домогосподарств в сільській місцевості. Крім того, в зазначених трьох обстеженнях вимірюється система гармонізованих (за змістом, методологією оцінювання) показників, яка включає, зокрема, такі показники, як статево – вікові характеристики, шлюбний стан, освітній рівень членів домогосподарств, розмір та склад домогосподарств тощо.

Результати ОУЖД використовуються в якості джерел інформації у системі національних рахунків, в статистиках, як соціальна статистика, статистика сільського господарства, цін, торгівлі, послуг, а також є інформаційною базою для моніторингу бідності, який координується Мінпраці України.

При формуванні вибірки, а також при обробці даних та оцінюванні показників в ОУЖД використовуються дані демографічної статистики, перепису населення, соціальної статистики та статистики сільського господарства.

2. ОГЛЯД МЕТОДІВ, ЩО ЗАСТОСОВАНІ ДЛЯ ОТРИМАННЯ РЕЗУЛЬТАТІВ ОБСТЕЖЕННЯ УМОВ ЖИТТЯ ДОМОГОСПОДАРСТВ

ОУЖД започатковано на постійній основі з 1999 року. Починаючи з 2004 року, в органах державної статистики впроваджена нова система організації проведення вибіркових обстежень населення (домогосподарств). Створена єдина уніфікована мережа статистиків, які проводять одночасно три  вибіркових обстеження населення: умов життя домогосподарств, економічної активності населення та сільськогосподарської діяльності домогосподарств у сільській місцевості. Одночасно з формуванням уніфікованої мережі статистиків, у зв’язку із закінченням терміну дії попередньої вибірки територій, була впроваджена нова загальнодержавна територіальна імовірнісна вибірка для проведення трьох вибіркових обстежень у 2004–2008 роках.

ОУЖД здійснюється на окремій мережі респондентів (неінституційних домогосподарств). Щороку для участі в цьому обстеженні відбирається 12977 домогосподарств, які представляють всі регіони України (в тому числі у міській місцевості – 8975, у сільській місцевості – 4002).

Формування вибірки здійснено на основі процедури стратифікованого багатоступеневого відбору [1, 2]. Процедура формування вибірки складається з таких основних етапів:

1) виключення територій, що не можуть бути обстежені;

2) виключення населення, яке не підлягає обстеженню;

3) стратифікація генеральної сукупності;

4) відбір територіальних одиниць;

5) відбір домогосподарств.

При здійсненні розрахунків чисельності населення, яке підлягає обстеженню, з чисельності постійного населення було виключено інституційне населення – військовослужбовці строкової служби; особи, які знаходяться у місцях позбавлення волі; особи, які постійно проживають у будинках-інтернатах, будинках для осіб похилого віку тощо. Крім того, вибіркова сукупність не репрезентує маргінальні прошарки населення (безпритульні тощо). Також була виключена із чисельності населення України і відповідних областей чисельність населення, що проживає у населених пунктах, розташованих у зоні відчуження (І зона) та зоні безумовного (обов’язкового) відселення (ІІ зона) на території, яка зазнала радіоактивного забруднення внаслідок Чорнобильської катастрофи.

У міській місцевості процедура формування вибірки складається з трьох, у сільській – з двох ступенів (див. рис. 1).

Основними відмінностями побудови вибірки для обстежень 2004–2008рр. у порівнянні з вибіркою, діючою у 1999–2003рр., є наступні:

- поріг саморепрезентативності у міській місцевості знижено з 118 тис. осіб до
80 тис. осіб, що забезпечило збільшення кількості міст (міськрад) у новій вибірці до 225 (у попередній вибірці – 195 міст (міськрад));

- у сільській місцевості до територіальної вибірки включені всі 490 районів (раніше обстежувалися лише 190 випадково відібраних районів);

- в якості основи вибірки для відбору міських територіальних одиниць використана нова інформаційна база – дані Всеукраїнського перепису населення 2001р.;

- в обстеження включені мешканці усіх типів гуртожитків (сімейних, студентських тощо). У 1999–2003рр. обстежувалися лише мешканці сімейних гуртожитків.

Примітка. Сірим кольором виділена частина вибірки, яка змінюється щорічно.

 

Рис. 1. Схема формування вибірки для державних вибіркових обстежень населення України у 2004−2008 роках, в т.ч. – для обстеження умов життя домогосподарств

 Для поширення результатів ОУЖД на все населення України розраховується система статистичних ваг [1, 3]. Статистичні ваги призначені для врахування при оцінюванні показників імовірностей включення домогосподарств до вибірки та фактичних рівнів їх участі в обстеженні, узгодження результатів обстеження із зовнішньою інформацією, зокрема, з даними демографічної статистики щодо чисельності та статево-вікової структури населення, даними соціальної статистики щодо чисельності та розміщення інституціонального населення тощо.

З метою наближення результатів вибіркового обстеження до наявної зовнішньої інформації та підвищення рівня надійності оцінок показників, які вимірюються шляхом вибіркового спостереження, до статистичних ваг була застосована процедура калібрації. Для вибіркового ОУЖД процедура калібрації передбачає коригування системи статистичних ваг з метою узгодження певних показників обстеження з інформацією двох зовнішніх джерел:

1) даними демографічної статистики станом на початок звітного року щодо:

· чисельності постійного населення за регіонами та типами місцевості;

· статево-вікової структури населення за регіонами в розрізі наступних вікових груп:

- жінки у віці до 18 років;

- чоловіки у віці до 18 років;

- жінки у віці 18-35 років;

- чоловіки у віці 18-35 років;

- жінки у віці 36-54 роки;

- чоловіки у віці 36-59 років;

- жінки у непрацездатному віці;

- чоловіки у непрацездатному віці.

2) даними статистичної звітності щодо населення, яке знаходиться в інституційних закладах.

При аналізі якості оцінок показників, побудованих на основі даних вибіркового обстеження, вирішальне значення для правильної інтерпретації результатів та для контролю оптимальності дизайну вибірки має інформація про величину похибки вибірки. Величиною цієї похибки визначаються межі довірчих інтервалів при побудові інтервальних оцінок показників – інтервалів можливих значень показників за даними вибіркового обстеження. Оцінка показника, для якого величина похибки вибірки є значною у порівнянні з величиною самої оцінки, не може бути використана при аналізі результатів обстеження.

Похибка вибірки розраховується як стандартна похибка SE на підставі величини оцінки дисперсії значень показника та об’єму вибірки n за формулою:

                                                            ,                                      (1)

де дисперсія  характеризує варіацію значень показника по одиницях вибірки.

Для вибірок зі складним дизайном, якою є, зокрема, вибірка для обстеження умов життя домогосподарств, величина  може бути розрахована на основі класичної формули для дисперсії ознаки y при простому випадковому відборі:

,                            (2)

 

де  – значення ознаки для i-го домогосподарства (наприклад, якщо y – грошовий дохід, то  – грошовий дохід конкретного домогосподарства з вибірки);

      – середнє значення ознаки для вибіркової сукупності;

     deff – параметр, який відображає вплив дизайну вибірки на величину дисперсії ознак (дизайн-ефект).

Для визначення дисперсій, стандартних похибок та величини дизайн-ефекту для вибірок зі складним дизайном, частіше за все використовуються спеціалізовані розрахункові методи. При аналізі якості даних ОУЖД застосовується реплікаційний метод збалансованих повторних дублювань (balanced repeated replications – BRR), який реалізований у стандартному пакеті програм WesVarPC. Цей метод полягає в тому, що повна вибірка домогосподарств розподіляється на шари, у кожному з яких містяться по два кластери (дві групи домогосподарств). Окремі реплікації – напіввибірки, будуються шляхом випадкового відбору по одному кластеру з кожного шару. Розрахунок дисперсії ознаки здійснюється на підставі порівняння оцінок по реплікаціях. Для використання цього методу побудовані системи шарів для загальнодержавного та регіонального рівнів, а також – для рівня економічних районів.

Найбільш наочно характеризують якість даних вибіркових обстежень наступні показники: гранична похибка вибірки LSE та коефіцієнт варіації CV  (або відносна стандартна похибка вибірки RSE).

Величина граничної похибки вибірки LSE визначає межі довірчого інтервалу для оцінки показника. Вона розраховується за формулою:

 

                                                     LSE = t× SE,                                             (3)

 

де – довірче число (квантиль нормального розподілу або квантиль розподілу ймовірностей), визначає співвідношення граничної та стандартної похибки при даній ймовірності p (p – ймовірність того, що похибка вибірки для оцінки показника не перевищить величину LSE). Типові значення t, які застосовуються при аналізі даних вибіркових обстежень: 0,67 (для p = 0,50); 1,28 (для p = 0,80); 1,64 (для p = 0,90);1,96 (для p = 0,95); 2,58 (для p = 0,99).

Гранична похибка вибірки використовується для побудови довірчих границь оцінок (границь довірчих інтервалів). Наприклад, для побудови нижньої  та верхньої  довірчих границь інтервальної оцінки середнього значення використовуються формули:

 

                                               =  - LSE;     =+ LSE.                              (4)

 

Коефіцієнт варіації  розраховується за формулою:

 

 (%)                                      (5)

 

Коефіцієнт варіації  часто використовується як показник придатності даних для аналізу. Так, якщо £ 5%, то оцінка вважається надійною, якщо 5%<  £10% – оцінка є придатною для кількісного аналізу, але її надійність недостатньо висока, якщо 10%££25% – оцінка придатна лише для якісного аналізу і її слід використовувати обережно (але іноді публікують дані, для яких досягає 30% і навіть 40%).

Слід відмітити, що як для рівня країни, так і для більшості регіонів оцінки показників, отримані за матеріалами річного періоду обстеження, мають більшу точність, ніж за даними окремих періодів.

Питання отримання надійних оцінок показників для “малих” територій при проведенні вибіркових обстежень гостро стоїть перед статистичними організаціями практично всіх країн. До “малих” відносяться території, обсяг вибіркової сукупності по яких не дозволяє отримати надійні статистичні оцінки показників. Для ОУЖД ця проблема стосується практично майже всіх регіонів. Одним із шляхів її вирішення є застосування методу об’єднання “малих” територій у “великі”. Після об’єднання для кожної “малої” території використовуються більш надійні оцінки показників, отримані для відповідної “великої” території.

Певним кроком у вирішенні зазначених проблем є підготовка результатів ОУЖД не тільки для національного рівня та рівня регіонів, а й для рівня економічних районів (груп регіонів).

Крім надання відомостей щодо граничної похибки вибірки та коефіцієнта варіації для оцінок зведених показників для уявлення щодо потенційної надійності даних ОУЖД, особливо в розрізі окремих груп домогосподарств, таблиці публікації з питань витрат і ресурсів домогосподарств містять рядок: “Довідково: кількість обстежених домогосподарств”. Загальновідомо, що зі збільшенням кількості обстежених домогосподарств надійність та точність отриманих оцінок показників підвищується.

Також для інформування щодо надійності оцінювання певних показників у публікаціях наводяться дані щодо кількості домогосподарств, які повідомили про конкретний вид витрат.

Для підвищення надійності оцінок показників, що отримуються за результатами ОУЖД, Держкомстат України здійснює систему заходів з навчання працівників, які проводять опитування домогосподарств, зокрема, в частині питань сприяння підвищенню участі респондентів в обстеженні, а також вдосконалює організаційно – методологічні підходи до контролю роботи цих працівників [4, 5].

 

ПЕРЕЛІК ПОСИЛАНЬ

1. Методологічні положення зі статистики. Вип. 2, т. 2/ Держ. ком. Статистики України. – К.: ІВЦ Держкомстату України, 2006. – 568 с.

2. Методологічні основи формування вибіркових сукупностей для проведення органами державної статистики України базових державних вибіркових обстежень населення (домогосподарств)

http://ukrstat.gov.ua/control/uk/localfiles/display/metod_polog/sdg/page_3.htm

3. Методика розрахунку системи статистичних ваг для поширення результатів державного вибіркового обстеження умов життя домогосподарств на генеральну сукупність

http://ukrstat.org/control/uk/localfiles/display/metod_polog/sdg/page_1.htm

4. Методика організації контролю якості роботи фахівців з інтерв'ювання. Затверджена наказом Держкомстату України від 18.07 2006 р. №335. –  59 c.

5. Порядок здійснення контролю роботи фахівців з інтерв’ювання з питань обстеження умов життя домогосподарств. Затверджений наказом Держкомстату України від 12.01 2007 р. №4. – 70 c.