ЗАТВЕРДЖЕНО

Наказ Державного комітету статистики України
29.12.2010   № 537

 

Методологічні положення щодо підготовки звітів

з якості даних річного вибіркового структурного обстеження малих підприємств

 

Передмова

Метою Методологічних положень є побудова стандартних звітів з якості, які дозволять порівнювати якість даних структурного обстеження малих підприємств у часі, а також з якістю аналогічних даних європейських країн.

Методологічні положення розроблені на виконання заходів із реалізації Стратегії розвитку державної статистики на період до 2012 року.

Метою звіту з якості в структурній статистиці малих підприємств є надання користувачам інформації про якість результатів річного структурного вибіркового обстеження малих підприємств.

У контексті цих методологічних положень якість може бути означена як сукупність рис та характеристик вихідних статистичних даних та/або послуг, що надає можливість задовольняти наявні або передбачені потреби споживачів.

Якість статистичних даних значною мірою зумовлює обґрунтованість прийняття управлінських рішень органами влади та суб’єктами підприємницької діяльності, є підставою для формування статистичного мислення у суспільстві, сприяє довірі до статистики. Інформація про якість статистичних даних потрібна користувачам для розуміння ними переваг та обмежень щодо використання даних, а також для того, щоб вони могли правильно їх інтерпретувати. Вона також є важливою при здійсненні відповідних міжнародних порівнянь. Інформування користувачів про якість даних є важливим елементом взаємовигідних стосунків статистики і суспільства, яке в ній зацікавлене. Якщо з’являються сумніви стосовно якості статистичних даних, падає довіра до організації, яка їх виробляє, та страждає її репутація як незалежного, об’єктивного джерела якісної інформації. Тому гарантування якості є однією з головних проблем при підготовці даних офіційної статистики.

Виробництво статистичних даних високої якості залежить від оцінювання якості як статистичних даних, так і процесів їхнього виробництва. Виконання систематичних робіт з оцінювання якості є необхідною умовою забезпечення контролю якості процесів виробництва даних, а з іншого – передумовою для інформування користувачів про якість статистичних даних. Результати виконання процедур оцінювання якості документуються у вигляді звітів з якості. Звіти з якості, які охоплюють сферу оцінювання якості процесів виробництва статистичних даних, є орієнтованими на виробників цих даних, тоді як звіти з якості, що містять опис якості статистичних даних, призначені передусім для користувачів цих даних. Методологічні положення охоплюють лише побудову звітів з якості статистичних даних, не торкаючись оцінювання якості процесів їхнього виробництва.

 

1. Загальні положення

Звітування з якості – це підготовлення та поширення на постійній чи нерегулярній основі звітів, які містять інформацію щодо якості статистичного продукту.

У звіті з якості надається інформація щодо основних характеристик якості статистичного продукту. Звіти з якості мають базуватися на індикаторах, які надають користувачеві чітку уяву про якість статистичного продукту.

Стандартні звіти з якості – це такі звіти з якості, що мають уніфіковану (не змінну у часі) структуру, чітко визначений набір критеріїв якості та їхніх індикаторів і характеристик. Стандартні звіти з якості виробляють з метою забезпечення порівняння якості даних різних статистичних спостережень, відслідковування якості даних в динаміці, а також міжнародних порівнянь.

1.1. Основні визначення та терміни

Вибіркова сукупність (вибірка) – сукупність одиниць, відібраних із генеральної сукупності за певними правилами, що забезпечують репрезентативність вибірки, для безпосереднього обстеження.

Вибіркове спостереження – статистичне спостереження, під час якого реєструються не всі елементи статистичної сукупності, а лише певна їх частина, відібрана у випадковому порядку.

Вибірковий метод – система правил відбору одиниць у вибірку і способів характеристики сукупності обстежених одиниць. Вибірковий метод дає змогу розповсюдити висновки, отримані на основі вивчення частини сукупності (вибірки) на всю сукупність (генеральну).

Вибіркові похибки – похибки, які виникають внаслідок випадковості відбору елементів для обстеження і пов’язаних із цим розбіжностей між структурами вибіркової та генеральної сукупностей щодо ознак, які вивчають.

Генеральна сукупність (основа вибірки) – сукупність усіх активних статистичних одиниць із заданими характеристиками, які планується вивчити й досліджувати при проведенні статистичного спостереження у наступному році.

Дисперсія оцінки показника характеризує варіацію оцінки за реплікатами (повторними вибірками з однієї і тієї ж сукупності).

Довірчий інтервал значення показника – це інтервал, що покриває реальне значення показника з певною ймовірністю.

Домен – це підсукупність одиниць генеральної сукупності, для якої необхідно оцінити деякі статистичні показники. У структурному обстеженні малих підприємств доменами є сукупності підприємств за видами економічної діяльності, регіонами.

Доступність статистичних продуктів показує, наскільки легко користувачі можуть отримати дані. Вона визначається фізичними умовами, за якими користувачі можуть отримати статистичні дані: способи та місця отримання даних, процедури замовлення, час, необхідний для виконання замовлень, політика ціноутворення, існуючі маркетингові умови (авторське право та ін.), формати, в яких дані можуть бути надані користувачам (паперові носії, електронні носії, CD-ROM, Інтернет та ін.), наявність макро- та мікроданих тощо.

Загальна похибка спостереження – це середня квадратична похибка (MSE), яка визначається за формулою: MSE = дисперсія + зміщення2.

Зіставність/Узгодженість двох або більше статистичних продуктів показує, наскільки у статистичних процесах, у рамках яких вони вироблялися, використовували однакові концепції, класифікації, визначення і сукупності, що вивчаються, а також гармонізовані методи. Послідовні статистичні продукти дозволяється об’єднувати і використовувати спільно.

Зміщення – це розбіжність між середньою величиною показника, обчисленою за всіма реплікатами (повторними вибірками з однієї і тієї ж сукупності), і реальним значенням цього показника.

Зрозумілість/Ясність статистичних продуктів показує, наскільки легко користувачі можуть зрозуміти дані. Вона характеризує інформаційне середовище даних: наявність та якість метаданих, що надаються зі статистичними даними (текстова інформація, пояснення, документація та ін.), ілюстрації (діаграми, мапи, схеми та ін.), наявність пояснень щодо якості даних (включаючи обмеження у використанні) та відомості про те, наскільки виробник готовий надати додаткову допомогу (супровід даних).

КВЕД –  Національний класифікатор ДК 009:2005 "Класифікація видів економічної діяльності" (КВЕД), розроблений на заміну державного класифікатора ДК 009:96 "Класифікація видів економічної діяльності"; прийнято та надано чинності наказом Держспоживстандарту України № 375 від 26.12.2005р.

КОАТУУ – Державний класифікатор ДК 014-97 "Класифікатор об’єктів адміністративно-територіального устрою України"; затверджено та введено в дію наказом Держстандарту України від 31.10.97 № 659 (із змінами та доповненнями).

Коефіцієнт варіації – це відносна стандартна похибка, яка визначається шляхом ділення стандартної похибки в абсолютній величині на очікуване значення оцінки показника.

Малі підприємства – суб’єкти малого підприємництва - юридичні особи, які визнані такими відповідно до законодавства.

Невибіркові похибки – це похибки, які виникають з причин, що є непов’язаними з випадковим відбором одиниць для обстеження, зокрема через недоліки основи вибірки, наявність невідповідей, навмисне чи ненавмисне викривлення даних інтерв’юером чи респондентом, невдалі формулювання питань у анкеті та пояснення в інструкції щодо її заповнення, неправильну організацію обстеження, недоліки введення, передачі, редагування та кодування даних тощо.

Невідповідь – відсутність даних за деякими чи усіма показниками запитальника у обстеженні.

Нетипові одиниці – одиниці спостереження, для яких значення цільової ознаки (у структурному спостереженні малих підприємств – обсягу реалізованої продукції) значно відрізняється від інших одиниць у сукупності (страті, домені).

Основа вибірки – упорядкована множина одиниць первинної сукупності, з якої здійснюється відбір одиниць для обстеження. Основа вибірки нерозривно пов’язана з одиницею відбору, її можна визначити як перелік, список одиниць відбору. Якщо одиниця відбору збігається з одиницею спостереження (як це є у структурному обстеженні малих підприємств), то основа вибірки адекватна генеральній сукупності.

Повна невідповідь – відсутність даних щодо одиниці обстеження.

Послідовність/Порівнянність є окремим випадком узгодженості, коли статистичні продукти відносяться до тих самих об’єктів даних, а мета їх об'єднання – зробити порівняння у часі або за регіонами, або за іншими сферами діяльності.

Похибки вимірювання – це похибки, що виникають під час збирання даних і призводять до реєстрації значень показників, що відрізняються від реальних.

Похибки оброблення – це похибки, що виникають на етапі оброблення даних, тобто під час проведення перевірок, редагування, кодування, імпутації, похибки в специфікації та впровадженні систем, необхідних для проведення обстеження та отримання результатів, похибки в автоматизованому зчитуванні даних тощо.

Похибки охоплення – це похибки, що виникають через викривлення між основою вибірки та цільовою сукупністю (надохоплення, недоохоплення та подвійний рахунок).

Похибки, спричинені відсутніми відповідями (похибки невідповідей) – це різниця між показниками, обчисленими за повними даними, та за даними, що містять невідповіді.

Пунктуальність характеризує інтервал часу між датою публікації даних і датою, на яку планували їхній випуск і яку було заздалегідь анонсовано.

Релевантність показує ступінь задоволення поточних та потенційних потреб користувачів у статистичних даних. Вона свідчить про те, чи всі необхідні статистичні дані розроблені і якою мірою поняття, що використовуються (визначення, класифікації та ін.), відображають потреби користувачів.

Своєчасність характеризує інтервал часу між моментом (періодом), у який відбувалося явище або процес, що описують статистичні дані, та датою готовності (подання) цих даних.

Стандартна похибка – це корінь з дисперсії оцінки показника.

Стратифікована вибірка – вибірка, що передбачає попередній розподіл основи вибірки на однорідні групи (страти) і відбір із кожної з них певної кількості одиниць. Стратифікована вибірка рівнозначна ряду випадкових вибірок із менших сукупностей (страт), якщо в кожній із них одиниці відбирають випадковим порядком. Відбір одиниць у кожній із утворених страт виконують або за допомогою простого випадкового, або систематичного відбору.

Точність/Надійність показує ступінь наближеності розрахунку або оцінок до точного або дійсного значення.

Цільова сукупність – це сукупність одиниць спостереження, що складає об’єкт дослідження і підлягає статистичному вивченню.

Часткова невідповідь – відсутність відповідей на окремі запитання анкети від обстежуваної одиниці.

Якість – це сукупність рис та характеристик вихідних статистичних даних та/або послуг, що надає можливість задовольняти наявні або передбачені потреби споживачів.

 

 

1.2. Перелік позначень

 

– кількість одиниць у генеральній сукупності

– кількість одиниць у вибірці, обсяг вибірки

H

– кількість страт

номер страти

розмір генеральної сукупності у страті h

– кількість одиниць вибірки у страті h

– значення обсягу реалізованої продукції для i-тої одиниці в страті h

середнє значення обсягу реалізованої продукції в страті h

– середньоквадратичне відхилення обсягу реалізованої продукції в страті h

w

– вибіркова вага

– коефіцієнт варіації

– домен

 

2. Основні критерії та індикатори якості

Євростат  рекомендує  застосовувати   такі  критерії  якості  статистичної  продукції: 1) відповідність/релевантість;    2) точність/надійність;    3) своєчасність;    4) пунктуальність;  5) доступність та зрозумілість/ясність; 6) послідовність/порівнянність; 7) зіставність/узгод-женість. Відповідно до методологічного документу Євростату “Визначення якості ЄСС”, останніх п’яти принципів Кодексу норм Європейської статистики та “Принципів діяльності органів державної статистики України”, які були розроблені та затверджені наказом Держкомстату від 14.06.2010 № 216, критерії якості об’єднані у п’ять компонент якості (табл. 1). Для кожної компоненти Євростат розробив індикатори якості, кількість яких є незначною, оскільки в цей набір входять лише найбільш важливі індикатори [10, 12].

 

Таблиця 1

Індикатори якості статистичних продуктів,

рекомендовані Євростатом для відображення у звітах з якості

 

Компонента якості

Індикатор якості

Назва

Код

1

Відповідність/

Релевантність

Рівень доступних результатів спостереження

Індекс задоволеності користувачів

Проміжок часу, що минув від останнього опитування користувачів

R1

US1

US2

2

Точність/

Надійність

Коефіцієнт варіації

Рівень надохоплення

Рівень неузгодженостей при редагуванні

Рівень відповідей

Рівень повних відповідей

Рівень імпутації

Кількість помилок за типами

Середній обсяг перевірок

А1

А2

А3

А4

А5

А6

А7

А8

3

Своєчасність та пунктуальність

Проміжок часу між закінченням звітного періоду та датою оприлюднення перших результатів

Проміжок часу між закінченням звітного періоду та датою оприлюднення остаточних результатів

Пунктуальність публікацій

Т1

 

Т2

 

Т3

4

Доступність та Зрозумілість/

Ясність

Кількість розсилок та/або проданих публікацій за видами

Кількість відвідувань онлайн баз даних

Рівень повноти метаданих

АС1

АС2

АС3

5

Послідовність/

Порівнянність та Зіставність/

Узгодженість

Довжини порівнянних часових рядів

Асиметрія показників дзеркальної статистики

СС1

СС2

При описуванні компонентів якості використовуються як індикатори якості, які є кількісними показниками, так і словесні описи (характеристики якості).

3. Типи звітів з якості

Звіти з якості поділяють на базові, підсумкові та повні. Базові та підсумкові звіти з якості призначені передусім для користувачів, тоді як повні звіти орієнтуються здебільшого на виробників статистичної інформації. Тому Методологічні положення обмежуються базовим та підсумковим звітами з якості.

Базовий звіт з якості – це динамічна інформація щодо основних характеристик якості результатів вибіркового обстеження, яка оновлюється для кожної публікації результатів і публікується (поширюється) разом з нею. Він містить поточну інформацію щодо найбільш важливих критеріїв якості. Базовий звіт з якості має уніфікований стандартизований формат та зміст як для зовнішніх, так і для внутрішніх користувачів. Цей звіт може містити посилання на основні джерела більш детальної інформації щодо якості результатів спостереження (веб-сайт Держкомстату, де розміщено підсумковий звіт з якості, методологічні та методичні документи щодо спостереження та ін.). Обсяг цього звіту, як правило, не перевищує 5 сторінок.

Зазвичай цей звіт подається разом з первинними результатами спостереження і має таку структуру:

1. Вступна частина;

2. Опис якості за основними компонентами (табл. 2):

відповідність/релевантність;

точність/надійність;

своєчасність і пунктуальність.

Таким чином, базовий звіт з якості складається з вступної частини, де описуються особливості спостереження та надаються посилання на підсумковий звіт, якщо такий передбачено, та опису якості за найбільш важливими компонентами, опис яких має бути максимально коротким.

Підсумковий звіт з якості – це більш детальна інформація щодо якості, яка містить опис змін методів, що застосовуються у вибірковому обстеженні, або методів вимірювання якості. Обсяг такого звіту має складати близько 15 сторінок. Цей звіт публікується окремо від результатів обстеження, а також розміщується на веб-сайті Держкомстату. Підсумковий звіт з якості може готуватися у двох форматах: в уніфікованому стандартному форматі для зовнішніх та внутрішніх користувачів, а також за запитами окремих користувачів (зовнішніх або внутрішніх) – у розширеному за окремими критеріями якості форматі.

Підсумковий звіт з якості має ширші межі ніж базовий і повинен містити інформацію щодо всіх основних критеріїв якості. Складається він, зазвичай, для підсумкових даних і має таку структуру:

1. Вступна частина.

2. Опис якості за компонентами (табл. 2):

відповідність/релевантність;

точність/надійність;

своєчасність і пунктуальність;

доступність і зрозумілість/ясність;

послідовність/узгодженість і зіставність/порівнянність;

конфіденційність, прозорість та захист.

3. Опис методології спостереження.

Оскільки статистичною інформацією користуються, зокрема, респонденти спостереження, то поряд із основними критеріями якості в підсумковому звіті з якості корисно наводити відомості щодо забезпечення конфіденційності статистичних даних.

 


 

Таблиця 2

Опис основних компонент якості за типами звітів з якості

Компонента якості

Звіт з якості

Базовий

Підсумковий

1

Відповідність/

Релевантність

короткий опис і класифікація користувачів

опис і класифікація користувачів;

опис результатів спостереження (основні показники, домени, звітний період та ін.);

означення цільових статистичних концепцій (сукупність, визначення одиниці спостереження і формули агрегування) та відмінності між застосованими концепціями та очікуваними з боку користувачів;

опис потреб користувачів в цілому та за доменами, протиріч між потребами окремих груп користувачів та встановлених пріоритетів;

посилання на документи, в яких потреби користувачів описуються більш детально;

методи одержання інформації про користувачів, їх потреби та ступінь задоволеності;

характеристика ступеня задоволеності потреб користувачів у цілому та за групами користувачів та основні причини випадків, коли високий ступінь задоволеності не був досягнутий;

кількість або питома вага недоступних результатів спостереження у порівнянні з доступними;

опис причин неповноти статистичних результатів та шляхи вирішення цієї проблеми в майбутньому;

опис заходів, що проводились для більш повного забезпечення потреб користувачів, та запланованих на майбутнє заходів;

кількість публікацій в паперовому та електронному форматах;

кількість звернень користувачів до відповідних веб-сторінок та завантажень доступних статистичних продуктів;

опис основних індикаторів релевантності.

2

Точність/

Надійність

коефіцієнти варіації основних показників спостереження;

категорії надійності основних показників спостереження;

рівень повних відповідей / невідповідей;

рівень часткових відповідей / невідповідей

Загальний опис надійності:

перелік стандартів та нормативно-правових документів, з якими узгоджена використана при оцінюванні надійності методологія;

ідентифікація основних джерел похибок цільових змінних;

оцінка загальної похибки обстеження;

опис типів похибок, які могли виникнути в обстеженні, та заходів щодо їх зниження;

орієнтовна оцінка зміщення (якщо воно є).

Вибіркові похибки:

опис методів, які використовувались для оцінювання дисперсії;

коефіцієнти варіації в цілому та за доменами (видами економічної діяльності та регіонами). Можна доповнити стандартними похибками та довірчими інтервалами;

опис використаних категорій надійності;

опис методів виділення нетипових одиниць, які застосовувались при оцінюванні.

Невибіркові похибки:

величина та ступінь можливого впливу на результати похибок охоплення (недоохоплення, надохоплення, подвійного рахунку);

опис методології побудови основи вибірки, періодичність її актуалізації та посилання на документи, які описують її більш детально;

опис використаних класифікацій;

заходи щодо зниження похибок охоплення;

опис інших похибок основи вибірки та методів їх виявлення;

опис ризиків виникнення похибок вимірювання;

результати проведення спеціальних спостережень щодо виявлення похибок вимірювання (якщо такі мали місце);

опис заходів щодо зниження рівня похибок вимірювання;

посилання на форму звітності обстеження;

рівень неузгодженостей при редагуванні;

визначення, формули обчислення рівнів відповідей/невідповідей;

рівні відповідей/невідповідей у цілому та за доменами (видами економічної діяльності та регіонами);

рівні повних відповідей/невідповідей у цілому та за доменами (видами економічної діяльності та регіонами);

методи компенсації відсутніх відповідей;

вплив методів компенсації відсутніх відповідей на результати;

заходи щодо зниження рівня невідповідей;

кількість невідповідей за причинами виникнення;

опис основних етапів оброблення даних;

методи виявлення та компенсації похибок на етапі редагування;

оцінки похибок оброблення за типами;

заходи щодо зниження похибок оброблення;

інші індикатори надійності.

3

Своєчасність та пунктуальність

проміжок часу між закінченням звітного періоду та датою оприлюднення результатів

посилання на документи, що визначають графік оприлюднення даних;

проміжок часу між закінченням звітного періоду та датою оприлюднення первинних результатів;

проміжок часу між закінченням звітного періоду та датою оприлюднення остаточних результатів;

пунктуальність публікацій;

причини, що пояснюють непунктуальність публікацій (якщо вона мала місце).

4

Доступність та Зрозумілість/

Ясність

кількість розсилок та/або проданих публікацій за видами;

кількість відвідувань онлайн баз даних;

загальний опис інформації (метаданих), що супроводжує статистичні показники (документація, пояснення, обмеження якості та ін.);

рівень повноти метаданих;

опис виконаних та запланованих покращень доступності та ясності результатів спостереження;

короткий опис оберненого зв’язку з користувачами щодо доступності та ясності.

5

Послідовність/Порівнянність та Зіставність/

Узгодженість

короткий опис усіх концептуальних та методологічних елементів метаданих, що можуть впливати на узгодженість та порівнянність;

оцінка (якщо така можлива) впливу кожної повідомленої відмінності на значення результатів;

рівень відмінностей із європейськими стандартами;

довжини порівнянних часових рядів (як додатковий показник – їх кількість);

звітні періоди, у яких були розриви рядів, їхні причини та методи змикання рядів;

кількісна оцінка порівнянності між регіонами, що базується на (зваженій) кількості відмінностей між елементами метаданих (якщо відмінності існують);

результати порівняння з основою системи національних рахунків і оберненим зв’язком з національними рахунками щодо узгодженості та питань надійності.

 

4. Вступна частина

У вступній частині надається:

коротка історична довідка, мета та завдання спостереження;

короткий опис спостереження та статистичних даних, які є його предметом;

основні зміни, які відбулися, та їх причини;

найбільш важливі питання щодо якості даних, які є предметом звіту з якості;

для базового звіту з якості наводяться посилання на підсумковий звіт з якості, якщо такий передбачається;

посилання на документи, з якими пов'язаний звіт з якості, наприклад, з методиками щодо проведення спостереження. Посилання на документи, які пов’язані з конкретними критеріями якості, надаються у відповідних розділах звіту з якості.

5. Опис якості за компонентами

5.1. Відповідність/Релевантність

Відповідність/Релевантність - статистичні дані повинні задовольняти поточні та потенційні потреби користувачів [8].

Відповідність/Релевантність показує ступінь задоволення поточних та потенційних потреб користувачів у статистичних даних. Вона свідчить про те, чи всі необхідні статистичні дані розроблені та якою мірою поняття, що використовуються (визначення, класифікації та ін.), відображають потреби користувачів.

Насамперед необхідно встановити, хто є користувачами, і дізнатися, які їхні очікування. Звіт з якості також повинен містити інформацію щодо незадоволених потреб користувачів, причин, через які певні потреби не можуть буди задоволені, та запланованих заходів для задоволення потреб більш повно в майбутньому.

Індикатор якості R1. Основним індикатором, що відображає відповідність/релевантність, за рекомендаціями Євростату є рівень доступних результатів спостереження, що розраховується як відношення кількості статистичних показників, які можуть бути обчисленими, до кількості бажаних показників (які визначені у Регламенті Європарламенту та Ради Міністрів ЄС № 295/2008 від 11.03.08 – для міжнародних порівнянь всередині ЄС, та в національних нормативно-правових документах стосовно структурної статистики підприємств). Якщо при спостереженні різні ознаки мають неоднакову важливість, то при розрахунку цього показника необхідно використовувати зважування компонент. Обчислення цього індикатора можливе за умови наявності відповідного нормативно-правового документа.

При описуванні та класифікації користувачів наводять типи користувачів та їхню кількість за типами. Додатково наводиться інформація про кількість звернень користувачів до відповідних веб-сторінок і завантажень доступних статистичних продуктів. Ця інформація також використовується для оцінювання типів та кількості користувачів.

Під потребами користувачів розуміють не тільки перелік необхідних даних, їхньої періодичності, рівнів та розрізів, деталізації, а й вимоги до їхньої надійності, своєчасності, умов та форматів розповсюдження, метаданих, необхідних для інтерпретації результатів, і зв’язків з іншими даними. Таким чином, потреби користувачів охоплюють усі компоненти якості статистичної інформації, проте відповідність/релевантність передусім. Потреби користувачів також описують за їхніми типами.

Для характеристики ступеня задоволеності потреб користувачів у цілому та за групами користувачів проводять спеціальні опитування користувачів.

Індикатор якості US1. Індекс задоволеності користувачів – це ступінь задоволеності користувачів наданим продуктом та послугами. Цей індикатор обчислюється за типами користувачів. Обчислення можливе за умови проведення спеціальних обстежень користувачів.

Індикатор якості US2. Проміжок часу, що минув від останнього опитування користувачів використовується за налагодженої системи спеціальних обстежень користувачів.

 

 

 

 

5.2. Точність/Надійність

Точність/Надійність - статистичні дані повинні бути точними та достовірними [8].

Точність/Надійність показує ступінь наближеності розрахунку або оцінок до точного або дійсного значення.

У результаті проведення статистичного обстеження отримують значення статистичних показників генеральної сукупності. В силу різних причин ці значення не співпадають із реальними значеннями, тому їх називають оцінками, а процес їх обчислення – оцінюванням. Близькість оцінок статистичних показників їхнім реальним значенням свідчить про надійність статистичної інформації.

Щоб охарактеризувати надійність, розглядають обернені до неї показники та характеристики. Такими показниками є загальна (сумарна) похибка спостереження та похибки, які є її складовими. Це означає, що статистична інформація з низькою надійністю матиме високі значення загальної похибки і, навпаки, надійна інформація матиме незначну похибку. Характеристики надійності розглядатимуться в наступних розділах.

Розглянемо коротко типи похибок, які можуть виникнути в статистичному обстеженні. Передусім зазначимо, що похибки можуть бути систематичними та випадковими. Перші призводять до зміщення оцінки, другі – до її дисперсії. Теоретично зміщення та дисперсію визначають із припущення, що обстеження проводиться велику кількість разів. Кожне таке обстеження називається реплікацією, а набір значень ознаки для конкретної реплікації реплікатом0. Тоді зміщення визначається як розбіжність між середньою величиною показника, обчисленою за всіма реплікатами, і реальним значенням цього показника. Дисперсія оцінки показника характеризує варіацію оцінки за реплікатами. Оскільки на практиці обстеження проводиться лише один раз, то точно визначити зміщення та дисперсію неможливо, проте існують методи для їхнього оцінювання (див. далі).

Наразі не існує загальноприйнятої класифікації похибок. На рис.1 зображена лише одна з таких класифікацій – за джерелами походження. За цією класифікацією похибки поділяються на невибіркові (похибки, непов’язані з вибіркою) та вибіркові (похибки репрезентативності). Для суцільного обстеження властиві лише невибіркові похибки, тоді як для вибіркового – як невибіркові, так і вибіркові. Зміщення та дисперсії можуть бути спричинені вибірковими та/або невибірковими похибками.

Вибіркові похибки виникають через те, що у вибіркових обстеженнях здійснюється відбір для обстеження лише частини сукупності. Вибіркова похибка відображає той факт, що оцінка може бути іншою, коли відбирається інша вибірка, за інших незмінних умов.

Невибіркові похибки – це похибки, які виникають з причин, що є непов’язаними з випадковим відбором одиниць для обстеження, зокрема через недоліки основи вибірки, наявність невідповідей, навмисне чи ненавмисне викривлення даних статистиком чи респондентом, невдалі формулювання питань у анкеті та пояснення в інструкції щодо її заповнення, неправильну організацію обстеження, недоліки введення, передачі, редагування та кодування даних тощо. Вони включають: похибки охоплення, похибки, спричинені відсутніми відповідями, похибки вимірювання, похибки оброблення та похибки методології.

Похибки моделювання зазвичай не розглядають як окремий тип похибок. В основному моделі використовуються саме для того, щоб зменшити інші похибки. Тобто вони є похідним типом похибок і  не розглядаються окремо.

 

 

Рис. 1. Типи похибок за джерелами походження

Виходячи з наведеної типізації похибок можна запропонувати таку структуру опису надійності у звіті з якості:

1.      Загальний опис надійності.

2.      Вибіркові похибки.

3.      Невибіркові похибки:

3.1 похибки охоплення;

3.2 похибки, спричинені відсутніми відповідями;

3.3 похибки вимірювання;

3.4 похибки оброблення.

Крім того, опис надійності обов’язково має супроводжуватись методологічними поясненнями, навіть у тому випадку, коли методологія подається окремим розділом звіту з якості чи окремим документом, на який у звіті з якості є посилання.

Загальний опис надійності

Передусім необхідно запевнити користувачів, що при оцінюванні надійності статистичної інформації були використані нормативи та стандарти, які гарантують найкращі методи оцінювання.

Далі необхідно описати основні джерела похибок та ризики виникнення різних типів похибок для цільових змінних.

У структурному обстеженні малих підприємств застосовуються лише незміщені оцінки показників вибірки, тому зміщення, пов’язаного з вибіркою, немає. Цей факт необхідно відобразити у звіті з якості.

Крім того, необхідно надати оцінку загальної похибки. Загальна похибка – це середня квадратична похибка (MSE), яка визначається за формулою: MSE = дисперсія + зміщення2.

Оцінити загальну похибку досить складно, проте існують наближені підходи до її обчислення, одним з яких є порівняння з іншим джерелом.

Вибіркові похибки

Для опису вибіркових похибок використовують такі показники, як дисперсія оцінки, стандартна похибка, коефіцієнт варіації та довірчий інтервал.

Оскільки вибіркового зміщення у структурному обстеженні малих підприємств немає, то вибіркова середньоквадратична похибка дорівнює дисперсії оцінки. Корінь з дисперсії оцінки називається стандартною похибкою. Стандартна похибка є абсолютною величиною, визначається в одиницях виміру ознаки та обчислюється за формулою:

.

Коефіцієнт варіації – це відносна стандартна похибка, яка визначається шляхом ділення стандартної похибки в абсолютній величині на очікуване значення оцінки показника і виражається як коефіцієнт або у відсотках:

.

Її обчислення рекомендується для додатних кількісних показників і не рекомендується для відносних величин, особливо часток, величин динаміки, тому що в цих випадках дуже легко неправильно зрозуміти її зміст. Вона також не застосовується для оцінок, що можуть набувати негативних значень. Якщо для деяких величин встановлені порогові значення коефіцієнта варіації, то порівняння їх з оціненими коефіцієнтами варіації повинно бути включено до звіту.

Довірчий інтервал значення показника – це інтервал, що покриває реальне значення показника з певною ймовірністю. 95% довірчий інтервал визначається як оцінка ±1,96 помножено на стандартну похибку:

.

При оцінюванні надійності показників, які можуть набувати великих додатних значень (наприклад, обсягів реалізованої продукції), для характеристики вибіркових похибок рекомендується використовувати коефіцієнти варіації. Саме така ситуація виникає у структурному обстеженні малих підприємств.

Опишемо процедуру оцінювання дисперсії оцінки у структурному обстеженні малих підприємств. Позначимо значення оцінюваної ознаки через , де  – номер страти, а  – обсяг вибірки зі страти .  Введемо такі величини , де  – домен, для якого оцінюється показник (наприклад, регіон або вид економічної діяльності). Тоді за вибіркою оцінка сумарного значення ознаки для домену  визначається за формулою:

,

де  – результативні вибіркові ваги:

.

Оскільки відбір одиниць із кожної страти відбувається незалежно, то дисперсію оцінки сумарного значення можна обчислити за формулою:

 

.

(1)

 

                                                   

Вибіркова дисперсія  у страті  обчислюється за величинами  за формулою , де  – середній обсяг реалізованої продукції у страті, обчислений за величинами .

Коефіцієнт варіації оцінки сумарного значення показника  обчислюється як відношення кореня з дисперсії до оцінки:

 

.

(2)

 

                                                                 

У цілому по сукупності обчислюється загальна дисперсія та коефіцієнт варіації. Для цього використовуються вищезазначені формули, в яких замість величин  використовуються .

Для характеристики надійності оцінок у структурному обстеженні малих підприємств використовується такий набір категорій (за коефіцієнтами варіації): А (не більше 5%), Б (5,1% – 10%), В (10,1% – 15%), Г (15,1% – 25%), Д (більше 25%).

Індикатор якості А1. Коефіцієнт варіації CV: описаний вище. Обчислюється в цілому та за доменами (видами економічної діяльності, регіонами).

 

 

Наведемо приклади обчислення дисперсії та коефіцієнта варіації оцінки обсягу реалізованої продукції у структурному обстеженні малих підприємств за видами економічної діяльності та за регіонами.

 

У економічних спостереженнях нетипові одиниці мають значний вплив на оцінки і часто приводить до значних вибіркових похибок. Звіт з якості повинен містити опис методів та причин оброблення нетипових одиниць у процесі оцінювання, або містити посилання на опис методології виявлення та оброблення нетипових підприємств.

 

 

Невибіркові похибки

Похибки охоплення та інші похибки основи вибірки

Цільова сукупність – це сукупність одиниць спостереження, що складає об’єкт дослідження і підлягає статистичному вивченню. Основа вибірки – це упорядкована множина одиниць первинної сукупності, з якої здійснюється відбір одиниць для обстеження.

Похибки охоплення виникають через викривлення між основою вибірки та цільовою сукупністю. Розрізняють три типи похибок охоплення:

Недоохоплення: коли не усі одиниці цільової сукупності присутні у основі вибірки;

Надохоплення: коли є такі одиниці в основі вибірки, що не належать до цільової сукупності;

Подвійний облік: коли одиниці цільової сукупності представлені в основі два і більше разів.

Інші види недоліків основи, що можуть призвести до виникнення похибок, це неправильна класифікація, контактні дані та додаткова інформація про одиниці, включені до основи. Такі недоліки можуть також спричиняти не тільки похибки охоплення, але й інші. Наприклад, неправильні контактні дані (адреса, номер телефону) можуть призвести до похибок, спричинених невідповідями, або якщо розмір одиниці є меншим ніж насправді, то може зростати вибіркова похибка (особливо, якщо виявиться, що це нетипова одиниця).

Надохоплення може бути виявлене при збиранні даних або обробленні і, як наслідок, виникає збільшення вибіркової похибки і невиправдано висока вартість спостереження.

Подвійний рахунок, якщо він був виявлений, може оброблятися статистичними методами і також приводить до збільшення вибіркової похибки і ціни, але незначних зміщень.

Кількісну інформацію щодо надохоплення та подвійного рахунку треба включити до звіту з якості досить детально, особливо для важливих доменів.

Недоохоплення є найбільш серйозним типом похибки охоплення. Зміщення, що виникає при цьому, залежить від одиниць, які не включені до основи, але є у цільовій сукупності, і різницею між характеристиками цих одиниць і тих, що містяться в основі. Виявити недоохоплення можна, наприклад, виявивши підприємства, яких немає у основі вибірки структурного обстеження, але є у фінансовій звітності. Методи виявлення недоохоплення, оцінки його впливу повинні бути включені у звіт.

До звіту з якості треба включити також інформацію щодо частоти і часу оновлення основи вибірки, а також про можливий вплив цього на оцінки обстеження. Основа вибірки у структурному обстеженні малих підприємств формується на базі даних Реєстру статистичних одиниць (РСО).

Крім того, зміна класифікацій може впливати на охоплення одиниць у обстеженні підприємств. Тому звіт з якості має включати опис використаних класифікацій.

Індикатор якості А2. Рівень надохоплення – це частка одиниць у основі вибірки, які не належать до цільової сукупності. У структурному обстеженні підприємств цей індикатор можна визначити як частку невідповідей, що не належать до поля спостереження.

Похибки, спричинені відсутніми відповідями (похибки невідповідей)

Невідповідь – це неможливість отримати дані по деяких чи усіх показниках запитальника у обстеженні. Різниці між показниками, обчисленими за повними даними і за даними, що містять невідповіді, називаються похибками, спричиненими відсутніми відповідями (похибки невідповідей).

Вплив відсутніх відповідей на результати спостереження полягає у появі зміщення та зростанні вибіркової похибки. Вибіркова похибка зростає через те, що зменшується наявна кількість відповідей, а зміщення, яке є головною проблемою, пов’язаною з невідповідями, з’являється у випадку, коли за своєю природою підприємства, що не надали відповідь, не схожі на підприємства, що її надали.

 

Похибки, спричинені відсутніми відповідями, бувають двох типів:

похибки, спричинені повними невідповідями – коли відсутні дані про одиниці сукупності;

похибки, спричинені частковими невідповідями – коли відсутні дані не для одиниць сукупності, а лише для деяких показників у анкеті.

Рівні відповідей (аналогічно рівні невідповідей) відповідно бувають:

рівень повних відповідей: відношення кількості одиниць, що мають дані за всіма ознаками, до загальної кількості одиниць, що мали обстежуватись;

рівень часткових відповідей: відношення кількості одиниць, для яких дані є принаймні за кількома ознаками, до загальної кількості одиниць, що мали обстежуватись.

Вибіркову сукупність можна поділити на такі групи:

R: Відповіді, що належать до цільової сукупності. З них:

F: Повні відповіді: одиниці, для яких отримані дані за всіма ознаками;

P: Часткові відповіді: одиниці, для яких отримані дані не за всіма ознаками;

N: Невідповіді, що належать до цільової сукупності;

U: Одиниці, для яких неможливо встановити, чи належать вони цільовій сукупності (можуть бути невідповідями або поза полем обстеження);

O: Одиниці, що не належать до цільової сукупності (поза полем обстеження).

Кількість одиниць вибірки в кожній групі позначимо , де відповідає одній із груп. Загальний обсяг вибірки . Для одиниць, для яких неможливо встановити, чи належать вони до цільової сукупності, припускають, що рівень невідповідей серед них дорівнює . Якщо не можна зробити припущення щодо , то рекомендується брати , що гарантує незанижену оцінку рівня невідповідей.

Індикатор якості А4. Рівень відповідей – це частка підприємств, які надали відповідь (тобто частка повних та часткових відповідей). Визначається за формулою:

.

Обернена до нього величина – рівень повних невідповідей – це частка підприємств, які не надали відповідь взагалі: .

Індикатор якості А5. Рівень повних відповідей – це частка підприємств, які надали повну відповідь (за усіма ознаками статистичної форми). Визначається за формулою:

.

Обернена до нього величина – рівень невідповідей – це частка підприємств, які надали частково незаповнену форму звітності, або не надали її взагалі (тобто частка часткових та повних невідповідей):

Як додатковий показник використовують рівень часткових відповідей – це частка підприємств, які надали частково незаповнену форму звітності.

Перелічені індикатори включаються у звіт з якості в цілому та за доменами (регіонами та видами економічної діяльності). Крім того, у звіт з якості включають основні визначення, формули обчислення та методи компенсації невідповідей. Якщо при компенсації відсутніх відповідей проводилась імпутація, у звіті з якості описують методи імпутації та їхній вплив на результати. У звіті з якості також мають бути описані усі заходи, що приймались для зниження рівня невідповідей.

Для обчислення зміщення, спричиненого відсутніми відповідями, застосовують метод порівняння підприємств, які надали та які не надали відповідь, за показниками, які є для обох цих підсукупностей. При цьому показники для підприємств, що не надали відповіді, отримують із інших обстежень, у яких ті брали участь або з адміністративних джерел. Якщо таких даних немає, то проводять спеціальні обстеження. Різниця між взаємопов’язаними показниками для двох підсукупностей буде вказувати на зміщення, спричинене відсутніми відповідями. Чим більшим є зв’язок між схожими показниками, тим точнішою буде оцінка зміщення.

Похибки вимірювання

Похибки вимірювання – це похибки, що виникають під час збирання даних і призводять до реєстрації значень показників, що відрізняються від реальних. Причинами можуть бути:

• Інтерв’юер: вплив на відповіді респондентів свідомої та несвідомої різниці в способах ведення обстеження інтерв’юерами;

• Респондент: може навмисно чи випадково давати невірні дані;

• Інструментарій спостереження: запитальник чи засоби збору даних можуть призвести до реєстрації невірних значень;

• Спосіб організації обстеження.

Похибки вимірювання можуть спричинити як зміщення, так і високу варіацію результатів. Особливо небезпечним є зміщення. У звіті з якості необхідно описати основні ризики, пов’язані з похибками вимірювання.

Редагування даних може встановити певні неузгодженості, які зазвичай є результатом похибок у первинних даних, хоча можуть також бути результатом похибок оброблення через невірне кодування або введення даних. Інформація щодо процесу редагування даних повинна включатись до звіту з якості, оскільки це відображає ризик похибки вимірювання.

Частку неузгодженостей можна обчислити за записами, до яких застосовувались правила редагування. Зазвичай до неузгодженостей у даних застосовується коригування та автоматична імпутація. Тому частка неузгодженостей характеризує якість збирання та оброблення даних, а не якість статистичної інформації. Інформація щодо редагування даних у звіті з якості повинна співвідноситись із важливістю похибок вимірювання у обстеженні в загальному та для цільових змінних.

Запитальники, що використовувались у спостереженні, повинні бути прикріплені до звіту з якості як додатки (можуть бути у вигляді гіперпосилань). Мають бути також коротко описані дизайн та тестування запитальників (якщо такі проводились).

Основним методом виявлення похибок вимірювання є спеціальні обстеження. Насамперед це повторні опитування невеликого обсягу. Використовуються також порівняння зі схожими даними з інших джерел.

Індикатор якості А3. Рівень неузгодженостей при редагуванні – це частка відповідей, для яких було зафіксовано порушення при проведенні контролів. Насправді це є тільки непрямий індикатор, оскільки не дає ніякої інформації щодо похибки вимірювання, яка залишилась після редагування. Проте він забезпечує інформацією про якість первинних даних.

Похибки оброблення

Між збиранням первинних даних і початком їх аналізу дані підлягають різноманітним перевіркам, редагуванню, кодуванню, імпутації та ін. Оброблення даних може мати важливий вплив на якість даних. Похибки, що виникають на цьому етапі, називаються похибками оброблення. Похибки оброблення приводять до зміщення та підвищення дисперсії результатів. Якщо вони є суттєвими, то треба оцінити їхній розмір та вплив на результати та подати такі оцінки у звіті з якості. Є дві категорії похибок оброблення: системні похибки і похибки оперування даними.

Системні похибки – похибки в специфікації та впровадженні систем, необхідних для проведення обстеження й отримання результатів, а також похибки в автоматизованому зчитуванні даних. Вплив системних похибок на якість даних залежить від того, коли вони були виявлені. Цей вплив повинен бути оцінений і порівняний з вартістю виправлення похибок у термінах людських ресурсів і в термінах можливої затримки випуску даних перш ніж ухвалити рішення чи виправити помилку. Системні похибки виявляються за допомогою перевірки та тестування всіх етапів обстеження під час стадії проектування.

Головні джерела похибок оперування даними:

·      Введення даних: фаза обстеження, де інформація, записана в анкеті переводиться у формат, який може бути інтерпретований комп'ютером;

·      Передача даних: похибки, що виникають в процесі передачі даних від районних відділів статистики до обласних управлінь, а від них до обчислювального центру Держкомстату;

·      Редагування даних: процедура ідентифікації похибок, що виникли в процесі збирання/введення даних за допомогою встановлених правил редагування. Помилкові значення даних мають бути компенсовані.

·      Кодування: процес класифікації відповідей за попередньо визначеними категоріями.

На етапі оброблення даних застосовуються також такі особливі прийоми як:

·      оброблення нетипових одиниць;

·      імпутація та зважування;

·      вибір методу аналізу, включаючи коригування на сезонність;

·      забезпечення конфіденційності інформації.

Похибки введення даних можуть бути виявлені за допомогою: 1) порівняння введених даних з даними паперових носіїв; 2) проведення подвійного введення даних різними способами та порівняння отриманих наборів даних; 3) порівняння набору даних при автоматизованому розпізнаванні з набором даних, отриманим іншими методами введення.

Похибки передачі даних виявляються шляхом порівнянь наборів даних на різних ланках системи.

Похибки редагування даних можна оцінити шляхом порівняння набору даних до і після редагування.

Похибки кодування даних можуть бути оцінені, якщо запропонувати різним кодувальникам однаковий набір даних та обчислити питому вагу однакових кодів. Крім того, використовується порівняння результатів такого обстеження зі стандартами.

Індикатор якості А6. Рівень імпутації – це відношення кількості імпутованих значень до загальної кількості значень ознаки. Цей індикатор є непрямим, оскільки вказує розмір імпутації, а не її вплив на результати.

Помилки, які були виявлені в опублікованій статистичній інформації, повинні виправлятися і про це необхідно надавати повідомлення. З цією метою визначають ще один індикатор:

Індикатор якості А7. Кількість помилок за типами.

 

5.3. Своєчасність та пунктуальність

Своєчасність та Пунктуальність статистичні дані повинні поширюватися своєчасно зі встановленою періодичністю [8].

Своєчасність характеризує інтервал часу між моментом (періодом), у який відбувалося явище або процес, що описують статистичні дані, та датою готовності (подання) цих даних.

Пунктуальність характеризує інтервал часу між датою публікації даних і датою, на яку планували їх випуск і яку було заздалегідь анонсовано.

Результати структурного обстеження малих підприємств публікуються в попередній та остаточній редакції. У цьому випадку кожна редакція має власну своєчасність і пунктуальність.

Індикатори якості, що використовуються при оцінюванні своєчасності і пунктуальності:

Індикатор якості Т1. Проміжок часу між закінченням звітного періоду та датою оприлюднення перших результатів – кількість днів від останнього дня звітного періоду до дня публікації перших результатів.

Індикатор якості Т2. Проміжок часу між закінченням звітного періоду та датою оприлюднення остаточних результатів.

Індикатор якості Т3. Пунктуальність публікації – кількість днів між датою, на яку повинна бути публікація, і реальною датою публікації.

5.4. Доступність та Зрозумілість/Ясність

Доступність та Зрозумілість/Ясність статистичні дані мають представлятися у зрозумілій формі, поширюватися у придатному та зручному для використання вигляді, бути доступними усім користувачам на рівних умовах та супроводжуватися метаданими і відповідними поясненнями [8].

Доступність статистичних продуктів показує, наскільки легко користувачі можуть отримати дані. Вона визначається фізичними умовами, за якими користувачі можуть отримати статистичні дані: способи та місця отримання даних, процедури замовлення, час, необхідний для виконання замовлень, політика ціноутворення, існуючі маркетингові умови (авторське право та ін.), формати, в яких дані можуть бути надані користувачам (паперові носії, електронні носії, CD-ROM, Інтернет та ін.), наявність макро- та мікроданих тощо.

Зрозумілість/Ясність статистичних продуктів показує, наскільки легко користувачі можуть зрозуміти дані. Вона характеризує інформаційне середовище даних: наявність та якість метаданих, що надаються зі статистичними даними (текстова інформація, пояснення, документація та ін.), ілюстрації (діаграми, мапи, схеми та ін.), наявність пояснень щодо якості даних (включаючи обмеження у використанні) та відомості про те, наскільки виробник готовий надати додаткову допомогу (супровід даних).

Оцінювання доступності може набувати різних форм, оскільки доступність знаходиться під впливом багатьох практичних аспектів розповсюдження результатів, таких як:

• канали розповсюдження даних;

• форма подачі результатів – мікродані чи макродані;

• цінова політика.

Звіт з якості повинен включати опис різноманітних шляхів доступу до статистичних результатів – у паперових публікаціях, на веб-сайті Держкомстату та ін. Цінова політика та її вплив на доступ до даних повинні бути описані разом із обмеженнями на доступ до даних, пов’язаними з забезпеченням конфіденційності та деякими іншими.

Ясність залежить від якості статистичних метаданих, що розповсюджуються разом із статистичними результатами. Підсумковий опис цих метаданих (документація, пояснення, обмеження якості та ін.) повинні включатись у звіт з якості.

Найкращим шляхом оцінювання ясності опублікованих даних є обернений зв’язок із користувачами. Запитання до користувачів, пов’язані з легкістю доступу до даних та їхнім точним значенням та інтерпретацією, повинні бути включені при розробці дизайну спостереження за задоволенням користувачів.

У звіті з якості необхідно описати нещодавні та заплановані заходи щодо покращення доступності та ясності даних.

За рекомендацією Євростату розраховуються такі індикатори якості щодо доступності та ясності даних:

Індикатор якості АС1. Кількість розсилок та/або проданих публікацій за видами;

Індикатор якості АС2. Кількість відвідувань онлайн баз даних;

Індикатор якості АС3. Рівень повноти метаданих – частка наданої кількості елементів метаданих відносно загальної кількості прийнятних елементів метаданих.

5.5. Послідовність/Узгодженість та Зіставність/Порівнянність

Послідовність/Узгодженість   та   Зіставність/Порівнянність статистичні дані мають бути узгоджені, зіставні в часі, за регіонами і країнами. Має бути створено можливість для поєднання та спільного використання статистичних даних з різних джерел [8].

Послідовність/Узгодженість двох або більше статистичних продуктів показує наскільки у статистичних процесах, у рамках яких вони вироблялися, використовували однакові концепції, класифікації, визначення та сукупності, що вивчаються, а також гармонізовані  методи. Послідовні статистичні продукти дозволяється об’єднувати та використовувати спільно.

Зі ставність/Порівнянність є окремим випадком узгодженості, коли статистичні продукти відносяться до тих самих об’єктів даних, а мета їх об'єднання – зробити порівняння в часі або за регіонами, або за іншими сферами діяльності.

Виділяють такі типи узгодженості та порівнянності:

• зіставність/порівнянність у часі;

• зіставність/порівнянність за регіонами;

• зіставність/порівнянність за іншими доменами;

• внутрішня зіставність/узгодженість: відноситься до даних, що виробляються у одному статистичному процесі (але можливе порівняння кількох різних сегментів) для одного часового періоду та регіону;

• послідовність/узгодженість між внутрішньорічними та щорічними результатами;

• послідовність/узгодженість з системою національних рахунків;

• послідовність/узгодженість між статистичними даними, отриманими з різних джерел.

За рекомендацією Євростату у звіті з якості повинні бути такі індикатори якості:

Індикатор якості СС1. Довжини порівнянних часових рядів визначаються як кількість років (кварталів, місяців) від останнього розриву в часовому ряді певного показника. Якщо в часовому ряді розривів не було, то показник розраховується як кількість років (кварталів, місяців) з початку часового ряду. Додатково до цього може розраховуватись кількість зіставних часових рядів;

Індикатор якості СС2. Асиметрія показників дзеркальної статистики.

 

 

 

6 Конфіденційність, прозорість та захист

Згідно зі статтею 21 Закону України “Про державну статистику” органи державної статистики надають гарантії щодо забезпечення конфіденційності статистичної інформації. “Первинні дані, отримані органами державної статистики від респондентів під час проведення статистичних спостережень, а також адміністративні дані щодо респондентів, отримані органами державної статистики від органів, що займаються діяльністю, пов’язаною із збиранням та використанням адміністративних даних, є конфіденційною інформацією, яка охороняється Законом і використовується виключно для статистичних цілей у зведеному знеособленому вигляді. Поширення статистичної інформації, на підставі якої можна визначити конфіденційну статистичну інформацію щодо конкретного респондента, забороняється.” Виключенням є інформація, зазначена у статті 22 цього Закону. Відповідно до Закону України “Про внесення змін до Кодексу України про адміністративні правопорушення” порушення порядку використання конфіденційної інформації тягне за собою накладення штрафу.

Згідно з Положенням про Державний комітет статистики України Держкомстат забезпечує повноту, надійність, об’єктивність, цілісність статистичної інформації, її адекватність соціально-економічним явищам і процесам; забезпечує гласність і відкритість статистичної інформації та методології; проводить прес-конференції, семінари з користувачами статистичної інформації.

Крім того, відповідно до Положення Держкомстат забезпечує згідно із законодавством збереження та захист статистичної інформації, дотримання її конфіденційності.

Згідно з Принципами діяльності органів державної статистики України, які є гармонізованими з Кодексом діяльності європейської статистики:

♦ органи державної статистики гарантують конфіденційність первинних статистичних даних, отриманих від респондентів, а також статистичної інформації, на підставі якої можна визначити інформацію щодо конкретного респондента, і адміністративних даних, що використовуються для статистичних цілей (Принцип 5);

♦ органи державної статистики складають і поширюють статистичну інформацію на основі науково-обґрунтованої методології неупереджено, об’єктивно, професійно, відкрито з наданням всім користувачам рівного доступу до неї (Принцип 6).

Конфіденційність

Відповідно до законодавства захист конфіденційності є обов’язковим, і фахівці, що проводять спостереження, повинні забезпечувати конфіденційність згідно з правовими нормами. Звіт щодо якості має підтверджувати такі заходи або повідомляти про будь-які виключення. Необхідно також описати процедури, які забезпечують конфіденційність протягом збирання, оброблення та розповсюдження даних. Це включає протоколи (письмові свідоцтва) для гарантування того, що індивідуальні дані доступні тільки за принципом необхідного знання основ, правил розмежування клітинок із конфіденційною інформацією у вихідних таблицях та процедур визначення та запобігання її розголошення. Крім того, повинні бути описані угоди, якщо вони є, відповідно до яких користувачі за межами національного статистичного органу мають доступ до мікроданих із науковими цілями.

Прозорість

Прозорість є необхідною для національних статистичних установ, щоб отримати довіру суспільства. Вони повинні оприлюднювати методи, які використовуються при підготовці офіційних статистичних даних, і звітувати стосовно всіх рішень, що ними приймаються, та результатів, які публікуються. Також виробникам статистики слід інформувати користувачів про правильну інтерпретацію даних. Крім того, якість статистичної інформації повинна бути оцінена до випуску цих даних. Респондентів слід повідомляти про документи, згідно з якими проводиться обстеження та про те, як будуть використовуватися зібрані дані.

Доповіді з питань статистики на прес-конференціях повинні бути об’єктивними та безсторонніми. Користувачів слід інформувати щодо надійності та узгодженості статистичних продуктів та відповідних обмежень на їх використання. Джерела та порядок одержання метаданих повинні бути опубліковані разом із самими даними для того, щоб користувачі мали повну можливість визначити, наскільки корисними для них є ці дані.

Захист

Звіт із якості повинен описувати запобіжні заходи щодо захисту:

·      процесів отримання даних, зокрема даних, зібраних за допомогою Інтернету;

·      зберігання анкет обстеження (як довго вони зберігаються та як вони знищуються);

·      кодування даних в портативних комп’ютерах та інших пристроях;

·      зберігання мікроданих в базах даних;

·      зберігання агрегованих даних в базах даних та на компакт-дисках.

У звіті з якості варто описати компроміс між конфіденційністю і безпекою, з одного боку, та доступністю з іншого.

 

СПИСОК ВИКОРИСТАНИХ ДЖЕРЕЛ

1.        Васєчко О.О. Методологічні засади статистики підприємств: Монографія. – К.: ІВЦ Держкомстату України, 2005. – 296 с.

2.        Вибіркове спостереження: Термінол. словн. / Укл.: О.О. Васєчко, О.І. Черняк, Є.М. Жуйкова, О.В. Гончар та ін. – К.: Держкомстат України, 2004. – 140 с.

3.        Виллебоордсе А. Руководство по планированию и проведению статистических обследований предприятий. – Люксембург: Евростат, 1999. – 209 с.

4.        Глосарій до плану статистичного спостереження (Затверджений наказом  Держкомстату від 29.12.2009 № 498).

5.        Закон України “Про державну статистику” від 13.07.2000 р. № 1922-ІІІ зі змінами та доповненнями. – Режим доступу: http:// www.zakon.rada.gov.ua

6.        Закон України “Про внесення змін до Кодексу України про адміністративні правопорушення” від 13.07.2000 р. № 1929-ІІІ. – Режим доступу: http://www.zakon.rada.gov.ua.

7.        Положення про Державний комітет статистики України (Затверджено постановою Кабінету Міністрів України від 11.07.2007 р. № 924). – Режим доступу: http://www.ukrstat.gov.ua.

8.        Принципи діяльності органів державної статистики України (Затверджені наказом Державного комітету статистики України від 14.06.2010 р. № 216). – Режим доступу: http://www.ukrstat.gov.ua.

9.        Methodological documents. ESS quality definitions. – Eurostat, Luxembourg, 2009. – 30 p.

10.    Methodological documents. ESS Standards for quality reports. – Eurostat, Luxembourg, 2009. – 30 p.

11.    Methodological documents. Glossary. – Eurostat, Luxembourg, 2003. – 10 p.

12.    Methodological documents. Handbook for quality reports. – Eurostat, Luxembourg, 2009. – 137 p.

13.    Methodological documents. Quality indicators. – Eurostat, Luxembourg, 2005. – 19 p.

14.    Methodological documents. Standard report. – Eurostat, Luxembourg, 2003. – 19 p.

15.    Методологічні положення з підготовки стандартних звітів щодо якості результатів державних вибіркових обстежень населення (домогосподарств) (Затверджені наказом Державного комітету статистики України від 18.07.2006 р. № 335). – Режим доступу: http://www.ukrstat.gov.ua.

16.    Quality Guidelines for Official Statistics 2nd Revised Edition. – Helsinki. -2007. – 138 p.

17.    Särndal C.E., Swensson B., Wretman J. Model assisted survey sampling. – Berlin: Springer-Verlag. – 1992. – 694 p.

18.    Офіційний сайт конференції з якості у Римі. – Режим доступу: http://q2008.istat.it.

19.    Офіційний сайт Євростату. Якість. – Режим доступу: http://ec.europa.eu/eurostat/quality.

 

Додаток А

 

 

 

 

Базовий звіт з якості результатів річного структурного обстеження малих підприємств за 2008 рік підготовлений фахівцями Науково-технічного комплексу статистичних досліджень за участі фахівців Департаменту міжгалузевої статистики підприємств Держкомстату.

Метою складання базового звіту з якості є інформування користувачів щодо найбільш важливих критеріїв та індикаторів якості статистичної інформації.

Базовий звіт з якості містить оцінку якості перших результатів річного вибіркового обстеження малих підприємств без перерахунку основного виду економічної діяльності. Підсумковий звіт з якості, який містить оцінку якості кінцевих результатів цього обстеження з урахуванням зміни основного виду економічної діяльності підприємствами за звітний період, публікується разом з результатами цього обстеження (додаток Б).

Особливістю цього звіту з якості є те, що він є першою спробою в практиці української статистики підприємств ознайомити користувачів із якістю статистичної інформації, якою вони користуються.

Статистичне спостереження малих підприємств усіх галузей економіки в національній статистиці вперше було розроблене і реалізоване на початку 90-х років. Згодом воно було розширене та перетворене в річне структурне обстеження підприємств за формою № 1-під-приємництво (коротка). За період свого існування це обстеження піддавалось певним змінам: дещо змінилась його структура та наповнення, окрім того з 2009 року воно було переведено на вибіркову основу, що знову-таки викликано вимогами до сучасної системи статистики та запозиченням міжнародного досвіду проведення обстежень.

 

Основні характеристики річного структурного обстеження малих підприємств

 

Критерії формування сукупності одиниць державного статистичного спостереження

охоплюються підприємства з основним видом економічної діяльності за КВЕД: секції від А-Н, I (крім 62.30.0), J (крім 65.11.0, 65.12.0), К, М, N, О (крім 91.11.0-91.33.0); та організаційно-правовою формою господарювання за КОПФГ: 120-193, 200-270, 300, 310, 330, 340, 500-590, 900, 915-940.

Географічне охоплення

економіка України загалом та у розрізі 27 регіонів України за КОАТУУ

Одиниця державного статистичного спостереження

підприємство

Розмір підприємства

мале підприємство згідно з чинним законодавством

Вид державного статистичного спостереження (за ступенем охоплення одиниць)

вибіркове

Рівні та розрізи оприлюднення результатів

національний рівень (Україна в цілому), регіональний рівень (за регіонами України), види економічної діяльності (в розрізі груп КВЕД)

У звіті наведена інформація щодо таких основних критеріїв якості: відповідність/релевантність, точність/надійність, своєчасність та пунктуальність.

Контакти для отримання додаткової інформації щодо результатів структурного обстеження підприємств, методологічного забезпечення їхнього проведення та аналізу результатів, оцінювання їхньої якості та ін. такі:

 

Адреса

01123, м. Київ, МСП, вул. Шота Руставелі, 3

Телефони

(044) 287-62-11, 287-15-11

Факс

235-37-39

Електронна пошта

I.Zhuk@ukrstat.gov.ua                    T.Zakharova@ukrstat.gov.ua

Відповідність/Релевантність

Відповідність/Релевантність - статистичні дані повинні задовольняти поточні та потенційні потреби користувачів.

Відповідність/Релевантність показує ступінь задоволення поточних та потенційних потреб користувачів у статистичних даних. Вона свідчить про те, чи всі необхідні статистичні дані розроблені і якою мірою поняття, що використовуються (визначення, класифікації та ін.), відображають потреби користувачів.

Статистичну інформацію щодо діяльності малих підприємств, отриману із структурних спостережень, споживають як внутрішні, так і зовнішні користувачі.

 

Перелік користувачів

 

 

Внутрішні користувачі

Зовнішні користувачі

структурний підрозділ, який займається питаннями макроекономічної статистики

органи державного управління

міжнародні організації

структурні підрозділи, які займаються питаннями галузевої статистики

науково-дослідні інститути

навчальні заклади

структурний підрозділ, який займається веденням реєстру статистичних одиниць

професійні об’єднання підприємців

засоби масової інформації

 

Точність/Надійність

Точність/Надійність – статистичні дані повинні бути точними та достовірними.

Точність/Надійність показує ступінь наближеності розрахунку або оцінок до точного або дійсного значення.

Для оцінювання надійності оцінок економічних показників у цілому, за видами економічної діяльності та за регіонами у даному звіті наведені коефіцієнти варіації та рівні надійності (табл. 2–5), а також рівні відповідей (рис. 1–2). Методологія розрахунку цих показників наводиться у підсумковому звіті з якості.

Для характеристики надійності оцінок використовується також такий набір категорій:

 

Таблиця 1

Категорія надійності

Значення коефіцієнта варіації, %

Рівень надійності

А

не більше 5

високий

Б

від 5,1 до 10

достатній

В

від 10,1 до 15

задовільний

Г

від 15,1 до 25

низький (придатні лише до якісного аналізу)

Д

більше 25

незадовільний (малопридатні до аналізу)

Розраховані коефіцієнти варіації та відповідні рівні надійності свідчать, що в цілому по Україні оцінки обсягу реалізованої продукції та кількості найманих працівників мають високу точність, тобто є нижчими за 5% (1% та 0,5% відповідно).

За видами економічної діяльності на рівні секції КВЕД показники мають високу та достатню точність (окрім освіти).

За регіонами оцінки мають високу та достатню точність, окрім обсягу реалізованої продукції в Миколаївській області, оцінка якого має задовільний рівень надійності та в Тернопільській області, де оцінка має низьку надійність.

 

Таблиця 2

Надійність оцінок обсягу реалізованої продукції (робіт, послуг) малих підприємств

за видами економічної діяльності у 2008 році

 

Вид економічної діяльності

Обсяг реалізованої продукції

(робіт, послуг), млрд. грн.

Коефіцієнт варіації, %

Категорія надійності

Усього

у тому числі

492,4

1,0

А

Сільське господарство, мисливство, лісове господарство

10,3

6,7

Б

Промисловість

45,0

1,9

А

Будівництво

44,5

2,6

А

Торгівля; ремонт автомобілів, побутових виробів та предметів особистого вжитку

299,1

1,5

А

Торгівля автомобілями та мотоциклами, їх технічне обслуговування та ремонт

22,4

5,9

Б

Оптова торгівля і посередництво в оптовій торгівлі

259,4

1,7

А

Роздрібна торгівля; ремонт побутових виробів та предметів особистого вжитку

17,3

3,5

А

Діяльність готелів та ресторанів

3,3

6,3

Б

Діяльність транспорту та зв'язку

16,6

4,7

А

Фінансова діяльність

7,8

3,6

А

Операції з нерухомим майном, оренда, інжиніринг та надання послуг підприємцям

52,9

1,5

А

Освіта

0,6

32,3

Д

Охорона здоров’я та надання соціальної допомоги

1,3

7,3

Б

Надання комунальних та індивідуальних послуг; діяльність у сфері культури та спорту

3,7

9,6

Б

 

Таблиця 3

Надійність оцінок кількості найманих працівників малих підприємств

 за видами економічної діяльності у 2008 році

 

Вид економічної діяльності

Кількість найманих працівників, тис. осіб

Коефіцієнт варіації, %

Категорія надійності

Усього

у тому числі

2156,7

0,5

А

Сільське господарство, мисливство, лісове господарство

146,2

2,0

А

Промисловість

383,9

1,1

А

Будівництво

273,4

1,3

А

Торгівля; ремонт автомобілів, побутових виробів та предметів особистого вжитку

554,6

0,7

А

Торгівля автомобілями та мотоциклами, їх технічне обслуговування та ремонт

52,6

2,2

А

Оптова торгівля і посередництво в оптовій торгівлі

361,0

0,9

А

Роздрібна торгівля; ремонт побутових виробів та предметів особистого вжитку

141,0

1,6

А

Діяльність готелів та ресторанів

70,6

3,0

А

Діяльність транспорту та зв'язку

125,8

1,8

А

Фінансова діяльність

24,5

3,3

А

Операції з нерухомим майном, оренда, інжиніринг та надання послуг підприємцям

450,8

1,1

А

Освіта

15,2

14,0

В

Охорона здоров’я та надання соціальної допомоги

33,0

3,4

А

Надання комунальних та індивідуальних послуг; діяльність у сфері культури та спорту

74,9

2,2

А

Таблиця 4

Надійність оцінок обсягу реалізованої продукції (робіт, послуг) малих підприємств

за регіонами у 2008 році

 

Регіон

Обсяг реалізованої продукції (робіт, послуг) , млрд. грн.

Коефіцієнт варіації, %

Категорія надійності

Україна

492,4

1,0

А

Автономна Республіка Крим

12,1

9,7

Б

Вінницька

7,9

7,1

Б

Волинська

4,9

9,1

Б

Дніпропетровська

45,9

2,8

A

Донецька

41,3

5,8

Б

Житомирська

6,3

3,9

A

Закарпатська

4,6

5,6

Б

Запорізька

17,7

3,7

A

Івано-Франківська

5,4

7,7

Б

Київська (без м. Києва)

20,9

4,9

A

Кіровоградська

6,9

9,4

Б

Луганська

15,5

9,0

Б

Львівська

17,3

2,8

A

Миколаївська

9,9

12,2

В

Одеська

31,4

6,9

Б

Полтавська

12,6

4,1

A

Рівненська

4,3

5,2

Б

Сумська

5,8

 3,4

A

Тернопільська

3,6

21,3

Г

Харківська

28,3

 2,6

A

Херсонська

8,0

 6,7

Б

Хмельницька

6,1

 7,3

Б

Черкаська

7,7

 4,2

A

Чернівецька

3,4

 5,0

Б

Чернігівська

5,1

 4,6

A

м. Київ

156,2

 1,5

A

м. Севастополь

3,5

 5,2

Б

 

Таблиця 5

Надійність оцінок кількості найманих працівників малих підприємств

за регіонами у 2008 році

 

Регіон

Кількість найманих працівників, тис. осіб

Коефіцієнт варіації, %

Категорія надійності

Україна

2156,7

0,5

А

Автономна Республіка Крим

86,4

3,6

A

Вінницька

55,0

5,5

Б

Волинська

36,2

5,4

Б

Дніпропетровська

146,3

2,2

A

Донецька

169,3

2,5

A

Житомирська

50,9

4,3

A

Закарпатська

38,4

6,0

Б

Запорізька

82,2

3,3

A

Івано-Франківська

42,6

5,2

Б

Київська (без м. Києва)

89,4

3,4

A

Кіровоградська

34,8

4,7

A

Луганська

72,1

3,4

A

Львівська

125,8

2,5

A

Миколаївська

50,5

4,0

A

Одеська

120,1

2,9

A

Полтавська

58,2

4,5

A

Рівненська

37,6

5,5

Б

Сумська

43,0

4,2

A

Тернопільська

34,6

5,8

Б

Харківська

140,2

2,7

A

Херсонська

39,5

6,5

Б

Хмельницька

45,5

4,6

A

Черкаська

46,2

4,6

A

Чернівецька

27,5

5,5

Б

Чернігівська

41,5

5,1

Б

м. Київ

420,6

1,1

A

м. Севастополь

22,3

6,9

Б

 

 

 

Рис. 1. Рівні повних відповідей малих підприємств за видами економічної діяльності у 2008 році

 

 

Рис. 2. Рівні повних відповідей малих підприємств за регіонами у 2008 році

Своєчасність і пунктуальність

Своєчасність характеризує інтервал часу між моментом (періодом), у який відбувалося явище або процес, що описують статистичні дані, та датою готовності (подання) цих даних.

Пунктуальність характеризує інтервал часу між датою публікації даних і датою, на яку планували їх випуск і яку було заздалегідь анонсовано.

Статистична інформація за результатами структурного обстеження оприлюднюється у два етапи згідно за планом державних статистичних спостережень і порядком її розміщення на веб-сайті Держкомстату. Перший етап передбачає публікацію матеріалів без урахування зміни підприємствами їхнього основного виду економічної діяльності, другий етап – з урахуванням зміни підприємствами їхнього основного виду економічної діяльності.

Результати обстеження без уточненого основного виду економічної діяльності оприлюднюються у третій декаді червня на веб-сайті Держкомстату, а також подаються керівним органам держави для здійснення моніторингів.

 

Додаток Б

 

 

Підсумковий звіт з якості результатів річного структурного обстеження малих підприємств за 2008 рік підготовлений фахівцями Науково-технічного комплексу статистичних досліджень за участю фахівців департаменту міжгалузевої статистики підприємств Держкомстату.

Підсумковий звіт з якості складають з метою інформування користувачів статистичної інформації щодо якості цієї інформації. Він містить більш детальну інформацію щодо якості, ніж базовий звіт з коротким описом методології, що застосовувалась при проведенні спостереження та оцінюванні якості його результатів.

Підсумковий звіт з якості містить оцінку якості кінцевих результатів річного вибіркового обстеження малих підприємств на відміну від базового звіту з якості, в якому подається інформація щодо попередніх результатів без перерахунку основного виду економічної діяльності (Додаток А).

Підсумковий звіт з якості результатів річного структурного обстеження малих підприємств вперше розроблений в українській статистиці підприємств.

Структурне обстеження малих підприємств (СОМП) – це державне статистичне спостереження, яке здійснюється на постійній основі з річною періодичністю, базується на загальноприйнятих міжнародних стандартах і відповідає сучасній економічній ситуації в Україні.

Метою структурного обстеження підприємств є отримання інформації про економічний стан, господарську діяльність підприємств для аналізу структури економіки країни (регіону), забезпечення інформаційних потреб системи національних рахунків, Реєстру статистичних одиниць.

Методологічні аспекти проведення вибіркового структурного обстеження малих підприємств відображені у відповідних методиках формування вибіркових сукупностей звітуючих одиниць.

Основні характеристики спостереження наведені в базовому звіті з якості.

У підсумковому звіті з якості наведена інформація щодо таких критеріїв якості, як відповідність/релевантність, точність/надійність, своєчасність та пунктуальність, доступність і зрозумілість/ясність, послідовність/узгодженість і зіставність/порівнянність; а також індика-тори та характеристики, що відображають вказані критерії якості, для таких показників структурного обстеження, як обсяг реалізованої продукції та кількість найманих працівників. Інформація подається за видами економічної діяльності та регіонами.

Контакти для отримання додаткової інформації щодо результатів структурного обстеження підприємств, методологічного забезпечення їх проведення та аналізу результатів, оцінювання їхньої якості та ін. такі:

 

Адреса

01123, м. Київ, МСП, вул. Шота Руставелі, 3

Телефони

287-62-11, 287-15-11

Факс

235-37-39

Електронна пошта

I.Zhuk@ukrstat.gov.ua

T.Zakharova@ukrstat.gov.ua

 

 

 

1. Відповідність/Релевантність

Відповідність/Релевантність – статистичні дані повинні задовольняти поточні та потенційні потреби користувачів.

Відповідність/Релевантність показує ступінь задоволення поточних та потенційних потреб користувачів у статистичних даних. Вона свідчить про те, чи всі необхідні статистичні дані розроблені та якою мірою поняття, що використовуються (визначення, класифікації та ін.), відображають потреби користувачів.

Статистичну інформацію щодо діяльності малих підприємств, отриману із структурних спостережень, споживають як внутрішні, так і зовнішні користувачі.

Перелік внутрішніх користувачів

 

Найменування користувача

Цілі використання

структурний підрозділ, який займається питаннями макроекономічної статистики

дані структурного обстеження є вхідними для складання річних рахунків поряд з даними галузевих і тематичних обстежень та адміністративними даними

структурні підрозділи, які займаються питаннями галузевої статистики

дані структурного обстеження слугують контрольними цифрами для оцінювання надійності результатів обстежень, що ними проводяться

структурний підрозділ, який займається веденням Реєстру статистичних одиниць

Дані структурного обстеження підприємств є інструментом актуалізації класифікаційних реквізитів одиниць, наповнення економічними показниками (кількості працівників, обсягу реалізованої продукції тощо) та їх періодичного поновлення

 

Перелік зовнішніх користувачів

 

Група користувачів

Найменування користувача

Міжнародні організації

Організація промислового розвитку ООН (ЮНІДО), Офіційне бюро статистики Європейського Союзу (Євростат), Міждержавний статистичний комітет Співдружності Незалежних Держав (Статкомітет СНД), Міжнародний банк реконструкції та розвитку (Світовий банк) (постійне представництво в Україні), Міжнародний валютний фонд (постійне представництво в Україні) та інші

Органи державного управління

Адміністрація Президента України, Верховна Рада України, Секретаріат Кабінету Міністрів України, Міністерство економіки України, Міністерство фінансів України, Міністерство праці та соціальної політики України, Міністерство освіти та науки України, Міністерство аграрної політики України, Міністерство промислової політики України, Міністерство регіонального розвитку та будівництва України, Національний банк України, Рада національної безпеки і оборони України, Державне казначейство України, Фонд державного майна України, Антимонопольний комітет України, Рахункова палата України, Державний комітет України з питань регуляторної політики та підприємництва, Державне агентство України з інвестицій та інновацій, Державна податкова адміністрація України та інші

Соціальні організації

Федерація професійних спілок України, Асоціація міст України та інші

Науково-дослідні установи

Національний інститут проблем міжнародної безпеки РНБО України, Інститут економіки та прогнозування НАН України, Рада по вивченню продуктивних сил НАН України, Національний інститут стратегічних досліджень, Науково-дослідний економічний інститут, Національний науковий центр "Інститут аграрної економіки", Український інститут науково-технічної та економічної інформації, Науково-дослідний інститут будівельного виробництва та інші

Навчальні заклади

Національна академія державного управління при Президентові України, Національна академія статистики, обліку та аудиту та інші

Бібліотеки

Національна бібліотека України ім. В.І. Вернадського, Національна парламентська бібліотека України, Державна наукова установа "Книжкова палата України ім. Івана Федорова" та інші

Засоби масової інформації

Журнали, газети та інші

Підприємства

Підприємства та фізичні особи

 

2. Точність/Надійність

Точність/Надійність –- статистичні дані повинні бути точними і достовірними.

Точність/Надійність показує ступінь наближеності розрахунку або оцінок до точного або дійсного значення.

Оскільки річне структурне обстеження малих підприємств усіх видів економічної діяльності є вибірковим, то йому властиві як невибіркові, так і вибіркові похибки (похибки репрезентативності).

 

2.1. Вибіркові похибки

Для характеристики вибіркових похибок цільових ознак спостереження у цілому, за видами економічної діяльності та за регіонами, у даному звіті наведені коефіцієнти варіації та рівні надійності (табл. 2–5).

Метод розрахунку коефіцієнтів варіації

Нехай  – значення оцінюваної ознаки, де  – номер страти, а  – обсяг вибірки зі страти . Введемо такі величини , де  – домен, для якого оцінюється показник (наприклад, регіон або вид економічної діяльності). Тоді за вибіркою оцінка сумарного значення ознаки для домену  визначається за допомогою такої формули:

,

де  – результативні вибіркові ваги:

.

Оскільки відбір одиниць з кожної страти відбувається незалежно, то дисперсію оцінки сумарного значення можна обчислити за формулою:

,

де  – вибіркова дисперсія у страті , обчислена за величинами .

Коефіцієнт варіації оцінки сумарного значення показника  обчислюється як відношення кореня з дисперсії до оцінки:

.

У цілому по сукупності обчислюється загальна дисперсія та коефіцієнт варіації. Для цього використовуються вищезазначені формули, в яких замість величин  використовуються .

 

Для характеристики надійності оцінок використовується також такий набір категорій:

Таблиця 1

Категорія надійності

Значення коефіцієнта варіації

Рівень надійності

А

не більше 5%

високий

Б

від 5,1% до 10%

достатній

В

від 10,1% до 15%

задовільний

Г

від 15,1% до 25%

низький (придатні лише до якісного аналізу)

Д

більше 25%

незадовільний (малопридатні до аналізу)

Розраховані коефіцієнти варіації та відповідні рівні надійності свідчать, що в цілому по Україні оцінки обсягу реалізованої продукції та кількості найманих працівників мають високу точність, тобто є нижчими за 5% (0,5% та 0,3% відповідно).

За видами економічної діяльності на рівні секцій КВЕД показники мають високу точність, окрім обсягу реалізованої продукції для виду економічної діяльності “Діяльність готелів та ресторанів”, де оцінка має достатню точність.

Найбільш точні оцінки отримані для підприємств секції “Торгівля; ремонт автомобілів, побутових виробів та предметів особистого вжитку” – 0,7% для обсягу реалізованої продукції та 0,4% для кількості найманих працівників. Найменш точними є значення для підприємств секції “Діяльність готелів та ресторанів”. Коефіцієнти варіації для цього виду економічної діяльності складають 5,3% та 2,1% відповідно.

За регіонами оцінки обсягу реалізованої продукції та кількості найманих працівників мають високу точність. Найбільш точні оцінки спостерігаються в м. Києві (0,7 і 0,6 відповідно), найменш точні – для обсягу реалізованої продукції – в Кіровоградській і Хмельницькій областях (4,3%), для кількості найманих працівників – в м. Севастополь (4,3%).

Коефіцієнти варіації обсягу реалізованої продукції та кількості найманих працівників досить щільно пов’язані між собою – коефіцієнт кореляції між ними складає 71%. Коефіцієнт варіації є меншим для регіонів з великою кількістю підприємств і, навпаки, є більшим для малих регіонів.

Таблиця 2

Надійність оцінок обсягу реалізованої продукції (робіт, послуг) малих підприємств за видами економічної діяльності у 2008 році

Вид економічної діяльності

Обсяг реалізованої продукції (робіт, послуг), млрд. грн.

Коефіцієнт варіації, %

Категорія надійності

Усього

у тому числі

492,4

0,5

А

Сільське господарство, мисливство, лісове господарство

10,3

1,9

А

Промисловість

45,6

0,9

А

Будівництво

42,3

1,3

А

Торгівля; ремонт автомобілів, побутових виробів та предметів особистого вжитку

305,3

0,7

А

Торгівля автомобілями та мотоциклами, їх технічне обслуговування та ремонт

22,9

2,5

А

   Оптова торгівля і посередництво в оптовій

   торгівлі

263,4

0,8

А

Роздрібна торгівля; ремонт побутових виробів та предметів особистого вжитку

19,0

1,8

А

Діяльність готелів та ресторанів

3,2

5,3

Б

Діяльність транспорту та зв'язку

16,7

1,6

А

Фінансова діяльність

8,0

2,2

А

Операції з нерухомим майном, оренда, інжиніринг та надання послуг підприємцям

55,5

1,1

А

Освіта

0,6

2,6

А

Охорона здоров’я та надання соціальної допомоги

1,2

4,0

А

Надання комунальних та індивідуальних послуг; діяльність у сфері культури та спорту

3,6

5,0

А

Таблиця 3

Надійність оцінок кількості найманих працівників малих підприємств

за видами економічної діяльності у 2008 році

 

Вид економічної діяльності

Кількість найманих працівників, тис. осіб

Коефіцієнт варіації, %

Категорія надійності

Усього

у тому числі

2156,8

0,3

А

Сільське господарство, мисливство, лісове господарство

145,7

1,1

А

Промисловість

381,5

0,7

А

Будівництво

267,2

0,9

А

Торгівля; ремонт автомобілів, побутових виробів та предметів особистого вжитку

554,6

0,4

А

Торгівля автомобілями та мотоциклами, їх технічне обслуговування та ремонт

52,6

1,2

А

   Оптова торгівля і посередництво в оптовій

   торгівлі

361,0

0,5

А

Роздрібна торгівля; ремонт побутових виробів та предметів особистого вжитку

141,0

0,9

А

Діяльність готелів та ресторанів

71,6

2,1

А

Діяльність транспорту та зв'язку

125,9

1,2

А

Фінансова діяльність

24,5

2,0

А

Операції з нерухомим майном, оренда, інжиніринг та надання послуг підприємцям

458,0

0,8

А

Освіта

15,2

2,1

А

Охорона здоров’я та надання соціальної допомоги

32,8

2,0

А

Надання комунальних та індивідуальних послуг; діяльність у сфері культури та спорту

75,4

1,5

А

Таблиця 4

Надійність оцінок обсягу реалізованої продукції (робіт, послуг) малих підприємств

за регіонами у 2008 році

 

Регіон

Обсяг реалізованої продукції (робіт, послуг), млрд. грн.

Коефіцієнт варіації, %

Категорія надійності

Україна

492,4

0,5

А

Автономна Республіка Крим

12,0

1,9

А

Вінницька

7,9

2,8

А

Волинська

4,9

4,1

А

Дніпропетровська

45,9

1,4

A

Донецька

41,3

2,7

А

Житомирська

6,3

2,7

A

Закарпатська

4,6

3,9

А

Запорізька

17,7

1,9

A

Івано-Франківська

5,4

4,0

А

Київська (без м. Києва)

20,9

2,6

A

Кіровоградська

6,9

4,3

А

Луганська

15,5

4,2

А

Львівська

17,3

1,6

A

Миколаївська

9,9

3,1

А

Одеська

31,4

3,4

А

Полтавська

12,6

2,4

A

Рівненська

4,3

3,4

А

Сумська

5,8

2,5

A

Тернопільська

3,6

3,5

А

Харківська

28,3

1,4

A

Херсонська

8,0

3,1

А

Хмельницька

6,1

4,3

А

Черкаська

7,7

2,9

A

Чернівецька

3,4

3,1

А

Чернігівська

5,0

3,0

A

м. Київ

156,2

0,7

A

м. Севастополь

3,5

3,5

А

 

 

Таблиця 5

Надійність оцінок кількості найманих працівників малих підприємств

 за регіонами у 2008 році

 

Регіон

Кількість найманих працівників, тис. осіб

Коефіцієнт варіації, %

Категорія надійності

Україна

2156,8

0,3

А

Автономна Республіка Крим

86,4

2,5

А

Вінницька

55,0

3,0

А

Волинська

36,2

3,5

А

Дніпропетровська

146,3

1,6

A

Донецька

169,3

1,9

А

Житомирська

50,9

3,2

A

Закарпатська

38,4

3,8

А

Запорізька

82,2

2,5

A

Івано-Франківська

42,6

3,6

А

Київська (без м. Києва)

89,4

2,5

A

Кіровоградська

34,8

3,6

А

Луганська

72,1

2,4

А

Львівська

125,8

1,9

A

Миколаївська

50,5

3,0

А

Одеська

120,1

2,1

А

Полтавська

58,2

2,9

A

Рівненська

37,6

3,2

А

Сумська

43,0

3,5

A

Тернопільська

34,7

3,6

А

Харківська

140,2

2,0

A

Херсонська

39,5

4,0

А

Хмельницька

45,5

3,2

А

Черкаська

46,2

3,1

A

Чернівецька

27,5

3,6

А

Чернігівська

41,5

3,4

A

м. Київ

420,6

0,6

A

м. Севастополь

22,3

4,3

А

 

 

2.2. Невибіркові похибки

Для характеристики невибіркових похибок у цьому звіті використовуються рівні повних відповідей, обчислені за видами економічної діяльності (рис. 1) та регіонами України (рис. 2), а також рівні невідповідей за їх причинами (табл. 6). Часткових відповідей в обстеженні малих підприємств 2008 року не виявлено.

Рівень повних відповідей за видами економічної діяльності змінюється від 84,3% для охорони здоров’я та надання соціальної допомоги до 93,3% для діяльності готелів та ресторанів.

У цілому за всіма малими підприємствами рівень повних відповідей становить 86,5%.

 

Подпись: %

 

Рис. 1. Рівні повних відповідей малих підприємств за видами економічної діяльності у 2008 році

Рівень повних відповідей за регіонами коливається від 75,1% у м. Севастополь до 94% у Хмельницькій області.

 

Подпись:  

 

Рис. 2. Рівні повних відповідей малих підприємств за регіонами у 2008 році

Таблиця 6

Рівні невідповідей за причинами

Причина

Рівень невідповідей,

%

Ліквідовано (або в стадії ліквідації);

3,5

Визнано банкрутом (або відкрито справу щодо визнання банкрутом)

1,6

Не знайдено за наявними адресами в ході проведення статистичного обстеження, при цьому підприємство мало найманих працівників та/або здійснювало реалізацію продукції

6,9

Не знайдено за наявними адресами в ході проведення статистичного обстеження, при цьому підприємство не мало найманих працівників та/або не здійснювало реалізацію продукції

33,7

Не відповідає умовам відбору (фермерське господарство з чисельністю менше 50 осіб, зміна ОПФГ, перетворено на філію або відокремлений підрозділ)

2,0

Категорична відмова звітувати

0,4

Відмова звітувати (призупинена діяльність, новостворене підприємство) та має найманих працівників або здійснювало реалізацію продукції (робіт, послуг)

2,4

Відмова звітувати (призупинена діяльність, новостворене підприємство) та не має найманих працівників або не здійснювало реалізацію продукції (робіт, послуг)

47,2

Інші причини

2,3

 

 

3. Своєчасність та пунктуальність

Своєчасність та Пунктуальність статистичні дані повинні поширюватися своєчасно зі встановленою періодичністю.

Своєчасність характеризує інтервал часу між моментом (періодом), у який відбувалося явище або процес, що описують статистичні дані, та датою готовності (подання) цих даних.

Пунктуальність характеризує інтервал часу між датою публікації даних і датою, на яку планували їх випуск і яку було заздалегідь анонсовано.

Статистична інформація за результатами структурного обстеження оприлюднюється у два етапи згідно з планом державних статистичних спостережень та порядком її розміщення на веб-сайті Держкомстату. Перший етап передбачає публікацію матеріалів без урахування зміни підприємствами їхнього основного виду економічної діяльності, другий етап – з урахуванням зміни підприємствами їхнього основного виду економічної діяльності.

Результати обстеження без уточненого основного виду економічної діяльності оприлюднюються у третій декаді червня на веб-сайті Держкомстату, а також подаються керівним органам держави для моніторингу.

Остаточні дані за результатами спостереження (з уточненим основним видом економічної діяльності) готові до оприлюднення через 10 місяців після закінчення звітного періоду.

Основні показники діяльності малих підприємств друкуються у збірнику “Діяльність малих підприємств” через 48 тижнів та у збірнику “Діяльність підприємств - суб’єктів підприємницької діяльності” через 46 тижнів.

Строки надання даних та публікації інформації затверджені у плані державних статистичних спостережень.

На веб-сайті Держкомстату (www.ukrstat.gov.ua) розміщені “Каталог статистичних видань”, у якому наведено перелік та терміни підготовки статистичних збірників за матеріалами структурного вибіркового обстеження, а також графік оновлення матеріалів веб-сайту Держкомстату, в якому зазначені терміни розміщення на сайті основних результатів обстеження та доповідей.

Публікація статистичних даних річного структурного обстеження підприємств відбувається своєчасно згідно з графіком, затвердженим планом державних статистичних спостережень.

 

4. Доступність та Зрозумілість/Ясність

Доступність та Зрозумілість/Ясність статистичні дані мають представлятися у зрозумілій формі, поширюватися  у придатному та зручному для використання вигляді, бути доступними усім користувачам на рівних умовах та супроводжуватися метаданими і відповідними поясненнями.

Доступність статистичних продуктів показує, наскільки легко користувачі можуть отримати дані. Вона визначається фізичними умовами, за якими користувачі можуть отримати статистичні дані: способи та місця отримання даних, процедури замовлення, час, необхідний для виконання замовлень, політика ціноутворення, існуючі маркетингові умови (авторське право та ін.), формати, в яких дані можуть бути надані користувачам (паперові носії, електронні носії, CD-ROM, Інтернет та ін.), наявність макро- та мікроданих тощо.

Зрозумілість/Ясність статистичних продуктів показує, наскільки легко користувачі можуть зрозуміти дані. Вона характеризує інформаційне середовище даних: наявність та якість метаданих, що надаються зі статистичними даними (текстова інформація, пояснення, документація та ін.), ілюстрації (діаграми, мапи, схеми та ін.), наявність пояснень щодо якості даних (включаючи обмеження у використанні) та відомості про те, наскільки виробник готовий надати додаткову допомогу (супровід даних).

Результати структурного обстеження підприємств доступні для користувачів у паперовому вигляді (публікації – статистичні збірники), електронному вигляді, та у вигляді файлів мікроданих (у знеособленому вигляді).

Основна інформація публікується у статистичних збірниках:

-   “Діяльність малих підприємств”;

-   “Діяльність підприємств - суб’єктів підприємницької діяльності”

у розрізах видів економічної діяльності (на рівні груп за Класифікацією видів економічної діяльності) 27 регіонів України. У публікаціях наведені основні визначення та терміни, що використовувались у публікації. Матеріал викладено у найбільш зручній для користувачів формі – в табличному та графічному вигляді.

Ці статистичні збірники в паперовому вигляді надсилаються користувачам поштою за затвердженим переліком розсилки. В електронному вигляді доступ до них користувачами здійснюється засобами Інтернет за адресою www.ukrstat.gov.ua.

Основні показники обстеження також наводяться у збірнику "Статистичний щорічник України".

 

5. Послідовність/Узгодженість і Зіставність/Порівнянність

Послідовність/Узгодженість   та   Зіставність/Порівнянність статистичні дані мають бути узгоджені, зіставні у часі, за регіонами і країнами. Має бути створено можливість для поєднання та спільного використання статистичних даних з різних джерел.

Послідовність/Узгодженість двох або більше статистичних продуктів показує, наскільки у статистичних процесах, у рамках яких вони вироблялися, використовували однакові концепції, класифікації, визначення та сукупності, що вивчаються, а також гармонізовані методи. Послідовні статистичні продукти дозволяється об’єднувати і використовувати спільно.

Зіставність/Порівнянність є окремим випадком послідовності, коли статистичні продукти відносяться до тих самих об’єктів даних, а мета їх об'єднання – зробити порівняння у часі або за регіонами, або за іншими сферами діяльності.

Результати спостереження узгоджені з даними фінансової звітності. На рис. 3 порівнюються обсяги реалізованої продукції, робіт, послуг (без ПДВ та акцизу), отримані за результатами структурного обстеження малих підприємств, та чистого доходу (виручки) від реалізації продукції, отримані з фінансової звітності, за видами економічної діяльності, на рис. 5 – за регіонами.

На рис. 4 відображена відповідність обсягів реалізованої продукції, робіт, послуг (без ПДВ, акцизу) за даними структурного обстеження та чистого доходу (виручки) від реалізації продукції за даними фінансової звітності за видами економічної діяльності, на рис. 6 – за регіонами.  Відповідність визначають як відношення обсягів реалізованої продукції (робіт, послуг) за результатами вибіркового обстеження до чистого доходу (виручки) від реалізації продукції (товарів, робіт, послуг) за даними фінансової звітності помножене на 100%.

На рис. 7–10 наведені аналогічні порівняння та відповідності для середньооблікової чисельності працюючих, отриманої за даними фінансової звітності, та кількості найманих працівників, отриманої за результатами структурного обстеження малих підприємств.

Рис. 3. Порівняння обсягу реалізованої продукції (робіт, послуг) та чистого доходу (виручки) від реалізації продукції (товарів, робіт, послуг) малих підприємств за видами економічної діяльності у 2008 році*

Рис. 4. Відповідність реалізованої продукції (робіт, послуг) та чистого доходу від реалізації продукції малих підприємств за видами економічної діяльності у 2008 році*

Рис. 5. Порівняння середньооблікової чисельності працюючих та кількості найманих працівників малих підприємств за видами економічної діяльності у 2008 році*

Рис. 6. Відповідність середньооблікової чисельності працюючих та кількості найманих працівників малих підприємств за видами економічної діяльності у 2008 році*

*На рисунках використані позначення, що відповідають секціям Класифікації видів економічної діяльності (КВЕД):

A

Сільське господарство, мисливство, лісове господарство

 

I

Діяльність транспорту та зв'язку

C

Добувна промисловість

 

J

Фінансова діяльність

D

E

Переробна промисловість

Виробництво та розподілення електроенергії, газу та води

 

K

Операції з нерухомим майном, оренда, інжиніринг та надання послуг підприємцям

F

Будівництво

 

M

Освіта

G

 

H

Торгівля; ремонт автомобілів, побутових виробів та предметів особистого вжитку

Діяльність готелів та ресторанів

 

N

O

Охорона здоров’я та надання соціальної допомоги

Надання комунальних та індивідуальних послуг; діяльність у сфері культури та спорту

 

Рис. 7. Порівняння обсягу реалізованої продукції (робіт, послуг) та чистого доходу (виручки) від реалізації продукції (товарів, робіт, послуг) малих підприємств за регіонами України у 2008 році

 

Рис. 8. Відповідність реалізованої продукції (робіт, послуг) та чистого доходу (виручки) від реалізації продукції (товарів, робіт, послуг) малих підприємств за регіонами України у 2008 році

 

Рис. 9. Порівняння середньооблікової чисельності працюючих та кількості найманих працівників малих підприємств за регіонами України у 2008 році

 

Рис. 10. Відповідність середньооблікової чисельності працюючих та кількості найманих працівників малих підприємств за регіонами України у 2008 році

 

6. Конфіденційність, прозорість та захист

Згідно зі статтею 21 Закону України “Про державну статистику” органи державної статистики надають гарантії щодо забезпечення конфіденційності статистичної інформації. “Первинні дані, отримані органами державної статистики від респондентів під час проведення статистичних спостережень, а також адміністративні дані щодо респондентів, отримані органами державної статистики від органів, що займаються діяльністю, пов’язаною із збиранням та використанням адміністративних даних, є конфіденційною інформацією, яка охороняється Законом і використовується виключно для статистичних цілей у зведеному знеособленому вигляді. Поширення статистичної інформації, на підставі якої можна визначити конфіденційну статистичну інформацію щодо конкретного респондента, забороняється.” Винятком є інформація, зазначена у статті 22 цього Закону. Відповідно до Закону України “Про внесення змін до Кодексу України про адміністративні правопорушення” порушення порядку використання конфіденційної інформації тягне за собою накладення штрафу.

Згідно з Положенням про Державний комітет статистики України Держкомстат забезпечує повноту, надійність, об’єктивність, цілісність статистичної інформації, її адекватність соціально-економічним явищам і процесам; забезпечує гласність і відкритість статистичної інформації та методології; проводить прес-конференції, семінари з користувачами статистичної інформації та анкетні опитування.

Крім того, відповідно до Положення Держкомстат забезпечує згідно із законодавством збереження та захист статистичної інформації, дотримання її конфіденційності.

 

 

 

Визначення основи вибірки

Генеральна сукупність малих підприємств (основа вибірки) є частиною генеральної сукупності звітних одиниць міжгалузевої статистики підприємств, яка формується на державному рівні на підставі Статистичного реєстру підприємств, річного та квартального структурного обстеження, а також річної та квартальної фінансової звітності.

До основи вибірки належать:

- сукупність підприємств тих видів економічної діяльності, які обстежуються суцільним чином (це спричинено неможливістю отримати надійні показники за цими видами економічної діяльності);

- основна сукупність: підприємства, які у попередньому до звітного року мали ненульовий обсяг реалізованої продукції або кількість найманих робітників (окрім зазначених вище видів економічної діяльності та незначних підприємств);

- незначні підприємства: підприємства, які у попередньому до звітного році мали нульові обсяги реалізованої продукції та кількість найманих працівників – 1–2 особи;

- новостворені у звітному році підприємства.

 

Рис. 1. Схема визначення основи вибірки для обстеження малих підприємств

 

Побудова дизайну вибірки

Генеральна сукупність малих підприємств є неоднорідною за цільовими ознаками. Тому для отримання репрезентативної вибірки використовується стратифікована вибірка, яка полягає у попередньому розподіленні основи вибірки на більш однорідні групи (страти) і відборі з кожної з них певної кількості одиниць для безпосереднього обстеження. Стратифікація відбувається окремо для основної сукупності, незначних та новостворених підприємств.

Побудова дизайну стратифікованої вибірки передбачає:

- стратифікацію сукупності підприємств;

- виявлення нетипових одиниць у стратах;

- об’єднання малих страт.

Стратифікація підприємств

Основна сукупність

Стратифікація основної сукупності малих підприємств проводиться за такими критеріями:

1) основний вид економічної діяльності (група за КВЕД);

2) територіальна належність підприємства;

3) розмір підприємства (визначається за кількістю найманих працівників).

За видом  економічної  діяльності виділено 60 груп,  за кількістю найманих працівників – 4 групи. Враховуючи те, що стратифікація за 27 регіонами в поєднанні з видом економічної діяльності дає значну кількість дрібних страт, які, в свою чергу не є більш однорідними, виконується об’єднання регіонів у 6 регіонально-локальних груп. При формуванні цих груп враховується структура сукупності за обсягом реалізованої продукції за видами економічної діяльності за регіонами та кількість підприємств генеральної сукупності за регіонами.

Після формування страт файл, в якому міститься основна сукупність активних  підприємств, агрегується за кодом страти, після чого для страт визначаються такі показники (для обсягу реалізованої продукції): мінімальне, максимальне та середнє значення, середньоквадратичне відхилення, коефіцієнт варіації, а також кількість підприємств у страті.

У статистичній практиці розвинених країн щодо вибіркових обстежень підприємств вважається, що коефіцієнт варіації не повинен перевищувати 3. Для зниження коефіцієнта варіації виконують процедури виявлення нетипових підприємств.

Новостворені та незначні підприємства

Для новостворених та незначних підприємств стратифікація проводиться за основним видом економічної діяльності.

 

Виявлення нетипових підприємств

Реальний вплив на зменшення розміру похибки вибірки має виявлення нетипових підприємств та розміщення їх в окремій страті для подальшого обстеження на суцільній основі. Виявлення нетипових підприємств здійснюється тільки в основній сукупності підприємств та виконується двічі: перший раз – одразу після стратифікації, вдруге – після об’єднання страт.

Для виявлення нетипових одиниць підприємства у кожній страті розміщують у порядку за спаданням обсягу реалізованої продукції з подальшою оцінкою їхніх значень математичним, графічним (ящичкові діаграми) та експертним методами.

Математичний метод:

Нетиповими вважаються підприємства, для яких значення обсягу реалізованої продукції потрапляє за межі інтервалу:

,

де  – значення обсягу реалізованої продукції для i-тої одиниці в страті h;  – середнє значення обсягу реалізованої продукції в страті h;  – середньоквадратичне відхилення обсягу реалізованої продукції в страті h;  – кількість одиниць у страті h.

Графічний метод використовується як допоміжний при проведенні експертної оцінки значень цільової ознаки (обсягу реалізованої продукції). Графік типу "box-plot" будується для кожної страти окремо. На ньому видно всі "викиди" значень цільової ознаки.

Нетипові підприємства групуються в окрему страту за кожним видом економічної діяльності. Такі страти називаються нетиповими. Нетипові одиниці обстежуються на суцільній основі (тобто ймовірність включення їх у вибірку дорівнює одиниці).

При виділенні нетипових підприємств спочатку застосовується математичний метод, після чого знову формується агрегований файл із вищевказаними статистичними показниками для перевірки коефіцієнту варіації цільової ознаки в кожній страті. Якщо коефіцієнт варіації в страті є більшим за 2, то необхідно продовжити виділення нетипових підприємств експертним та графічним методами.

Проте необхідно слідкувати за тим, щоб кількість нетипових підприємств не була дуже великою. Експертним шляхом встановлено, що загальна кількість підприємств, які обстежуються на суцільній основі не повинна перевищувати 12%.

 

Об’єднання страт

Страти, в яких менше 10 одиниць, вважають малими й обстежують повністю. Перелік підприємств основної сукупності за виключенням нетипових підприємств і малих страт  називають основною підсукупністю.

Оскільки наявність малих страт призводить до збільшення обсягу вибірки, намагаються зменшити їхню кількість шляхом об’єднання. Для цього для кожної з отриманих страт аналізують їхні показники, враховуючи економічні особливості та тенденції розвитку певних видів економічної діяльності та регіонів. Об’єднання проводиться як за локально-регіональними групами, так і за розміром підприємств в межах одного виду економічної діяльності. Об’єднанню підлягають страти з близькими середніми за умови, що коефіцієнт варіації об’єднаної страти буде нижчим за максимальний із двох об’єднуваних страт.

Для виявлення схожих регіонів застосовується t-критерій для незалежних вибірок. Процедура t-критерію для незалежних вибірок порівнює середні значення для двох груп спостережень. Реалізація цієї процедури відбувається стандартними засобами пакету обробки статистичних даних SPSS.

За даними, отриманими за допомогою цього критерію, можна зробити висновок щодо того, чи значно відрізняються характеристики однієї страти від іншої, а отже, показники однієї локально-регіональної групи від іншої. Якщо з економічної точки зору можливо об’єднати регіони і t-критерій підтвердив ідентичність середніх, приймається рішення про об’єднання двох регіонів у один.

Таким чином, об’єднання виконується як для зменшення кількості страт, так і для зниження коефіцієнту варіації.

Об’єднання страт проводиться поступово, передусім об’єднуються страти в межах одного виду економічної діяльності та локально-регіональної групи (тобто ті, що відрізняються лише групою за розміром підприємств), потім ті страти, що відрізняються територіальною приналежністю (в межах одного виду економічної діяльності та групи за розміром).

Після об’єднання проводиться повторна агрегація основної підсукупності з повторним розрахунком статистичних показників для всіх страт. На цьому етапі виконується остаточне виявлення нетипових одиниць.

Малі страти та нетипові підприємства повинні міститись в окремому файлі, оскільки вони обстежуються з імовірністю 1 (тобто суцільним чином).

 

Обчислення обсягу вибірки

Одним із визначальних етапів планування вибіркового обстеження та формування вибірки є розрахунок обсягу вибіркової сукупності, необхідного для задоволення встановлених вимог. Від обсягу вибірки залежить надійність результатів обстеження та його вартість. Занадто великий обсяг вибірки призводить до невиправданих витрат та неефективного використання коштів, а недостатній обсяг вибірки – до незадовільної якості результатів обстеження.

Обчислення загального обсягу вибірки

При визначенні обсягу вибіркової сукупності виходять із того, що його граничним значенням є 20%.

Загальний обсяг вибірки складають:

-   підприємства тих видів економічної діяльності, які обстежуються суцільним чином (100%);

-   нетипові підприємства та малі страти (100%);

-   1% – 3% підсукупності незначних підприємств;

-    10% підсукупності новостворених підприємств;

-    приблизно 25% підприємств основної підсукупності.

Відсоток відбору з основної підсукупності розраховується за різницею максимально допустимого загального обсягу вибірки та суми обсягів вибірок з інших підсукупностей.

 

Обчислення обсягу вибірки за стратами

Передусім обсяг вибірки для основної підсукупності підприємств поділяється на дві частини: 90% – для розподілення за стратами на основі визначеного розміщення, 10% – “резерв”. “Резерв” – це кількість одиниць вибірки, які використовуються для коригування розмірів вибіркових страт. Ця процедура необхідна для упорядкування кількості підприємств у стратах вибірки, що пов’язано передусім із високим відсотком неотримання відповідей у ході вибіркового обстеження, що для малочисленої страти є суттєвим при поширенні її даних на генеральну сукупність.

Згідно з дизайном вибірки з “резерву” поповнюються такі страти вибіркової сукупності:

· з кількістю підприємств у вибірці меншою за 10 (доповнюються до 10 одиниць);

· які відповідають стратам генеральної сукупності з високим коефіцієнтом варіації (порівняно з іншими стратами);

· в яких спостерігався високий відсоток невідповідей у попередньому обстеженні.

Принцип розподілу обсягу вибірки за стратами залежить від виду відбору, який застосовується для формування вибіркової сукупності. Найбільш оптимальним для отримання надійних результатів на національному рівні є розміщення Неймана, при якому обсяг вибірки у страті обраховується за формулою:

,

де  – обсяг вибірки зі страти h; – кількість одиниць у страті h;  – середньоквадратичне відхилення обсягу реалізованої продукції в страті h.

У деяких випадках формула дає . Тоді розмір вибірки у страті  дорівнює розміру сукупності у страті : . Обсяг вибірки, що вивільняється, у таких випадках додається до обсягу вибірки зі страт, у яких , після чого процедура обчислення обсягів вибірки за стратами за оптимальним розміщенням Неймана проводиться повторно.

Після застосування оптимального розміщення Неймана відбувається розподілення “резерву” у ручний спосіб.

Зауважимо, що при обчисленні обсягу вибірки округлення завжди відбувається в бік збільшення.

При розподіленні “резерву” необхідно враховувати наступне:

·         Для кожної страти кількість одиниць у вибірці має бути не менше 10.

·         Розмір вибірки в страті коригується на відсоток невідповідей (за результатами попередньо проведеного обстеження), а саме збільшується (зменшується) при високому (низькому) значенні відсотку невідповідей.

·         Розмір вибіркових страт коригується в залежності від статистичних характеристик, а саме збільшується (зменшується) в стратах із високим (низьким) показником варіації при незмінному загальному розмірі вибіркової сукупності.

·         Для кожної групи за видом економічної діяльності та локально-регіональної групи у вибірці необхідно дотримуватися наступного співвідношення між вагами страт залежно від групування за кількістю найманих працівників:

 w1 >= w2 >= w3 >= w4.

 

Принципи формування переліку одиниць для обстеження

Вибіркова сукупність формується з кожної вищевказаної складової основи вибірки окремо.

Формування вибіркової сукупності починається з визначення кроку відбору та початку відбору (перший елемент відбору). Крок відбору – це результат ділення обсягу генеральної сукупності на обсяг вибірки (по кожній страті):

step = N / n.

Для розрахунку першого елементу відбору спочатку розраховують змінну добутком кроку відбору на випадкове число. Випадкове число визначається за допомогою генератора випадкових чисел і приймає значення від 0 до 1:

k = step*rnd.

Перший елемент відбору визначається відповідно до змінної k: якщо ця змінна більше або дорівнює одиниці, то вона буде вказувати на перший елемент відбору, якщо ця змінна менше одиниці, то перший елемент відбору визначається додаванням до цієї змінної кроку відбору:

Перед початком відбору виконується впорядкування елементів страти за територіальною ознакою, а для основної підсукупності – і за обсягом реалізованої продукції.

Нетипові підприємства, малі страти та підприємства з окремими попередньо визначеними видами економічної діяльності обстежують повністю.

 

Оброблення та аналіз результатів

Після того, як первинні дані зібрані, вони піддаються обробленню та аналізу. Основними етапами оброблення та аналізу даних є:

1)        редагування даних;

2)        врахування невідповідей;

3)        розповсюдження даних;

4)        оцінювання надійності результатів.

Редагування масиву даних, що утворився в результаті безпосередньої реєстрації даних у респондентів на предмет наявності грубих помилок, здійснюється на етапі введення первинної інформації для електронної обробки. Редагування даних на невідповіді здійснюється на масиві, що вже не містить грубих помилок.

Для одержаного масиву насамперед необхідно перевірити належність підприємств до поля спостереження. Не відповідають умовам відбору одиниці спостереження, наприклад, великі та середні підприємства. Вони вилучаються із бази даних і приєднуються до відповідного масиву.

Наступним етапом є ідентифікація невідповідей та їх оброблення. Компенсація відсутніх відповідей проводиться в два етапи:

1) аналіз причин невідповідей та їх ідентифікація;

2) застосування методів компенсації відсутніх відповідей.

Розрізняють два основні види відсутності даних (невідповідей, пропусків):

-  повна невідповідь, коли досліджувана одиниця взагалі не надає даних (третя група);

-  часткова невідповідь, коли досліджувана одиниця не надає даних лише за одним чи кількома показниками анкети, а за іншими надає (друга група).

Перед тим, як застосовувати той чи інший метод аналізу невідповідей, важливо з’ясувати, до якого типу невідповідей належить саме ця. Лише знаючи тип невідповіді та причини її виникнення, можна прийняти правильне рішення щодо найбільш прийнятного методу її обробки.

Для більш точної ідентифікації підприємств, що не відповіли, та для розрізнення одиниць, яких фактично не існує, і тих, що з певних причин не відповіли, необхідно деталізувати типи причин ненадання підприємствами звіту.

Таким чином, оброблення результатів складається з таких етапів:

1)        очищення основного масиву підприємств від одиниць, що не відповідають умовам відбору, та таких, які призупинили свою діяльність в роки, що передують звітному, тобто одиниць, які не входять до поля нашого обстеження;

2)        видалення підприємств, які не надали відповідей;

3)        виявлення та підрахунок кількості нетипових підприємств в основному масиві:

-  перевірка підприємств на причетність до нетипових;

-  виділення нетипових підприємств, що відповідають за велику кількість підприємств генеральної сукупності за допомогою фільтрів;

-  підрахунок кількості нетипових підприємств в межах кожної страти;

4)        коригування базової ваги кожного підприємства в страті (для основного масиву) та в межах виду економічної діяльності (для масиву незначних та новостворених підприємств) та визначення результативної ваги для кожного підприємства у вибірковій сукупності. Підрахунок скоригованої ваги.

Для компенсації відсутніх відповідей використовується метод прямого перезважування. Цей метод полягає у визначенні базової ваги кожної вибіркової одиниці та коригуванні її на кількість невідповідей за допомогою вагового коефіцієнта.

Для отримання оцінок показників діяльності малих підприємств за видами економічної діяльності та регіонами, використовується метод, описаний у пункті “Надійність” цього звіту.