Главная Обратная связь

Дисциплины:






Способи формування вибірок



Формування репрезентативної вибірки (тобто такої, що правильно характеризує генеральну сукупність) – це не безладний процес; він здійснюється за певними правилами. В залежності від основи вибірки у практиці вибіркових обстежень використовують різні способи формування вибіркових сукупностей.

Способи формування вибірки:

1. проста випадкова вибірка;

2. механічна вибірка;

3. типова (районована) вибірка;

4. серійна вибірка;

5. комбінована вибірка.

Простий випадковий відбір проводиться жеребкуванням або на основі таблиць випадкових чисел. Це класичний спосіб формування вибіркової сукупності і саме на ньому ґрунтується теорія вибіркового методу. Він передбачає попередню досить складну підготовку до формування вибірки. Так, для жереба на кожну одиницю відбору треба заготовити відповідну фішку; при використанні таблиць випадкових чисел всі елементи генеральної сукупності мають бути пронумеровані. У великих за обсягом сукупностях така робота здебільшого недоцільна, а часом і неможлива. Тому на практиці застосовують інші різновиди випадкових вибірок.

Механічний (систематичний) відбір передбачає, що основою вибірки є впорядкована чисельність елементів генеральної сукупності. Відбір елементів здійснюється через однакові інтервали, крок інтервалу залежить від частки вибірки D=n/N і визначається як 1/D=N/n. Початковий елемент відбору визначають як випадкове число всередині першого інтервалу жеребкування (іноді розпочинають з середини інтервалу), другий елемент залежить від початкового числа і кроку інтервалу. Так для частки вибірки D=0,05 кроком інтервалу є число 1/0,05=20. Тобто у вибірку має попасти кожний двадцятий елемент. Якщо початковий елемент – випадкове число 3, то другий елемент становить 3+20=23, третій – 23+20=43 і т.д.

Механічний відбір особливо зручний в тих випадках, коли вже є списки одиниць сукупності, складені в тому чи іншому порядку, а також в тих випадках, коли мають справу з генеральною сукупністю, чисельність якої відома лише наближено, одиниці якої з’являються поступово протягом деякого періоду, наприклад, при контролі якості продукції, що виготовляється. Похибка вибірки при механічному відборі визначається за формулою простої випадкової безповторної вибірки

Розшарований (районований, типовий, стратифікований) відбір передбачає попередню структуризацію генеральної сукупності та незалежний відбір елементів у кожній складовій частині. Обсяг розшарованої вибірки – це сума частинних вибірок nj, тобто , де m число складових частин (груп, типів, районів, страт тощо).

При обчисленні похибки розшарованої вибірки використовують середню з групових дисперсій



 

. (10.12)

А відповідно до правила складання дисперсій , або , де - кореляційне відношення, яке визначає щільність зв’язку між ознаками, що відображають причину і наслідок. Таким чином, розшарування (типізація) сукупності зменшує похибку вибірки на частку 1-h2. Чим щільніший зв’язок між ознаками, тим помітніше зменшення похибки вибірки.

У практиці вибіркових обстежень застосовують різні способи визначення обсягу частинних вибірок nj. Найпростішим із них, коли всі m груп представлені однаковою кількістю елементів, є такий:

 

.

 

Проте застосування цього способу обмежене. Якщо чисельності груп Nj дуже відрізняються, може виникнути ситуація, коли nj > Nj (N=N1+ N2+…+ Nj+…+ Nm).

Найчастіше використовують пропорційний відбір, який передбачає однакове для всіх складових частин представництво у вибірці. Обсяг частинних вибірок у цьому випадку визначається як

 

,

де D=n/N - частка вибірки.

Оптимальним щодо мінімізації похибки вибірки при розшарованому відборі є відбір пропорційний як чисельності групи Nj так і середньому квадратичному відхиленню ознаки, яка вивчається у цій групі sj. Обсяг частинних вибірок визначається при цьому за формулою

.

Очевидно, що точні розрахунки оптимального розподілу обсягу вибірки між групами практично неможливі, так як до проведення досліджень про величини sj можна мати лише наближені уявлення. Тому на практиці, коли є підстави вважати, що в тій чи іншій групі варіація ознаки, яку вивчають, більша, ніж у решти груп, цій групі „на око” дещо збільшують чисельність вибірки.

Похибку розшарованої вибірки обчислюють за формулою

 

.

 

При серійному відборі основа вибірки складається з серій елементів сукупності, зв’язаних територіально (райони, селища), організаційно (фірми, акціонерні товариства) тощо. Серії відбираються за схемою механічної або простої випадкової вибірки, обстеженню підлягають всі елементи серії. При обчисленні похибки вибірки враховується міжсерійна варіація:

 

,

 

де nk та - відповідно обсяг і середня k-тої серії.

Похибка серійної вибірки визначається за формулою:

 

,

 

де S – загальна кількість серій у генеральній сукупності;

s – число відібраних серій для обстеження. Ця похибка буде меншою порівняно з похибкою простої випадкової чи механічної вибірки в тому разі, якщо серії більш-менш однорідні і варіація серійних середніх незначна.

Застосування того чи іншого способу формування вибіркової сукупності залежить від мети вибіркового обстеження, можливостей його організації і проведення. Найбільш поширеними є комбіновані вибірки, які поєднують різні способи відбору: механічний і серійний, розшарований і механічний, простий випадковий і серійний. Поєднання способів відбору забезпечує високу репрезентативність результатів з найменшими трудовими і грошовими витратами на організацію та проведення досліджень.

 

Визначення необхідного обсягу вибірки

 

Визначення необхідного обсягу вибірки – це перша задача, з якою стикається дослідник, що організовує вибіркове обстеження. Практично при цьому йому точно відомі тільки мета вибірки і величина похибки D, яку він вважав би несуттєвою. Сам по собі розрахунок чисельності вибірки на основі допустимої величини похибки нескладний, так як, задавшись довірчою ймовірністю, з якою необхідно забезпечити певну точність D, можна перейти до величини стандартної похибки відбірки m, а потім і до чисельності вибірки.

Проектуючи вибіркові обстеження, визначають мінімально достатній обсяг вибірки, за якого вибіркові оцінки репрезентували б основні властивості генеральної сукупності з заданою точністю.

При повторному відборі , а D=tm. Визначивши m=D/t, підставимо його значення у формулу стандартної похибки вибірки і виразимо з неї n:

 

,

 

аналогічно для частки .

 

При безповторному відборі . Замінивши m на D/t у формулі стандартної похибки вибірки і виразивши з неї n, отримаємо

-для середньої величини

 

,

- для частки

.

 

Для визначення обсягу вибірки n використовують оцінки дисперсій s2 аналогічних пробних обстежень. Якщо такі обстеження відсутні, то можна скористатися співвідношенням

 

,

а для частки взяти найбільше значення дисперсії s2=pq=0,5× 0,5=0,25.

Якщо в основу розрахунку n покласти відносну граничну похибку вибірки , яку ще можна виразити як , де - коефіцієнт варіації ознаки х, то формули обсягу вибірки відповідно модифікуються:

- для середньої величини

,

- для частки

, де q= 1- p.

 





sdamzavas.net - 2017 год. Все права принадлежат их авторам! В случае нарушение авторского права, обращайтесь по форме обратной связи...