Главная Обратная связь

Дисциплины:






Визначення середньої і граничної похибок та необхідної чисельності вибірки



Вибіркова сукупність має пізнавальне значення, оскільки дає уявлення (з певною ймовірністю) про показники генеральної сукупності. Але, як уже зазначалось, при вибірковому спостереженні можуть виникати помилки спостереження. У разі несуцільного спостереження, зокрема вибіркового, крім помилок реєстрації можливі так звані помилки вибірки, або репрезентативності (відповідності), які виникають у зв'язку з тим, що відібрана частина сукупності має за досліджуваною ознакою дещо відмінну структуру порівняно з усією сукупністю.

Помилки реєстрації, як і при суцільному спостереженні, - це розходження між записаними даними в процесі спостереження і дійсними даними. Виникають вони внаслідок недбалого ставлення, неточності вимірювальних приладів, випадкової описки, різного розуміння тих чи інших положень інструкції чи статистичного формуляра.

Помилки репрезентативності - це розходження між середніми величинами або частками ознаки вибіркової і генеральної сукупностей. Помилки репрезентативності можуть бутисистематичними і випадковими.

Систематичні помилки репрезентативності виникають внаслідок порушення принципів проведення вибіркового спостереження. Вони мають тенденційний характер викривлення величини досліджуваної ознаки в бік її збільшення або зменшення.

Випадкові помилки репрезентативності зумовлені тим, що вибіркова сукупність не відтворює точно середні і відносні показники генеральної сукупності.

При організації вибіркового обстеження важливо уникнути систематичних помилок. Властиві вибірковому спостереженню випадкові помилки усунути неможливо, проте теорія вибіркового методу дає математичну основу для обчислення розміру і визначення напрямів зменшення їх. Завдання полягає в тому, щоб максимально наблизити показники вибіркової сукупності до показників генеральної сукупності і знайти можливі межі відхилень цих показників, тобто найти помилку вибірки.

Обумовимо основні позначення статистичних характеристик, які будуть використовуватись при визначенні помилок вибіркового спостереження (табл. 7.1).

Умовні позначення статистичних характеристик генеральної і вибіркової сукупностей

Характеристика Сукупність
генеральна вибіркова
Обсяг сукупності N n
Середнє значення ознаки X x
Загальна дисперсія
Середнє з групових дисперсій
Між групова дисперсія
Частка елементів сукупності, які мають певні значення ознаки W w
Частка вибіркової сукупності в генеральній x D
Кількість серій R r
Дисперсія альтернативної ознаки

 



Достовірність вибіркового спостереження забезпечується розрахунками його помилок для середньої величини і для частки (питомої ваги) ознаки, що вивчається. Помилки вибірки (репрезентативності) позначаються символом (дельта) і є різницею між вибірковою середньою (часткою) і генеральною середньою (часткою):

- помилка вибірки для середньої величини;

- помилка вибірки для частки.

Ці помилки складаються з помилок репрезентативності і помилок реєстрації. Величини помилок вибірки (репрезентативності) в основному залежить:

по-перше, від обсягу вибірки, тому що зі збільшенням числа досліджуваних одиниць результати вибірки все менше будуть відрізнятися від результатів генеральної сукупності;

по-друге, від варіації досліджуваної ознаки. Чим більше варіює ознака, тим більше вибіркова середня (частка) відрізняється від генеральної середньої (частки). Оскільки основним показниками варіації ознаки є дисперсія і середнє квадратичне відхилення, то можна стверджувати, що помилка вибірки перебуває у прямій залежності від величин цих показників;

по-третє, від способу і виду відбору вибіркової сукупності.

Для узагальнюючої характеристики помилок репрезентативності розраховують середню помилку вибірки , її називають ще стандартом. Для визначення середньої помилки репрезентативності вибірки застосовують формули (табл. 2):

 

Особливість обчислення помилок репрезентативності для середньої величини при різних способах відбору полягає в тому, що для її обчислення в основу беруться різні показники дисперсій. При випадковому і механічному відборі для обчислення помилки вибірки використовується загальна дисперсія 2 для середньої і w(1 - w) — для частки.

 

Середня помилка вибірки

Спосіб відбору Метод відбору
повторний безповторний
помилка вибірки для середньої величини
Випадковий і механічний
Типовий (районований)
Серійний
помилка вибірки для частки
Випадковий і механічний
Типовий (районований)
Серійний

 

Коли відбір одиниць здійснюється з окремих типово однорідних груп, виділених за відповідною ознакою, варіації групових середніх немає, і похибка типової вибірки залежить від середньої величини з групових о-,2 для середньої і ^(1 - w) – для частки.

В разі серійної вибірки, яка передбачає суцільне спостереження одиниць у відібраних серіях, похибка вибірки залежить не від числа обстежених одиниць сукупності, від кількості відібраних серій. Похибка вибірки залежатиме не від варіації ознаки у всій сукупності, а від варіації серійних середніх, яка вимірюється міжгруповою дисперсією середньої <з\. При обчисленні середньої помилки вибірки для частки ознаки в основі розрахунку є міжгрупова (міжсерійна) дисперсія вибіркової частки д ^(w,-^)2 8^ ==^

Похибка вибірки для частки ознаки при серійному відборі залежить від числа серій у генеральній сукупності R і числа відібраних серій г.

У формулах для обчислення помилок вибірки при безповторному відборі у підкореневий вираз формул повторного відбору додається множник.

Безповторний відбір гарантує точніші результати, оскільки він виключає можливість обстеження одних і тих самих одиниць при відборі з генеральної сукупності.

Часто постає потреба порівняння похибки вибірки різних ознак або однієї і тієї ознаки в різних сукупностях. Такі порівняння виконують за допомогою відносної помилки, яка показує на скільки відсотків вибіркова оцінка може відхилятися від параметра генеральної сукупності. Відносна стандартна помилка середньої - це коефіцієнт варіації вибіркових середніх:

Для узагальнюючої характеристики помилки вибірки поряд із середньою розраховують граничну помилку вибірки. Стверджувати, що дана генеральна середня не вийде за межі середньої помилки вибірки можна лише з певним ступенем імовірності.

Гранична помилка вибірки -це максимально можлива похибка для взятої ймовірності F(x). Довірче число t показує, як співвідносяться гранична та стандартна похибки. (табл.2).

 

 

Як бачимо з рис. з імовірністю 0,683 гранична похибка не вийде за межі стандартної і тд.

Гранична помилка вибірки розраховується за вибірковим спостереженням по-різному, залежно від видів і способів відбору. Вона можливість встановити, в яких межах лежать значення генеральної середньої або частки. В таблиці 3 наведені формули для обчислення граничної помилки вибірки в різних умовах її здійснення розраховується:

 

Граничні помилки вибірки

Спосіб відбору Метод відбору
повторний безповторний
помилка вибірки для середньої величини
Випадковий і механічний
Типовий (районований)
Серійний
помилка вибірки для частки
Випадковий і механічний
Типовий (районований)
Серійний

 

За допомогою формул граничної похибки вибірки визначають:

1. довірчі межі генеральної середньої і частки з певною ймовірністю;

2. ймовірність того, що відхилення між вибірковими і генеральними характеристиками не перевищує визначену величину;

3. необхідну чисельність вибірки, яка із заданою ймовірністю забезпечує очікувану точність вибіркових показників.

 

Під час вибіркового спостереження важливо правильно визначити необхідну чисельність обсягу вибірки, яка з відповідною ймовірністю забезпечує встановлену точність результатів спостереження. Надмірна чисельність вибірки призводить до затягнення строків дослідження, зайвих витрат часу і коштів, недостатня ж дає результати з великою похибкою репрезентативності.

Визначення необхідної чисельності вибірки залежить від алгебраїчного перетворення формул граничної похибки вибірки при різних способах відбору. Формули необхідної чисельності вибірки при повторному і безповторному відборах наведені в таблиці 4:

 

Аналіз наведених в таблиці 7.4 формул дає підстави стверджувати, що чисельність вибірки залежить:

1. від розміру граничної помилки. Чим точніші результати треба одержати, тобто з меншою помилкою вибірки, тим більшою повинна бути чисельність вибірки;

2. від показників варіації ознаки та частки. Чим більші варіації, тим більше треба взяти одиниць для вибіркового спостереження;

3. від ймовірності, з якою вимагається гарантувати результати вибірки. Чим більша ймовірність, тим більший коефіцієнт кратності, тим більшою повинна бути чисельність вибірки.

•ї-.

Покажемо застосування цих формул на прикладі:

Припустимо, що для господарства, в якому є 8000 корів, необхідно організувати вибіркове обстеження з метою встановлення середньої річної молочної продуктивності корів. Якою має бути чисельність вибірки?

Якщо орієнтуватися на повторний відбір, то в разі граничної похибки ЗО кг, ймовірності Р = 0,954 і середнього квадратичного відхилення 300 кг, визначеного за результатами аналогічних обстежень, необхідна чисельність вибірки становитиме:

^о-2 22•3002 4-90000 ,,,

п = ———— = —————т——— = ———————— = 40(J КОРІВ

Д2, ЗО2 900 кр

При безповторному відборі за тих самих умов необхідна чисельність вибірки становитиме:

t^a^N ^ 4-90000-8000 j ^N+t2^2 ~ 900-8000+4-90000 ~ КОР1В і

Цей розрахунок підтверджує, що за тих самих умов обсяг вибірки при безповторному відборі завжди менший, ніж при повторному.

Частку породних корів з похибкою до 5% за ймовірності 0,954 і дисперсії альтернативної ознаки 0,25 знаходимо необхідну чисельність

вибірки:

- при повторному відборі:

t2 ©(І -w) 4-0.25 і

" = ——^—— = ———— = 400 корів А2^ 0.0025 р

при без повторному відборі:

t^co^-o^N 8000 8000

п = —т;,= ————————— = —— = 380 корів

A^N+t2^-^ 0.0025-8000+1 21 p

Отже, забезпечити очікувану точність при повторному відборі можна, досліджуючи 400 корів, а при без повторному відборі — 380.

В практичних розрахунках чисельності вибірки стикаються з труднощами, що і при розрахунку середньої помилки: відсутні показники мінливості одиниць сукупності ст та w(J - w).

Проблему вирішують таким чином: замість фактичних значень ст2 та ю підставляють їх наближені значення, встановлені або на підставі попереднього обстеження, або на підставі пробних вибіркових обстежень.

Для частки ознаки в сукупності питання про дисперсію вирішується простіше. Справа в тому, що дисперсія альтернативної ознаки змінюється так: при w(l - w) будемо мати:

w = 0,2 0,2 (1 - 0,2) = 0,16 w = 0,3 0,3 ( 1 - 0,3) = 0,21 w = 0,4 0,4 ( 1 - 0,4) = 0,24 w = 0,5 0,5 (1 - 0,5) = 0,25 w = 0,6 0,6 (1 - 0,6) = 0,24 w = 0,7 0,7 ( 1 - 0,7) = 0,21 w = 0,8 0,8 (1-0,8) =0,16

Це означає, що максимальне значення дисперсії альтернативної ознаки може бути 0,25. Для визначення необхідної чисельності вибірки в процесі дослідження частки в розрахунках приймають максимальне значення дисперсії альтернативної ознаки 0,25.

Необхідну чисельність вибірки в разі серійного відбору визначають як відбір певної кількості серій, які забезпечують з відповідною ймовірністю потрібну точність результатів дослідження. Для повторного відбору необхідна чисельність вибірки

_tl62 -Ї^R__

г- .2 , а ДЛЯ беЗПОВТОрНОГО - r ~ ,2n f2s-2-

Д Д К + ( д

У статистичній практиці вибіркове спостереження з великих масивів генеральної сукупності часто здійснюють у вигляді

комбінованої, ступінчастої або кількафазної вибірки. Вибіркова сукупність у разі комбінованої вибірки формується внаслідок

ступінчастого відбору.

Загальна помилка для комбінованої вибірки складається з помилок, які можливі на кожному ступені, і визначається як корінь квадратний з квадратів помилок відповідних вибірок. Наприклад, якщо серійну вибірку скомбінувати з власне випадковою або механічною, то гранична помилка вибірки буде визначатись:

^84r\ aY, n\ А-ґ,—1-—+—1-—. х \ r { R) n{ NJ

У разі моментного методу спостереження гранична помилка частки визначається як для звичайної повторної простої випадкової вибірки.

Наприклад, дослідник провів 120 спостережень і отримав шість

відміток про те, що устаткування простоювало. Вибіркова питома вага буде становити 6 :120 або 5%. Похибка вибірки з довірчою ймовірністю

Р = 0,954:

fw(l-w) 10,05 .0,95 A == f p——'- = 2 -———— = 0,04 \ n \ 120

w-A^W^w+A;

0,05 - 0,04 ^ W ^ 0,05 + 0,04;

і

0,01^^^0,09.

Висновок: з ймовірністю 0,954 можна стверджувати, що частка простоїв устаткування за весь робочий час лежить у межах від 1 до 9 %.

Відбір моментів здійснюють за схемою механічної вибірки або за схемою випадкової вибірки за таблицею випадкових чисел. Другий спосіб доцільно застосовувати в тих випадках, коли спостереження має бути для об'єкта несподіваним, аби не порушувати його звичайний трудовий ритм.

Визначають чисельність моментних спостережень за формулою граничної помилки випадкової повторної вибірки. Відбір у моментних спостереженнях завжди безповторний, однак фор

мулу безповторного відбору застосовувати не можна, оскільки чисельність генеральної сукупності моментів роботи визначити неможливо, вона нескінчена, якщо момент спостереження досить короткий. А тому необхідна чисельність моментів спостереження

0.2512 п = ——^—^ або якщо прийняти довірчу ймовірність Р = 0,954,

д ' _ 0.25 •21 _ 0,25-4 1 тобто коефіцієнт довіри t = 2, тоді " -- дї- дГ.

Наприклад, припустимо, що треба визначити число моментних спостережень за часом роботи устаткування, щоб гранична помилка не перевищувала 1 %, при ймовірності 0,954:

п = ———— = 10000 спостережень. 0,0001 v

Якщо спостереження здійснюють протягом 25 днів і фіксують стан у статкування в моменти спостереження в 50 одиниць, тоді за день

10000 має бути = 8 спостережень за кожною одиницею.

J\) ' Z,J

Кінцевою мстою будь-якого вибіркового спостереження є поширення його характеристик на генеральну сукупність. На практиці застосовують різні способи поширення вибіркових даних.

Спосіб прямого перерахунку використовують у тому випадку, коли метою вибіркового обстеження є визначення обсягу ознаки в генеральній сукупності.

Наприклад, за результатами вибіркового спостереження середня урожайність круп'яних культур становить 25 ц/га, гранична помилка середньої при ймовірності 0,954-0,5 ц/га. У тому разі, коли загальна посівна площа під круп'яними культурами в генеральній сукупності становить 2000 га, то можливий обсяг валового збору зерна з цієї площі буде не менше 49 тис. ц — 2000 (25 - 0,5), а максимальний валовий збір становитиме 51 тис. ц — 2000 (25 + 0,5).

Якщо вибіркове спостереження проводять з метою уточнення результатів суцільного спостереження, застосовують спосіб поправочних коефіцієнтів.

Наприклад, після проведення перепису худоби, що належить населенню, провели 10%-й вибірковий контроль, під час якого визначили

відсоток недообліку худоби. Згідно з даними перепису в господарствах, які попали у вибірку, поголів'я худоби становить 200 голів, а за даними вибірки 205. Отже, недооблік худоби становитиме (5 : 200) 100 = 2,5 %. Це той коефіцієнт, який слід розповсюдити на всю генеральну сукупність. Дані перепису худоби N = 10 000 відповідно коригуються: 10 000 1,025 = =10250 голів, і

 





sdamzavas.net - 2020 год. Все права принадлежат их авторам! В случае нарушение авторского права, обращайтесь по форме обратной связи...