Главная Обратная связь

Дисциплины:






Вибірковий метод у статистиці



п.1. Предмет і задачі математичної статистики. Імовірнісні характеристики більшості випадкових явищ (подій, величин, процесів), які зустрічаються на практиці, невідомі. Оцінити їх можна дослідним шляхом.

Математична статистика - це прикладна математична дисципліна, яка досліджує масові випадкові явища і встановлює закономірності, яким вони підпорядковані, на базі вивчення методами теорії Ймовірностей статистичних даних - результатів спостережень або дослідів.

Основними задачами математичної статистики є:

1) розробка методів збору і систематизації статистичних даних, одержаних в результаті спостережень або спеціально поставлених експериментів;

2) розробка методів аналізу статистичних даних залежно від мети досліджень. Сюди входять: оцінка ймовірності події; знаходжен-ня функції розподілу випадкової величини; оцінка параметрів розподілу; перевірка правдоподібності припущень про закон розподілу випадкової величини, про форму зв'язку між випадковими величинами або про значення параметра, який оцінюють.

п.2. Поняття генеральної сукупності та вибірки.Сукупність (множину) однорідних об'єктів, що об'єднані якою-небудь загальною кількісною або якісною ознакою, називають статистичною сукупністю. Об'єкти, що утворюють, статистичну сукупність, називають її одиницями або елементами.

Якщо кількість елементів сукупності, яку вивчають, досить велика і обстежити їх усіх важко або неможливо, то вибирають яким-небудь способом із усієї сукупності обмежене число об'єктів і обстежують тільки їх. Вибірковою сукупністю (вибіркою) називають сукупність випадково взятих об'єктів. Генеральною називають сукупність об'єктів, з якої зроблено вибірку. Об'ємом сукупності (вибіркової або генеральної) називають кількість її об'єктів.

Суть вибіркового методуполягає в тому, що за знайденими значеннями характеристик вибіркової сукупності роблять певні висновки про значення відповідних характеристик генеральної сукупності.

Щоб за даними вибірки можна було робити правильні висновки про генеральну сукупність, необхідно, щоб елементи вибірки правильно її представляли, тобто щоб вибірка була репрезентативною (представницькою). Вибірка буде репрезентативною, якщо вона випадкова.

Вибірка називається випадковою, якщо із генеральної сукупності елементи відбираються навмання, тобто будь-який її елемент з однаковою ймовірністю може потрапити у вибіркову сукупність.

Розрізняють два типи випадкових вибірок: повторні і безповторні. Вибірка називається повторною, якщо з генеральної сукупності відбирають будь-який елемент, фіксують значення ознаки, яку вивчають, а потім повертають цей елемент назад, у генеральну сукупність, і відбирають наступний елемент. Отже, при повторному відборі один і той самий елемент може потрапити у вибірку декілька разів. Вибірка називається безповторною, якщо відібрані елементи назад у генеральну сукупність не повертаються.



Якщо досліджується випадкова величина X, яка спостерігається в деякому досліді, то генеральною сукупністю називають множину всіх її можливих значень, а вибіркою - результат скінченої кількості спостережень цієї величини.

Набір значень ξ1, ξ2 ,…, ξn випадкової величини X, одержаних на практиці в результаті п незалежних послідовних дослідів,

проведених в однакових умовах, називають вибіркою об'єму п. Ви­бірку ξ1, ξ2 ,…, ξn можна розглядати як послідовність незалежних в сукупності випадкових величин, розподіл кожної з яких збігається з розподілом досліджуваної випадкової величини X.

п.3. Статистичні методи опису результатів спостережень.Нехай із генеральної сукупності випадкової величини X взята вибірка об'єму п: ξ(1), ξ(2) ,…, ξ(n). Спосіб запису вибірки, за яким її елементи впоряд­ковуються за величиною, тобто записуються у вигляді послідовності ξ(1), ξ(2) ,…, ξ(n), де ξ(1)≤ ξ(2)≤…≤ξ(n), називається варіаційним рядом. Різниця між найбільшим і найменшим елементами вибірки ξ(n)(1)=ω називається розмахом вибірки.

Нехай варіаційний ряд містить k різних елементів х1, х2, …, хк, причому х1 повторюється n1 разів, х2 - п2 разів, ..., xk - пк разів. Тоді, елемент хi називається варіантою, число пi- йогочастотою, а відношення пi /п = wi - відносною частотою (і = 1..к).

За значеннями варіант, частот і відносних частот можна побу­дувати таблиці 8.1 і 8.2, які називають відповідно статистичними розподілами (рядами) частот і відносних частот або статистич­ними розподілами вибірки.

Таблиця 1

хi х1 х2 xk
пi n1 п2 пк
Таблиця 2
хi х1 х2 xk
wi w1 w2 wk

Якщо досліджувана випадкова величина X дискретна, то для графічного зображення статистичного розподілу вибірки викорис­товують полігон частот (або відносних частот).

Полігоном частот називають ламану, відрізки якої сполу­чають точки (хi;пi) на координатній площині Охп.

Полігоном відносних частот називають ламану, відрізки якої сполучають точки (xi,wi) на координатній площині OxW.

Для вибірки з неперервного розподілу або для вибірки великого об'єму з дискретного розподілу використовують представлення її у вигляді інтервального {групованого) статистичного ряду.

Для його побудови потрібно інтервал, який містить всі елементи вибірки розбити на декілька часткових інтервалів довжиною h і знайти для кожного інтервалу його частоту ті - суму частот варіант,

які потрапили в і-й інтервал (варіанта, яка збіглася з верхньою межею інтервалу відноситься до наступного інтервалу), або відносну частоту - wi =

Інтервальний розподіл частот можна подати у вигляді таблиці 3:

Інтервал (z0, z1) (z1, z2)   (zl-1, zl)
Частота m1 m2 ml

Для графічного зображення інтервального статистичного ряду будують гістограму частот (відносних частот) - східчасту фігуру, яка складається з прямокутників, основами яких є часткові інтервали довжиною h, а висоти дорівнюють mi/h. Величину mi/h називають щільністю частоти.

Аналогічно будується гістограма відносних частот. Висоти прямокутників у цьому випадку дорівнюють wi/h. Величину wi/h називають щільністю відносної частоти.

п.4. Емпірична функція розподілу. Нехай для вибірки об'єму п з генеральної сукупності ВВ X, функція розподілу якої F(x), побудовано статистичний ряд частот (табл. 8.1).

Розподілом вибірки називають дискретну випадкову величину X*, яка приймає значення варіант вибірки xi з ймовірностями pi=ni/n

Функцію розподілу величини X* називають емпіричною (вибірковою) функцією розподілу і позначають F*(x). Отже,

F*(x) = nx/n, (8.1)

де - сума частот варіант xi, менших х, п - об'єм вибірки.

Для кожного значення х€(-∞,+∞) F*(x) визначає відносну частоту події X < х, ймовірність цієї події визначає функція F(x) -теоретична функція розподілу. Згідно з законом великих чисел, для будь-якого х€(-∞,+∞) і довільного ε > 0

тобто при кожному х F*(x) збігається по ймовірності до F(x) і, отже, при великому об'ємі вибірки може служити наближеним значенням (оцінкою) функції розподілу генеральної сукупності в кожній точці х .

п.5. Числові характеристики вибіркового розподілу.Розглянемо закон розподілу ДВВ X , побудований за вибіркою із генеральної сукупності ВВ X:

Таблиця 4

X* х1 х2 xk
P n1/n n2/n   nk/n

Числові характеристики цього вибіркового розподілу називаються вибірковими {емпіричними) числовими характеристиками. Вибіркові числові характеристики є характеристиками даної вибірки і не є характеристиками генеральної сукупності.

До числових характеристик вибірки відносяться: вибіркова середня, вибіркова дисперсія, вибіркове середнє квадратичне відхилення та ряд інших значень.

Вибірковою середньою хв називають середнє арифметичне елементів вибірки:

хв = М(X*) = 1/nΣnixi,. (8.2)

Вибірковою дисперсією Dв називають середнє арифметичне квадратів відхилень елементів вибірки від їх середнього значення хв :

Dв =1/nΣni(xiв)2 (8.3)

Вибіркова дисперсія дорівнює різниці середнього квадратів елементів вибірки і квадрата вибіркової середньої:

De= (8.4)

Вибірковим середнім квадратичним відхиленням називають корінь квадратний з вибіркової дисперсії:

σв=(8.5)

Вибірковою модою М*о називають варіанту, яка має найбільшу частоту.

Вибірковою медіаною Ме називають число, яке ділить статистичний ряд на дві частини, рівні за кількістю варіант.

Якщо число варіант непарне, тобто k = 2т + 1, то Мет +1.

При парному k = 2т медіана Ме тт +1).

Середнім абсолютним відхиленням Q називають середнє арифметичне абсолютних величин відхилень елементів вибірки від вибіркової середньої:

Q=

Коефіцієнтом варіації V1 (за середнім абсолютним відхиленням) називають визначене в процентах відношення середнього абсолютного відхилення до вибіркової середньої:

Коефіцієнтом варіації V2 (за середнім квадратичним відхиленням) називають визначене в процентах відношення вибіркового середнього квадратичного відхилення до вибіркової середньої:

Зауваження. При обчисленні числових характеристик вибірки, заданої інтервальним статистичним рядом, в якості варіант беруть середини часткових інтервалів (усереднені варіанти).

Приклад 8.1. Записати у вигляді варіаційного і статистичного рядів вибірку 7, 2, 8, 5, 5, 8, 7, 5, 8, 5. Визначити розмах вибірки та обчислити її вибіркову середню, вибіркову дисперсію і вибіркове середнє квадратичне відхилення.

Розв'язання. Об'єм вибірки n = 10. Впорядкувавши елементи вибірки за величиною, одержимо варіаційний ряд: 2, 5, 5, 5, 5, 7,7, 8, 8, 8. Різними в даній в даній вибірці є елементи х1 =2, х2= 5, х3 = 7, х4 = 8. Отже, статистичний ряд вибірки такий:

 

хі 2
пі

Розмах вибірки ω = 8-2=6.

Вибіркова середня = 0,1 • (2 • 1 + 5 • 4 + 7 • 2 + 8 • 3) = 6 ; вибіркова дисперсія DB = 0,1• (4•1 + 25•4 + 49•2 + 64•3)-36 = 3,4; вибіркове середнє квадратичне відхилення σв = =1,84.

п.6. Статистичний опис вибірки двовимірного випадкового вектора.Нехай {xs,ys), s = l,n - вибірка об'єму п із генеральної
сукупності двовимірного випадкового вектора (X, Y). Попереднє уявлення про двовимірну генеральну сукупність можна отримати, зображаючи елементи вибірки точками на площині з вибраною прямокутною системою координат. Це зображення вибірки називається діаграмою розсіяння.

У даній вибірці пари xs, ys (s = \,n) можуть повторюватись. Різні значення (варіанти) xі (і = 1,к), yj (j = 1, т) та числа (частоти) nij- повторень пар (xt,yj) при великому об'ємі вибірки зручно

представити у вигляді кореляційної таблиці (табл. 5) або таблиці спряженості ознак. До цього завжди вдаються у випадку неперервного розподілу випадкового вектора (X,Y) і будують, як правило, таблиці за групованими вибірками компонент X та Y. Таблиця 5

  X
Y   x1 х2 ... xk
y1 n11 n12 ... n1k ny1
y2 n21 n22 ... n2k ny2
  ... ... ... ... ...
ym nm1 nm2 ... nmk nym
nx1 nx2 ... nxk

Розподілом двовимірної вибіркиназивається розподіл двовимірного дискретного випадкового вектора, який приймає значення (xi, yj) з ймовірностями .

Вибіркові числові характеристикиобчислюються як відповідні числові характеристики двовимірного дискретного випадкового вектора.

 





sdamzavas.net - 2020 год. Все права принадлежат их авторам! В случае нарушение авторского права, обращайтесь по форме обратной связи...