Хи квадрат - единичен и множествен


Категория на документа: Икономика


УНИВЕРСИТЕТ ЗА НАЦИОНАЛНО И СВЕТОВНО СТОПАНСТВО

КУРСОВА РАБОТА

по
Статистическо изследване на зависимости
на тема: " Хи-квадрат - единичен и множествен "

Изготвил:
Поток:
Група:
Фак. номер:
София
2013

1.Хи-квадрат (х2) метод

1.1.Същност

Хи-квадрат методът е разработен от английския статистик Карл Пирсън и по своята същност това е статистически метод за проверка на хипотези от класа на непараметричните. Чрез него могат да се решават различни типове практически задачи. По-важните от тях са: при изследване наличието на връзка между явления, представени чрез променливи на слабите на измерване; при изследване закона на разпределение на единиците от една съвкупност; при изследване на някои от условията за приложение на други методи и анализи, като дисперсионен анализ, МНМК и др., където е необходимо равенство на дисперсиите на резултативната променлива в отделните категории на факторната и някои други приложения. Методът се основава на т.нар. Хи-квадрат разпределение. Едно от основните предимства на метода се крие във факта, че като непараметричен метод за проверка на хипотези не изисква познаването на закона на стохастичното разпределение. Нещо, което при слабите скали на измерване би било почти невъзможно.По принчип методът е приложим и при връзки, представени на по-високи равнища на индикиране на променливите(ординална, интервална или относителна скала), но в тези случаи съществуват и други по-ефективни методи за анализ, поради което използването на този метод става безпредметно.

Хи-квадрат методът е пригоден за изследване на връзки от корелационен тип, каквито са болшинството в социално-икономическата област. Чрез този метод се търси отговор на въпроса, доколко предполагаема зависимост ( или някакъв друг тип връзка) съществува обективно, неслучайно и се проявява като такава сред изследвана съвкупност от единици. Използването на метода предполага предварително едновременно групиране на единиците по значенията на онези признаци, чрез които са индикирани изследваните явленията, т.е да разполагаме с двумерни, тримерни или многомерни емпирични честотни разпределения под формата на таблици. Методът е конструиран така, че се основава на сравнението на две разпределения. Едното - емпирично, такова, каквото се наблюдава в действителността, а другото - теоретично, каквото бихме имали, ако между изследваните явления не съществува обективно връзка. От съпоставянето на тези две разпределения се изгражда критерий, въз основа на който се провярява наличието на изследваната предполагаема връзка.
1.2.Особености и ограничителни условия при приложение на Хи-квадрат (х2)метода.

Първо, методът показва само дали съществува дадена предполагаема връзка, но не може да даде отговор на въпроса, дали тя е от причинно-следствен или има друг характер. Нито пък да определи каква е посоката на връзката. Отговорите на тези въпроси се търсят вън от метода, с допълнителен анализ.

Второ, при практическото провеждане на хи- квадрат метода винаги съществува възможност една връзка да се докаже като обективно съществуваща, колкото и слаба да е тя. Логическото обяснение на тази особеност трябва да се търси във факта, че по принцип отхвърлянето на една хипотеза зависи главно от две неща: първо от силата, с която си взаимодействат явленията (ако такова взаимодействие съществува); второ от условията, при които се осъществява проверката- преди всичко от обема на извадката (броя на изследваните случаи) и от избраните рискове за грешки. С увеличаване обема на извадката се свързва възможността за компенсиране на случайните влияния и открояването на преден план на закономерното (неслучайното). А това създава предпоставки за отхвърляне на нулевата хипотеза, когато тя не е вярна. В същата посока действа и силата на изследваната връзка. Колкото по-тясна е връзката между изследваните две или повече явления, толкова по-малки са ефектите от влиянието на случайните фактори. Толкова по- голяма е и вероятността да бъде потвърдено предположението за наличие на закономерна (неслучайна) връзка. Когато една връзка е силна дори и при малки по обем извадки обективността на съществуванието й ще бъде доказно, и обратно. Когато броят на наблюдаваните случаи нарасне и стане достатъчно голям, винаги съществува вероятност една връзка да се докаже като обективно съществуваща, колкото и слаба или незначителна да е тя. Именно в това се крие причината сам по себе си хи-квадрат методът да не може да оценява теснотата на изследваната връзка или силата на взаимодействие между явленията.

Трето, както при всяка проверка на хипотези, така и при Хи-квадрат метода изходните данни за анализа трябва да бъдат събрани чрез представителна извадка. Това изискване се свързва: първо с възможността да бъдат отчитани случайните и закономерните влияние; второ с използването на стохастичните разпределения като основа за проверката на хипотези и трето с вероятностния характер на статистическата проверка на хипотези.

Четвърто, методът е приложим само в случаите, когато общият брой на изследваните случаи е не по малко от 50 и когато е теоретично очакваният брой случаи в отделните клетки на таблицата е не по-малък от 5, т.е. ijfij≥50 и fij≥5. Тези ограничения се свързват с осигуряването на достатъчно приближение на емпиричната характеристика на хипотезата xемп2 до вероятното x2 разпределение. В редица случаи тези ограничения са твърде строги и не позволяват или затрудняват в голяма степен прилагането на метода. Като изход от ситуацията, когато не е налице второто изискване, се предлага обединяването на два съседни реда или две съседни колони. Всичко това обаче води до загуба на информация, като проблемът особено се изостря при малки по обем извадки. Когато методът се прилага за проверка на закона на разпределение на единиците в една съвкупност по значението на някакъв признак, изискването за общ брой на наблюдаваните случаи минимум 50 остава, но второто изискване се смекчава и се свежда до fij≥1 за всяка клетка на таблицата.

Пето, методът е приложим само в случаите, когато в изходните клетки на таблицата броят на случаите е даден като абсолютна величина. Хи-квадрат не може да бъде оценен от относителни честоти.

Шесто, в редица случаи при изследване на връзки в социално-икономическата област се допуска при част от въпросите в анкетата да се дават повече от един отговор. За да се приложи Хи-квадрат метода, е необходимо предварително да се преработят въпросите по такъв начин, че всеки един от отговорите да се третира като самостоятелен въпрос с две разновидности: "да" и "не". При същата група анкетни изследвания е възможно част от анкетираните лица да не отговорят на отделни въпроси. Те формира т.нар. групата на "непосочили" или "непоказали". Такъв ред или колона в изходната таблица трябва да бъдe отстранен от таблицата. Обяснението е, че неотговорилите не са разновидност на нито едно от изследваните явления. За тях просто липсва информация и по тях не може да се съди за интересуващата ни връзка.

Както при всички изследвания на връзки и при слабите скали на измерване въпросът се свързва с изследването на единични, частни и множествени връзки. За целта могат да се използват Хи-квадрат методът за изследване на единични връзки (обикновен Хи-квадрат метод) и неговите модификации, сумарните Хи-квадрат методи, както и някои от вариантите на множествения Хи-квадрат метод.
2.Изследване на единични връзки с x2 метода

Когато стои задача да се изследва някаква предполагаема връзка между две явления, представени чрез измерители, разположени на слабите скали за измерване, се използва обикновения x2 метод.

Представена в най-общ вид (чрез символи), изходната таблица би имала вида:
Признак А

Брой лица, които са от категорията (признак B)
(fij)
ОБЩО
jf.j

B1




Сподели линка с приятел:





Яндекс.Метрика
Хи квадрат - единичен и множествен 9 out of 10 based on 2 ratings. 2 user reviews.