F-тест

F-тест је сваки статистички тест у којем тест статистика има F-дистрибуцију под нултом хипотезом. Најчешће се користи када се пореде статистички модели који су прилагођени скупу података, како би се идентификовао модел који најбоље одговара популацији из које су подаци узорковани. Тачни „F-тестови“ углавном настају када су модели прилагођени подацима коришћењем најмањих квадрата. Име је сковао Џорџ В. Снедекор, у част Роналда Фишера. Фишер је првобитно развио статистику као однос варијансе 1920-их.^[1]

Уобичајени примери

Уобичајени примери употребе F-тестова укључују проучавање следећих случајева:

Хипотеза да су средње вредности датог скупа нормално распоређених популација, које све имају исту стандардну девијацију, једнаке. Ово је можда најпознатији F-тест и игра важну улогу у анализи варијансе (ANOVA).
Хипотеза да се предложени регресиони модел добро уклапа у податке.
Хипотеза да скуп података у регресионој анализи прати једноставнији од два предложена линеарна модела који су угнежђени један у другом.

Поред тога, неке статистичке процедуре, као што је Шефеов метод за прилагођавање вишеструких поређења у линеарним моделима, такође користе F-тестове.

Ф-тест једнакости две варијансе

Ф-тест је осетљив на ненормалност.^[2] У анализи варијансе (АНОВА), алтернативни тестови укључују Левенов тест, Бартлетов тест и Браун–Форсајтов тест. Међутим, када се било који од ових тестова спроведе да би се тестирала основна претпоставка хомоскедастичности (тј. хомогености варијансе), као прелиминарни корак за тестирање средњих ефеката, постоји повећање експерименталне стопе грешке типа I.^[3]

Формула и рачунање

Већина Ф-тестова настаје разматрањем декомпозиције варијабилности у колекцији података у смислу збира квадрата. Статистика теста у Ф-тесту је однос два скалирана збира квадрата који одражавају различите изворе варијабилности. Ови збирови квадрата су конструисани тако да статистика тежи да буде већа када нулта хипотеза није тачна. Да би статистика пратила F-дистрибуцију под нултом хипотезом, збир квадрата треба да буде статистички независан и сваки треба да прати скалирану χ²-дистрибуцију. Последњи услов је загарантован ако су вредности података независне и нормално распоређене са заједничком варијансом.

Проблеми ANOVA вишеструког поређења

F-тест у једносмерној анализи варијансе (ANOVA) се користи за процену да ли се очекиване вредности квантитативне варијабле унутар неколико унапред дефинисаних група разликују једна од друге. На пример, претпоставимо да медицинско испитивање упоређује четири третмана. ANOVA F-тест се може користити да се процени да ли је било који од третмана у просеку бољи или инфериорнији у односу на друге у односу на нулту хипотезу да сва четири третмана дају исти средњи одговор. Ово је пример "омнибус" теста, што значи да се један тест изводи да би се открила било која од неколико могућих разлика. Алтернативно, могли бисмо да спроведемо тестове у пару међу третманима (на пример, у примеру медицинског испитивања са четири третмана могли бисмо да спроведемо шест тестова између парова третмана). Предност ANOVA F-теста је у томе што не морамо унапред да специфицирамо који третмани треба да се поредимо и не морамо да се прилагођавамо за вишеструка поређења. Недостатак ANOVA F-теста је у томе што ако одбацимо нулту хипотезу, не знамо за које се третмане може рећи да се значајно разликују од осталих, нити, ако се F-тест изводи на нивоу α, можемо рећи да се третмански пар са највећом средњом разликом значајно разликује на нивоу α.

Формула за једнофакторску АНОВА Ф-тест статистику је

$F={\frac {\text{објашњена варијанса}}{\text{необјашњена варијанса}}},$

„Објашњена варијанса“ или „варијабилност између групе“ је:

$\sum _{i=1}^{K}n_{i}({\bar {Y}}_{i\cdot }-{\bar {Y}})^{2}/(K-1)$

где ${\bar {Y}}_{i\cdot }$ означава средњу вредност узорка у и-тој групи, $n_{i}$ је број запажања у и-тој групи, ${\bar {Y}}$ означава укупну средину података, и $K$ означава број група.

„Необјашњива варијанса“ или „варијабилност унутар групе“ је

$\sum _{i=1}^{K}\sum _{j=1}^{n_{i}}\left(Y_{ij}-{\bar {Y}}_{i\cdot }\right)^{2}/(N-K),$

где је $Y_{ij}$ посматрање у и-том из $K$ групе и $N$ је укупна величина узорка. Ова Ф-статистика прати Ф-дистрибуцију са степенима слободе $d_{1}=K-1$ и $d_{2}=N-K$ под нултом хипотезом. Статистика ће бити велика ако је варијабилност између група велика у односу на варијабилност унутар групе, што је мало вероватно да ће се десити ако популацијска средина свих група има исту вредност.

Имајте на уму да када постоје само две групе за једнофакторску ANOVA, $F=t^{2}$ где је т Студентов т статистик.

Референце

Нормативна контрола	Енциклопедија Британика

^ Lomax, Richard G. (2007). Statistical concepts : a second course (3rd изд.). Mahwah, N.J.: Lawrence Erlbaum Associates. ISBN 978-0-8058-5850-1. OCLC 150257419.
^ Box, G. E. P. (1953). „Non-Normality and Tests on Variances”. Biometrika. 40 (3–4): 318—335. JSTOR 2333350. doi:10.1093/biomet/40.3-4.318. .
^ Sawilowsky, Shlomo (2002-11-01). „Fermat, Schubert, Einstein, and Behrens-Fisher: The Probable Difference Between Two Means When σ_1^2≠σ_2^2”. Journal of Modern Applied Statistical Methods. 1 (2): 461—472. doi:10.22237/jmasm/1036109940.

Статистика

Дескриптивна статистика

Функција густине вероватноће

Централна тенденција	Средња вредност Аритметичка средина Кубик Генерализована средина Геометријска средина Хармонијска средина Хајнцова средина Лемерова средина Медијана Модус
Дисперзија	Средње апсолутно одступање Коефицијент варијације Интерквартилни ранг Перцентил Ранг Стандардна девијација Варијанса
Облик	Централна гранична теорема Моменти Куртозис L-момент Скјунис

Бројање података

Индекс дисперзије

Табеле

Табела контигенције
Дистрибуција фреквенције
Груписани подаци

Зависност

Делимична корелација
Пирсонов коефицијент корелације
Ранг корелација
- Кендалов τ
- Спирманов ρ
Дијаграм расејања

Графикони

Стубичасти дијаграм
Биплот
Кутијасти дијаграм
Контролни графикон
Корелограм
Хистограм
Дијаграм тока
Кружни графикон
Q–Q дијаграм
Радарски графикон
Покретни дијаграм
Дијаграм расејања
Преглед стабљике и листова
Виолински дијаграм

Колекција података

Експериментални дизајн	Величина ефекта Подаци који недостају Оптимални нацрт Популација Репликација Одређивање величине узорка Статистик Статистичка моћ
Методологија испитивања	Узорковање Кластер Стратификовани Испитивање јавног мњења Упитник Стандардна грешка
Контролни експерименти	Блоковање Факторијални нацрти Интеракција Рандомизација Рандомизовани експеримент Научна контрола
Адаптивни нацрти	Адаптивна клиничка испитивања Стохастичка апроксимација Горе-и-доле нацрти
Посматрање	Студија попречног пресека Кохортна студија Природни експеримент Квази-експеримент

Статистичка интерференција

Статистичка теорија

Популација
Статистик
Расподела вероватноће
Дистрибуција узорковања
- Order statistic
Емпиријска дистрибуција
- Процена густине вероватноће
Статистички модел
- Модел спецификације
- L^p простор
Параметар
- локација
- скала
- облик
Параметријска статистика
- Вероватноћа [[Monotone likelihood ratio|(monotone)]]
- Location–scale family
- Exponential family
Completeness
Sufficiency
Statistical functional
- Бутстрап
- U
- V
Оптимална одлука
- функција губитка
Ефикасност
Статистичка дистанца
- Дивергенција
Асимпотска теорија
Робусност

Фреквентистичко закључивање

Тачка естимације	Једначине за процену Максимална вероватноћа Метод момената M-естиматор Минимална дистанца Пристрасност процењивача Непристрасна процена минималне варијансе Рао–Блаквел теорема Леман–Шефе теорема Медијанска непристрасна процена Принцип прикључка
Процена интервала	Интервал поверења Пивот Интервал вероватноће Интервал предикције Интервал толеранције Поновно узорковање Бутстрап Џекнајф
Тестирање хипотеза	Једнострани и двострани тестови Моћ теста Уједначено најмоћнији тест Пермутациони тест Рандомизацијски тест Вишеструка поређења
Параметријски тестови	Тест односа вероватноће Резултат теста Волд

Специфични тестови

Z-тест (normal) Студентов т-тест F-тест
Доброта уклапања	Хи-квадрат G-тест Колмогоров–Смиров Андерсон–Дарлинг Лилифор Харке–Бера Нормалност (Шапиро–Вилк) Тест односа вероватноће Селекција модела Попречна валидација AIC BIC
Ранг статистика	Знак Медијана узорка Означени рангови (Вилкоксон) Хоџ-Леманов естиматор Сума ранга (Ман-Витни) Непараметријска Анова 1-факторска (Крускал–Волис) 2-факторска (Фридман) Алтернатива (Џонкир-Терпстра) Ван дер Верден тест

Бајесово закључивање

Бајесова вероватноћа
- Претходна вероватноћа
- Постериорна вероватноћа
Веродостојан интервал
Бајесов фактор
Бајесов естиматор
- Максимална а постериори процена

Корелација	Пирсонов продукт-момент коефицијент корелације Делимична корелација Конфундирајућа варијабла Коефицијент детерминације
Регресиона анализа	Грешке и резидуали Валидација регресије Мешовити модел ефеката Модел симултаних једначина Мултиваријантне адаптивне регресионе сплине (MARS)
Линеарна регресија	Једноставна линеарна регресија Оринарни најмањи квадрати Генерални линеарни модел Бајесова регресија
Нестандардизовани предиктори	Нелинеарна регресија Непараметријски Семипараметријска Изотонична Робусна Хомоскедастичност и хетероскедастичност
Генерализовани линеарни модел	Експоненцијална породица Логистичка (Бернули) / Биномска / Поасонова регресија
Подела збира квадрата	Анализа варијансе (ANOVA, anova) Анализа коваријансе Мултиваријантна ANOVA Степени слободе

Категоричка / Мултиваријантна / Time-series / Анализа преживљавања

Категоричка

Мултиваријантна

Регресија
Manova
Анализа главних компоненти
Канонска корелација
Дискриминациона анализа
Кластерска анализа
Класификација
Структурални модел једнакости
- Факторска анализа
Мултиваријантна дистрибуција
- Елиптична дистрибуција
  - Нормална

Time-series

Генерално	Декомпозиција Тренд Стационарност Seasonal adjustment Exponential smoothing Cointegration Structural break Granger causality
Специфични тестови	Дики-Фулер Јохансен Q-статистик (Лјунг-Бокс) Дурбин-Вотсон Бројш-Годфри
Временски домен	Аутокорелација (ACF) парцијална (PACF) Попречна-корелација (XCF) ARMA model ARIMA модел (Бокс-Џенкинс) Ауторегресивна кондиционална хетероскедастичност (ARCH) Векторска ауторегресија (VAR)
Фреквенцијски домен	Процена спектралне густине Фуријеова анализа Спектрална анализа најмањих квадрата Вејвлет Вајтлова вероватноћа

Преживљавање

Функција преживљавања	Каплан-Мејер естиматор Модел пропорционалних опасности Модел убрзаног времена отказивања First hitting time
Функција опасности	Нелсон–Ален естиматор
Test	Лог-ранг тест

Апликације

Биостатистика	Биоинформатика Клиничка студија / студије Епидемиологија Медицинска статистика
Статистика инжењерства	Хемометрија Пробабилистички нацрт Процес / квалитет контроле Поузданост Идентификација система
Статистика друштвених наука	Актуарска наука Попис становништва Криминолошка статистика Демографска Економетрија Јуриметрија Национална статистика Званична статистика Статистика популације Психометрија
Спацијална статистика	Картографија Статистика животне средине Географски информациони систем Геостатистика Кригинг