F-тест

F-тест је сваки статистички тест у којем тест статистика има F-дистрибуцију под нултом хипотезом. Најчешће се користи када се пореде статистички модели који су прилагођени скупу података, како би се идентификовао модел који најбоље одговара популацији из које су подаци узорковани. Тачни „F-тестови“ углавном настају када су модели прилагођени подацима коришћењем најмањих квадрата. Име је сковао Џорџ В. Снедекор, у част Роналда Фишера. Фишер је првобитно развио статистику као однос варијансе 1920-их.[1]

Уобичајени примери

Уобичајени примери употребе F-тестова укључују проучавање следећих случајева:

  • Хипотеза да су средње вредности датог скупа нормално распоређених популација, које све имају исту стандардну девијацију, једнаке. Ово је можда најпознатији F-тест и игра важну улогу у анализи варијансе (ANOVA).
  • Хипотеза да се предложени регресиони модел добро уклапа у податке.
  • Хипотеза да скуп података у регресионој анализи прати једноставнији од два предложена линеарна модела који су угнежђени један у другом.

Поред тога, неке статистичке процедуре, као што је Шефеов метод за прилагођавање вишеструких поређења у линеарним моделима, такође користе F-тестове.

Ф-тест једнакости две варијансе

Ф-тест је осетљив на ненормалност.[2] У анализи варијансе (АНОВА), алтернативни тестови укључују Левенов тест, Бартлетов тест и Браун–Форсајтов тест. Међутим, када се било који од ових тестова спроведе да би се тестирала основна претпоставка хомоскедастичности (тј. хомогености варијансе), као прелиминарни корак за тестирање средњих ефеката, постоји повећање експерименталне стопе грешке типа I.[3]

Формула и рачунање

Већина Ф-тестова настаје разматрањем декомпозиције варијабилности у колекцији података у смислу збира квадрата. Статистика теста у Ф-тесту је однос два скалирана збира квадрата који одражавају различите изворе варијабилности. Ови збирови квадрата су конструисани тако да статистика тежи да буде већа када нулта хипотеза није тачна. Да би статистика пратила F-дистрибуцију под нултом хипотезом, збир квадрата треба да буде статистички независан и сваки треба да прати скалирану χ²-дистрибуцију. Последњи услов је загарантован ако су вредности података независне и нормално распоређене са заједничком варијансом.

Проблеми ANOVA вишеструког поређења

F-тест у једносмерној анализи варијансе (ANOVA) се користи за процену да ли се очекиване вредности квантитативне варијабле унутар неколико унапред дефинисаних група разликују једна од друге. На пример, претпоставимо да медицинско испитивање упоређује четири третмана. ANOVA F-тест се може користити да се процени да ли је било који од третмана у просеку бољи или инфериорнији у односу на друге у односу на нулту хипотезу да сва четири третмана дају исти средњи одговор. Ово је пример "омнибус" теста, што значи да се један тест изводи да би се открила било која од неколико могућих разлика. Алтернативно, могли бисмо да спроведемо тестове у пару међу третманима (на пример, у примеру медицинског испитивања са четири третмана могли бисмо да спроведемо шест тестова између парова третмана). Предност ANOVA F-теста је у томе што не морамо унапред да специфицирамо који третмани треба да се поредимо и не морамо да се прилагођавамо за вишеструка поређења. Недостатак ANOVA F-теста је у томе што ако одбацимо нулту хипотезу, не знамо за које се третмане може рећи да се значајно разликују од осталих, нити, ако се F-тест изводи на нивоу α, можемо рећи да се третмански пар са највећом средњом разликом значајно разликује на нивоу α.

Формула за једнофакторску АНОВА Ф-тест статистику је

F = објашњена варијанса необјашњена варијанса , {\displaystyle F={\frac {\text{објашњена варијанса}}{\text{необјашњена варијанса}}},}

„Објашњена варијанса“ или „варијабилност између групе“ је:

i = 1 K n i ( Y ¯ i Y ¯ ) 2 / ( K 1 ) {\displaystyle \sum _{i=1}^{K}n_{i}({\bar {Y}}_{i\cdot }-{\bar {Y}})^{2}/(K-1)}

где  Y ¯ i {\displaystyle {\bar {Y}}_{i\cdot }} означава средњу вредност узорка у и-тој групи, n i {\displaystyle n_{i}} је број запажања у и-тој групи, Y ¯ {\displaystyle {\bar {Y}}} означава укупну средину података, и  K {\displaystyle K} означава број група.

„Необјашњива варијанса“ или „варијабилност унутар групе“ је

i = 1 K j = 1 n i ( Y i j Y ¯ i ) 2 / ( N K ) , {\displaystyle \sum _{i=1}^{K}\sum _{j=1}^{n_{i}}\left(Y_{ij}-{\bar {Y}}_{i\cdot }\right)^{2}/(N-K),}

где је Y i j {\displaystyle Y_{ij}} посматрање у и-том из K {\displaystyle K} групе и N {\displaystyle N} је укупна величина узорка. Ова Ф-статистика прати Ф-дистрибуцију са степенима слободе d 1 = K 1 {\displaystyle d_{1}=K-1} и d 2 = N K {\displaystyle d_{2}=N-K} под нултом хипотезом. Статистика ће бити велика ако је варијабилност између група велика у односу на варијабилност унутар групе, што је мало вероватно да ће се десити ако популацијска средина свих група има исту вредност.

Имајте на уму да када постоје само две групе за једнофакторску ANOVA, F = t 2 {\displaystyle F=t^{2}} где је т Студентов т статистик.

Референце

Нормативна контрола Уреди на Википодацима
  • Енциклопедија Британика
  1. ^ Lomax, Richard G. (2007). Statistical concepts : a second course (3rd изд.). Mahwah, N.J.: Lawrence Erlbaum Associates. ISBN 978-0-8058-5850-1. OCLC 150257419. 
  2. ^ Box, G. E. P. (1953). „Non-Normality and Tests on Variances”. Biometrika. 40 (3–4): 318—335. JSTOR 2333350. doi:10.1093/biomet/40.3-4.318. .
  3. ^ Sawilowsky, Shlomo (2002-11-01). „Fermat, Schubert, Einstein, and Behrens-Fisher: The Probable Difference Between Two Means When σ_1^2≠σ_2^2”. Journal of Modern Applied Statistical Methods. 1 (2): 461—472. doi:10.22237/jmasm/1036109940. 
  • п
  • р
  • у
Функција густине вероватноће
Централна тенденција
Дисперзија
Облик
Бројање података
  • Индекс дисперзије
Табеле
Зависност
Графикони
Колекција података
Експериментални дизајн
  • Величина ефекта
  • Подаци који недостају
  • Оптимални нацрт
  • Популација
  • Репликација
  • Одређивање величине узорка
  • Статистик
  • Статистичка моћ
Методологија испитивања
Контролни експерименти
  • Блоковање
  • Факторијални нацрти
  • Интеракција
  • Рандомизација
  • Рандомизовани експеримент
  • Научна контрола
Адаптивни нацрти
  • Адаптивна клиничка испитивања
  • Стохастичка апроксимација
  • Горе-и-доле нацрти
Посматрање
  • Студија попречног пресека
  • Кохортна студија
  • Природни експеримент
  • Квази-експеримент
Статистичка интерференција
Статистичка теорија
  • Популација
  • Статистик
  • Расподела вероватноће
  • Дистрибуција узорковања
    • Order statistic
  • Емпиријска дистрибуција
    • Процена густине вероватноће
  • Статистички модел
    • Модел спецификације
    • Lp простор
  • Параметар
    • локација
    • скала
    • облик
  • Параметријска статистика
    • Вероватноћа [[Monotone likelihood ratio|(monotone)]]
    • Location–scale family
    • Exponential family
  • Completeness
  • Sufficiency
  • Statistical functional
    • Бутстрап
    • U
    • V
  • Оптимална одлука
  • Ефикасност
  • Статистичка дистанца
    • Дивергенција
  • Асимпотска теорија
  • Робусност
Фреквентистичко закључивање
Тачка естимације
  • Једначине за процену
  • Пристрасност процењивача
    • Непристрасна процена минималне варијансе
      • Рао–Блаквел теорема
      • Леман–Шефе теорема
    • Медијанска непристрасна процена
  • Принцип прикључка
Процена интервала
  • Интервал поверења
  • Пивот
  • Интервал вероватноће
  • Интервал предикције
  • Интервал толеранције
  • Поновно узорковање
    • Бутстрап
    • Џекнајф
Тестирање хипотеза
  • Једнострани и двострани тестови
  • Моћ теста
    • Уједначено најмоћнији тест
  • Пермутациони тест
    • Рандомизацијски тест
  • Вишеструка поређења
Параметријски тестови
  • Тест односа вероватноће
  • Резултат теста
  • Волд
Специфични тестови
Доброта уклапања
  • Хи-квадрат
  • G-тест
  • Колмогоров–Смиров
  • Андерсон–Дарлинг
  • Лилифор
  • Харке–Бера
  • Нормалност (Шапиро–Вилк)
  • Тест односа вероватноће
  • Селекција модела
    • Попречна валидација
    • AIC
    • BIC
Ранг статистика
  • Знак
    • Медијана узорка
  • Означени рангови (Вилкоксон)
    • Хоџ-Леманов естиматор
  • Сума ранга (Ман-Витни)
  • Непараметријска Анова
    • 1-факторска (Крускал–Волис)
    • 2-факторска (Фридман)
    • Алтернатива (Џонкир-Терпстра)
  • Ван дер Верден тест
Бајесово закључивање
Корелација
  • Пирсонов продукт-момент коефицијент корелације
  • Делимична корелација
  • Конфундирајућа варијабла
  • Коефицијент детерминације
Регресиона анализа
  • Грешке и резидуали
  • Валидација регресије
  • Мешовити модел ефеката
  • Модел симултаних једначина
  • Мултиваријантне адаптивне регресионе сплине (MARS)
Линеарна регресија
  • Једноставна линеарна регресија
  • Оринарни најмањи квадрати
  • Генерални линеарни модел
  • Бајесова регресија
Нестандардизовани предиктори
  • Нелинеарна регресија
  • Непараметријски
  • Семипараметријска
  • Изотонична
  • Робусна
  • Хомоскедастичност и хетероскедастичност
Генерализовани линеарни модел
Подела збира квадрата
  • Анализа варијансе (ANOVA, anova)
  • Анализа коваријансе
  • Мултиваријантна ANOVA
  • Степени слободе
Категоричка / Мултиваријантна / Time-series / Анализа преживљавања
Категоричка
Мултиваријантна
Time-series
Генерално
  • Декомпозиција
  • Тренд
  • Стационарност
  • Seasonal adjustment
  • Exponential smoothing
  • Cointegration
  • Structural break
  • Granger causality
Специфични тестови
  • Дики-Фулер
  • Јохансен
  • Q-статистик (Лјунг-Бокс)
  • Дурбин-Вотсон
  • Бројш-Годфри
Временски домен
  • Аутокорелација (ACF)
    • парцијална (PACF)
  • Попречна-корелација (XCF)
  • ARMA model
  • ARIMA модел (Бокс-Џенкинс)
  • Ауторегресивна кондиционална хетероскедастичност (ARCH)
  • Векторска ауторегресија (VAR)
Фреквенцијски домен
  • Процена спектралне густине
  • Фуријеова анализа
  • Спектрална анализа најмањих квадрата
  • Вејвлет
  • Вајтлова вероватноћа
Преживљавање
Функција преживљавања
  • Каплан-Мејер естиматор
  • Модел пропорционалних опасности
  • Модел убрзаног времена отказивања
  • First hitting time
Функција опасности
  • Нелсон–Ален естиматор
Test
  • Лог-ранг тест
Апликације
Биостатистика
Статистика инжењерства
  • Хемометрија
  • Пробабилистички нацрт
  • Процес / квалитет контроле
  • Поузданост
  • Идентификација система
Статистика друштвених наука
Спацијална статистика
  • КатегоријаCategory
  • КатегоријаCategory
  • Портал Математика
  • Страница ОставеCommons
  • Википројекат WikiProject