Kiểm định giả thuyết thống kê

Kiểm định giả thuyết thống kê (statistical hypothesis test) là phương pháp ra quyết định sử dụng dữ liệu, hoặc từ thí nghiệm hoặc từ nghiên cứu quan sát (observational study)(không có kiểm soát). Trong thống kê (statistics), một kết quả được gọi là đủ độ tin cậy mang tính thống kê (statistically significant) nếu nó ít có khả năng diễn ra theo một ngưỡng xác suất cho trước (ví dụ 5% hay 10%). Cụm từ kiểm định độ tin cậy ("test of significance") được đưa ra bởi Ronald Fisher.

Kiểm định giả thuyết đôi khi được gọi là phân tích dữ liệu để khẳng định, để so sánh với phân tích dữ liệu để khám phá.

Ví dụ

Ví dụ 1 – Kết luận xử án

Một đợt kiểm định độ tin cậy được tiến hành cho một tội phạm. Bị cáo sẽ chưa bị kết luận là có tội khi tội của anh ta chưa được chứng minh. Nguyên đơn cố gắng chứng minh tội của bị cáo. Chi khi có đủ bằng chứng thì bị cáo mới bị buộc tội.

Bắt đầu đợt kiểm định, có hai giả thuyết $H_{0}$ : "bị cáo không có tội", và $H_{1}$ : "bị cáo có tội". Giả thuyết thứ nhất được gọi là Giả thuyết không (null hypothesis), và hiện tại đang được chấp nhận. Giả thuyết thứ 2 được gọi là giả thuyết nghịch (alternative hypothesis). Đây là giả thuyết mà nguyên đơn cố gắng chứng minh.

Giả thuyết 1 chỉ được bác bỏ nếu lỗi nói sai rất ít khả năng xảy ra, bởi vì chúng ta không muốn đổ oan cho người vô tội. Lỗi nói sai đó được gọi là lỗi loại một (nghĩa là đổ oan cho người vô tội), và khả năng mắc lỗi này được kiểm soát sao cho ít xảy ra nhất. Vì do chúng ta cố gắng không áp tội cho người khác, nên xảy ra lỗi loại 2 (bỏ thoát tội một người mà thực tế có tội), xác suất lỗi này thường lớn hơn.

	Null Hypothesis (H₀) là đúng Anh ta thực sự không có tội	Alternative Hypothesis (H₁) là đúng Anh ta thực sự có tội
Chấp nhận Null Hypothesis Xóa án	Quyết định đúng	Quyết định sai Lỗi loại II
Bác bỏ Null Hypothesis Kết án	Quyết định sai Lỗi loại I	Quyết định đúng

Phiên tòa có thể được coi là một hay cả hai quá trình: có tội với không có tội hoặc bằng chứng với một người ("quá một mức nghi ngờ hợp lý"). Kiểm định giả thuyết ở đây là hoặc kiểm định giả thuyết hoặc kiểm định bằng chứng.

Xem thêm

Lehmann, E.L.(1970). Testing statistical hypothesis (5th ed.). Ney York: Wiley.
Lehmann E.L. (1992) "Introduction to Neyman and Pearson (1933) On the Problem of the Most Efficient Tests of Statistical Hypotheses". In: Breakthroughs in Statistics, Volume 1, (Eds Kotz, S., Johnson, N.L.), Springer-Verlag. ISBN 0-387-94037-5 (followed by reprinting of the paper)
Neyman, J.; Pearson, E.S. (1933). “On the Problem of the Most Efficient Tests of Statistical Hypotheses”. Phil. Trans. R. Soc., Series A. 231: 289–337. doi:10.1098/rsta.1933.0009.

Tham khảo

Liên kết ngoài

Wilson González, Georgina (ngày 10 tháng 9 năm 1997). “Hypothesis Testing”. Environmental Sampling & Monitoring Primer. Virginia Tech. Bản gốc lưu trữ ngày 11 tháng 12 năm 2011. Truy cập ngày 27 tháng 4 năm 2012. Đã định rõ hơn một tham số trong author-name-list parameters (trợ giúp)
Bayesian critique of classical hypothesis testing
Critique of classical hypothesis testing highlighting long-standing qualms of statisticians
Dallal GE (2007) The Little Handbook of Statistical Practice (A good tutorial)
References for arguments for and against hypothesis testing
Statistical Tests Overview: Lưu trữ 2009-10-29 tại Wayback Machine How to choose the correct statistical test
An Interactive Online Tool to Encourage Understanding Hypothesis Testing Lưu trữ 2011-07-26 tại Wayback Machine