اختبار كولموغوروف–سميرنوف (KS)
هو اختبار إحصائي يستخدم لمقارنة توزيع مُلاحظ مع توزيع نظري أو لمقارنة توزيعين مُعَايَنين مع بعضهما. يقيس الاختبار أكبر فرق مطلق بين دوال التوزيع التراكمي (FDC) بين المجموعات المختلفة من البيانات.
مثال بسيط لتوضيح طريقة عمل اختبار كولموغوروف–سميرنوف:
اختبار كولموغوروف-سميرنوف للتحقق مما إذا كانت العينة تتبع التوزيع الطبيعي. نفترض أن لدينا عينة من البيانات ونريد اختبار ما إذا كانت هذه العينة تتبع توزيعًا طبيعيًا. لاختبار ذلك باستخدام اختبار كولموغوروف-سميرنوف، سنقوم بخطوات التالية:
معطيات العينة: X=[2.3,2.9,3.1,3.6,4.0,4.3,4.7,5.1,5.3,6.0]
هذه العينة تحتوي على 10 قيم.
نحسب المتوسط والانحراف المعياري للعينة:
- المتوسط (Mean):

الانحراف المعياري (Standard Deviation):

حساب دالة التوزيع التراكمي (CDF) للتوزيع الطبيعي: نحتاج الآن إلى حساب دالة التوزيع التراكمي النظرية للتوزيع الطبيعي. باستخدام المتوسط والانحراف المعياري المحسوبين:
نحسب القيمة المعيارية z بالعلاقة :


Étape 3 : Calcul de la fonction de distribution cumulée empirique (FDE)
La fonction de distribution cumulée empirique Fn(xi) est simplement la proportion de données
inférieures ou égales à xi. Puisque l’échantillon contient 10 valeurs, pour chaque xi, nous calculons
Fn(xi) = i / n, où i est le rang de xi dans l’échantillon trié.
| Fn(xi) | Rang i | Valeur xi |
| 0.1 | 1 | 2.3 |
| 0.2 | 2 | 2.9 |
| 0.3 | 3 | 3.1 |
| 0.4 | 4 | 3.6 |
| 0.5 | 5 | 4.0 |
| 0.6 | 6 | 4.3 |
| 0.7 | 7 | 4.7 |
| 0.8 | 8 | 5.1 |
| 0.9 | 9 | 5.3 |
| 1.0 | 10 | 6.0 |
Le test de Kolmogorov-Smirnov repose sur le calcul de la plus grande différence absolue entre la CDF empirique Fn(xi) et la CDF théorique Fthéorique(xi). Calculons cette différence pour chaque valeur de l’échantillon.
La plus grande différence Dn est la valeur maximale parmi ces différences. Dans cet exemple, Dn = 0.1810.
Étape 5 : Comparaison avec la valeur critique
La valeur critique dépend de la taille de l’échantillon n et du niveau de signification alpha. Pour un test à 5 % de niveau de signification (alpha = 0.05) et un échantillon de taille 10, la valeur critique pour Dn est environ 0.294 (en utilisant les tables de Kolmogorov-Smirnov).
Puisque Dn = 0.1810 est inférieur à la valeur critique 0.294, nous ne rejetons pas l’hypothèse nulle. Cela signifie que, sur la base de ce test, nous pouvons conclure que l’échantillon suit une distribution normale.
Conclusion :
L’échantillon semble suivre une distribution normale, car la différence entre les CDF empirique et théorique est inférieure à la valeur critique.
Table de la loi de Kolmogorov-Smirnov
En fonction de la taille n de l’échantillon et d’une probabilité a, valeur de l’écart qui a la probabilité a d’être dépassé en valeur absolue.
| n | 0.10 | 0.05 | 0.01 |
| 1 | 0,9500 | 0.9750 | 0.9950 |
| 2 | 0,7764 | 0.8419 | 0.9293 |
| 3 | 0,6360 | 0.7076 | 0.8290 |
| 4 | 0,5652 | 0.6239 | 0.7342 |
| 5 | 0,5095 | 0.5633 | 0.6685 |
| 6 | 0,4680 | 0.5193 | 0.6166 |
| 7 | 0,4361 | 0.4834 | 0.5758 |
| 8 | 0,4096 | 0.4543 | 0.5418 |
| 9 | 0,3875 | 0.4300 | 0.5133 |
| 10 | 0,3697 | 0.4092 | 0.4889 |
| 11 | 0,3524 | 0.3912 | 0.4677 |
| 12 | 0,3381 | 0.3754 | 0.4491 |
| 13 | 0,3255 | 0.3614 | 0.4325 |
| 14 | 0,3142 | 0.3489 | 0.4176 |
| 15 | 0,3040 | 0.3376 | 0.4042 |
| 16 | 0,2947 | 0.3273 | 0.3920 |
| 17 | 0,2863 | 0.3180 | 0.3809 |
| 18 | 0,2785 | 0.3094 | 0.3706 |
| 19 | 0,2714 | 0.3014 | 0.3612 |
| 20 | 0,2647 | 0.2941 | 0.3524 |
| 21 | 0,2586 | 0.2872 | 0.3443 |
| 22 | 0,2528 | 0.2809 | 0.3367 |
| 23 | 0,2475 | 0.2749 | 0.3295 |
| 24 | 0,2424 | 0.2693 | 0.3229 |
| 25 | 0,2377 | 0.2640 | 0.3166 |
| 30 | 0,2176 | 0.2417 | 0.2899 |
| 35 | 0,2019 | 0.2242 | 0.2690 |
| 40 | 0,1891 | 0.2101 | 0.2521 |
| 45 | 0,1786 | 0.1984 | 0.2380 |
| 50 | 0,1696 | 0.1884 | 0.2260 |
| 60 | 0,1551 | 0.1723 | 0.2067 |
| 70 | 0,1438 | 0.1598 | 0.1917 |
| 80 | 0,1347 | 0.1496 | 0.1795 |
| 90 | 0,1271 | 0.1412 | 0.1694 |
| 100 | 0,1207 | 0.1340 | 0.1608 |
| n>100 | 1.223 قسمة n | 1.358 قسمة n | 1.629 قسمة n |