الموثوقية والاتساق في Psychometrics

عندما نطلق على شخص ما أو شيء موثوق به ، فإننا نعني أنه ثابت ويمكن الاعتماد عليه. الموثوقية هي أيضا عنصر هام في اختبار نفسي جيد. بعد كل شيء ، فإن الاختبار لن يكون ذا قيمة كبيرة إذا كان غير متناسق وأنتج نتائج مختلفة في كل مرة. كيف يحدد علماء النفس الموثوقية؟ ما تأثير ذلك على الاختبار النفسي؟

تشير الموثوقية إلى اتساق المقياس. يعتبر الاختبار موثوقًا إذا حصلنا على نفس النتيجة بشكل متكرر. على سبيل المثال ، إذا تم تصميم اختبار لقياس سمة (مثل الانطواء ) ، ففي كل مرة يتم فيها إجراء الاختبار لموضوع ما ، يجب أن تكون النتائج متماثلة تقريبًا. للأسف ، من المستحيل حساب الموثوقية بالضبط ، ولكن يمكن تقديرها بعدد من الطرق المختلفة.

موثوقية الاختبار وإعادة الاختبار

اختبار الموثوقية للاختبار هو مقياس لاتساق الاختبار أو التقييم النفسي. يتم استخدام هذا النوع من الموثوقية لتحديد اتساق الاختبار عبر الوقت. من الأفضل استخدام موثوقية الاختبار-إعادة الاختبار للأشياء التي تكون مستقرة مع مرور الوقت ، مثل الذكاء .

تُقاس موثوقية الاختبار - إعادة الاختبار بإدارة اختبار مرتين في نقطتين مختلفتين من الوقت. يفترض هذا النوع من الموثوقية أنه لن يكون هناك أي تغيير في الجودة أو البناء الجاري قياسه.

في معظم الحالات ، تكون الموثوقية أعلى عندما يكون الوقت القليل قد مر بين الاختبارات.

إن طريقة إعادة الاختبار هي واحدة من الطرق التي يمكن استخدامها لتحديد مدى موثوقية القياس. التقنيات الأخرى التي يمكن استخدامها تشمل الموثوقية الداخلية ، الاتساق الداخلي ، وموثوقية النماذج المتوازية.

من المهم ملاحظة أن موثوقية الاختبار-إعادة الاختبار تشير فقط إلى تناسق الاختبار ، وليس بالضرورة صحة النتائج.

المصداقية بين المراجع

يتم تقييم هذا النوع من الموثوقية من خلال وجود قاضيين مستقلين أو أكثر يسجلان الاختبار. ثم تتم مقارنة النتائج لتحديد مدى اتساق تقديرات المراجعين.

تتمثل إحدى طرق اختبار الوثوقية المتبادلة في تعيين كل نقطة تقييم لكل عنصر اختبار. على سبيل المثال ، قد تسجل كل وحدة تقييم العناصر على مقياس من 1 إلى 10. بعد ذلك ، ستقوم بحساب العلاقة بين التقديرين لتحديد مستوى الموثوقية المتبادلة.

وهناك وسيلة أخرى لاختبار مدى موثوقية التفاعل بين الوحدات هي تحديد الفئة التي تقع كل ملاحظة عليها ثم حساب النسبة المئوية للاتفاق بين المراجعين. لذا ، إذا وافق المراجعون على 8 من 10 مرات ، فإن الاختبار له معدل موثوقية بيني بنسبة 80٪.

موثوقية النماذج المتوازية

يتم قياس موثوقية النماذج المتوازية من خلال مقارنة اختبارين مختلفين تم إنشاؤهما باستخدام نفس المحتوى. ويتم تحقيق ذلك عن طريق إنشاء مجموعة كبيرة من عناصر الاختبار التي تقيس نفس الجودة ثم تقسم العناصر عشوائياً إلى اختبارين منفصلين. بعد ذلك يجب أن تدار الاختبارات على نفس المواضيع في نفس الوقت.

موثوقية الاتساق الداخلي

يستخدم هذا النوع من الموثوقية للحكم على اتساق النتائج عبر العناصر في نفس الاختبار. بشكل أساسي ، تقوم بمقارنة عناصر الاختبار التي تقيس نفس البنية لتحديد الاتساق الداخلي للاختبارات. عندما ترى سؤالًا يبدو مشابهًا جدًا لسؤال اختبار آخر ، فقد يشير إلى أن السؤالين يتم استخدامهما لقياس الموثوقية. نظرًا لأن السؤالين متشابهين ومصممين لقياس الشيء نفسه ، فيجب على الممتحن الإجابة على كلا السؤالين نفسه ، مما يشير إلى أن الاختبار له اتساق داخلي.

العوامل التي يمكن أن تؤثر على الموثوقية

هناك عدد من العوامل المختلفة التي يمكن أن تؤثر على موثوقية المقياس.

أولاً ، وربما من الواضح بشكل أكبر ، من المهم أن يكون الشيء الذي يتم قياسه مستقرًا ومتسقًا إلى حد ما. إذا كان المتغير المقاس هو شيء يتغير بانتظام ، فلن تكون نتائج الاختبار متسقة.

يمكن أيضًا أن تؤثر جوانب اختبار الوضع على الموثوقية. على سبيل المثال ، إذا تم إعطاء الاختبار في غرفة شديدة الحرارة ، فقد يكون المستطلعون مشتتين وغير قادرين على إكمال الاختبار بأفضل ما لديهم. هذا يمكن أن يكون لها تأثير على موثوقية التدبير. كما أن أشياء أخرى مثل التعب والإجهاد والمرض والحوافز وسوء التعليمات والإلهاءات البيئية قد تضر أيضًا بالموثوقية.

الموثوقية مقابل الصلاحية

من المهم أن نلاحظ أنه لمجرد أن الاختبار له مصداقية لا يعني أن له صلاحية. تشير الصلاحية إلى ما إذا كان الاختبار يقيس بالفعل ما تدعي قياساته أم لا. فكر في الموثوقية كمقياس للدقة والصلاحية كمقياس للدقة. في بعض الحالات ، قد يكون الاختبار موثوقًا ولكنه غير صالح. على سبيل المثال ، تخيل أن المتقدمين للوظيفة يقومون باختبار لتحديد ما إذا كانوا يمتلكون سمة شخصية معينة . على الرغم من أن الاختبار قد يؤدي إلى نتائج متناسقة ، إلا أنه قد لا يقوم في الواقع بقياس السمة التي يزعم أنها تقيسها.