چگونه می توان تفسیر دقیق تری از نتایج ارزیابی ها داشت؟
در دنیای امروزه تست ها و آزمون های متفاوتی در زمینه های مختلف وجود دارند؛ از پزشکی و روانشناسی تا مدیریت و اپیدمیولوژی متخصصان از تست های مختلفی برای بررسی وجود یا عدم وجود یک پدیده استفاده می کنند. اما به راستی چقدر نتایج این تست ها معتبر هستند؟ چگونه باید نتایج مختلف تست ها را تفسیر کرد؟ در این گزارش با مطرح کردن مثالی به بررسی این موضوع می پردازیم.
فرض کنید تستی برای تشخیص نوع خاصی از سرطان تولید شده که دارای 99 درصد حساسیت (sensitivity) و 98 درصد ویژه بودن (specificity) است. برای توضیح این مفاهیم باید مطرح شود که حساسیت در این مثال یعنی تشخیص درست موارد بیمار؛ به بیان دیگر اگر 100 نفر بیمار واقعی داشته باشم، این تست قادر است 99 نفر از آنها را شناسایی کند و نتیجه مثبت باشد. همچنین ویژه بودن به معنی نتیجه منفی واقعی است، یعنی این تست ما بر روی 100 نفر آزمودنی سالم به صورت واقعی، 98 نفر را سالم تشخیص می دهد و فقط دو نفر خطا دارد.
با توجه به توضیحات مطرح شده، تست ساخته شده توسط ما باید بسیار رضایت بخش باشد، درست است؟ اگر فردی آزمایش دهد و نتیجه مثبت باشد، چقدر احتمال دارد وجود سرطان را برای او تشخیص دهید؟
باید بدانید که احتمال واقعی وجود سرطان در فردی با نتیجه تست مثبت در این مثال، فقط 0.49 درصد است!! عجیب است، اینطور نیست؟
برای توضیح بیشتر به مثالی عددی توجه کنید. فرض کنید که از یک میلیون نفر تست گرفته ایم و به طور واقعی می دانیم از هر 10 هزار نفر، یک نفر این نوع سرطان را دارد.بنابر این به صورت قطعی 100 نفر بیمار و 999900 نفر آزمودنی سالم در این نمونه داریم. (بدیهی است در واقعیت ما مقدار دقیق مبتلایان را نمی دانیم اما این مثال صرفا برای بحث آموزشی مطرح می شود.) با توجه به اعداد قبلی در مورد حساسیت و ویژه بودن، جدول زیر محاسبه می شود: (ستون های این جدول از راست به چپ به ترتیب دارای اسامی مثبت واقعی، منفی کاذب، مثبت کاذب و منفی واقعی هستند.)
مورد | بیمار واقعی، نتیجه مثبت | بیمار واقعی، نتیجه منفی | سالم واقعی، نتیجه مثبت | سالم واقعی، نتیجه منفی |
تعداد | 99 | 1 | 19980 | 979902 |
دقت کنید فقط 100 نفر به صورت واقعی بیمار هستند، اما ما برای 99 + 19980 نفر جواب مثبت صادر کرده ایم! بنابر این احتمال واقعی سرطان داشتن در صورت جواب مثبت تست به صورت زیر محاسبه می شود:
مورد بسیار مهمی که لازم به ذکر است این است که میزان وجود پدیده ای که می خواهیم آن را در جامعه اندازه گیری کنیم، متغیر بسیار مهمی در شناسایی آن پدیده است. برای توضیح بیشتر اگر در همین مثال قبلی نسبت ابتلای بیماری از 0/0001به 0/01 افزایش یابد، احتمال شناسایی صحیح بیمار سرطانی از 0.49% به 33.33% افزایش پیدا می کند. بنابراین هرچه قدر شناسایی پدیده مورد نظر در جامعه سخت تر باشد، انتظار می رود تا آزمون خطای بیشتری از خود نشان دهد.
در مجموع مشاهده می شود که لزوم نتیجه مثبت در یک تست دلیل متقنی بر وجود پدیده نیست. به همین دلیل است که ما در مجموعه رسا با استفاده از ابزار های گوناگونی همچون تست های شخصیت روز دنیا، مصاحبه و تمرین های موقعیتی در تلاشیم تا با جمع آوری اقسام متفاوتی از اطلاعات دیدی، چند جانبه به دست بیاوریم.
منابع:
- Altman, D. G., & Bland, J. M. (1994). Diagnostic tests. 1: Sensitivity and specificity. BMJ: British Medical Journal, 308(6943), 1552.
- Baratloo, A., Hosseini, M., Negida, A., & El Ashal, G. (2015). Part 1: simple definition and calculation of accuracy, sensitivity and specificity.
- Wasserman, T., & Wasserman, L. D. (2012). The sensitivity and specificity of neuropsychological tests in the diagnosis of attention deficit hyperactivity disorder. Applied Neuropsychology: Child, 1(2), 90-99.