پرسشنامه ها و آزمون های روانی استاندارد

پرسشنامه ها و آزمون های روانی استاندارد

آزمون های روانی، گویه های روانی، مقیاس های روانی، روان سنجی، آزمون یار، azmonyar، پرسشنامه استاندارد، آزمونهای استاندارد
پرسشنامه ها و آزمون های روانی استاندارد

پرسشنامه ها و آزمون های روانی استاندارد

آزمون های روانی، گویه های روانی، مقیاس های روانی، روان سنجی، آزمون یار، azmonyar، پرسشنامه استاندارد، آزمونهای استاندارد

آزمون بینایی- حرکتی بندرگشتالت

آزمون بینایی- حرکتی بندرگشتالت

 آزمون بینایی- حرکتی بندر گشتالت (بندر، 1938، 1946)، که بر مبنای مکتب روان شناسی گشتالت تهیه شده از یک مبنای نظری مشخص برخوردار است. اصولاً جهت گیری رویکرد گشتالت برای مطالعه پدیده ادراک، به سرعت به همه جنبه های نظریه پردازی روان شناختی گسترش یافت. به طور خلاصه اساس نظری این رویکرد این بود که وقایع فقط می توانند با مطالعه آنها به صورت کلی ادراک شوند و نه از طریق مطالعه عناصر منفرد تشکیل دهنده آنها، زیرا با جداسازی اجزا از یک کل، یکپارچگی عناصر تشکیل دهنده آن از بین خواهد رفت.
بندر (1938) مهارت ادراکی حرکتی – بینایی کودکان کم سن و سال را از دیدگاه گشتالت مورد مطالعه قرار داد و متوجه شد وقتی به این کودکان نقاشیهایی از شکلهای ناقص و الگوهای ساده دیگر نشان داده شود، قدرت ادراک آنها از "کل ها" و روابط بین پدیده ها به تدریج رشد می کند. بندر با استدلال به این صورت که تمامی رشد روان شناختی فرد در این جنبه خاص از عملکرد منعکس شده است، مطرح کرد که سطح کلی مهارت ذهنی را می توان از عملکرد ادراکی حرکتی – بینایی مورد ارزیابی قرار داد. وی ساخت مواد آزمون خود را بر اساس همین فرض بنا نهاد.
آزمون بندر گشتالت از 9 کارت به ابعاد 16 در 11 سانتی متر، تشکیل شده، که هر یک از آنها دربرگیرنده یکی از الگوهای اصلی به کار برده شده در مطالعات پژوهشی بنیادی گشتالت درباره ادراک است. کارتها یک به یک به آزمودنی نشان داده و از وی خواسته می شود تا الگوها را روی یک صفحه کاغذ سفید به ابعاد 28 در 22 سانتی متر رسم کند. بندر (1946) اصولاً نقاشیها را طبق این اصل که "در پاسخ به الگوهای محرک معین ارایه شده، هر گونه انحراف در کل ارگانیزم در الگوهای نهایی حسی – حرکتی منعکس خواهد شد" تعبیر و تفسیر می کرد (ص4). بندر نمونه های (الف) پاسخهای کودکان عادی در سطوح سنی مختلف و (ب) الگوهای پاسخ گروههای مختلف بیماران روانی را که فکر می کرد با این ابزار قابل شناسایی هستند، برای آزمون خود معرفی کرد. فرض او بر این بود که آسیبهای روان شناختی به وسیله ضربه دوره اولیه کودکی ایجاد می شود، که در نتیجه مانع به تکامل رسیدن رشد توانایی دریافت، [ادراک] گشتالت یا "کل" خواهد شد.
گرچه جای بحث دارد که هر گونه نمره گذاری پاسخهای آزمون بندر - گشتالت با تأکید بر دیدگاه نظری گشتالت (اینکه یک "کل" بیش از مجموعه اجزای تشکیل دهنده آن است) تناقض خواهد داشت، بندر (1938) با استفاده از پاسخهای کودکان به کارتهای آزمون، برای اندازه گیری سطح رسش کودکان، در واقع، یک طرح نمره گذاری تجربی ارایه داد. در مورد این آزمون چندین نظام نمره گذاری دیگر، هم برای بزرگسالان (هات، 1977؛ پاسکال و ساتل، 1951) و هم برای کودکان (کوپیتز، 1975، 1963) تهیه شده است.  
مبانی نظری این آزمون نشان می دهد که اعتبار آن حداقل به طور مقدماتی باید بر اساس میزان موفقیت آزمون در جداسازی آزمودنیهایی که در رشد عملکرد بینایی – حرکتی گشتالت یا ظرفیت سازماندهی ادراک "کل" با یکدیگر متفاوت اند، ارزیابی شود. چندین مطالعه نشان داده است که از پاسخهای کودکان 4 تا 12 ساله به این آزمون می توان یک نمره سن عقلی نسبتاً مناسبی را استنتاج کرد (بیلینگزلی، 1963)؛ این نتیجه گیری با فرض اولیه بندر همخوانی دارد. همچنین گاهی اوقات می توان تمایزی کلی بین اشخاص عادی و گرههای گوناگون انجام داد، به ویژه کسانی که آسیب مغزی دارند، گرچه این یافته ها از صراحت کمتری برخوردارند (بیلینگزلی، 1963؛ گلدن، 1979) و برای تشخیص جداسازی آسیب مغزی روشهای با ثبات دیگری هم وجود دارد (نگاه کنید به بِرگ، فرانزن و ودینگ، 1987).
بیشترین کاربرد آزمون بندر – گشتالت در زمینه ارزیابی شخصیت بوده است. این اعتقاد در سطح گسترده ای وجود دارد که جنبه های کیفی گوناگونی از پاسخهای آزمودنی به این آزمون – از قبیل اندازه نسبی شکل رسم شده، شدت فشار بر کاغذ، و میزان فضای اشغال شده روی صفحه کاغذ- موارد مفیدی برای ارزیابی شخصیت فرد هستند (گروت و مارنات، 1990). با وجود این، تلاشهای عملی برای نشان دادن این رابطه ناموفق بوده اند (کیتای، 1972؛ ساتلر، 1985). با در نظر گرفتن این واقعیت که مبنای نظری بندر و انتخاب محرک آزمون از جانب او، دست کم در سطح ارزیابی ویژگیهای رفتاری قابل مشاهده، فقط رابطه اندکی با عملکرد شخصیت دارند، یافته های منفی نباید تعجب آور باشد. هات (1977) به وسیله این آزمون تفاوت معنی داری را بین افراد عادی و گروههای مختلفی از انواع آسیبهای روان شناختی گزارش کرد. با وجود این، در مطالعه وی عواملی از قبیل هوش کنترل نشده بودند و در نتیجه، این عوامل به سادگی می توانستند موجب این اختلافها شوند.
جان کلام اینکه، مبنای آزمون حرکتی (بینایی بندر گشتالت به عنوان یک مقیاس اندازه گیری کارکرد شخصیت معتبر نیست؛ به نظر می رسد نه نظریه و نه محرک آزمون هیچ کدام به طور کامل بر مبنای کارکرد شخصیت نیستند. از این رو، عجیب نیست که این آزمون برای ارزیابی شخصیت فاقد اعتبار شناخته شود.

سه راهبرد برای تهیه آزمونهای شخصیت
 

در این فصل و فصل گذشته به توضیح برخی از معروفترین ابزارهای ارزشیابی شخصیت پرداختیم، که نوعاً آزمونهای شخصیت نامیده می شدند. همه این ابزارها بر اساس یک یا چند تا از این راهبردهای تهیه آزمونهای شخصیتی تهیه شده اند: (الف) منطقی – نظری، (ب) تجربی و (ج) تحلیل عاملی. همان گونه که قبلاً مطرح شد در ساخت مقیاسهای اندازه گیری شخصیت در نظر گرفتن وضعیت جاری هنر به منظور مکمل هر سه راهبرد به کار گرفته می شود، و در عین حال، عوامل محدودساز آنها را به حداقل می رساند. بنابراین، یک رویکرد متعادل باید شامل انتخاب اولیه محرک آزمون بر اساس ملاحظات نظری یا منطقی، استفاده از تحلیل عاملی برای کسب ثبات درونی، و پرداخت نهایی آزمون بر اساس آشکارسازی یافته های تجربی باشد. با وجود اینکه این نوع آزمون سازی هم وقت گیر است و هم گران قیمت، مشخصاً برای دستیابی به سطوح رضایت بخش اعتبار کاری ضروری است. حال اجازه دهید وسعت عملکرد و محدودیتهای هر یک از راهبردها را به طور مفصلتر بررسی کنیم.

روشهای منطقی - نظری
 

به نظر می رسد سودمندی پرسشنامه هایی که مبنای منطقی دارند، حداقل به سه شرط خاص بستگی دارد:
1. پاسخ دهندگان صلاحیت داشته باشند که با توجه به سؤالهای مطرح شده درباره خودشان به قضاوت بپردازند.
2. پاسخ دهندگان باید راجع به آنچه از آنها سؤال می شود و فرض بر این است که نسبت به آن آگاهی دارند، اطمینان داشته باشند که حقیقت را می گویند.
3. محرکهای آزمون واضح و بدون ابهام باشند.
اکثر دیدگاههای روان پویایی شخصیت تمایل به رد اعتبار دو شرط اول دارند. این دیدگاهها حکایت از آن دارند که اکثر مردم به عنوان روشی جهت پرهیز از اضطراب، حقایق ناخوشایند را از خودآگاهی پنهان می کنند؛ اضطرابی که در نتیجه پذیرش این حقایق ایجاد می شود. بنابراین، نظر به اینکه ارزیابی اهمیت بسیار فراوانی دارد، احتمال خیلی ضعیفی وجود دارد که پاسخهای دقیقی از جنبه های مختلف شخصیت به دست آید. به علاوه، اکثر اشخاص بخوبی از احتمال تقیه آگاه اند؛ یعنی، آشکار نکردن عمدی حقایق ناخوشایند درباره خود به دلیل پیامدهای اجتماعی به آنها. هر دوی این ملاحظات از متداولترین ایرادات وارد به ابزارهای مبتنی بر منطق هستند.
در مورد شرط سوم، معنی روان شناختی محرکها به دو طریق می تواند تفاوتهای میان اشخاص را مد نظر قرار دهد:

(الف) به عنوان یک پیامد دفاعی که قبلاً ذکر شد، و (ب) به خاطر تفاوتهای فردی ناشی از تفاوتهای موجود در تجارب شخصی و تاریخچه یادگیری افراد. بنابراین، محرک "من اغلب اوقات سردرد دارم" در یک پرسشنامه، ممکن است از جانب فردی که کلمه "اغلب" را ماهی یکبار تعبیر می کند، پاسخ منفی بگیرد. بدین ترتیب، انتخاب محرک صریح و بدون ابهام به هیچ وجه کار ساده ای نیست.
این تفاوتهای فردی در معنای روان شناختی مواد محرک یا سؤالهای آزمون برای اولین بار از کاربرد محرک آزمون "فرافکن" ناشی شد. فرض اصلی زیربنایی فرافکنی در این معنا این است که تفاوتهای فردی در پاسخ به محرکهای مبهم عملاً مربوط به بعضی خصوصیات منطقی، یعنی، ویژگیهای برجسته عادتی شخصیت افراد است. یکی از فرضهای پذیرفته شده تهیه کنندگان آزمون این است که روابط بین محرک و پاسخها بر اساس بعضی مبانی منطقی، شناخته شده یا قابل شناسایی هستند. با وجود این، این روابط به دلیل ماهیت ظریفشان برای آزمودنیها به همین سادگیها قابل شناسایی نیستند. از این رو، تأثیر حالت تدافعی و تعمدی پاسخها را کاهش می دهند. از قرار معلوم این ظرافت فراوان یا ماهیت کمرنگ رابطه بین پاسخ آزمون و ویژگیهای شخصیتی فرض شده از جمله جدی ترین انتقادهای ابزارهای سنتی فرافکن به شمار می آید.
با اینکه ممکن است انتخاب منطقی محرکهای آزمون در اغلب موارد یک مبنای کافی برای سودمندی یا اعتبار آزمون نباشد، اما ضروری به نظر می رسد؛ یعنی، با نبودن رابطه منطقی بین پاسخ آزمودنی و ویژگیهای مورد ارزیابی یا ملاک مورد پیش بینی، احتمال دستیابی به اعتبار در سطحی رضایت بخش بسیار کاهش می یابد. بنابراین، یک امر مهم در انتخاب محرک آزمون این است که معنی پاسخهای داده شده به محرک آزمون باید با خود محرکها یا سبکی که انتخاب شده اند، همبستگی داشته باشد.
مثال واضحی از این نکته در به کارگیری مواد پرسشنامه ای در یک پژوهش به وسیله نورمن (a1963، b1963) گزارش شده است. نورمن به منظور ارزیابی تناسب شخصیت داوطلبان با مشاغل مورد علاقه آنها (یعنی شرایطی که می تواند احتمال دفاعی بودن پاسخهای آنها را افزایش دهد)، سعی کرد مواد "ظریفی" تهیه کند که معنی آنها برای پاسخ دهندگان روشن نباشد. وی روی 5 بُعد شخصیتی یک رتبه بندی از چندین گروه از دانشجویان کالج، توسط دوستانشان به دست آورد. این رتبه بندیها بعداً به عنوان ملاک شخصیت برای پیش بینی پاسخهای دانشجویان به سه گرو از محرکهای آزمون مورد استفاده قرار گرفت. اولین آزمون توصیف ویژگیهای شخصیت را مورد استفاده قرار می داد (رابطه آشکار با ملاک)، دومین آزمون شامل رتبه بندی اولویت عناوین شغلی طرحهای هندسی را می سنجید (رابطه بسیار ضعیف با ملاک)، و سومین آزمون اولویت رتبه بندی طرحهای هندسی را می سنجید (رابطه بسیار ضعیف با ملاک). نورمن با استفاده از میزان دسترسی به گروههای ملاک، از نتایج هر یک از این آزمونها یکسری مقیاسهای شخصیتی ساخت. فقط مقیاسهایی که بر مبنای آزمون اول بودند (توصیف ویژگیهای خود) و در عین حال، معنی آنها از همه روشنتر بودند، همبستگی کاملی با ملاک داشتند.
داف (1965) نیز اهمیت منطق عقلانی در محرکهای آزمون را با استفاده از آزمون MMPI نشان داد. وی به پیروی از کارهای قبلی سی من (1952 و 1953) که نشان داده بود MMPI هم مواد آشکار و هم مواد مبهم را در بر می گیرد، و اینکه برای آزمودنی مشکل است در پاسخ به مواد مبهم اقدام به وانمودسازی یا جعل پاسخ کند، آن دسته از مواد MMPI را که اصولاً اشخاص عادی را از کسانی که وضعیت خاص روان پزشکی داشتند، مجزا می کرد، به فهرست در آورد: الف) هیستری تبدیلی، (ب) شخصیت جامعه ستیز، و (ج) اسکیزوفرنی. پس از آن، از داوران متخصص خواسته شد تا نشان دهند چه موادی بر اساس محتوایشان برای آشکارسازی هر یک از این تفاوتها مناسب است؛ یعنی، از داوران خواسته شد موادی را که از لحاظ منطقی انتظار می رفت برای این جداسازیها مناسب باشد، انتخاب کنند. داف پس از شناسایی مواد منطقی یا آشکار (محتوای مربوط) و مواد مبهم یا ناآشکار (محتوای نامربوط) این روش، با بررسی پاسخهای بیماران در گروههای تشخیصی مناسب اعتبار دو نوع مواد را با یکدیگر مقایسه کرد. یافته های او با صراحت نشان داد که مواد محتوی مربوط – یعنی، موادی که منطقی یا آشکار به شمار می رفتند – بیشتر از مواد مبهم یا ناآشکار قادر به جداسازی گروهها بودند.
گلدبرگ و اسلوویک (1967) که فرضیه انحراف برگ (1959) را مورد آزمون قرار دادند نیز به نتیجه مشابهی دست یافتند. برگ اعتقاد داشت که محتوای منطقی محرکهای آزمون چندان مهم نیست، و طرفدار تنوع بیشتر محرکهای آزمون بود، از قبیل طرحهای انتزاعی هندسی که در آنها فقط باید قابلیت انعطاف تغییر پاسخ به حدی باشد که کشف روابط تجربی امکان پذیر باشد. گلدبرگ و اسلوویک همانند داف تا آنجا که امکان داشت در مورد انواع مختلفی از مواد پرسشنامه شخصیتی از جمله مواد غیرکلامی رابطه بین اعتبار محتوا و اعتبار تجربی را بررسی کردند. آنها دریافتند که "در مجموع ماده هایی که اعتبار صوری پایینی داشتند ضریب اعتبارشان پایین بود، و در مقابل، ماده هایی که اعتبار صوری بالایی داشتند اعتبارشان در همه دامنه توزیع گسترده بود (مثلاً، بعضی مواد که ظاهراً احتمال می رفت مربوط به هم باشند، در واقع، توانایی جداسازی معتبری داشتند، در حالی که در مورد بقیه این طور نبود)" (ص 467). این یافته ها مستقیماً مخالف دیدگاه برگ بود و بیشتر از این عقیده حمایت می کرد که اعتبار محتوی مبنای لازم ولی ناکافی برای اعتبار تجربی است.
جکسون (1971) به منظور حمایت از این بحث خود که داشتن ریشه منطقی یک ضرورت کامل است، در یک مقاله عمدتاً نظری مباحث بسیاری را مورد بررسی قرار داد. او سودمندترین ابزارهای ارزیابی شخصیت، از جمله آنهایی را که به گونه ای منطقی – عقلانی (از یک فرمول بندی روشن بر مبنای تعریف نظری یک صفت ساخته شده بودند) مورد ملاحظه قرار داد (ص 232). جکسون بر لزوم تهیه مجموعه ای از مواد که دارای محتوای مناسب باشند و به گونه ای معرف محتوای جامع مندرج در تعریف باشند، تأکید داشت. وی همچنین از کاربرد موادی که هم می توانند به صورت محتوای مبهم و ناآشکار و هم محتوای آشکار به کار گرفته شوند، حمایت کرد. برای مثال، این ماده که "من فکر می کنم نوزادان تازه متولد شده شباهت بسیار زیادی به میمونهای کوچک دارند"، در اولین نگاه هیچ تناسب محتوایی خاصی ندارد، اما لحظه ای تأمل نشان می دهد که بخوبی گویای قطب منفی از بعد مهرورزی است. ارزش مقاله جکسون در این است که یک منطق بسیار دقیق و الگویی برای تهیه آزمون شخصیت به روشی منطقی – نظریه ای دارد که اعتبار بالقوه مواد را افزایش می دهد.
بیشتر شواهدی که اولویت رویکرد منطقی را مد نظر دارند، اندازه گیریهای کارکرد شخصیت عادی را در بر می گیرند. اشخاصی با مشکلات روان شناختی جدی، احتمالاً کمتر می توانند به طور دقیق خود را توصیف کنند، و از این روست که استفاده از روشهای منطقی در ارزیابی آسیب شناسی روانی بسیار محدود است. اگرچه پژوهش داف (1965) خلاف چنین چیزی را نشان می دهد، در این مورد شواهد پژوهشی بیشتری مورد نیاز است.
درباره عاقبت نظری تداوم روش منطقی- نظری یک نکته قابل ذکر است و آن اینکه علی رغم اظهارنظر جکسون، وضعیت کنونی ابزارهای ارزیابی شخصیت بر مبنای نظری معتبر همچنان در پرده ابهام باقی است. تقریباً تعداد اندکی از این قبیل ابزارها در دسترس هستند، و سهم آنها در دانش کارکرد شخصیت چه از لحاظ کاربردی و چه نظری اندک است. این ابزارها در خصوص روان شناسی تجربی که با توصیف و فهم یک شخص منفرد سر و کار دارد، کمتر به کار می آیند. بنابراین، هنوز هم ادعای آنها به عنوان دقیقترین رویکرد به مسئله فهم شخصیت تصدیق نشده است.
حداقل دو دلیل برای این موضوع وجود دارد: اولاً، رویکردهای اندکی به شخصیت وجود دارند که شرایط کامل یک نظریه را داشته باشند و بتوان آنها را نظریه نامید. به علاوه، نظریه پردازان روان شناختی معاصر نسبت به تهیه نظریه های جامع شخصیت علاقه اندکی نشان داده اند. در عوض، توجه بسیار زیادی به ساخت خرده نظریه هایی شده است که تلاش می کنند با یک رشته رفتارهای محدودتر سر و کار داشته باشند تا نظریه هایی که نوعاً تحت عنوان شخصیت رده بندی شده اند. یکی از نظریه های شخصیت که در تقویت رشد آزمونهای شخصیت بیشترین تأثیر را داشته، نظریه روان کاوی فروید بوده است، که می توان آزمون تصویر بلاکی، آزمون IES (نهاد، خود، فراخود) (دوبروس(528)، اسلوبین، 1958) و بعضی آزمونهای دیگر را در این زمینه مطرح کرد.
دومین دلیل برای مبنای غیرنظری در ابزارهای ارزیابی حاضر، اشتغال ذهنی روان شناسانی است که به تهیه آزمونهایی با ظرافتهای روان سنجی علاقه مندند تا فایده بالینی. میزان بالای افزایش تقاضا برای تخصص گرایی در بین متخصصان روان سنجی ممکن است منجر به فاصله گرفتن آنها هم از نظریه پردازی و هم از پژوهش در سایر زمینه ها شده باشد که می تواند برای رشد آزمون سازی اهمیت اساسی داشته باشد. پرواضح است که در زمینه ساخت آزمون شخصیت هم مهارت فنی لازم است و هم درک نظری.
یکی از رایجترین انتقادها به پرسشنامه های شخصیت در رابطه با ظاهر ساده آنها بوده است که موجب تحریف یا جعل پاسخها توسط افرادی می شود که انگیزه چنین کاری را دارند. چون امروزه این موضوع بخوبی جا افتاده که یک عنصر اساسی در مقیاس پرسشنامه ای موفق، اعتبار محتوی است، این امر برجسته تر به نظر می رسد. واکنش عمده به این انتقاد به کارگیری مقیاسهایی به نام مقیاسهای "اعتبار" بوده است، مانند مقیاسهای K , F , L در آزمون MMPI که به منظور تعیین یا تصحیح چنین سوگیریهایی ساخته شده است. این موضوع در فصل هفتم به طور مفصلتر مورد بحث قرار گرفته است.

روشهای تجربی
 

البته سهم منحصر به فرد انتخاب مواد یا سؤالهای آزمون به روش تجربی این است که برای ارتباط داشتن هر ماده آزمون با مفهوم یا ویژگی موجود در سؤال از لحاظ آماری نوعی تضمین درونی به دست می دهد. چنانچه قبل از انتخاب نهایی مواد یا محرکها این مرحله اجرا شود، احتمال بیشتری وجود دارد که آزمون در عمل "موفق" شود؛ یعنی، وارسی اعتبار موفقیت بیشتری داشته باشد. وارسی اعتبار عبارت است از ارایه دلیلی مبنی بر اینکه آزمون با استفاده از نمونه های مستقل از گروه ملاک و آزمودنیهای عادی می تواند به عمل جداسازی ادامه دهد.
ضرورت قطعی وارسی اعتبار را باید به روشنی درک کرده باشید. به عنوان یک مثال عینی، مجموعه ای از 1000 ماده پرسشنامه خود – مرجع را که پاسخ آنها به صورت مثبت و منفی است، در نظر بگیرید. اگر دو گروه را به طور دلخواه انتخاب کنیم - مثلاً، یک گروه افرادی با چشمهای آبی و یک گروه افرادی با چشمهای قهوه ای- پاسخهای این دو گروه به بعضی از مواد آزمون فقط به طور شانسی با هم تفاوت خواهد داشت. مخصوصاً اگر به تفاوتهایی توجه نماییم که کمتر از 5 درصد موارد روی می دهند، می توانیم حدود 5 درصد یا 50 مورد از 1000 سؤال را شناسایی کنیم که به عنوان یک آزمون تجربی به منظور تفکیک رنگ چشم عمل می کند. با این همه، ممکن است این موارد بر مبنای آمار غیرواقعی انتخاب شده و رابطه پایداری با رنگ چشم نداشته باشند. بنابراین، اگر تجزیه و تحلیل مواد آزمون را روی دو گروه دیگر از آزمودنیهای چشم آبی و چشم قهوه ای تکرار می کردیم، مقیاس دوم به دست آمده، 50 ماده متفاوت دیگر را در بر می گرفت؛ یعنی یک انتخاب شانسی دیگر از 1000 ماده یا سؤال. نیازی به گفتن نیست که هیچ یک از این دو مقیاس هیچ ارزشی برای جداسازی گروههای ملاک نخواهند داشت. از آنجا که میزان شانسی بودن تغییرات مقیاسهایی که بر مبنای تجربی تهیه شده اند، همیشه مشخص نیست، ارایه دلیلی برای توانایی جداسازی آنها به طور مستقل امری ضروری است.
وقتی که یک ابزار اندازه گیری تنها بر مبنای روشهای تجربی تهیه شده باشد، ضروری است که در تعبیر و تفسیر صفت شخصیتی که به استناد آن عمل اندازه گیری صورت گرفته است، دقت لازم اعمال شود، زیرا ممکن است سایر تفاوتهای موجود بین گروههای ملاک و کنترل معنای مقیاس را تغییر دهند. بنابراین، مقیاس فرضی سلطه جویی که در فصل سوم توضیح داده شد ممکن است در تحقیق بعدی احساسات سیاسی را به جای آنچه اصولاً به معنی تسلط گرایی مورد توافق بوده است اندازه گیری کند، و در نتیجه برای تشخیص افرادی که از لحاظ بین فردی سلطه جو هستند، کاربرد اندکی داشته باشد. البته با به کارگیری یک مبنای منطقی – نظری برای حوزه مواد اصلی که به منظور حفظ توانایی جداسازی تجربی به طوری که معرف نمونه اصلی مواد باشد، این مشکل بالقوه برطرف خواهد شد.
یک مشکل بالقوه دیگر در رابطه با روش تجربی وجود دارد. در این روش گروههای ملاک به گونه ای انتخاب شده اند که به طور خالص و اغلب تا آنجا که امکان دارد نمونه هایی از حوزه رفتاری مورد نظر را در بر بگیرند. ما در تهیه مقیاس اسکیزوفرنی از اسکیزوفرنهای "واقعی" استفاده می کنیم، و در تهیه مقیاس سلطه جویی از افرادی با سلطه جویی بسیار بالا در برابر افراد بسیار منفعل استفاده می کنیم، حتی هنگامی که نوعاً بیشتر به شناسایی افرادی علاقه مند باشیم که جایی در وسط پیوستار دارند و نه افرادی که در دو حد نهایی پیوستار قرار می گیرند. اینکه مواد انتخاب شده به این روش چه از لحاظ منطقی و چه از لحاظ تجربی برای شناسایی موارد متعادل این پدیده مناسب باشد یا خیر، قابل بحث است.

روشهای تحلیل عاملی
 

همان طور که در فصل سوم اشاره شد، تحلیل عاملی مجموعه هایی از مواد یا سایر متغیرهایی را که از لحاظ آماری با یکدیگر همبستگی دارند، شناسایی می کند. معمولاً این گونه نتیجه گرفته می شود که چنین موادی معنای مشترکی دارند و از این رو، یک جنبه اساسی یا محوری را ارزیابی می کنند. در بسیاری از موارد، همین هدف مطرح است. به عنوان نمونه، اگر 50 ماده برای نمونه گیری جامعی از یک صفت شخصیتی مانند "صمیمیت" نوشته شده باشد، و در صورتی که اکثر مواد به کار رفته به طور معنی داری با یک عامل واحد همبستگی داشته باشند، پس آن مواد می توانند به عنوان مواد تشکیل دهنده مقیاس اندازه گیری "صمیمیت" در نظر گرفته شوند. اما اگر در مورد مجموعه ای از مواد این مضمون منطقی- نظری وجود نداشته باشد، یا اگر در تحلیل عاملی به جای فقط یک عامل بر چندین عامل مختلف تأکید شده باشد (مجموعه های مختلفی از مواد همبسته)، پس به منظور تعیین دقیق تر معانی، نامگذاری عامل یا عوامل باید با تکیه بر پژوهش بیشتر به طور کاملاً تجربی انجام شود.
راجع به پنج عامل عمده شخصیتی یکسری موضوعات مطرح شده که ارتباط بسیار نزدیکی با یکدیگر دارند. آیا این واقعیت که آنها تحت پوشش یک عامل قرار گرفته اند، ثابت می کند که فقط یک ساختار "واقعی" شخصیت در آنها وجود دارد یا همه این ساختارها در واقع ساختهای دست انسان است؟ میشل در تأیید بخش دوم دیدگاه فوق چنین ابراز می دارد که بخشی از این "همبستگی موجود در پنج عامل رفتاری، به جای اینکه همبستگی واقعی در رفتار آزمودنی باشد، ساخته ذهن مشاهده کننده است" (ص 43). در حالی که نورمن و گلدبرگ (1966) و گلدبرگ (b1990) توانستند نشان دهند که ریشه عوامل چیزی بیش از فقط توافق ذهنی (معنایی) است، و (حداقل بخشی از آن) ماهیت ساختار شخصیتی خود آزمودنیهاست.
بنابراین، سهم اصلی تحلیل عاملی به درک رابطه بین مواد و مقیاسهای آزمونهای شخصیتی مربوط می شود. فایده مقیاسهایی که به روش تحلیل عاملی تجزیه و تحلیل شده اند به ویژگی درونی این مقیاسها بر نمی گردد، بلکه این موضوع باید به طور تجربی نشان داده شود (مگر اینکه مثل کتل فرض کنیم که این مقیاسها برخی از خصوصیات "واقعی" ارگانیزم را ارزیابی می کنند). به طور کلی، اعتبارهای گزارش شده مقیاسهای تحلیل عاملی در مجموع بیشتر پایین بوده اند. مگر در موارد خیلی استثنایی، از قبیل ساختار دوعاملی که به کرات تکرار شده و ساختار 5 عاملی که برای آن هم شواهد محکمی وجود دارد.

مقایسه روشها
 

پژوهشی که درباره اهمیت اعتبار محتوا در بالا توضیح داده شد، با تفسیرهایی که ما بر اساس روشهای تجربی و تحلیل عاملی ساخت آزمون انجام داده بودیم، همخوانی دارد؛ یعنی، صرف نظر از اینکه کدام روش تهیه آزمون مورد استفاده قرار بگیرد، تناسب محتوی یک ضرورت اساسی است. همچنین به منظور مقایسه قدرت پیش بینی کنندگی هر روش به تنهایی یک پژوهش مقابله ای انجام گرفته است. در یک مطالعه قدیمی، هیس و گلدبرگ (1967) با استفاده از مواد آزمون CPI، چهار مجموعه 11 مقیاسی ساختند، و با در نظر گرفتن الگوهای منطقی- نظری به عنوان رویکردهای جداگانه، هر مجموعه را به وسیله یکی از روشهای آزمون سازی تهیه کردند. بعد، آنها اعتبارهای پیش بین این چهار مجموعه مقیاس را با 13 ملاک از اندازه های به دست آمده از 200 دانشجوی زن، از قبیل تواناییهای مربوط به پیشرفت در کالج، آزمون آزمایشگاهی همنوایی، عضویت در کلوپ (انجمن خیریه)، رفتار قرار ملاقات، رتبه بندی همسالان درباره صفات شخصیتی مختلف، مثل سلطه جویی، اجتماعی بودن و احساس مسئولیت مقایسه کردند. یافته اصلی این بود که همه 4 مجموعه مقیاسها در مقایسه با 13 ملاک مختلف تراز شده دارای اعتبار یکسانی بودند. به علاوه، همبستگی اعتبارهای به دست آمده به طور معنی داری بالاتر از همبستگی دو مجموعه مقیاس دیگری بود که به منظور کنترل اهداف پژوهشی تهیه شده بودند.
آشتون و گلدبرگ (1973) بعداً در یک مطالعه، این ادعای جکسون (1971) را مورد آزمون قرار دادند: اعتبار مقیاسهایی که به روش منطقی توسط متخصصان کارآزموده و حتی افراد بی تجربه ساخته شده از مقیاسهایی که نوعاً به روش تجربی تهیه شده اند، کمتر است. آنها در یک مطالعه پیچیده و گسترده مقیاسهای موجود در CPI و RFP را با مقیاسهای منطقی که به وسیله دانشجویان فارغ التحصیل روان شناسی و کسانی که آموزش رسمی روان شناسی ندیده بودند، تهیه شده بود، مورد مقایسه قرار دادند. همه مقیاسها روی 169 دانشجوی زن اجرا شد، و ملاک اعتبار را میانگین رتبه بندیهای ابعاد مختلف دانشجویان به وسیله گروه همسالان تشکیل می داد و "با ثبات ترین مقیاسهای ساخته شده توجهی از همه مقیاسهای CPI بیشتر بود" (آشتون و گلدبرگ، 1973، ص 1).
در مطالعه آشتون و گلدبرگ بالاترین میانگین همبستگی فقط در حدود 0/35 بود، با این حال، این مطالعه مزایای رویکرد منطقی یا تجربی تهیه مواد آزمون را به وضوح نشان داد. بوریش (1984) 16 مطالعه را که روشهای مختلف ساخت مقیاس را با هم مقایسه کرده بودند، و او آنها را روشهای ملاک خارجی (تجربی)، قیاسی (تحلیل عاملی) و استقرایی (منطقی) نام نهاده بود، مورد بررسی قرار داد. با اینکه هیچ یک از رویکردها نسبت به دیگری برتری پایداری نشان نداد، بوریش نتیجه گرفت که این مزایای رویکرد منطقی است که این روش را کاراتر نموده است (ساخت مقیاسهای منطقی آسانتر است و اطلاعات را مستقیم تر در اختیار ارزیابی کننده قرار می دهند.) همه این یافته ها با وضعیت جاری هنر که قبلاً توضیح داده شد، همساز هستند: تهیه مقدماتی مجموعه ای از مواد یا سؤالها بر مبنای منطقی یا نظری و بعد استفاده از روش تجربی و تحلیل عاملی به منظور انتخاب بهترین ماده.

روشهای فرافکن
 

بحث بالا درباره نقاط قوّت و ضعف روشهای مختلف آزمون سازی فقط بر پرسشنامه ها متمرکز بوده است، زیرا ادبیات مربوط در این زمینه منحصراً پرسشنامه ها را در بر می گرفت. اما همین مسئله برای تهیه مواد فرافکن هم صادق است. ما از این بحث که چندان هم درک ما را از روشهای فرافکن افزایش نمی دهد، چه چیزی می توانیم بیاموزیم؟ به یک دلیل، در فصل سوم نشان داده شد که بهترین اعتبارهای روشهای فرافکن با استفاده از نظامهای نمره گذاری خاصی به دست آمده که بر مبنای تناسب محتوی ساخته شده اند. این اظهار عقیده با این نتیجه گیری که تناسب محتوی یک جزء ضروری اعتبار پرسشنامه هاست و از پژوهشهای فوق به دست آمده است، کاملاً انطباق دارد. هرچند در این مورد پرسشنامه ها می توانند به سرعت نمره گذاری شوند (اغلب به وسیله کامپیوتر)، در حالی که کار "نمره گذاری" یا "رمزگردانی" محتوای پاسخهای فرافکن وقت گیر است و این امر عامل دیگری است که در کار اندازه گیری مشکل ایجاد می کند. دادن فرصت ارایه پاسخهای باز به آزمودنیها به جای محدود ساختن آنها به پاسخهای صحیح – غلط یا چند گزینه ای، بهایی است که باید برای آزمودنیهایی که به این آزمونها پاسخ می دهند، پرداخت شود.
تعبیر و تفسیر مشهورترین آزمونهای فرافکن، یعنی، رورشاخ، نیازی به تأکید بر محتوای آزمون ندارد، بلکه بر یک رشته از متغیرهایی استوار است که شباهت زیادی با شیوه های پاسخ دارند (نگاه کنید به فصل هفتم). می توان نتیجه گرفت که شاید اعتبار این متغیرها (مکان، حرکت انسان، رنگ و غیره) مربوط به محتوای مبهم آنها باشد. حمایت آشکار از این موضوع در یک مطالعه توسط گورهام (1967) صورت گرفته است. گورهام با استفاده از روش لکه جوهر هولتزمن توانست تنها با استفاده از محتوای شش کلمه اول پاسخ هر فرد، نمره های مستقلی را برای نمره گذاری طبقات [مقولات] اصلی استخراج کنند. چنین نتیجه گیریهایی نشان می دهند که پژوهش درباره آزمون رورشاخ (و سایر آزمونهای فرافکن) باید بر مبنای محتوای متغیرها صورت گیرد، هرچند بررسی آثار معاصر درباره رورشاخ نشان می دهد که این چنین نبوده است.

خلاصه
 

در این فصل مشهورترین روشهای فرافکن مورد بحث قرار گرفت و نقاط قوّت و ضعف سه روش اساسی آزمون سازی توضیح داده شد. در روش جملات ناتمام، آزمودنیها بخشهای پایانی جملات گوناگونی را می نویسند که در ابتدای این جملات، کلماتی آورده شده است که به شخصیت افراد مربوط می شود. این روش گسترده ترین کاربرد را در شیوه بالینی یا تشخیصی داشته است، گرچه چندین فرم قابل نمره گذاری دیگر نیز در دسترس است، و یافته های پژوهش نشان می دهند که مقیاسهای استاندارد شده بر اساس محتوا از بهترین اعتبار برخوردارند.
در آزمون رورشاخ، به آزمودنی مجموعه ای از 10 لکه جوهر نشان داده می شود، و پاسخها طبق چند ویژگی صوری طبقه بندی می شوند. کشف اولیه تفاوتهای پایدار بین پاسخها به طور تصادفی در گروههایی از بیماران روان پزشکی صورت گرفت، و هنوز هم علی رغم بسیاری از شواهد پژوهشی، تفکر تجربی رورشاخ درباره دلایل این تفاوتها، به عنوان روشی معتبر مورد تأیید بسیاری از متخصصان بالینی است. روش لکه جوهر هولتزمن (HIT) به منظور ارزیابی متغیرهای اساسی اندازه گیری شده به وسیله رورشاخ طراحی، و در عین حال، از تعدادی مشکلات جدی روان سنجی موجود در رورشاخ اجتناب شد. با اینکه HIT این متغیرها را واقعاً به طور رضایت بخشی اندازه می گیرد، برای سودمندی آن در ارزیابی شخصیت شواهد اندکی وجود دارد.
تکنیکهای داستان - تصویر که از میان آنها آزمون اندریافت موضوع (TAT) پرطرفدارترین آنهاست، مستلزم این است که آزمودنی درباره تصاویر مورد نظر داستان هایی بسازد که توصیف کننده شخصیت مربوط به شکلها باشد. به طور کلی، فرض این آزمون بر آن است که رفتارها و احساسات شخصیتهای اصلی، یعنی (قهرمانان زن و مرد) داستانها منعکس کننده ویژگیهای شخصیتی خود آزمودنیهاست. چندین طرح استاندارد شده برای نمره گذاری محتوی و سایر جنبه های داستانها وجود دارد، اما استفاده بالینی از تکینکهای داستان - تصویر، به طور کلی یک هنر تخیلی است [ یعنی، نوعی تشخیص هنری]. در روشهای ترسیم تصویر به آزمودنی یک کاغذ سفید داده می شود که روی آن چیزی (غالباً یک انسان) نقاشی کند. صرف نظر از وجود یک رابطه کلی بین میزان واقعیت داشتن نقاشی (در صورتی که شکل یک انسان باشد) و سطوح عمومی سازگاری آزمودنی، این نقاشیها هنوز ارزش زیادی را نشان نداده اند.
شاید بیشترین جهت گیری نظری ابزارهای ارزیابی در آزمون تصاویر بلاکی باشد که بر اساس رشد روانی - جنسی از نظریه روان کاوی ساخته شده است. در مورد این آزمون یک نظام استاندارد شده نمره گذاری وجود دارد، و شواهدی در دسترس است که این نظام اطلاعات معتبری برای اهداف پژوهشی فراهم کند. فرض اصلی آزمون حرکتی - بینایی بندر گشتالت، که در چهارچوب نظریه روان شناسی گشتالت طراحی شده، بر این است که همه دوره های رشد انسان از جمله شخصیت در کارکرد ادراکی منعکس می شود. این آزمون ظاهراً یک نمره "سن عقلی" نسبتاً رضایت بخشی را برای کودکان به دست می دهد، اما به نظر می رسد برای ارزیابی شخصیت اعتباری نشان نداده است.
هر یک از این سه روش اساسی تهیه آزمونهای شخصیت نقاط قوّت و ضعف خاص خود را دارند، و وضعیت جاری هنر در ساخت آزمونها به منظور یک شیوه مکمل برای هر سه روش به کار می رود. نتایج پژوهش با صراحت نشان داده است که اگرچه مبنای منطقی یا محتوایی برای اعتبار مواد آزمون ضروری است، اما با این حال کافی نیست. در انتهای پیوستار منطقی - نظری، ابزارهای نسبتاً اندکی وجود دارد، و وعده های این رویکرد هنوز نیاز به تکامل و رشد بیشتری دارد. پیشرفتهای تکاملی (ساخت آزمون) بیشتر به روش روان سنجی گرایش دارند تا ماهیت نظری.
سهم روشهای تجربی انتخاب آزمون در ایجاد تضمین درونی آنهاست، تا مواد آزمون از لحاظ آماری با ملاک مورد نظر همبستگی داشته باشند. با اینکه وارسی اعتبار در استفاده از رویکرد تجربی ضروری است، برای درک روابط بین آزمون و مقیاسها، رویکرد عاملی سهم اصلی را به عهده دارد و در یک آزمون منجر به ساخت مقیاسهایی می شود که هم ثبات درونی داشته و هم از لحاظ معنایی از سایر مقیاسهای همان آزمون متمایز باشند.
پژوهشهای انجام شده درباره مقایسه قدرت پیش بینی کنندگی هر یک از سه روش اساسی ساخت آزمون به طور جداگانه نشان داده است که هیچ یک از آنها نسبت به دیگری برتری ندارند، و در مقابل، رویکرد استفاده مشترک از آنها مورد حمایت قرار گرفته است. گرچه مسایل مربوط به آزمونهای روان سنجی که در این فصل مورد بحث قرار گرفت، هم برای تهیه آزمونهای فرافکن و هم مواد پرسشنامه ای کاربرد یکسانی دارند، اما در واقع، کاربرد آنها در زمینه فرافکن مانع از کاربرد بسیاری از تکنیکهای روان سنجی جاری موجود شده است.

نظرات 0 + ارسال نظر
امکان ثبت نظر جدید برای این مطلب وجود ندارد.