روانشناسی کاربردی. قابلیت اطمینان - درجه سازگاری نتایج به‌دست‌آمده از کاربرد مکرر یک تکنیک اندازه‌گیری الزامات اساسی برای معیارها

آزمون 3. روش تحقیق

1. داده های مربوط به رفتار واقعی انسان که از طریق مشاهده بیرونی به دست می آید، نامیده می شوند:

الف) L - داده؛

ب) داده های Q;

ج) T-data;

د) داده های Z.

2. به نوع نتایج ثبت شده با استفاده از پرسشنامه و سایر روشهای خودارزیابی می گویند:

الف) L - داده؛

ب) داده های Q;

ج) T-data;

د) داده های Z.

3. این تخصیص اعداد به اشیا، که در آن تفاوت‌های مساوی در اعداد با تفاوت‌های مساوی در ویژگی یا ویژگی اندازه‌گیری شده شی مطابقت دارد، وجود مقیاس را پیش‌فرض می‌گیرد:

الف) اسامی؛

ب) سفارش؛

ج) فواصل

د) روابط

4. مقیاس سفارش مربوط به اندازه گیری در سطح:

الف) اسمی؛

ب) ترتیبی؛

ج) فاصله

د) روابط

5. رتبه بندی اشیاء با توجه به شدت یک ویژگی خاص جوهر اندازه گیری در سطح است:

الف) اسمی؛

ب) ترتیبی؛

ج) فاصله

د) روابط

6. در روانشناسی استفاده از مقیاس زیر بسیار نادر است:

الف) اسامی؛

ب) سفارش؛

ج) فواصل

د) روابط

7. فرضیاتی که بر دگرگونی های مقیاس های ترتیبی حاکم هستند، فرض های زیر را شامل نمی شوند:

الف) تریکوتومی؛

ب) عدم تقارن؛

ج) گذر؛

د) دوگانگی ها.

8. در کلی ترین شکل، مقیاس های اندازه گیری با مقیاس نشان داده می شوند:

الف) اسامی؛

ب) سفارش؛

ج) فواصل

د) روابط

9. شما نمی توانید هیچ عملیات حسابی را در مقیاس انجام دهید:

الف) اسامی؛

ب) سفارش؛

ج) فواصل

د) روابط

10. ایجاد برابری روابط بین ارزشهای فردی در سطح مقیاس مجاز است:

الف) اسامی؛

ب) سفارش؛

ج) فواصل

د) روابط

11. بی.جی. Ananyev به روش تحقیق طولی اشاره می کند:

الف) به روش های سازمانی؛

ب) روش های تجربی؛

ج) روش های پردازش داده ها؛

د) به روش های تفسیری.

12. ادراک هدفمند و منظم انجام شده از اشیایی که شخص به آنها علاقه مند است:

الف) آزمایش؛

ب) تحلیل محتوا؛

ج) مشاهده؛

د) روش تجزیه و تحلیل محصولات فعالیت.

13. مشاهده بلندمدت و سیستماتیک، مطالعه بر روی افراد مشابه، که به فرد امکان می دهد رشد ذهنی را در مراحل مختلف زندگی تجزیه و تحلیل کند و بر این اساس نتایج خاصی بگیرد، معمولاً تحقیق نامیده می شود:

الف) ایروباتیک؛

ب) طولی؛

ج) مقایسه ای؛

د) پیچیده

14. مفهوم "خود مشاهده" مترادف با این اصطلاح است:

الف) درونگرایی؛

ب) introjection;

ج) درون نگری؛

د) اینتروسکوپی.

15. استفاده سیستماتیک از مدل سازی معمول ترین است:

الف) برای روانشناسی انسان گرا؛

ب) برای روانشناسی گشتالت؛

ج) برای روانکاوی؛

د) برای روانشناسی آگاهی.

16. یک آزمون روان‌شناختی استاندارد و مختصر که تلاش می‌کند یک فرآیند ذهنی یا شخصیت خاص را به طور کلی ارزیابی کند:

الف) مشاهده؛

ب) آزمایش؛

ج) آزمایش؛

د) مشاهده خود

17. دريافت داده‌ها در مورد فرآيندها و حالات ذهني خود در زمان وقوع يا به دنبال آن عبارت است از:

الف) مشاهده؛

ب) آزمایش؛

ج) آزمایش؛

د) مشاهده خود

18. مداخله فعال محقق در فعالیت های یک موضوع به منظور ایجاد شرایط برای احراز یک واقعیت روانی نامیده می شود:

الف) تحلیل محتوا؛

ب) تجزیه و تحلیل محصولات فعالیت؛

ج) گفتگو؛

د) آزمایش

19. روش اصلی برای تحقیقات روان شناسی مدرن این نیست:

الف) دوقلو؛

ب) فرزندان خوانده؛

ج) خانواده؛

د) درون نگری.

20. بسته به موقعیت، مشاهدات زیر قابل تشخیص است:

الف) میدان؛

ب) جامد؛

ج) سیستماتیک،

د) گسسته

21. روشی برای مطالعه ساختار و ماهیت روابط بین فردی افراد بر اساس سنجش انتخاب بین فردی آنها نامیده می شود:

الف) تحلیل محتوا؛

ب) روش مقایسه؛

ج) روش واحدهای اجتماعی.

د) جامعه سنجی

22. برای اولین بار آزمایشگاه روانشناسی تجربی افتتاح شد:

الف) دبلیو جیمز;

ب) G. Ebbinghaus;

ج) W. Wundt;

د) اچ ولف.

23. اولین آزمایشگاه آزمایشی جهان کار خود را آغاز کرد:

الف) در سال 1850؛

ب) در سال 1868;

ج) در سال 1879;

24. اولین آزمایشگاه روانشناسی تجربی در روسیه شناخته شده است:

الف) از سال 1880؛

ب) از سال 1883؛

ج) از سال 1885؛

25. اولین آزمایشگاه پدولوژی ایجاد شد:

الف) A.P. نچایف در سال 1901؛

ب) اس. هال در 1889;

ج) دبلیو جیمز در 1875;

د) N.N. لانگ در سال 1896

26. در روسیه، اولین آزمایشگاه روانشناسی تجربی توسط:

هدف. سچنوف;

ب) G.I. چلپانوف؛

ج) V.M. Bekhterev;

د) I.P. پاولوف

27. توانایی محقق برای برانگیختن برخی فرآیندها یا ویژگی های ذهنی مزیت اصلی است:

الف) مشاهدات؛

ب) آزمایش؛

ج) تحلیل محتوا؛

د) تجزیه و تحلیل محصولات فعالیت.

28. با استفاده از روش تجربی، فرضیه هایی در مورد وجود:

الف) پدیده ها؛

ب) ارتباط بین پدیده ها.

ج) رابطه علت و معلولی بین پدیده ها.

د) همبستگی بین پدیده ها.

29. موارد زیر به شما امکان می دهد کلی ترین الگوهای ریاضی و آماری را ایجاد کنید:

الف) تحلیل محتوا؛

ب) تجزیه و تحلیل محصولات فعالیت؛

ج) گفتگو؛

د) آزمایش

30. یک آزمایش انجمنی برای مطالعه تشکیلات عاطفی ناخودآگاه ایجاد و پیشنهاد شد:

الف) P. Janet;

ب) اس. فروید;

ج) جی برویر;

الف) R. Gottsdanker;

ب) A.F. لازورسکی؛

ج) D. Campbell;

د) W. Wundt.

32. مفهوم "آزمایش انطباق کامل" توسط:

الف) R. Gottsdanker;

ب) A.F. لازورسکی؛

ج) D. Campbell;

د) W. Wundt.

33. حد واسط بین روش های تحقیق طبیعی و روش هایی که در آن کنترل دقیق متغیرها اعمال می شود:

الف) آزمایش فکری؛

ب) شبه آزمایش;

ج) آزمایش آزمایشگاهی؛

د) روش مکالمه

34. مشخصه ای که به طور فعال در یک آزمایش روانشناختی تغییر می کند، متغیر نامیده می شود:

الف) مستقل؛

ب) وابسته؛

ج) خارجی؛

د) سمت.

35. طبق نظر D. Campbell، متغیرهای بالقوه کنترل شده به متغیرهای آزمایش اشاره دارند:

الف) مستقل؛

ب) وابسته؛

ج) وثیقه؛

د) خارجی

36. به عنوان معیاری برای پایایی نتایج، اعتبار به دست آمده در طول یک آزمایش واقعی در مقایسه با یک آزمایش ایده آل نامیده می شود:

الف) داخلی؛

ب) خارجی؛

ج) عملیاتی؛

د) سازنده

37. معیار انطباق روش آزمایشی با واقعیت عینی، اعتبار را مشخص می کند:

الف) داخلی؛

ب) خارجی؛

ج) عملیاتی؛

د) سازنده

38. در یک آزمایش آزمایشگاهی، اعتبار بیشتر نقض می شود:

الف) داخلی؛

ب) خارجی؛

ج) عملیاتی؛

د) سازنده

39. مفهوم "اعتبار زیست محیطی" بیشتر به عنوان مترادف مفهوم "اعتبار" استفاده می شود:

الف) داخلی؛

ب) خارجی؛

ج) عملیاتی؛

د) سازنده

40. هشت عامل اصلی ناقض اعتبار درونی و چهار عامل ناقض روایی خارجی شناسایی شدند:

الف) R. Gottsdanker;

ب) A.F. لازورسکی؛

ج) D. Campbell;

د) W. Wundt.

41. عامل عدم هم ارزی گروه ها در ترکیب که باعث کاهش اعتبار درونی تحقیق می شود توسط دی کمپبل نامگذاری شد:

الف) انتخاب؛

ب) رگرسیون آماری.

ج) غربالگری تجربی؛

د) توسعه طبیعی

42. اثر دارونما کشف شد:

الف) روانشناسان؛

ب) معلمان؛

ج) پزشکان؛

د) فیزیولوژیست ها

43. وجود هر ناظر خارجی در آزمایش را اثر می گویند:

الف) دارونما؛

ب) هاثورن؛

ج) تسهیل اجتماعی؛

د) هاله

44. تأثیر آزمایشگر بر نتایج در مطالعات بسیار مهم است:

الف) روانی فیزیولوژیکی؛

ب) فرآیندهای فردی «جهانی» (هوش، انگیزه، تصمیم گیری و غیره).

ج) روانشناسی شخصیت و روانشناسی اجتماعی.

د) روان زایی

45. به عنوان یک تکنیک خاص توسعه یافته، درون نگری به طور مداوم در تحقیقات روانشناختی استفاده شده است:

الف) A.N. لئونتیف;

ب) W. Wundt;

ج) V.M. Bekhterev;

د) ز. فروید.

46. فنون روان‌شناختی که بر اساس مواد آموزشی ساخته می‌شوند و برای سنجش میزان تسلط بر دانش و مهارت‌های آموزشی به‌عنوان آزمون شناخته می‌شوند:

الف) دستاوردها؛

ب) هوش؛

ج) شخصیت؛

د) تصویری.

47. ارزیابی توانایی‌های فرد برای تسلط بر دانش، مهارت‌ها و توانایی‌ها، از ماهیت عمومی یا خاص، از طریق آزمون انجام می‌شود:

الف) دستاوردها؛

ب) هوش؛

ج) شخصیت؛

د) توانایی ها

48. ارزیابی سازگاری شاخص‌های به‌دست‌آمده از آزمایش مجدد همان موضوعات با همان آزمون یا فرم معادل آن، آزمون را از نظر آن مشخص می‌کند:

الف) اعتبار؛

ب) قابلیت اطمینان؛

ج) قابلیت اطمینان؛

د) نمایندگی.

49. معیار کیفیت آزمون مورد استفاده برای تعیین انطباق آن با حوزه پدیده های ذهنی اندازه گیری شده، نشان دهنده اعتبار آزمون است:

الف) سازنده؛

ب) بر اساس معیار؛

د) پیش آگهی.

50. معیار کیفیت آزمون مورد استفاده در هنگام اندازه گیری هر پدیده ذهنی پیچیده ای که دارای ساختار سلسله مراتبی است، که به این دلیل اندازه گیری آن با یک عمل آزمایش غیرممکن است، به عنوان شناخته شده است:

الف) اعتبار ساختاری آزمون؛

ب) اعتبار آزمون مربوط به معیار؛

ج) اعتبار محتوایی آزمون؛

د) پایایی آزمون.

51. داده های پرسشنامه های شخصی نباید تحت تأثیر:

الف) استفاده از استانداردهای نادرست توسط افراد؛

ب) فقدان مهارت های درون نگری در میان آزمودنی ها.

ج) اختلاف بین توانایی های فکری پاسخ دهندگان و الزامات رویه نظرسنجی.

د) تأثیر شخصی محقق.

52. برای ایجاد رابطه آماری بین متغیرها از موارد زیر استفاده می شود:

الف) آزمون تی دانشجویی؛

ب) تحلیل همبستگی؛

ج) روش تجزیه و تحلیل محصولات فعالیت.

د) تحلیل محتوا.

53. تحلیل عاملی اولین بار در روانشناسی مورد استفاده قرار گرفت:

الف) R. Cattell;

ب) K. Spearman;

ج) جی کلی;

د) L. Thurstone.

54. متداول ترین مقدار در مجموعه ای از داده ها نامیده می شود:

الف) میانه؛

ب) مد؛

ج) دهک؛

د) صدک.

55. اگر داده‌های روان‌شناختی در مقیاس فاصله‌ای یا مقیاس نسبتی به‌دست آید، برای شناسایی ماهیت رابطه بین نشانه‌ها از ضریب همبستگی استفاده می‌شود:

الف) خطی؛

ب) رتبه بندی شده؛

ج) اتاق بخار؛

د) چندگانه

56. جدول بندی، ارائه و شرح مجموع نتایج تحقیقات روانشناختی انجام می شود:

الف) در آمار توصیفی؛

ب) در نظریه استنتاج آماری;

ج) در آزمون فرضیه ها؛

د) در مدل سازی

57. وسیع ترین دامنه کاربرد روش های ریاضی در روانشناسی امکان کمی سازی شاخص ها را در مقیاس می دهد:

الف) اسامی؛

ب) سفارش؛

ج) روابط؛

د) فاصله

58. پراکندگی یک شاخص است:

الف) تنوع؛

ب) معیارهای گرایش مرکزی.

ج) ساختاری متوسط؛

د) متوسط

59. روش های آماری چند متغیره شامل موارد زیر نمی شود:

الف) مقیاس بندی چند بعدی؛

ب) تحلیل عاملی؛

ج) تجزیه و تحلیل خوشه ای؛

د) تجزیه و تحلیل همبستگی.

60. ارزیابی بصری شباهت‌ها و تفاوت‌های بین اشیاء خاص که توسط تعداد زیادی متغیر مختلف توصیف شده‌اند توسط:

الف) مقیاس بندی چند بعدی؛

ب) تحلیل عاملی؛

ج) تجزیه و تحلیل خوشه ای؛

د) تحلیل نهفته ساختاری.

61. مجموعه رویه های تحلیلی و آماری برای شناسایی متغیرهای پنهان (ویژگی ها) و همچنین ساختار داخلی ارتباطات بین این ویژگی ها نامیده می شود:

الف) مقیاس بندی چند بعدی؛

ب) تحلیل عاملی؛

ج) تجزیه و تحلیل خوشه ای؛

د) تحلیل نهفته ساختاری.

*پایایی و اعتبار یک آزمون از ویژگی های انطباق یک مطالعه با معیارهای رسمی است که کیفیت و مناسب بودن را برای استفاده در عمل تعیین می کند.

قابلیت اطمینان چیست

در طول تست قابلیت اطمینان تست، سازگاری نتایج به دست آمده در هنگام تکرار تست ارزیابی می شود. اختلاف داده ها باید وجود نداشته باشد یا ناچیز باشد. در غیر این صورت، نمی توان با اطمینان با نتایج آزمایش برخورد کرد.

قابلیت اطمینان آزمون معیاری است که نشان می دهد ویژگی های زیر آزمون ها ضروری تلقی می شوند:

تکرارپذیری نتایج به دست آمده از مطالعه؛
درجه دقت یا ابزارهای مرتبط؛
پایداری نتایج در یک دوره زمانی معین

در تفسیر قابلیت اطمینان، مولفه های اصلی زیر قابل تشخیص است:

قابلیت اطمینان ابزار اندازه گیری (یعنی سواد و عینیت تکلیف آزمون)، که می تواند با محاسبه ضریب مربوطه ارزیابی شود.
پایداری مشخصه مورد مطالعه در یک دوره زمانی طولانی و همچنین قابل پیش بینی بودن و صاف بودن نوسانات آن.
عینی بودن نتیجه (یعنی استقلال آن از ترجیحات شخصی محقق).

عوامل قابلیت اطمینان

درجه اطمینان می تواند تحت تأثیر تعدادی از عوامل منفی قرار گیرد که مهمترین آنها موارد زیر است:

نقص روش (دستورالعمل های نادرست یا نادرست، عبارت نامشخص وظایف)؛
بی ثباتی موقت یا نوسانات ثابت در مقادیر شاخص مورد مطالعه؛
ناکافی بودن محیطی که مطالعات اولیه و بعدی در آن انجام می شود.
تغییر رفتار محقق و همچنین بی ثباتی وضعیت آزمودنی؛
رویکرد ذهنی هنگام ارزیابی نتایج آزمون

روش های ارزیابی پایایی آزمون

برای تعیین پایایی آزمون می توان از تکنیک های زیر استفاده کرد.

روش تست مجدد یکی از رایج ترین روش هاست. این به شما امکان می دهد تا درجه همبستگی بین نتایج مطالعات و همچنین زمانی که آنها در آن انجام شده اند را تعیین کنید. این تکنیک ساده و موثر است. با این وجود، به عنوان یک قاعده، معاینات مکرر باعث تحریک و واکنش های منفی در افراد می شود.

اعتبار سازنده یک آزمون معیاری است که هنگام ارزیابی آزمونی که دارای ساختار سلسله مراتبی است (در فرآیند مطالعه پدیده های پیچیده روانشناختی استفاده می شود) استفاده می شود.
روایی مبتنی بر معیار شامل مقایسه نتایج آزمون با سطح توسعه یک یا آن ویژگی روانشناختی آزمودنی است.
اعتبار محتوا مطابقت روش با پدیده مورد مطالعه و همچنین محدوده پارامترهایی را که پوشش می دهد تعیین می کند.
روایی پیش بینی اعتباری است که به فرد امکان می دهد توسعه آینده یک پارامتر را ارزیابی کند.

انواع معیارهای اعتبار

اعتبار آزمون یکی از شاخص هایی است که به شما امکان می دهد کفایت و مناسب بودن یک تکنیک را برای مطالعه یک پدیده خاص ارزیابی کنید. چهار معیار اصلی وجود دارد که می تواند بر آن تأثیر بگذارد:

معیار مجری (ما در مورد صلاحیت و تجربه محقق صحبت می کنیم).
معیارهای ذهنی (نگرش آزمودنی نسبت به یک پدیده خاص، که در نتیجه آزمایش نهایی منعکس می شود).
معیارهای فیزیولوژیکی (وضعیت سلامت، خستگی و سایر ویژگی هایی که می تواند تأثیر قابل توجهی بر نتیجه آزمایش نهایی داشته باشد).
معیار شانس (در تعیین احتمال وقوع یک رویداد خاص اتفاق می افتد).

معیار اعتبار یک منبع مستقل از داده ها در مورد یک پدیده خاص (ویژگی روانی) است که مطالعه آن از طریق آزمایش انجام می شود. تا زمانی که نتایج به‌دست‌آمده از نظر انطباق با معیار بررسی نشود، اعتبار آن قابل قضاوت نیست.

الزامات معیارهای اساسی

معیارهای خارجی که بر شاخص اعتبار آزمون تأثیر می‌گذارند باید الزامات اساسی زیر را برآورده کنند:

انطباق با حوزه خاصی که تحقیق در آن انجام می شود، ارتباط و همچنین ارتباط معنایی با مدل تشخیصی؛
عدم وجود هرگونه تداخل یا شکست شدید در نمونه (نکته این است که همه شرکت کنندگان در آزمایش باید پارامترهای از پیش تعیین شده را داشته باشند و در شرایط مشابه باشند).
پارامتر مورد مطالعه باید قابل اعتماد، ثابت و در معرض تغییرات ناگهانی نباشد.

راه های ایجاد اعتبار

بررسی اعتبار آزمون ها به روش های مختلفی انجام می شود.

ارزیابی اعتبار صوری شامل بررسی اینکه آیا آزمون برای هدف مناسب است یا خیر.

اعتبار سازه زمانی ارزیابی می شود که مجموعه ای از آزمایش ها برای مطالعه یک اندازه گیری پیچیده خاص انجام شود. آن شامل:

اعتبارسنجی همگرا - بررسی رابطه ارزیابی های به دست آمده با استفاده از تکنیک های مختلف پیچیده.
اعتبار سنجی واگرا، که شامل حصول اطمینان از این است که روش شناسی به ارزیابی شاخص های خارجی که به مطالعه اصلی مربوط نیستند، دلالت نمی کند.

ارزیابی اعتبار پیش بینی شامل ایجاد امکان پیش بینی نوسانات آتی شاخص مورد مطالعه است.

نتیجه گیری

روایی و پایایی آزمون، شاخص های مکملی هستند که کامل ترین ارزیابی را از عادلانه بودن و اهمیت نتایج تحقیق ارائه می کنند. اغلب آنها به طور همزمان تعیین می شوند.

قابلیت اطمینان نشان می دهد که تا چه حد می توان به نتایج آزمون اعتماد کرد. این به معنای ثبات آنها در هر بار تکرار یک آزمون مشابه با همان شرکت کنندگان است. درجه پایینی از قابلیت اطمینان ممکن است نشان دهنده تحریف عمدی یا رویکرد غیرمسئولانه باشد.

مفهوم اعتبار آزمون با جنبه کیفی آزمایش همراه است. ما در مورد اینکه آیا ابزار انتخاب شده با ارزیابی یک پدیده روانشناختی خاص مطابقت دارد یا خیر صحبت می کنیم. در اینجا هم می توان از شاخص های کیفی (ارزیابی نظری) و هم از شاخص های کمی (محاسبه ضرایب مربوطه) استفاده کرد.

در مفهوم عملی، قابلیت اطمینان به ثبات یا پایداری نتایج اندازه گیری اشاره دارد. اگر یک ابزار اندازه گیری خاص قابل اعتماد باشد، اندازه گیری های مکرر توسط همان ابزار و شخص دیگری نتیجه را تغییر نمی دهد. برعکس، ابزارهای اندازه گیری غیرقابل اعتماد بسته به شرایط مختلف، نتایج اندازه گیری متفاوتی را تولید می کنند.

قابلیت اطمینانیک نیاز کلی برای هر نوع اندازه گیری تحت هر شرایطی است.

چندین روش برای ارزیابی میزان اطمینان وجود دارداین تست نتایج اندازه گیری را ارائه می دهد. سه روش بیشتر مورد استفاده قرار می گیرد.

1.ارزیابی پایایی آزمون با استفاده از روش آزمون مجدد. یکی از پرکاربردترین. این روش ضریب همبستگی بین دو متغیر را محاسبه می‌کند - نتایج اندازه‌گیری‌هایی که با آزمایش دو بار افراد مشابه با استفاده از یک آزمون، اما در زمان‌های مختلف به دست می‌آیند.

از دیدگاه محقق، روش آزمایش مجدد ساده است و زمان کمی را می طلبد. احتمالاً داوطلبان آزمون کمتر آن را دوست دارند زیرا باید دو بار در آزمون شرکت کنند. همانطور که اسمیت و جورج تاکید می‌کنند، یکی از جنبه‌های مهم تست انگیزه دادن به آزمون‌دهندگان برای موفقیت در آزمون است. ممکن است در طول آزمایش های مکرر، آزمودنی ها احساس بی حوصلگی یا بی حوصلگی کنند که باعث ایجاد خطای اضافی در نتایج می شود.

هنگام بررسی پایایی یک آزمون با آزمون مجدد، رویدادهای دیگری نیز ممکن است بین آزمون اول و دوم رخ دهد. اگر این زمان خیلی کوتاه باشد، ممکن است میزان ماندگاری تحت تأثیر عواملی مانند حفظ سؤالات آزمون یا تجربه به دست آمده در اولین آزمون و همچنین کاهش علاقه شرکت کنندگان به آزمون باشد. اگر زمان زیادی بین آزمون اول و دوم بگذرد، شرکت کنندگان ممکن است به روش های مرتبط با آزمون تغییر کنند (ممکن است آماده شده باشند، تجربه کسب کرده باشند، مطالب را یاد گرفته باشند و غیره).

واکنش های ناهموار آزمودنی ها به آزمون اول باعث ایجاد خطای اضافی در ارزیابی پایایی آزمون می شود. به همین دلیل، این روش برای ارزیابی پایایی آزمون‌هایی که برای ارزیابی مهارت‌هایی طراحی شده‌اند که مرتبط با حافظه نیستند و بعید است با تمرین کوتاه در اولین آزمون بهبود یابند، بسیار مفید است. نمونه‌هایی از این آزمون‌ها شامل تست‌های شنوایی، مهارت‌های حل مسئله و مهارت‌های حرکتی ظریف است.

2. ارزیابی پایایی آزمون با بررسی سازگاری داخلی. برخی از مشکلات مرتبط با انگیزه، حافظه و تجربه که در ارزیابی پایایی آزمون-بازآزمایی به وجود می‌آیند را می‌توان با استفاده از روشی برای بررسی سازگاری درونی آزمون دور زد. این به جای سازگاری نتایج به دست آمده در طول آزمون در زمان‌های مختلف، سازگاری پاسخ‌ها به سؤالات آزمون فردی را بررسی می‌کند. یکی از روش‌هایی که معمولاً مورد استفاده قرار می‌گیرد این است که چندین آزمودنی یک بار در آزمون شرکت کنند، سپس آزمون را به دو بخش تقسیم کنید که نتایج آن به طور جداگانه نمره‌گذاری می‌شود. اکنون هر موضوع دو نتیجه دارد و از آنها برای محاسبه ضریب همبستگی استفاده می شود.

به طور معمول، آزمون به دو بخش به شرح زیر تقسیم می شود: سوالات با اعداد فرد در یک نیمه و سوالات با اعداد زوج در نیمه دیگر گنجانده می شود. ضریب همبستگی حاصل از r بین دو مجموعه از "نتایج" ضریب سازگاری داخلی یا گاهی اوقات ضریب جدایی نامیده می شود.

3. ارزیابی پایایی آزمون با استفاده از روش فرم های معادلعلاوه بر روش بررسی سازگاری داخلی، می توانید از یک روش جایگزین استفاده کنید که مبتنی بر استفاده از دو تست مختلف است.

اگر هر دو آزمون بر اساس یک ماده و از نظر شکل و سختی معادل باشند، می توان با استفاده از روش فرم های معادل، ارزیابی پایایی را انجام داد. به هر موضوعی هر دو آزمون ارائه می شود و ضریب همبستگی بین نتایج به دست آمده (r) که ضریب هم ارزی نامیده می شود محاسبه می شود. این نام نشان دهنده نقطه ضعف اصلی این روش - دشواری ساخت فرم های آزمون معادل است. اگر نتایج یکسانی با استفاده از ابزار اندازه گیری یکسان به دست آید، یک آزمون قابل اعتماد در نظر گرفته می شود. اگر اشکال مختلف آزمون معادل نباشند، از ابزار اندازه‌گیری یکسانی استفاده نمی‌شود و بر این اساس، تخمین پایایی کمتر برآورد می‌شود.

ساختن فرم های آزمون معادل می تواند دشوار و وقت گیر باشد. علاوه بر این، قبل از اینکه بتوان از فرم های مختلف آزمون برای ارزیابی قابلیت اطمینان آزمون استفاده کرد، باید آنها را برای هم ارزی با استفاده از یک نمونه متفاوت آزمایش کرد. با این حال، هنگامی که یک آزمون کافی و قابل اعتماد نشان داده شد، ممکن است در دسترس بودن اشکال معادل از آزمون مفید باشد.

اما بر خلاف قابلیت اطمینان، علاوه بر عوامل تصادفی عوامل سیستماتیک بر اعتبار آزمون تأثیر می گذارد.آنها سوگیری های سیستماتیک را به نتایج وارد می کنند. این عوامل از دیگر ویژگی های ذهنی هستند که مانع از بروز ویژگی هایی می شوند که هدف آزمون در نتایج آزمون است. به عنوان مثال، ما می خواهیم پتانسیل یادگیری (یک جزء حیاتی از توانایی کلی فکری یک فرد) را اندازه گیری کنیم. اما به آزمودنی آزمونی با محدودیت زمانی دقیق و بدون فرصتی برای بازگشت و اصلاح اشتباه می دهیم. کاملاً بدیهی است که مشخص می شود که ویژگی ذهنی مورد نظر در آزمون با خاصیت ذهنی کاذب مخلوط می شود - مقاومت در برابر استرس: آزمودنی هایی با سطوح بالای مقاومت استرسی در آزمون عملکرد بهتری خواهند داشت. این اثر تحریف سیستماتیک را آشکار خواهد کرد.

در روان سنجی مدرن، ده ها روش مختلف نظری و تجربی برای آزمون اعتبار آزمون ها ایجاد شده است. عنصر اصلی تقریباً همه این روش ها به اصطلاح معیار است. معیار اعتبارمنبعی مستقل از آزمون از اطلاعات در مورد ویژگی ذهنی مورد اندازه گیری، خارج از آزمون است. تا زمانی که نتایج آن را با منبعی از اطلاعات واقعی (یا حداقل آشکارا معتبرتر) در مورد ویژگی مورد اندازه گیری - با یک معیار - مقایسه نکنیم، نمی توانیم اعتبار یک آزمون را قضاوت کنیم.

معیارهای آزمایشگاهی خاص در تحقیقات علمی غالب است. به عنوان مثال، یک پرسشنامه آزمون فشرده برای اضطراب در حال ساخت است. و به عنوان معیار اعتبار، از یک آزمایش آزمایشگاهی عینی با کار فشرده ویژه استفاده می شود که در آن یک موقعیت واقعی اضطراب بازتولید می شود (آزمودنی های داوطلب برای اقدامات اشتباه و غیره با شوک الکتریکی تهدید می شوند).

در عمل، معمولاً معیارهای عمل گرایانه به عنوان معیار اعتبار - شاخص های اثربخشی فعالیت به منظور پیش بینی اینکه کدام آزمایش انجام می شود، استفاده می شود. در مدرسه، معمولی ترین شاخص معیار عملکرد تحصیلی است. اما برای سازگاری روانی-اجتماعی کودک، یک شاخص معیار خارجی ممکن است سطح محبوبیت در کلاس باشد.

27. مشکل تطبیق آزمون ها و روش های زبان های خارجی و خارجی. (تطبیق تئوری و روش شناختی تغذیه با آزمون ها و تکنیک های خارجی)

عمل روان‌شناختی به آزمون‌های تشخیصی روان‌شناختی استاندارد شده علمی و در عین حال مقرون‌به‌صرفه نیاز دارد. در این راستا، مشکل نه تنها توسعه داخلی، بلکه انطباق روش های تشخیصی خارجی، آزمایش شده و معتبر همیشه مطرح بوده و هست. انطباق آزمون- این مجموعه اقداماتی است که کفایت روش را در شرایط جدید کاربرد آن تضمین می کند.

مراحل اصلی انطباق آزمون:

1) تحلیل و بررسیاصلی مفاد نظرینویسنده آزمون، که شامل شناسایی نقاط تماس با نظریه و روش شناسی روانشناسی داخلی است.

2) ترجمه زبانیمتن و دستورالعمل های آن به زبان کاربر. این مرحله با ارزیابی تخصصی از مطابقت متون نسخه ترجمه شده با متون اصلی به پایان می رسد.

3) تایید تجربیمتن ترجمه شده با توجه به معیارهای روایی، پایایی و پایایی مطابق با الزامات روانسنجی؛

4) استانداردسازی تجربیتست بر روی نمونه های مناسب

از مراحل بالا مشخص می شود که استفاده از آزمون های زبان خارجی فقط ترجمه به زبان دیگر نیست. در این مورد، اصلی مشکلات نه تنها با تفاوت های زبانی، بلکه با تفاوت های اجتماعی-فرهنگی در محیطی که آزمون در آن ایجاد شده و در آن مورد استفاده قرار خواهد گرفت، مرتبط است. جنبه زبانی سازگاریبه معنای تطبیق واژگان و دستور زبان متن با سن و ویژگی های آموزشی جمعیت های برنامه ریزی شده برای امتحان و همچنین در نظر گرفتن معنای مفهومی (متخصصان منطق از این مفهوم استفاده می کنند. مفهومیبه عنوان معادل مفهوم ضمنی. بدین ترتیب، معنای مفهومی- این یکی است که مفروض یا ضمنییا با یک کلمه، نماد، اشاره یا رویداد بیان می شود. معانی دلالتی معمولاً کیفیات انتزاعی، خصوصیات کلی یا طبقاتی از اشیاء یا اجزای عاطفی را تعریف می کنند. باید در نظر داشت که یافتن معادل در فرهنگ دیگری برای ویژگی های زبانی فرهنگ جامعه ای که آزمون در آن ایجاد شده است دشوار و گاه به سادگی غیرممکن است، بنابراین ترجمه تخصصی آزمون های ذهنی همیشه با تصحیح زبانی همراه است؛ ساختارهای زبان در معرض تأیید ذهنی هستند (صحت ادراک، افکار، مفروضات. تایید- این تأییدیه انطباق محصول نهایی با الزامات مرجع از پیش تعریف شده است.) بنابراین، انطباق تجربی کامل آزمون پس از ترجمه آن الزامی است، و اغلب به اندازه توسعه روش اصلی دشوار است.

اخیراً، انطباق تست های خارجی نه تنها به موضوع بحث در بین متخصصان، بلکه جهت تحقیقات خاص، موضوع ادبیات روش شناختی، مشاوره ای و آموزشی مربوطه تبدیل شده است.

مشخص است که بسیاری از روش‌ها چگونه مراحل پیچیده انطباق را طی کردند، به عنوان مثال، آزمون شخصیت چند عاملی مینه سوتا (MMPI) یا پرسشنامه شخصیت 16 عاملی R. Cattell (16-PF). انطباق این روش ها در بررسی مطابقت هنجارهای آزمون آمریکایی و اسلوونی با استفاده از محاسبات آماری میانگین های حسابی و انحرافات استاندارد برای مقیاس های تشخیصی اصلی در نمونه های جدید افراد بیان شد. همبستگی بین مقیاس‌های این روش‌ها نیز مورد مطالعه قرار گرفت، اما مهم‌ترین مرحله بررسی صحت نسخه‌های تطبیقی این پرسش‌نامه‌ها - تجزیه و تحلیل تکرارپذیری مقیاس‌های تشخیصی، یعنی تجزیه و تحلیل همبستگی‌های بین آیتم‌های فردی - بسیار دیرتر انجام شد. . این امر امکان یافتن موارد زیر را فراهم کرد:

1) قرض گرفتن سیستمی از مفاهیم متمایز (ویژگی های شخصیتی) در رابطه با مفاهیمی که توسط توسعه دهندگان در سایر شرایط اجتماعی-فرهنگی پیشنهاد شده بود، چقدر مشروع بود.

2) چه مفاهیم تشخیصی واقعاً در شرایط ما "کار می کنند".

در نتیجه یک سری مطالعات، مشخص شد که پرسشنامه های تست شخصیت چند عاملی خارجی در رابطه با نمونه های روسی زبان، هم ویژگی های تشخیصی پایدار و هم ویژگی های خاص را نشان می دهد.

بنابراین، برای تشخیص روانی عملی انطباق تست های خارجیبه معنای نه تنها تفسیر معنایی در یک نسخه زبان جدید، بلکه همچنین آزمون آزمایشی و هنجاری کامل آنها در سایر شرایط اجتماعی-فرهنگی با استفاده از روش های مدرن تحلیل ریاضی است.

در مقابل، روایی به این اشاره دارد که آیا روش مورد استفاده در یک مطالعه معین، دقت آنچه را که در نظر گرفته شده است اندازه گیری می کند یا خیر. به عنوان مثال، هنگام استفاده از تست واژگان تصویر پی بادی، کودک...

بخش اول، مطالعه جامع مسیر زندگی یک فرد

بهش میگن کتابچه با عکس. آزمایش‌کننده کلمه محرک را با صدای بلند می‌گوید و از کودک می‌خواهد یکی از 4 تصویر موجود در صفحه کتابچه را نشان دهد که شی نام‌گذاری شده و غیره را نشان می‌دهد. این فقط یک تست برای درک کلمات انگلیسی است که به صورت شفاهی ارائه می‌شود. با این حال، محققان گاهی اوقات به اشتباه از آن برای اندازه گیری هوش استفاده می کنند. ناگفته نماند که چنین استفاده ای از آزمون باطل، یعنی بی اساس است.

مشاهده مستقیم.شاید رایج ترین نوع اندازه گیری مورد استفاده در نوزادان و کودکان خردسال، مشاهده مستقیم رفتار کودک در یک موقعیت خاص باشد. محقق می تواند مشاهده کند که کودک چگونه با اسباب بازی برخورد می کند یا به غریبه ها واکنش نشان می دهد. کودکان را می توان در محیط مدرسه مشاهده کرد تا ببیند چگونه برای حل یک مشکل با یکدیگر همکاری می کنند. برای افزایش دقت و محتوای اطلاعاتی مشاهدات، دانشمندان اغلب از تجهیزات ضبط مانند دوربین فیلمبرداری استفاده می کنند. در صورت لزوم انجام تحقیق بر روی کودکان بزرگتر، نوجوانان یا بزرگسالان، سازماندهی مشاهده مستقیم رفتار آنها با مشکلات فزاینده ای مواجه می شود. نوجوانان و بزرگسالان واقعاً دوست ندارند «روی صحنه بروند»؛ آنها ترجیح می دهند افکار و احساسات خود را به محققان بگویند.

تجزیه و تحلیل موارد فردی.هدف این روش مطالعه فردیت است و می تواند مصاحبه عمیق، مشاهده یا ترکیبی از هر دو باشد. افراد خارق‌العاده اغلب برای تحقیق با استفاده از این روش انتخاب می‌شوند: این افراد می‌توانند برندگان جایزه نوبل، بیماران روانی، بازماندگان اردوگاه‌های کار اجباری و نوازندگان با استعداد باشند. به طور معمول، یک رویکرد غیر رسمی و کیفی برای توصیف و ارزیابی رفتار آنها استفاده می شود. تحلیل موردی می‌تواند برای توسعه حوزه‌های جدید مطالعه یا بررسی دقیق‌تر تعامل متوالی تأثیرات متضاد متعدد مورد استفاده قرار گیرد. اولین نمونه استفاده از این روش در "خاطرات کودک" حاوی داده های مشاهده ای یک نوزاد در حال رشد یافت می شود. همانطور که در گزیده‌هایی از دفتر خاطرات گردآوری شده توسط مور (1896) مشاهده می‌شود، نوشته‌های این نوع خاطرات معمولاً ناقص و غیرسیستماتیک هستند.

هفته پنجم: من چهره شخص را شناختم.

هفته نهم: با دیدن سینه ها و صورت مادرم شناختم.

هفته دوازدهم: دستم را شناختم.

هفته شانزدهم: شست و پستانکم را شناخت.

هفته هفدهم: یک سنگ مرمر را از چند فوتی تشخیص داد.

مطالعات موردی به ندرت در تحقیقات توسعه ای مورد استفاده قرار می گیرد زیرا شامل مشکلات ذهنی و متغیرهای کنترل نشده است و شامل مطالعه یک فرد می شود. بنابراین، روابط علت و معلولی برقرار کنید و در مورد تأثیرات تعمیم دهید

فصل اول چشم انداز توسعه انسانی، فرآیندها و روش های تحقیق

تقریبا غیر ممکن است در عین حال، تجزیه و تحلیل صحیح انجام شده از رشد یک فرد می تواند مطالعه دقیق تری از مشکلات آشکار شده در او را تحریک کند.

در حوزه‌های عملی مانند پزشکی، آموزش، مددکاری اجتماعی و روان‌شناسی بالینی، تحلیل موردی ابزار مهمی برای تشخیص و ارائه توصیه‌ها است. مطالعه کوتاه‌مدت با استفاده از این روش، مانند تجزیه و تحلیل دقیق واکنش‌های کودک به جنگ یا ضربه، ممکن است برای درک رفتار بعدی مفید باشد. اگرچه تجزیه و تحلیل موردی باید با احتیاط به عنوان یک ابزار تحقیق مورد بررسی قرار گیرد، اما تصویر واضح، بصری و دقیقی از چگونگی تغییر کل فرد در رابطه با محیط خود ارائه می دهد.

آزمون های موفقیت و توانایی.آزمون‌های کتبی پیشرفت یا توانایی شکل رایج اندازه‌گیری جنبه‌های فیزیکی و شناختی رشد هستند. برای مفید بودن، این آزمون ها باید در اندازه گیری توانایی هایی که برای اندازه گیری طراحی شده اند قابل اعتماد و معتبر باشند. اغلب اینها روش‌هایی هستند که به صورت دستی پر می‌شوند، اگرچه نسخه‌های رایانه‌ای آنها به طور فزاینده‌ای رایج می‌شوند.

تکنیک های خود گزارش دهیروش های خودگزارش دهی شامل مصاحبه و اشکال مختلف گزارش و پرسشنامه است که توسط خود آزمودنی پر می شود که در آن محقق برای شناسایی نظرات و اشکال معمول رفتار پاسخگو سوالاتی را مطرح می کند. گاهی از آزمودنی ها خواسته می شود که اطلاعاتی در مورد خودشان، در مورد اینکه الان، در حال حاضر یا در گذشته چگونه بوده اند، ارائه دهند. گاهی اوقات از آنها خواسته می شود تا در مورد گفته ها یا مقاصد خود تأمل کنند، درباره رفتار یا سبک زندگی خود قضاوت کنند یا خود را بر اساس مجموعه ای از ویژگی های شخصیتی ارزیابی کنند. در هر صورت از آنها انتظار می رود که تا حد امکان منصفانه و عینی عمل کنند. گاهی اوقات چنین روش‌هایی شامل «مقیاس دروغ» است که شامل سؤالاتی از بخش اصلی پرسشنامه است که به شکل کمی تغییر یافته تکرار می‌شود و هدف آن ارزیابی صداقت پاسخ‌دهنده است. علی‌رغم این کنترل، داده‌های به‌دست‌آمده از طریق تکنیک‌های خودگزارش‌دهی ممکن است محدود به آنچه پاسخ‌دهنده مایل است گزارش دهد یا آنچه محقق برای محقق قابل قبول می‌داند، محدود شود.

علیرغم استفاده گسترده از مصاحبه و پرسشنامه در مطالعات نوجوانان و بزرگسالان، این روش ها نیاز به سازگاری قابل توجهی در هنگام کار با کودکان دارند. در یکی از این تحقیقات، محققان به دنبال درک باورهای کودکان در مورد خود و خانواده شان بودند. یک تکنیک گزارش خود به نام گفتگوی تعاملییکی از این دیالوگ ها به این سوال اختصاص داشت که من شبیه چه کسی هستم و اعضای خانواده ام چه کسانی هستند؟ محقق مجموعه ای از کارت ها را با تصاویر طرح برای مصاحبه آماده کرد. هنگام پاسخ دادن به سؤالات، کودکان کارت ها را در دو گروه مرتب می کردند و از این طریق شباهت ها یا تفاوت های بین موقعیت های نشان داده شده در تصاویر و روابط خانواده خود را نشان می دادند (رید، رامی، و بورچینال، 1990).

بخش 1. مطالعه جامع مسیر زندگی یک فرد

تکنیک های فرافکنیگاهی محقق اصلاً سؤال مستقیم نمی کند. در آزمون های فرافکنی، به آزمودنی ها تصویر، کار یا موقعیتی ارائه می شود که حاوی عنصر عدم قطعیت است و آنها باید داستانی را بیان کنند، آنچه ترسیم شده را توضیح دهند یا راهی برای خروج از موقعیت پیدا کنند. از آنجایی که تکلیف اولیه، به دلیل نامشخص بودن آن، به گونه‌ای است که نمی‌توان پاسخ درست یا نادرستی داشت، فرض بر این است که در این صورت افراد احساسات، نگرش‌ها، اضطراب‌ها و نیازهای خود را به این موقعیت فرافکنی می‌کنند. احتمالاً مشهورترین تکنیک تصویری، تست لکه جوهر رورشاخ است. مثال دیگر آزمون نگرش موضوعی (TAT) است که در آن از آزمودنی خواسته می شود تا داستان های کوتاهی را با مجموعه ای از تصاویر با محتوای نسبتا مبهم بسازد. سپس آزمایش‌کننده مضامین موجود در تمام داستان‌هایی را که آزمون‌شونده ایجاد کرده است، تجزیه و تحلیل می‌کند.

تکنیک های فرافکنی مانند تست تداعی کلمه و تست جمله ناتمام نیز بسیار مورد استفاده قرار می گیرند. ممکن است از آزمودنی ها خواسته شود جمله ای مانند: «پدر من همیشه...» را تکمیل کنند، ممکن است مجموعه ای از تصاویر به آنها نشان داده شود و از آنها خواسته شود که آنچه را که ترسیم شده است، بیان کنند، نگرش خود را نسبت به آنچه به تصویر کشیده شده است بیان کنند، تصاویر را تجزیه و تحلیل کنند، یا آنها را به ترتیب بچینند. چنین نظمی برای شکل دادن یک داستان منسجم. به عنوان مثال، در یک مطالعه، کودکان 4 ساله در یک بازی به نام "پیک نیک خرس" شرکت کردند. آزمایشگر چندین داستان در مورد یک خانواده خرس عروسکی گفت. سپس به کودک یک توله خرس داده شد ("این توله خرس شما خواهد بود") و از او خواسته شد که داستان را کامل کند (Mueller, & Lucas, 1975).

پایان کار -

این موضوع متعلق به بخش:

توسعه انسانی: دیدگاه ها، فرآیندها و روش های تحقیق

اگر به مطالب اضافی در مورد این موضوع نیاز دارید یا آنچه را که به دنبال آن بودید پیدا نکردید، توصیه می کنیم از جستجو در پایگاه داده آثار ما استفاده کنید:

با مطالب دریافتی چه خواهیم کرد:

اگر این مطالب برای شما مفید بود، می توانید آن را در صفحه خود در شبکه های اجتماعی ذخیره کنید:

تمامی موضوعات این بخش:

روانشناسی رشد
نسخه هفتم بین‌المللی سری «کارشناس ارشد روان‌شناسی» ترجمه از انگلیسی توسط N. Malgina, N. Mironov, S. Rysev, E. Turutina به سردبیری علمی عمومی پروفسور. A. A. Alek

کریگ جی
K78 روانشناسی رشد. - سن پترزبورگ: پیتر، 2000. - 992 ص: ill. - (سری "استادهای روانشناسی") ISBN 5-314-00128-4 کتاب پیشنهادی در 7 نسخه در آمریکا انجام شد. امروز این یکی از بهترین هاست

اهداف فصل
پس از تکمیل این فصل، باید بتوانید کارهای زیر را انجام دهید. 1. مشخص کردن فرآیندهای زیستی و محیطی توسعه و همچنین توضیح ماهیت و

زمینه های توسعه
رشد در سه حوزه فیزیکی، شناختی و روانی اجتماعی رخ می دهد. حوزه فیزیکی شامل ویژگی های فیزیکی مانند اندازه و شکل بدن و اندام ها، تغییرات است

مشخصات کلی مناطق توسعه
جدول 1-1 ویژگی های ناحیه رشد فیزیکی شامل رشد و تغییرات در بدن انسان است. این ورودی است

فرآیندهای توسعه بیولوژیکی
همه موجودات زنده بر اساس کد ژنتیکی یا طرح اولیه خود رشد می کنند. در برخی گونه ها مانند پروانه ها یا پروانه ها، این طرح ژنتیکی کاملاً تعریف شده است و عملاً مجاز نیست.

تأثیر محیط بر رشد انسان
هر لحظه در معرض محیط قرار می گیریم. نور، صدا، گرما، غذا، دارو، خشم، مهربانی، شدت - همه اینها و خیلی چیزهای دیگر می تواند برای ارضای نیازهای اولیه بیولوژیکی باشد.

تعامل فرآیندهای توسعه
بحث‌های مداومی در میان برخی از روانشناسان وجود دارد که چقدر از رفتار ما توسط بلوغ و چقدر با یادگیری تعیین می‌شود. کودک ابتدا می نشیند، سپس می ایستد و در نهایت

دوره بحرانی - تنها دوره زمانی در چرخه زندگی یک موجود زنده که یک عامل محیطی خاصی قادر به ایجاد یک اثر است.
به عنوان مثال، اگر یک زن باردار نسبت به سرخجه مصونیت نداشته باشد، در نتیجه 2 ماه پس از لقاح بیمار می شود، این می تواند منجر به عواقب جدی شود: ناشنوایی کودک یا

مدل اکولوژیکی
شاید تاثیرگذارترین مدل رشد انسان تا به امروز، مدلی باشد که توسط روانشناس آمریکایی، یوری برونفنبرنر ارائه شده است. بر اساس مدل سیستم های اکولوژیکی او (بر

دیدگاه های تاریخی و فرهنگی
دیدگاه دوره زندگی، که قبلاً در این فصل با بررسی نتایج مطالعه طولی کالیفرنیا معرفی کردیم، بر 4 فرض اساسی استوار است (استولر،

سیر زندگی انسان: تغییرات مرتبط با سن در مقایسه با تغییرات تاریخی
رشد انسان در طول زندگی را نمی توان در یک محیط آزمایشگاهی کنترل شده مطالعه کرد. عوامل فرهنگی و تاریخی، آمیخته با تغییرات قابل پیش بینی مرتبط با سن،

کوهورت گروه یا مجموعه ای از افراد است که در یک دوره زمانی به دنیا آمده اند
بخش 1 مطالعه جامع دوره زندگی انسان برخی از محققان نسل افرادی را که در دوران رکود بزرگ متولد شده اند و در دوران نوجوانی از جنگ جهانی دوم جان سالم به در برده اند مطالعه کردند.

نگرش به کودکان از منظر تاریخی
در طول تاریخ بشر، نگرش نسبت به کودکان دستخوش تغییرات قابل توجهی شده است. طبق منابع مکتوب، در اروپای قرون وسطی، بزرگسالان تا حد زیادی این دوره را نادیده می گرفتند

توسعه در بستر یک خانواده در حال تغییر
نگرش نسبت به اندازه خانواده، ساختار و کارکردهای آن نیز در طول زمان تغییر کرد. تا دهه 1920، خانواده های آمریکایی پرجمعیت بودند و نمایندگان سه نفر بودند

مطالعه سیستماتیک عینی رشد انسانی
به دست آوردن حقایق قابل اعتماد و قابل تأیید مرتبط با زمینه توسعه انسانی کار آسانی نیست. چگونه داده‌های تجربی شخصی ما با داده‌های جمع‌آوری‌شده توسط یک محقق متفاوت است؟ در چه مرحله ای هستید

اصل عینیت
مهم نیست که چقدر منصف و بی طرف باشیم، نگرش های فردی و فرهنگی ما می تواند موانع جدی برای درک صحیح رفتار انسان ایجاد کند.

هنر پرسیدن سوال
بیشتر اکتشافات در علوم طبیعی و اجتماعی ناشی از طرح پرسش های معنادار و مشاهده دقیق محققان بوده است. دانشمندی که متوجه چیز جالبی می شود خارج می شود

با استفاده از روش علمی
تحقیقات رشد کودک از همان روش علمی استفاده می کند که در هر حوزه دیگری از علوم اجتماعی یا رفتاری استفاده می شود. اصطلاح روش علمی به موضوعی اطلاق می شود که عموماً پذیرفته شده است

انتخاب شرایط تحقیق
برنامه ریزی هر تحقیق علوم اجتماعی مستلزم تعیین ساختار و نوع داده هایی است که جمع آوری می شود و نحوه تجزیه و تحلیل آنها. بدن انسان در حال رشد در

متغیر وابسته - متغیری در آزمایش که در نتیجه دستکاری متغیر مستقل تغییر می کند
آزمایشگاه مکانی ایده آل برای آزمایش فرضیه ها و اثبات وجود روابط علت و معلولی بین متغیرها است. در این شرایط بود که مطالعات زیادی انجام شد.

انتخاب یک طرح آزمایشی برای مطالعه تغییرات در طول زمان
همانطور که بیش از یک بار گفته شده است، توسعه یک فرآیند مستمر و پویا است که در طول زندگی ادامه می یابد. بنابراین تحقیقات ژنتیکی بر خلاف انواع دیگر تحقیقات بر روی و

روش طولی (طراحی) - سازماندهی مطالعه ای که در آن موضوعات مشابه در یک دوره معین مشاهده می شود.
ممکن است کودکان تا رسیدن به بزرگسالی تحت تعقیب قرار گیرند تا ببینند کدام ویژگی های شخصیتی باقی می مانند و کدام یک از بین می روند. پلان های طولی به ویژه برای متخصصان جذابیت دارد

طراحی همگروهی- ترتیبی
برنج. 1-4. طرح های تحقیقاتی اصلی: طولی، مقطعی

روش های جمع آوری داده ها
مطالعات علمی بسته به روش‌های اندازه‌گیری مورد استفاده و ترکیب افراد، نتایج بسیار متفاوتی تولید می‌کنند. افراد را می توان در زندگی واقعی مشاهده کرد یا می توان آنها را آزمایش کرد

تفسیر اطلاعات
پس از جمع‌آوری داده‌ها، زمان آن است که محقق آن را تفسیر کند و بررسی کند که آیا از فرضیه‌ای که قبلاً فرموله کرده بود پشتیبانی می‌کند یا خیر. ما همیشه یکسان تفسیر نمی کنیم

تعیین مرزهای پین
دور شدن از زمین محکم حقایق در تلاش برای دستیابی به نتایجی فراتر از آنچه واقعاً در فرآیند تحقیق کشف شده است بسیار آسان است. اگرچه این می تواند به روش های مختلف اتفاق بیفتد

علیت - رابطه بین دو متغیر که در آن تغییر در یکی منجر به تغییر در دیگری می شود
شاید کودکان پرخاشگر بیشتر تلویزیون تماشا می کنند زیرا صحنه های خشونت را دوست دارند؟ تعدادی از مطالعات نشان می دهد که رفتار پرخاشگرانه و علاقه به صحنه های خشونت دیده شده در تلویزیون

همبستگی - بیانی ریاضی از رابطه بین دو متغیر
هنگام مطالعه کودکان، ابتدا می توانید تعداد ساعاتی را که کودک صرف تماشای برنامه های تلویزیونی شامل صحنه های خشونت می کند، تعیین کنید و سپس میزان پرخاشگری رفتار او را بسنجید.

اخلاق تحقیق
ناگفته نماند که هنگام انجام تحقیقات بر روی انسان، دانشمندان باید از اصول اخلاقی هدایت شوند. آسیب رساندن عمدی به یک موضوع یا نقض حقوق اساسی بشر -

استانداردهای اخلاقی برای انجام تحقیقات روانشناختی
بسیاری از ما موافقیم که اگر می‌خواهیم تأثیری را که پدیده‌های بالقوه خطرناک محیطی بر مردم می‌گذارند درک و کنترل کنیم، باید به نحوی

اگرچه مطالعه توسعه انسانی نتایج چشمگیری به همراه دارد، اما گاهی اوقات نمی تواند به سؤالات اساسی اجتماعی پاسخ دهد. به عنوان مثال، آیا تلویزیون باعث ایجاد چنین چیزی می شود

اصطلاحات و مفاهیم اولیه
متغیر وابسته آمادگی اعتباری گروه‌های ترتیبی/سنی

اهداف فصل
پس از اتمام مطالعه این فصل، باید بتوانید با وظایف زیر کنار بیایید: 1. ماهیت سه موضوع بحث برانگیز که در نظریه های رشد کودک مطرح می شود را توضیح دهید. 2. درباره

اهمیت نظریه ها
حجم زیادی از داده ها که پرداختن به آنها دشوار است با کمک تئوری ها مرتب می شوند. دانشمندان علوم اجتماعی از نظریه ها برای طرح سؤالات مهم استفاده می کنند

طبیعت یا تربیت
طبیعت یا پرورش، فرمول کوتاهی از این سوال است که کدام عوامل - مربوط به وراثت یا مربوط به محیط - نقش تعیین کننده ای در توسعه دارند. دادن n

تداوم یا ناپیوستگی
سوال اساسی دیگر برای محققان توسعه این است که چگونه این فرآیند - به طور مداوم یا اسپاسمیک - رخ می دهد. آیا توسعه به گونه ای رخ می دهد که مختلف

ارگانیسم یا مکانیسم
سؤال آخر - این که آیا انسان ذاتاً یک ارگانیسم است یا یک مکانیسم - مانند دو سؤال قبل، منشأ فلسفی دارد. طرفداران رویکرد ارگانیسمی معتقدند که افراد فعال هستند،

نظریه های یادگیری
بر اساس نظریه های یادگیری، کلید درک ماهیت انسان نحوه شکل گیری آن توسط محیط است، یعنی بیشتر رفتارها از طریق یادگیری به دست می آیند. یادگیری است

رفتارگرایی
در آغاز قرن بیستم، روانشناسان آمریکایی شروع به ایجاد "علم رفتار انسانی" کردند. آنها به افکار، رویاها یا احساسات انسانی علاقه ای نداشتند. یا بهتر است بگوییم، آنها می خواستند "حقایق" را جمع آوری کنند، قابل مشاهده

تعمیم محرک انتقال یک واکنش از یک محرک خاص به محرک های مشابه دیگر
به راحتی می توان دید که چگونه تعمیم محرک در زندگی روزمره کودکان رخ می دهد. کودکان ممکن است از کت سفید دکتر یا بوی دارو بترسند زیرا آنها را با آنها مرتبط می دانند

به یک محرک خاص (یا مجموعه ای از محرک ها) به دلیل ترکیب مکرر این محرک با تقویت مثبت
چگونه می توان از شرطی سازی عامل برای آموزش اقدامات پیچیده استفاده کرد؟ اغلب شکل نهایی رفتار باید گام به گام ساخته شود یا شکل بگیرد. با چنین شکل گیری گام به گام

تشکیل پاسخ تقویت سیستماتیک رویکردهای ناسازگار به یک اقدام مطلوب
ماشین های یادگیری مورد استفاده اسکینر نیز بر اساس اصول شرطی سازی عامل بود (اسکینر، 1968). با کمک این ماشین ها، آموزش در مراحل کوچک متوالی، از

نظریه یادگیری اجتماعی
روانشناسانی که نظریه یادگیری اجتماعی را ایجاد کردند، دامنه نظریه یادگیری را برای توضیح رفتار اجتماعی پیچیده گسترش دادند. آنها برای این کار بسیار فراتر از ظواهر پیش رفتند

پیامدهای یک واکنش - نتایج اقدامات مشاهده شده توسط فرد و استفاده از او برای تقسیم رفتار خود
برخلاف نظریه یادگیری مکانیکی تر، نظریه یادگیری اجتماعی به تفکر آگاهانه نقش بیشتری در هدایت رفتار می دهد. تقلید و

ارزیابی نظریه های یادگیری
نظریه های یادگیری، از جمله رفتارگرایی، تحلیل رفتار مدرن، و نظریه یادگیری اجتماعی، سهم عمده ای در درک ما از رشد انسانی داشته اند. محور اصلی این نظریه ها است

1. شرطی سازی کلاسیک و عامل را مقایسه کنید. هنگام فرمول بندی پاسخ خود حتما از اصطلاحات اساسی استفاده کنید. 2. توضیح دهید که چگونه سازندگان نظریه یادگیری اجتماعی گسترش یافتند

نظریه های شناختی
برخلاف نظریه‌های یادگیری اولیه، که در آن افراد ماشین‌های غیرفعالی در نظر گرفته می‌شوند که تحت تأثیر محیط بیرونی عمل می‌کنند، نظریه‌های شناختی افراد را منطقی، فعال و آگاه معرفی می‌کنند.

درک حفاظت از نظر پیاژه، دستاورد شناختی اصلی در مرحله عملیات ملموس
اکنون کودک قادر است تغییرات در مقدار یک ماده را بر اساس تفکر منطقی و نه فقط بر اساس داده های ادراکی قضاوت کند. بنابراین، او معتقد است که مقدار آب ثابت خواهد ماند، بله

انطباق اصطلاح پیاژه برای تغییر فرآیندهای فکری ما زمانی است که یک شی یا ایده جدید در مفاهیم ما نمی گنجد.
پیاژه یک مدل بیولوژیکی برای توصیف فرآیند سازگاری مردم با جهان ارائه کرد. هنگامی که یک حیوان غذا می خورد، دو فرآیند به طور همزمان اتفاق می افتد. سازگاری رخ می دهد (مطابق

متعادل کردن
اصطلاح پیاژه برای فرآیند اساسی سازگاری انسان. در تعادل، افراد برای دستیابی به تعادل یا مطابقت بین محیط خارجی و محیط خود تلاش می کنند

مرحله قبل از عمل
طبق گفته پیاژه، مرحله دوم رشد شناختی (از 2 تا 7 سال). از زمانی شروع می شود که کودکان توانایی استفاده از نمادها مانند زبان را به دست می آورند. موششون

مرحله عملیات خاص
طبق گفته پیاژه، دوره سوم رشد شناختی (از 7 تا 11 سال). کودکان شروع به تفکر منطقی می کنند. در این مرحله آنها می توانند اشیاء را با در نظر گرفتن سلسله مراتب کلاس طبقه بندی کنند. فصل

رویکرد اطلاعاتی به توسعه
پیاژه توسط بسیاری از روانشناسان از جمله حامیان رویکرد اطلاعاتی مورد انتقاد قرار گرفته است. آنها مانند پیاژه روانشناسان شناختی هستند زیرا تفکر و هوش را مطالعه می کنند.

رشد شناختی در بافت اجتماعی
طبق نظریه پیاژه، کودک یک «دانشمند فعال» است که با محیط فیزیکی تعامل دارد و راهبردهای فکری پیچیده‌تری را توسعه می‌دهد. به نظر می رسد که این

ارزیابی نظریه های شناختی
روانشناسان شناختی نظریه های یادگیری را نقد می کنند. آنها معتقدند که تاکید بر تکرار و تقویت مثبت رویکردی بسیار ساده برای توضیح بسیاری از جنبه ها است.

سنت روانکاوی
نظریه‌های زیگموند فروید، نئوفرویدیان و نمایندگان روان‌شناسی ایگو چیزی را شکل می‌دهند که ما سنت روانکاوی می‌نامیم. نیروی محرکه این روند کار زیگموند فروید است.

شناسایی
پذیرش رفتار و ویژگی های فردی که فرد به آن احترام می گذارد و دوست دارد از آن الگوبرداری کند. با بلوغ بیولوژیکی کودک، منیت او نیز رشد می کند.

اریکسون
اریک اریکسون (1904-1994) متعلق به نسل سوم فرویدیان است. نظریه رشد شخصیت او شباهت زیادی با نظریه فروید دارد، اما چندین تفاوت مهم بین آنها وجود دارد.

مراحل رشد روانی اجتماعی
در نظریه اریکسون، مراحل رشد که در طی آن تجربه زندگی به دست آمده توسط فرد، مهمترین سازگاری با محیط اجتماعی و تغییرات اساسی در شخصیت را از پیش تعیین می کند.

ارزیابی سنت روانکاوی
اگرچه بسیاری روانکاوی سنتی را موضوعی تاریخی می‌دانند، اما همچنان کمک قابل توجهی به مطالعه رفتار انسان می‌کند. قدرت او در ثروت اوست

تکرار و کاربرد مطالب آموخته شده
1. مفروضات فروید در مورد رشد شخصیت و نظریه رشد روانی-جنسی او را شرح دهید. 2. نظریه رشد شخصیت اریکسون چه تفاوتی با نظریه فروید دارد؟ 3. پره

روانشناسی انسان گرا
روانشناسی انسان گرا در اواسط قرن بیستم به عنوان نیروی سوم خوش بینانه تر در مطالعه شخصیت ظاهر شد (مزلو، 1968). این واکنشی بود در برابر جبر بیرونی،

خودشکوفایی تحقق کامل پتانسیل فرد تنها پس از ارضای سطوح "پایین" فرد است.
به عنوان مثال، یک کودک گرسنه تا زمانی که به او غذا داده نشود، نمی تواند در مدرسه روی مطالعه یا نقاشی تمرکز کند. مزلو نیازهای انسان را به شکل یک هرم ساخت و نشان داد

نگرش مثبت
این نگرش "گرم، مثبت، پذیرنده" درمانگر نسبت به مشتری است که راجرز دریافته است که در ارتقای رشد شخصی مؤثرتر است. قدردانی از انسانیت

اخلاق شناسی
اخلاق شناسی شاخه ای از زیست شناسی است که به مطالعه الگوهای رفتار حیوانات می پردازد. این او بود که علاقه به خواص بیولوژیکی مشترک انسان ها و حیوانات را زنده کرد. اخلاق شناسان بر اهمیت تحقیق تاکید دارند

تکرار و کاربرد مطالب آموخته شده
1. روان‌شناسی انسان‌گرا و نظریه‌های مرتبط با «خود» با نظریه‌هایی که قبلاً بحث شد، تفاوت دارند؟ 2. ماهیت سلسله مراتب نیازهای مزلو را توضیح دهید. 3. چیست؟

کاربرد مطالب مورد مطالعه
شما به تازگی با یک انتشارات بزرگ قرارداد امضا کرده اید تا زندگی نامه خود را بنویسید. با شناخت دامنه کار، تصمیم می گیرید با شناسایی موضوعات و رویدادهای اصلی شروع کنید

اصطلاحات و مفاهیم اولیه
انطباق مرحله مقعدی جذب رفتارگرایان محرک تعمیم مرحله تناسلی

سیاره ما - یک عکس فوری
میزان مرگ و میر برای کودکان زیر 5 سال شکل. 1. میانگین امید به زندگی در بدو تولد، 1993 ژاپن، آلمان، ایالات متحده آمریکا |

اهداف فصل
پس از اتمام این فصل، باید بتوانید وظایف زیر را انجام دهید: 1. اصول و فرآیندهای تولید مثل ژنتیکی را توضیح دهید. 2. علل و ویژگی ها را شرح دهید

قبل از اینکه تکنیک‌های تشخیصی روان‌شناختی برای اهداف عملی مورد استفاده قرار گیرند، باید آن‌ها را در برابر تعدادی از معیارهای رسمی که کیفیت و اثربخشی بالای آن‌ها را ثابت می‌کند، آزمایش کرد. این الزامات در تشخیص روانی در طول سال ها در فرآیند کار بر روی آزمایش ها و بهبود آنها تکامل یافته است. در نتیجه، محافظت از روانشناسی در برابر انواع جعلیات بی سواد که وانمود می کنند تکنیک های تشخیصی نامیده می شوند، ممکن شد.

معیارهای اصلی برای ارزیابی تکنیک های تشخیص روانشناختی شامل پایایی و روایی است. روانشناسان خارجی سهم زیادی در توسعه این مفاهیم داشتند (A. Anastasi، E. Ghiselli، J. Guilford، L. Cronbach، R. Thorndike و E. Hagen و غیره). آنها هر دو دستگاه رسمی منطقی و آماری ریاضی (عمدتاً روش همبستگی و تحلیل واقعی) را برای اثبات درجه انطباق روش ها با معیارهای ذکر شده توسعه دادند.

در تشخیص روانی، مشکلات پایایی و اعتبار روش‌ها ارتباط تنگاتنگی با یکدیگر دارند، اما سنت ارائه جداگانه این مهم‌ترین ویژگی‌ها وجود دارد. به دنبال آن، با در نظر گرفتن قابلیت اطمینان روش ها شروع می کنیم.

قابلیت اطمینان

در آزمایش سنتی، اصطلاح «قابلیت اطمینان» به معنای ثبات، پایداری و ثبات نسبی نتایج آزمایش در طول استفاده اولیه و مکرر بر روی موضوعات مشابه است. همانطور که A. Anastasi (1982) می نویسد، اگر در ابتدای هفته کودک شاخصی برابر با BUT داشته باشد و در پایان هفته 80 باشد، به سختی می توان به یک آزمون هوش اعتماد کرد. برآوردها در این صورت ممکن است تا حدی هم خود نتایج و هم جایگاه ترتیبی (رتبه ای) که آزمودنی در گروه اشغال می کند مطابقت داشته باشد. در هر دو مورد، هنگام تکرار آزمایش، برخی اختلافات ممکن است، اما مهم است که آنها در یک گروه ناچیز باشند. بنابراین، می‌توان گفت که قابلیت اطمینان یک تکنیک معیاری است که نشان‌دهنده دقت اندازه‌گیری‌های روان‌شناختی است، یعنی. به ما این امکان را می دهد تا در مورد اعتبار نتایج قضاوت کنیم.

میزان اطمینان روش ها به دلایل زیادی بستگی دارد. بنابراین، یک مشکل مهم در تشخیص عملی، شناسایی عوامل منفی موثر بر دقت اندازه گیری است. بسیاری از نویسندگان سعی کرده اند چنین عواملی را طبقه بندی کنند. از جمله مواردی که بیشتر به آنها اشاره می شود موارد زیر است:

1) بی ثباتی اموال مورد تشخیص؛

نقص تکنیک های تشخیصی (دستورالعمل ها با بی دقتی تهیه می شوند ، وظایف ماهیت ناهمگن هستند ، دستورالعمل های ارائه تکنیک به افراد به وضوح تنظیم نشده است و غیره).

تغییر وضعیت معاینه (زمان های مختلف روز هنگام انجام آزمایش ها، نور اتاق های مختلف، وجود یا عدم وجود سر و صدای اضافی و غیره)؛

تفاوت در رفتار آزمایشگر (از آزمایشی به آزمایش دیگر دستورالعمل ها را متفاوت ارائه می دهد ، انجام وظایف را به طور متفاوت تحریک می کند و غیره).

نوسانات در وضعیت عملکردی موضوع (در یک آزمایش سلامت خوبی وجود دارد، در دیگری - خستگی و غیره).

عناصر ذهنی در روش های ارزیابی و تفسیر نتایج (زمانی که پاسخ های آزمودنی ها ثبت می شود، پاسخ ها با توجه به درجه کامل بودن، اصالت و غیره ارزیابی می شوند).

اگر همه این عوامل را در نظر داشته باشید و سعی کنید شرایطی را که در هر یک از آنها باعث کاهش دقت اندازه گیری می شود حذف کنید، می توانید به سطح قابل قبولی از قابلیت اطمینان تست دست پیدا کنید. یکی از مهمترین ابزارهای افزایش قابلیت اطمینان یک تکنیک تشخیص روانشناسی یکسان بودن روش معاینه، مقررات دقیق آن است: محیط و شرایط کاری یکسان برای نمونه مورد بررسی، همان نوع دستورالعمل ها، محدودیت های زمانی یکسان برای همه، روش ها و ویژگی های تماس با افراد، ترتیب ارائه وظایف و غیره د. با چنین استانداردسازی روش تحقیق، می توان تأثیر عوامل تصادفی خارجی را به میزان قابل توجهی بر نتایج آزمون کاهش داد و در نتیجه قابلیت اطمینان آنها را افزایش داد.

ویژگی های قابلیت اطمینان روش ها تا حد زیادی تحت تأثیر نمونه مورد مطالعه است. می تواند این شاخص را کاهش یا افزایش دهد؛ به عنوان مثال، در صورت وجود پراکندگی اندکی از نتایج در نمونه، قابلیت اطمینان را می توان به طور مصنوعی افزایش داد. اگر نتایج از نظر ارزش به یکدیگر نزدیک باشند. در این صورت، در طول معاینه مجدد، نتایج جدید نیز در یک گروه نزدیک قرار می گیرد. تغییرات احتمالی در رتبه‌بندی آزمودنی‌ها ناچیز خواهد بود و بنابراین، قابلیت اطمینان تکنیک بالا خواهد بود. همین تخمین غیرقابل توجیه پایایی می تواند هنگام تجزیه و تحلیل نتایج یک نمونه متشکل از گروهی با نمرات بسیار بالا و گروهی با نمرات آزمون بسیار پایین رخ دهد. سپس این نتایج به طور گسترده از هم جدا نخواهند شد، حتی اگر عوامل تصادفی با شرایط تجربی تداخل داشته باشند. بنابراین، کتابچه راهنمای معمولاً نمونه‌ای را توصیف می‌کند که پایایی تکنیک بر روی آن تعیین شده است.

در حال حاضر، قابلیت اطمینان به طور فزاینده ای بر روی همگن ترین نمونه ها تعیین می شود، به عنوان مثال. بر روی نمونه های مشابه از نظر جنسیت، سن، سطح تحصیلات، آموزش حرفه ای و غیره. برای هر نمونه، ضرایب پایایی خاص خود آورده شده است. شاخص قابلیت اطمینان ارائه شده فقط برای گروه هایی مشابه با گروه هایی که بر اساس آن تعیین شده است قابل استفاده است. اگر تکنیکی برای نمونه ای متفاوت از نمونه ای که پایایی آن آزمایش شده است اعمال شود، این روش باید تکرار شود.

بسیاری، و همچنین شرایط مؤثر بر نتایج آزمایش‌های تشخیصی (V Cherny، 1983) با این حال، تنها چند نوع از قابلیت اطمینان کاربرد عملی پیدا می‌کنند.

از آنجایی که همه انواع قابلیت اطمینان منعکس کننده درجه سازگاری دو سری از شاخص های به دست آمده مستقل هستند، تکنیک ریاضی و آماری که پایایی روش به وسیله آن ایجاد می شود، همبستگی است (طبق نظر پیرسون یا اسپیرمن، به فصل چهاردهم مراجعه کنید). هر چه ضریب همبستگی حاصل به وحدت بیشتر نزدیک شود، قابلیت اطمینان بالاتر است و بالعکس.

در این راهنما، هنگام تشریح انواع پایایی، تأکید اصلی بر آثار K.M. Gurevich (1969، 1975، 1977، 1979) است که پس از تجزیه و تحلیل کامل ادبیات خارجی در مورد این موضوع، پیشنهاد کرد که پایایی به این صورت تفسیر شود. :

قابلیت اطمینان خود ابزار اندازه گیری،

ثبات صفت مورد مطالعه؛

3) ثبات، یعنی. استقلال نسبی نتایج از شخصیت آزمایشگر

شاخصی که ابزار اندازه گیری را مشخص می کند، ضریب قابلیت اطمینان نامیده می شود، شاخصی که ثبات ویژگی اندازه گیری شده را مشخص می کند ضریب پایداری است. و شاخص برای ارزیابی تأثیر شخصیت آزمایشگر ضریب ثبات است.

به این ترتیب است که توصیه می شود روش شناسی را بررسی کنید: توصیه می شود ابتدا ابزار اندازه گیری را بررسی کنید. اگر داده‌های به‌دست‌آمده رضایت‌بخش باشند، می‌توانیم اقدام به ایجاد معیاری از پایداری اموال در حال اندازه‌گیری کنیم و پس از آن، در صورت لزوم، معیار ثبات را در نظر بگیریم.

اجازه دهید نگاهی دقیق‌تر به این شاخص‌ها بیندازیم، که قابلیت اطمینان تکنیک روان‌شناسی را از زوایای مختلف مشخص می‌کند.

1. تعیین قابلیت اطمینان ابزار اندازه گیری.دقت و عینیت هر اندازه گیری روانشناختی بستگی به نحوه تدوین روش، نحوه صحیح انتخاب وظایف از نقطه نظر سازگاری متقابل آنها و میزان همگن بودن آن دارد. همگنی درونی روش نشان می دهد که وظایف آن همان ویژگی، علامت را به فعلیت می رساند.

برای بررسی قابلیت اطمینان یک ابزار اندازه گیری، که نشان دهنده همگنی (یا همگنی) آن است، از روش به اصطلاح "شکاف" استفاده می شود. به طور معمول، وظایف به زوج و فرد تقسیم می شوند، به طور جداگانه پردازش می شوند و سپس نتایج دو سری به دست آمده با یکدیگر مرتبط می شوند. برای استفاده از این روش، باید سوژه ها را در شرایطی قرار داد که بتوانند برای حل (یا تلاش برای حل) تمام کارها وقت داشته باشند. اگر تکنیک همگن باشد، در این صورت تفاوت زیادی در موفقیت راه حل برای چنین نیمه هایی وجود نخواهد داشت و بنابراین، ضریب همبستگی بسیار بالا خواهد بود.

می توانید کارها را به روش دیگری تقسیم کنید، به عنوان مثال، نیمه اول آزمون را با فصل دوم، سه ماهه اول و سوم با چهارم و چهارم و غیره مقایسه کنید، اما به نظر می رسد "تقسیم" به کارهای زوج و فرد از همه بیشتر باشد. مناسب است، زیرا این روش است که بیشتر از تأثیر عواملی مانند کارایی، تمرین، خستگی و غیره مستقل است.

روش زمانی قابل اعتماد در نظر گرفته می شود که ضریب به دست آمده کمتر از آن نباشد0.75-0.85. بهترین آزمون های پایایی ضرایبی از مرتبه 0.90 یا بیشتر را ارائه می دهند.

اما در مرحله اولیه توسعه یک تکنیک تشخیصی، ضرایب قابلیت اطمینان پایین را می توان به عنوان مثال در مرتبه 0.46-0.50 به دست آورد. این بدان معنی است که روش توسعه یافته شامل تعداد معینی از وظایف است که به دلیل ویژگی آنها منجر به کاهش ضریب همبستگی می شود. چنین وظایفی باید به طور ویژه تجزیه و تحلیل شوند و یا بازسازی شوند یا به طور کلی حذف شوند.

برای سهولت در تعیین اینکه به دلیل کدام وظایف ضرایب همبستگی کاهش می یابد، لازم است جداول را با داده های نوشتاری تهیه شده برای همبستگی تجزیه و تحلیل کنیم. لازم به ذکر است که هرگونه تغییر در محتوای روش - حذف وظایف، تنظیم مجدد آنها، فرمول مجدد سؤالات یا پاسخ ها مستلزم محاسبه مجدد ضرایب قابلیت اطمینان است.

هنگام آشنایی با ضرایب قابلیت اطمینان، نباید فراموش کرد که آنها نه تنها به انتخاب صحیح وظایف از نظر سازگاری متقابل، بلکه به همگنی اجتماعی و روانشناختی نمونه ای که پایایی ابزار اندازه گیری بر روی آن آزمایش شده است بستگی دارد. .

در واقع، تکالیف ممکن است حاوی مفاهیمی باشد که برای بخشی از آزمودنی ها کمتر شناخته شده، اما برای بخشی دیگر به خوبی شناخته شده است. ضریب پایایی بستگی به این دارد که چه تعداد از این مفاهیم در روش وجود دارد؛ وظایف با چنین مفاهیمی را می توان به طور تصادفی در هر دو نیمه زوج و فرد آزمون قرار داد. بدیهی است که شاخص قابلیت اطمینان نباید تنها به این تکنیک نسبت داده شود و بدون توجه به اینکه چه نمونه ای آزمایش می شود نمی توان به آن اعتماد کرد که بدون تغییر باقی بماند.

2. تعیین پایداری صفت مورد مطالعه.تعیین قابلیت اطمینان خود تکنیک به معنای حل تمام مسائل مربوط به کاربرد آن نیست. همچنین لازم است مشخص شود که صفتی که محقق قصد اندازه گیری آن را دارد تا چه اندازه پایدار است. این یک اشتباه روش شناختی است که روی ثبات مطلق ویژگی های روانی حساب کنیم. در این واقعیت که یک ویژگی اندازه گیری شده در طول زمان تغییر می کند، هیچ چیز خطرناکی برای قابلیت اطمینان وجود ندارد. نکته کلی این است که نتایج تا چه اندازه از آزمایشی به آزمایش دیگر برای یک موضوع متفاوت است، چه این نوسانات منجر به این واقعیت شود که آزمودنی به دلایل نامعلومی خود را در ابتدا، سپس در وسط یا در انتهای نمونه نتیجه گیری خاصی در مورد سطح صفت اندازه گیری ارائه شده در چنین موضوعی غیرممکن است. بنابراین، نوسانات در مشخصه نباید غیرقابل پیش بینی باشد. اگر دلایل نوسانات شدید مشخص نباشد، نمی توان از چنین علامتی برای اهداف تشخیصی استفاده کرد.

برای بررسی پایداری علامت یا ویژگی تشخیص داده شده، از تکنیکی به نام تست مجدد استفاده می شود. این شامل بررسی مجدد موضوعات با استفاده از همان تکنیک است. ثبات یک علامت با ضریب همبستگی بین نتایج اولین و مکرر معاینه قضاوت می شود. نشان می دهد که آیا هر آزمودنی شماره ترتیبی خود را در نمونه حفظ می کند یا خیر.

درجه مقاومت و پایداری خاصیت تشخیص داده شده تحت تأثیر عوامل مختلفی است. تعداد آنها بسیار زیاد است. قبلاً در بالا گفته شد که رعایت الزامات یکنواختی رویه آزمایشی چقدر مهم است. بنابراین، به عنوان مثال، اگر اولین آزمایش در صبح انجام شود، سپس آزمایش دوم

باید در صبح انجام شود، اگر آزمایش اول با نمایش اولیه وظایف همراه بود، در طول آزمایش دوم نیز باید این شرط و غیره رعایت شود.

هنگام تعیین پایداری یک علامت، فاصله زمانی بین معاینه اول و مکرر از اهمیت بالایی برخوردار است. هرچه دوره از آزمایش اول تا دوم کوتاه تر باشد، احتمال (مساوی بودن سایر موارد) بیشتر است که علامت تشخیص داده شده سطح آزمایش اول را حفظ کند. با افزایش فاصله زمانی، ثبات صفت تمایل به کاهش دارد، زیرا تعداد عوامل خارجی مؤثر بر آن افزایش می یابد. در نتیجه، نتیجه گیری خود نشان می دهد که توصیه می شود آزمایش های مکرر در مدت کوتاهی پس از آزمایش اول انجام شود. با این حال، در اینجا مشکلاتی وجود دارد: اگر دوره بین آزمایش اول و دوم کوتاه باشد، برخی از آزمودنی ها می توانند پاسخ های قبلی خود را در حافظه بازتولید کنند و بنابراین، از معنای تکمیل تکالیف منحرف شوند. در این صورت، نتایج دو ارائه تکنیک را دیگر نمی توان مستقل در نظر گرفت.

پاسخ دادن به این سوال که چه دوره ای را می توان برای آزمایش مکرر بهینه در نظر گرفت دشوار است. فقط یک محقق، بر اساس جوهر روانشناختی تکنیک، شرایطی که در آن انجام می شود و ویژگی های نمونه آزمودنی ها، می تواند این دوره را تعیین کند. علاوه بر این، چنین انتخابی باید توجیه علمی داشته باشد. در ادبیات تست شناسی، بیشتر به فواصل زمانی چند ماهه (اما نه بیشتر از شش ماه) اشاره می شود. هنگام معاینه کودکان خردسال، زمانی که تغییرات و رشد مرتبط با سن بسیار سریع اتفاق می افتد، این فواصل می تواند در حد چند هفته باشد. (A Anastasi, 1982).

لازم به یادآوری است که ضریب پایداری را نباید تنها از جنبه صوری باریک آن بر حسب مقادیر مطلق آن در نظر گرفت. اگر آزمون خاصیتی را بررسی کند که در طول دوره آزمایش در فرآیند توسعه فشرده است (به عنوان مثال، توانایی تعمیم دادن)، ممکن است ضریب پایداری پایین باشد، اما این نباید به عنوان یک اشکال تفسیر شود. چنین ضریب پایداری باید به عنوان شاخصی از تغییرات خاص، توسعه خواص مورد مطالعه تفسیر شود. در این مورد، برای مثال، KM Gurevich (1975) توصیه می کند که نمونه ای را که ضریب پایداری بر روی آن تعیین شده است، در قسمت هایی در نظر بگیرید. با چنین بررسی، بخشی از موضوعاتی که مسیر توسعه را با سرعت یکسانی طی می‌کنند، مشخص می‌شوند، بخشی دیگر - جایی که توسعه با سرعتی خاص پیش رفته است. و بخشی از نمونه که در آن پیشرفت سوژه ها تقریباً به طور کامل نامرئی است. هر بخش از نمونه مستحق تحلیل و تفسیر خاصی است. بنابراین، تنها بیان اینکه ضریب پایداری پایین است کافی نیست، بلکه باید بفهمید که به چه چیزی بستگی دارد.

اگر نویسنده تکنیک معتقد باشد که خاصیت اندازه گیری شده قبلاً شکل گرفته است و باید به اندازه کافی پایدار باشد، یک الزام کاملاً متفاوت بر روی ضریب پایداری قرار می گیرد. ضریب پایداری در این مورد باید کاملاً بالا باشد (نه کمتر از 0.80).

بنابراین، مسئله پایداری ویژگی اندازه گیری شده همیشه به طور واضح حل نمی شود. تصمیم به ماهیت اموالی که تشخیص داده می شود بستگی دارد.

3. تعریف ثبات،یعنی استقلال نسبی نتایج از شخصیت آزمایشگر. از آنجایی که این تکنیک برای تشخیص توسعه یافته است

اهداف، قرار نیست برای همیشه در دست سازندگان آن باقی بماند، بسیار مهم است که بدانیم نتایج آن تا چه اندازه تحت تأثیر شخصیت آزمایشگر است. اگرچه یک تکنیک تشخیصی همیشه همراه با دستورالعمل‌های دقیق برای استفاده از آن، قوانین و مثال‌هایی که نحوه انجام آزمایش را نشان می‌دهد، ارائه می‌شود، تنظیم رفتار آزمایش‌کننده، سرعت گفتار، لحن صدا، مکث‌ها و حالت چهره بسیار دشوار است. نگرش آزمودنی نسبت به تجربه همیشه منعکس کننده نحوه ارتباط خود آزمایشگر با این تجربه خواهد بود (اجازه سهل انگاری می کند یا دقیقاً مطابق با الزامات رویه عمل می کند، خواستار، مداوم یا کنترل نشده است و غیره).

شخصیت آزمایشگر در هنگام انجام تکنیک های به اصطلاح غیر قطعی (مثلاً در آزمون های تصویری) نقش مهمی ایفا می کند.

اگرچه در عمل آزمایش شناسی معیار ثبات به ندرت مورد استفاده قرار می گیرد، با این حال، به گفته KM Gurevich (1969)، این نمی تواند مبنایی برای دست کم گرفتن آن باشد. اگر نویسندگان روش در مورد تأثیر احتمالی شخصیت آزمایشگر بر نتیجه روش تشخیصی مشکوک هستند، توصیه می شود روش را با توجه به این معیار بررسی کنید. توجه به نکته زیر ضروری است. اگر تحت تأثیر یک آزمایشگر جدید، همه موضوعات به طور یکسان شروع به کار کمی بهتر یا کمی بدتر کردند، این واقعیت به خودی خود (اگرچه شایسته توجه است) بر قابلیت اطمینان این تکنیک تأثیری نخواهد گذاشت. قابلیت اطمینان تنها زمانی تغییر می‌کند که تأثیر آزمایش‌کننده بر آزمودنی‌ها متفاوت باشد: برخی بهتر شروع به کار کردند، برخی بدتر و برخی دیگر مانند آزمایش‌کننده اول. به عبارت دیگر، اگر آزمودنی ها، تحت آزمایشگر جدید، مکان های ترتیبی خود را در نمونه تغییر دهند.

ضریب ثبات با همبستگی نتایج دو آزمایش انجام شده در شرایط نسبتاً یکسان روی یک نمونه از افراد، اما توسط آزمایش‌کنندگان متفاوت تعیین می‌شود. ضریب همبستگی نباید کمتر از 0.80 باشد.

بنابراین، سه شاخص پایایی تکنیک‌های تشخیصی روان‌شناختی در نظر گرفته شد. ممکن است این سوال پیش بیاید: آیا هنگام ایجاد روش های تشخیص روانی، آزمایش هر یک از آنها ضروری است؟ در ادبیات خارجی در این باره بحث وجود دارد. برخی از محققان بر این باورند که تمام روش‌های تعیین پایایی یک آزمون تا حدی یکسان هستند و بنابراین کافی است پایایی تکنیک را با یکی از آنها بررسی کنیم. به عنوان مثال، نویسنده کتابی در مورد آمار برای روانشناسان و معلمان، که بارها در ایالات متحده بازنشر شده است، G. Garrett (1962)، هیچ تفاوت اساسی بین روش های تست قابلیت اطمینان پیدا نمی کند. به نظر او همه این روش ها تکرارپذیری شاخص های آزمون را نشان می دهد. گاهی یکی، گاهی دیگری معیار بهتری ارائه می دهد. سایر محققان دیدگاه متفاوتی دارند. بنابراین، نویسندگان «الزامات استاندارد برای آزمون‌های آموزشی و روان‌شناختی» (1974) در فصل «پایایی» خاطرنشان می‌کنند که ضریب پایایی به معنای امروزی مفهومی کلی است که شامل چندین نوع است و هر نوع معنای خاص خود را دارد. این دیدگاه توسط K.M. گورویچ (1975). به نظر او، وقتی از روش‌های مختلف تعیین پایایی صحبت می‌کنند، با معیار بهتر یا بدتر سروکار ندارند، بلکه با معیارهایی با پایایی اساساً متفاوت سروکار دارند. در واقع، اگر مشخص نباشد که آیا به خودی خود به عنوان یک ابزار اندازه گیری قابل اعتماد است یا اینکه پایداری ویژگی مورد اندازه گیری ثابت نشده است، چه ارزشی دارد؟ هزینه یک تکنیک تشخیصی چقدر است اگر

مشخص نیست که آیا نتایج ممکن است بسته به اینکه چه کسی آزمایش را انجام می دهد تغییر کند؟ هر شاخص منفرد به هیچ وجه نمی‌تواند جایگزین روش‌های تأیید دیگر شود و بنابراین نمی‌تواند به عنوان یک مشخصه قابلیت اطمینان لازم و کافی در نظر گرفته شود. تنها تکنیکی که دارای ویژگی قابلیت اطمینان کامل باشد برای استفاده تشخیصی و عملی مناسب‌تر است.

اعتبار

بعد از پایایی، یکی دیگر از معیارهای کلیدی برای ارزیابی کیفیت روش ها، روایی است. مسئله اعتبار روش ها تنها پس از اثبات پایایی کافی آن حل می شود، زیرا روش غیرقابل اعتماد بدون اطلاع از اعتبار آن عملاً بی فایده است.

لازم به ذکر است که مسئله اعتبار تا همین اواخر یکی از دشوارترین ها به نظر می رسید. تثبیت‌شده‌ترین تعریف از این مفهوم، تعریفی است که در کتاب A. Anastasi ارائه شده است: «روایی آزمون مفهومی است که به ما می‌گوید آزمون چه چیزی را اندازه‌گیری می‌کند و چقدر آن را به خوبی انجام می‌دهد» (1982، ص 126). اعتبار در هسته خود یک ویژگی پیچیده است که از یک سو شامل اطلاعاتی در مورد اینکه آیا تکنیک برای اندازه گیری آنچه برای آن ایجاد شده است مناسب است یا خیر و از سوی دیگر، اثربخشی و کارایی آن چیست. به همین دلیل، هیچ رویکرد جهانی واحدی برای تعیین اعتبار وجود ندارد. بسته به اینکه محقق بخواهد کدام جنبه از اعتبار را در نظر بگیرد، از روش های شواهد مختلفی استفاده می شود. به عبارت دیگر، مفهوم اعتبار شامل انواع مختلف آن است که معنای خاص خود را دارد. بررسی اعتبار یک روش، اعتبار سنجی نامیده می شود.

روایی در درک اول مربوط به خود روش شناسی است، یعنی اعتبار ابزار اندازه گیری است. به این نوع آزمایش، اعتبار سنجی نظری می گویند. اعتبار در فهم دوم نه چندان به روش شناسی که به هدف استفاده از آن اشاره دارد. این اعتبار سنجی عملی است.

بنابراین، در طول اعتبار سنجی نظری، محقق به خود ویژگی اندازه گیری شده توسط تکنیک علاقه مند است. این اساساً به این معنی است که خود اعتبار سنجی روانشناختی در حال انجام است. با اعتبار سنجی عملی، ماهیت موضوع اندازه گیری (ویژگی روانی) از دید خارج می شود. تأکید اصلی بر اثبات این است که «چیزی» که با این تکنیک اندازه‌گیری می‌شود، با حوزه‌های خاصی از تمرین ارتباط دارد.

انجام اعتبار سنجی نظری، بر خلاف اعتبار سنجی عملی، گاهی اوقات بسیار دشوارتر می شود. در حال حاضر بدون پرداختن به جزئیات خاص، اجازه دهید به طور کلی در مورد چگونگی بررسی اعتبار عملگرایانه صحبت کنیم: برخی از معیارهای خارجی، مستقل از روش شناسی، انتخاب شده است که موفقیت در یک فعالیت خاص (آموزشی، حرفه ای و غیره) را تعیین می کند. نتایج حاصل از روش تشخیصی مقایسه می شود. اگر ارتباط بین آنها رضایت بخش در نظر گرفته شود، در مورد اثربخشی و کارایی عملی تکنیک تشخیصی نتیجه گیری می شود.

برای تعیین اعتبار نظرییافتن معیار مستقلی که خارج از روش شناسی باشد بسیار دشوارتر است. بنابراین، در مراحل اولیه توسعه تست شناسی، زمانی که مفهوم اعتبار به تازگی در حال شکل گیری بود، یک ایده شهودی وجود داشت که آزمون اندازه گیری می کند:

1) روش به عنوان معتبر شناخته شد، زیرا آنچه که اندازه گیری می کند به سادگی "بدیهی" است.

اثبات اعتبار مبتنی بر اطمینان محقق بود که روش او به او اجازه می‌دهد «موضوع را بفهمد».

این تکنیک معتبر در نظر گرفته شد (یعنی این جمله پذیرفته شد که فلان آزمون فلان کیفیت را می سنجد) فقط به این دلیل که نظریه ای که بر اساس آن تکنیک مبتنی بود "بسیار خوب" بود.

پذیرش اظهارات بی اساس در مورد اعتبار روش نمی تواند برای مدت طولانی ادامه یابد. اولین جلوه‌های نقد واقعاً علمی این رویکرد را رد کرد: جستجو برای شواهد مبتنی بر علمی آغاز شد.

همانطور که قبلاً ذکر شد، انجام اعتبار سنجی نظری یک تکنیک نشان دادن این است که آیا تکنیک واقعاً ویژگی را می سنجد یا خیر، کیفیتی را که به گفته محقق باید اندازه گیری کند. بنابراین، به عنوان مثال، اگر آزمایشی برای تشخیص رشد ذهنی دانش‌آموزان ایجاد شده باشد، باید تجزیه و تحلیل شود که آیا واقعاً این رشد را اندازه‌گیری می‌کند و نه برخی از ویژگی‌های دیگر (مثلاً شخصیت، شخصیت و غیره). بنابراین، برای اعتبار نظری، مشکل اساسی رابطه بین پدیده های ذهنی و شاخص های آنها است که از طریق آن سعی می شود این پدیده های ذهنی شناخته شوند. این نشان می دهد که قصد نویسنده و نتایج روش شناسی مطابقت دارند.

اگر از قبل تکنیکی با اعتبار شناخته شده و اثبات شده برای اندازه گیری یک ویژگی خاص وجود داشته باشد، انجام اعتبار سنجی نظری یک تکنیک جدید چندان دشوار نیست. وجود همبستگی بین یک تکنیک جدید و مشابه قدیمی نشان می دهد که تکنیک توسعه یافته همان کیفیت روانشناختی را اندازه گیری می کند. و اگر روش جدید در عین حال در انجام و پردازش نتایج فشرده تر و مقرون به صرفه تر باشد، روانشناسان این فرصت را دارند که از ابزار جدیدی به جای ابزار قدیمی استفاده کنند. این تکنیک به ویژه اغلب در سایکوفیزیولوژی افتراقی هنگام ایجاد روش هایی برای تشخیص ویژگی های اساسی سیستم عصبی انسان مورد استفاده قرار می گیرد (به فصل هفتم مراجعه کنید).

اما اعتبار نظری نه تنها با مقایسه با شاخص‌های مرتبط، بلکه با شاخص‌هایی که بر اساس فرضیه، نباید ارتباط معناداری وجود داشته باشد، اثبات می‌شود. بنابراین، برای بررسی اعتبار نظری، از یک سو، تعیین درجه ارتباط با یک تکنیک مرتبط (روایی همگرا) و عدم وجود این ارتباط با تکنیک هایی که مبنای نظری متفاوتی دارند (روایی افتراقی) مهم است.

زمانی که چنین مسیری غیرممکن باشد، انجام اعتبارسنجی نظری یک تکنیک بسیار دشوارتر است. اغلب، این وضعیتی است که یک محقق با آن مواجه است. در چنین شرایطی، تنها انباشت تدریجی اطلاعات مختلف در مورد اموال مورد مطالعه، تجزیه و تحلیل مقدمات نظری و داده های تجربی، و تجربه قابل توجه در کار با این تکنیک امکان آشکارسازی معنای روانشناختی آن را فراهم می کند.

نقش مهمی در درک آنچه که روش اندازه گیری می کند با مقایسه شاخص های آن با اشکال عملی فعالیت ایفا می کند. اما در اینجا به ویژه مهم است که روش شناسی به صورت نظری به دقت کار شود، یعنی. به طوری که یک پایه علمی محکم و مستدل وجود دارد. سپس، هنگام مقایسه روش با روش برگرفته از

عمل روزمره، با یک معیار خارجی مطابق با آنچه که اندازه گیری می کند، می توان اطلاعاتی را به دست آورد که از ایده های نظری در مورد ماهیت آن پشتیبانی می کند.

یادآوری این نکته مهم است که اگر اعتبار نظری ثابت شود، تفسیر شاخص های به دست آمده واضح تر و مبهم تر می شود و نام تکنیک با دامنه کاربرد آن مطابقت دارد.

مربوط به اعتبار سنجی عملی،سپس شامل آزمون روش شناسی از نقطه نظر اثربخشی، اهمیت و سودمندی عملی آن است. به آن اهمیت زیادی داده می شود، به ویژه در جایی که مسئله انتخاب مطرح می شود. توسعه و استفاده از تکنیک‌های تشخیصی تنها زمانی معنا پیدا می‌کند که یک فرض معقول وجود داشته باشد که کیفیت اندازه‌گیری شده در موقعیت‌های خاص زندگی، در انواع خاصی از فعالیت‌ها آشکار می‌شود.

اگر دوباره به تاریخچه پیشرفت تستولوژی بپردازیم (A Anastasi, 1982؛ B.S. Avanesov, 1982؛ K.M. Gurevich, 1970؛ "General psychodiagnostics", 1987؛ B.M. Teplov, 1985 و غیره) آنگاه می توانیم چنین مواردی را برجسته کنیم. دوره (دهه 20 تا 30)، که محتوای علمی آزمون ها و "توشه" نظری آنها کمتر مورد توجه بود. مهم این بود که آزمون "کار کند" و به انتخاب سریع ترین افراد کمک کند. معیار تجربی ارزیابی تکالیف آزمون تنها راهنمای صحیح در حل مسائل علمی و کاربردی در نظر گرفته شد.

استفاده از تکنیک‌های تشخیصی با توجیه تجربی صرف، بدون مبنای نظری روشن، اغلب به نتیجه‌گیری‌های شبه علمی و توصیه‌های عملی غیرقابل توجیه منجر می‌شد. نمی‌توان دقیقاً توانایی‌ها و ویژگی‌هایی را که آزمایش‌ها نشان داد نام برد. B.M. تپلوف، با تجزیه و تحلیل آزمون های آن دوره، آنها را "آزمون های کور" نامید (1985).

این رویکرد به مسئله اعتبار آزمون تا اوایل دهه 50 معمول بود. نه تنها در ایالات متحده، بلکه در سایر کشورها نیز. ضعف نظری روش‌های اعتبارسنجی تجربی نمی‌تواند انتقادی را از سوی آن دسته از دانشمندان برانگیزد که در توسعه آزمایش‌ها، نه تنها بر تجربیات و عمل «لخت»، بلکه بر یک مفهوم نظری نیز تکیه می‌کردند. همانطور که می دانیم عمل بدون نظریه کور است و نظریه بدون عمل مرده است. در حال حاضر، ارزیابی نظری و عمل‌گرایانه اعتبار روش‌ها به عنوان مؤثرترین تلقی می‌شود.

برای انجام اعتبار سنجی عملی روش، به عنوان مثال. برای ارزیابی اثربخشی، کارایی و اهمیت عملی آن، معمولاً از یک معیار خارجی مستقل استفاده می شود - شاخصی از تجلی اموال مورد مطالعه در زندگی روزمره. چنین معیاری می تواند عملکرد تحصیلی (برای آزمون های توانایی های یادگیری، آزمون های دستاوردها، آزمون های هوش)، دستاوردهای تولید (برای روش های جهت گیری حرفه ای)، اثربخشی فعالیت های واقعی - نقاشی، مدل سازی و غیره باشد. (برای تست های توانایی ویژه)، ارزیابی های ذهنی (برای تست های شخصیت).

محققان آمریکایی تیفین و مک کورمیک (1968)، پس از تجزیه و تحلیل معیارهای خارجی مورد استفاده برای اثبات اعتبار، چهار نوع را شناسایی کردند:

1) معیارهای عملکرد (اینها ممکن است شامل میزان کار انجام شده، عملکرد تحصیلی، زمان صرف شده برای آموزش، نرخ رشد باشد.

مدارک تحصیلی و غیره)؛

2) معیارهای ذهنی (آنها شامل انواع مختلفی از پاسخ ها هستند که منعکس کننده نگرش فرد نسبت به چیزی یا شخصی، نظر، دیدگاه ها، ترجیحات او هستند؛ معمولاً معیارهای ذهنی با استفاده از مصاحبه، پرسشنامه، پرسشنامه به دست می آیند).

3) معیارهای فیزیولوژیکی (از آنها برای مطالعه تأثیر محیط و سایر متغیرهای موقعیتی بر روی بدن و روان انسان استفاده می شود؛ ضربان نبض، فشار خون، مقاومت الکتریکی پوست، علائم خستگی و غیره اندازه گیری می شود).

4) معیارهای تصادفات (در مواردی که هدف مطالعه مربوط می شود، به عنوان مثال، مشکل انتخاب برای کار افرادی که کمتر در معرض حوادث هستند، اعمال می شود).

معیار خارجی باید سه شرط اساسی را برآورده کند:

باید مرتبط، عاری از آلودگی و قابل اعتماد باشد.

ارتباط به مطابقت معنایی یک ابزار تشخیصی با یک معیار حیاتی مستقل اشاره دارد. به عبارت دیگر، باید اطمینان داشت که این معیار دقیقاً شامل آن ویژگی‌های روان فردی است که با تکنیک تشخیصی اندازه‌گیری می‌شوند. معیار بیرونی و تکنیک تشخیصی باید با یکدیگر مطابقت معنایی درونی داشته باشند و از نظر ماهیت روانشناختی از نظر کیفی همگن باشند (K.M. Gurevich, 1985). به عنوان مثال، اگر یک آزمون ویژگی های فردی تفکر، توانایی انجام اعمال منطقی با اشیاء و مفاهیم خاص را اندازه گیری کند، این معیار باید دقیقاً به دنبال تجلی این مهارت ها باشد. این به همان اندازه در مورد فعالیت های حرفه ای صدق می کند. نه یک، بلکه چندین هدف و هدف دارد که هر کدام خاص بوده و شرایط خاص خود را برای اجرا تحمیل می کند. این امر دلالت بر وجود معیارهای متعددی برای انجام فعالیت های حرفه ای دارد. بنابراین، موفقیت در تکنیک های تشخیصی را نباید با راندمان تولید به طور کلی مقایسه کرد. باید معیاری پیدا کرد که بر اساس ماهیت عملیات انجام شده، قابل مقایسه با روش باشد.

اگر در رابطه با یک معیار خارجی مشخص نباشد که آیا به خاصیت اندازه گیری شده مربوط است یا خیر، مقایسه نتایج یک تکنیک تشخیص روانی با آن عملاً بی فایده می شود. این اجازه نمی دهد که فرد به نتیجه ای برسد که بتواند اعتبار روش را ارزیابی کند.

الزامات برای رهایی از آلودگی ناشی از این واقعیت است که، برای مثال، موفقیت تحصیلی یا صنعتی به دو متغیر بستگی دارد: به خود شخص، ویژگی‌های فردی او که با روش‌ها اندازه‌گیری می‌شود، و به موقعیت، شرایط تحصیل و کار، که می‌تواند تداخل را معرفی کنید و معیار اعمال شده را "آلوده کنید". برای جلوگیری از این امر تا حدی باید گروه هایی از افراد را که در شرایط کم و بیش یکسان قرار دارند برای تحقیق انتخاب کرد. می توان از روش دیگری استفاده کرد. این شامل تصحیح تأثیر تداخل است. این تعدیل معمولاً ماهیت آماری دارد. بنابراین، برای مثال، بهره وری را نباید به صورت مطلق در نظر گرفت، بلکه باید در رابطه با میانگین بهره وری کارگرانی که در شرایط مشابه کار می کنند، در نظر گرفت.

وقتی آنها می گویند که یک معیار باید پایایی آماری معنی داری داشته باشد، به این معنی است که باید ثبات و ثبات تابع مورد مطالعه را منعکس کند.

جستجوی یک معیار مناسب و به راحتی قابل شناسایی، یک کار بسیار مهم و پیچیده اعتبارسنجی است. در تست غربی، بسیاری از روش ها تنها به این دلیل رد صلاحیت می شوند که نمی توان معیار مناسبی برای آزمایش آنها پیدا کرد. به عنوان مثال، بیشتر پرسشنامه ها دارای داده های روایی مشکوک هستند، زیرا یافتن یک معیار خارجی کافی که با آنچه اندازه گیری می کنند، مشکل است.

ارزیابی روایی روش می تواند کمی و کیفی باشدشخصیت.

برای محاسبه یک شاخص کمی - ضریب اعتبار - نتایج به دست آمده در هنگام استفاده از روش تشخیصی با داده های به دست آمده با استفاده از یک معیار خارجی برای همان افراد مقایسه می شود. انواع مختلفی از همبستگی خطی استفاده می شود (طبق گفته پیرسون، طبق گفته اسپیرمن).

برای محاسبه اعتبار به چند موضوع نیاز است؟ عمل نشان داده است که نباید کمتر از 50 باشد، بلکه بیشتر از 200 بهترین است.اغلب این سوال پیش می آید که مقدار ضریب اعتبار چقدر باید باشد تا قابل قبول تلقی شود؟ به طور کلی ذکر می شود که کافی است ضریب روایی از نظر آماری معنی دار باشد. ضریب اعتبار حدود 0.20-0.30 کم، متوسط - 0.30-0.50 و بالا - بیش از 0.60 در نظر گرفته می شود.

اما، همانطور که A. Anastasi (1982) تأکید می کند، K.M. گورویچ (1970) و دیگران، استفاده از همبستگی خطی برای محاسبه ضریب اعتبار همیشه مشروع نیست. این تکنیک تنها زمانی توجیه می شود که ثابت شود موفقیت در برخی فعالیت ها با موفقیت در انجام تست تشخیصی رابطه مستقیم دارد. جایگاه آزمایش‌شناسان خارجی، به‌ویژه آن‌هایی که درگیر شایستگی و انتخاب حرفه‌ای هستند، اغلب به این موضوع برمی‌گردد که بدون قید و شرط، کسی که وظایف بیشتری را در آزمون انجام داده، برای این حرفه مناسب‌تر است. اما ممکن است برای موفقیت در یک فعالیت نیز نیاز باشد که دارایی در سطح 40 درصد از محلول آزمایشی داشته باشید. موفقیت بیشتر در آزمون دیگر هیچ اهمیتی برای این حرفه ندارد. یک مثال واضح از مونوگراف KM Gurevich: یک پستچی باید بتواند بخواند، اما چه با سرعت معمولی و چه با سرعت بسیار بالا - این دیگر ندارد. اهمیت حرفه ای با چنین همبستگی بین شاخص‌های روش و معیار خارجی، مناسب‌ترین راه برای ایجاد اعتبار، ممکن است معیار تفاوت‌ها باشد.

مورد دیگری نیز امکان پذیر است: سطح دارایی بالاتر از میزان مورد نیاز این حرفه در موفقیت حرفه ای اختلال ایجاد می کند. بنابراین F. Taylor دریافت که توسعه یافته ترین کارگران زن تولیدی بهره وری نیروی کار پایینی دارند. یعنی سطح بالای رشد ذهنی آنها باعث می شود نتوانند با بهره وری بالا کار کنند. در این حالت، تحلیل واریانس یا محاسبه روابط همبستگی برای محاسبه ضریب اعتبار مناسب تر خواهد بود.

همانطور که تجربه آزمایش‌شناسان خارجی نشان داده است، هیچ یک از روش‌های آماری نمی‌تواند به طور کامل تنوع ارزیابی‌های فردی را منعکس کند. بنابراین، اغلب از مدل دیگری برای اثبات اعتبار روش ها استفاده می شود - ارزیابی های بالینی. این چیزی نیست جز توصیف کیفی ماهیت آنچه مورد مطالعه است

خواص در این مورد، ما در مورد استفاده از تکنیک هایی صحبت می کنیم که بر پردازش آماری متکی نیستند.

چند نوع اعتبار وجود دارد،مشروط به ویژگی‌های تکنیک‌های تشخیصی، و همچنین وضعیت موقت معیار خارجی در بسیاری از آثار (A Anastasi, 1982؛ L.F. Burlachuk, SM. Morozov, 1989؛ KM. Gurevich, 1970؛ B.V. Kulagin, Cherny, 1984; ، 1983؛ "Psychodiagnostics عمومی"، 1987، و غیره) موارد زیر اغلب نامیده می شوند:

اعتبار محتوا.این تکنیک در درجه اول در آزمون های پیشرفت استفاده می شود. معمولاً، آزمون‌های پیشرفت شامل تمام مطالبی که دانش‌آموزان پرداخته‌اند، نیست، بلکه بخش کوچکی از آن (3-4 سؤال) را شامل می‌شود. آیا می توانید مطمئن باشید که پاسخ صحیح به این چند سوال نشان دهنده تسلط شما بر همه مطالب است؟ این همان چیزی است که یک آزمون اعتبار محتوا باید پاسخ دهد. برای انجام این کار، مقایسه موفقیت در آزمون با ارزیابی های کارشناسی معلمان (بر اساس این مطالب) انجام می شود. روایی محتوایی برای آزمون های مرجع معیار نیز اعمال می شود. این تکنیک گاهی اوقات اعتبار منطقی نامیده می شود.

اعتبار همزمانیا اعتبار مداوم، با استفاده از یک معیار خارجی تعیین می شود که به وسیله آن اطلاعات به طور همزمان با آزمایشات روی روش مورد آزمایش جمع آوری می شود. به عبارت دیگر، داده های مربوط به عملکرد فعلی در طول دوره آزمون، عملکرد در همان دوره و غیره جمع آوری می شود. نتایج موفقیت در آزمون با آن همبستگی دارد.

اعتبار "پیش بینی کننده".(نام دیگر اعتبار «پیش‌بینی» است). همچنین با یک معیار خارجی نسبتاً قابل اعتماد تعیین می شود، اما اطلاعات مربوط به آن مدتی پس از آزمایش جمع آوری می شود. یک معیار خارجی معمولاً توانایی فرد است که در نوعی ارزیابی بیان می شود، برای نوع فعالیتی که برای آن بر اساس نتایج آزمایش های تشخیصی انتخاب شده است. اگرچه این تکنیک بیشتر با وظیفه تکنیک های تشخیصی سازگار است - پیش بینی موفقیت آینده، اما اعمال آن بسیار دشوار است. صحت پیش بینی با زمان تعیین شده برای چنین پیش بینی رابطه معکوس دارد. هر چه زمان بیشتری پس از اندازه گیری بگذرد، تعداد عواملی که باید در ارزیابی اهمیت پیش آگهی این تکنیک در نظر گرفته شوند، بیشتر می شود. با این حال، تقریباً غیرممکن است که همه عوامل مؤثر بر پیش بینی را در نظر بگیریم.

اعتبار «عقب‌نگر».بر اساس معیاری که رویدادها یا وضعیت کیفیت در گذشته را منعکس می کند تعیین می شود. می توان از آن برای به دست آوردن سریع اطلاعات در مورد قابلیت های پیش بینی تکنیک استفاده کرد. بنابراین، برای بررسی میزان مطابقت نتایج آزمون استعداد خوب با یادگیری سریع، ارزیابی عملکرد گذشته، نظرات کارشناسان گذشته و غیره را می توان مقایسه کرد. در افراد با شاخص های تشخیصی جریان بالا و پایین.

هنگام ارائه داده هایی در مورد اعتبار روش توسعه یافته، مهم است که دقیقاً نوع اعتبار مورد نظر (از نظر محتوا، همزمان و غیره) مشخص شود. همچنین توصیه می‌شود اطلاعاتی درباره تعداد و ویژگی‌های افرادی که اعتبارسنجی بر روی آنها انجام شده است ارائه شود. چنین اطلاعاتی به محققی که از این تکنیک استفاده می‌کند اجازه می‌دهد تصمیم بگیرد که چقدر این تکنیک برای گروه مورد نظر معتبر است.

که قرار است از آن استفاده کند. همانند پایایی، مهم است که به خاطر داشته باشید که یک تکنیک ممکن است در یک نمونه روایی بالا و در نمونه دیگر اعتبار پایین داشته باشد. بنابراین، اگر محققی قصد دارد از تکنیکی در نمونه ای از آزمودنی ها استفاده کند که به طور قابل توجهی با نمونه ای که آزمون روایی بر روی آن انجام شده است متفاوت است، نیاز به انجام مجدد چنین آزمونی دارد. ضریب اعتبار ارائه شده در کتابچه راهنمای تنها برای گروه هایی از موضوعات مشابه با مواردی که در آن تعیین شده است اعمال می شود.

ادبیات

آناستازی ا.تست روانشناسی" در 2 کتاب / ویرایش شده توسط K.M. Gurevich، V. I. Lubovsky M.، 1982. کتاب 1.

گورویچ K.M Oقابلیت اطمینان شاخص های روانی فیزیولوژیکی // مشکلات روان فیزیولوژی دیفرانسیل M.، 1969 جلد VI. از 266-275.

گورویچ ک.م.قابلیت اطمینان تست های روانشناختی // تشخیص روانشناختی مشکلات و روش های آن M، 1975 P 162-176.

گورویچ KMآمار - دستگاهی برای اثبات تشخیص‌های روان‌شناختی//مشکلات تشخیص‌های روان‌شناختی تالین 1977. صص 206-225

Gurevich K.Mch^oتشخیص روانشناختی م.، 1985 است.