نمونه های تست انواع وظایف تست باز. انواع تست ها و اشکال تکالیف تستی – سخنرانی. طبقه بندی وظایف آزمون

انواع آزمون ها و اشکال وظایف آزمون

1. انواع اصلی آزمون های آموزشی.

2. اشکال وظایف آزمون.

3. تأیید تجربی و پردازش آماری نتایج.

4. اصول انتخاب محتوا. معیارهای ارزیابی محتوای آزمون.

5. رابطه بین شکل تکلیف و نوع دانش، مهارت ها و توانایی های مورد آزمایش.


1. انواع اصلی آزمون های آموزشی

دو نوع آزمون اصلی وجود دارد: سنتی و غیر سنتی.

آزمون دارای ترکیب، یکپارچگی و ساختار است. این شامل وظایف، قوانین برای کاربرد آنها، نمرات برای تکمیل هر کار و توصیه هایی برای تفسیر نتایج آزمون است. یکپارچگی آزمون به معنای ارتباط متقابل وظایف، تعلق آنها به یک عامل اندازه گیری مشترک است. هر کار تست نقش تعیین شده خود را انجام می دهد و بنابراین هیچ یک از آنها را نمی توان بدون از دست دادن کیفیت اندازه گیری از آزمون حذف کرد. ساختار آزمون با نحوه اتصال وظایف به یکدیگر شکل می گیرد. اساساً این ساختار به اصطلاح عاملی است که در آن هر ماده از طریق محتوای مشترک و تنوع رایج در نمرات آزمون به موارد دیگر مرتبط است.

یک آزمون سنتی وحدتی از حداقل سه سیستم است:

یک سیستم رسمی از وظایف با افزایش دشواری؛

ویژگی های آماری وظایف و نتایج آزمودنی ها.

آزمون سنتی تربیتی را باید به دو معنا در نظر گرفت: - به عنوان یک روش اندازه گیری آموزشی و در نتیجه استفاده از آزمون. تعجب آور است که متون روسی به سمت معنای روش گرایش پیدا می کنند، در حالی که در اکثر آثار نویسندگان غربی مفهوم آزمون بیشتر به معنای نتیجه در نظر گرفته می شود. در همین حال، هر دوی این معناها، آزمون را از جنبه های مختلف مشخص می کنند، زیرا آزمون باید به طور همزمان هم به عنوان یک روش و هم در نتیجه یک اندازه گیری آموزشی درک شود. یکی مکمل دیگری است. یک آزمون، به عنوان یک روش، بدون نتایجی که کیفیت خود و کیفیت ارزیابی های اندازه گیری افراد در سطوح مختلف آمادگی را تایید می کند، قابل تصور نیست.

چندین ایده در تعریف فوق از یک آزمون سنتی ایجاد شده است.

ایده اول این است که آزمون نه به عنوان یک مجموعه معمولی یا مجموعه ای از سؤالات، وظایف و غیره، بلکه در قالب مفهوم "سیستم وظایف" در نظر گرفته می شود. چنین سیستمی با هیچ کلیتی شکل نمی گیرد، بلکه تنها با چیزی که ظهور یک کیفیت یکپارچه جدید را تعیین می کند که آزمون را از یک مجموعه ابتدایی از وظایف و از سایر ابزارهای کنترل آموزشی متمایز می کند، شکل می گیرد. از میان بسیاری از سیستم‌های ممکن، بهترین سیستم توسط آن مجموعه انتگرالی شکل می‌گیرد که در آن کیفیت آزمون به میزان نسبتاً بیشتری آشکار می‌شود. از این رو ایده شناسایی اولین عامل از دو عامل اصلی تشکیل دهنده سیستم - بهترین ترکیب وظایف آزمایشی که یکپارچگی را تشکیل می دهد، به وجود آمد. بر این اساس، می‌توانیم یکی از کوتاه‌ترین تعاریف را ارائه دهیم: آزمون سیستمی از وظایف است که بهترین یکپارچگی روش‌شناختی را تشکیل می‌دهد. یکپارچگی آزمون تعامل پایدار وظایفی است که آزمون را به عنوان یک سیستم در حال توسعه تشکیل می دهد.

ایده دوم این است که در این تعریف از آزمون، از سنت ریشه‌دار نگاه کردن به آزمون به‌عنوان وسیله‌ای ساده برای بررسی، آزمایش و آزمایش فاصله گرفته می‌شود. هر آزمون شامل یک عنصر تست است، همه چیز در مورد آن نیست. زیرا یک آزمون یک مفهوم، محتوا، شکل، نتایج و تفسیر است - هر چیزی که نیاز به توجیه دارد. این نشان می دهد که آزمون یک ابزار کیفی برای اندازه گیری آموزشی است. مطابق با مفاد نظریه، نمرات آزمونارزیابی دقیقی از موضوعات نیست. درست است که بگوییم آنها فقط این معانی را با کمی دقت نشان می دهند.

سومین ایده توسعه یافته در تعریف ما از آزمون سنتی، گنجاندن یک مفهوم جدید - اثربخشی آزمون است که قبلاً در ادبیات آزمون به عنوان معیاری برای تجزیه و تحلیل و ایجاد آزمون در نظر گرفته نشده است. ایده اصلی آزمون سنتی مقایسه دانش هر چه بیشتر دانش آموزان با حداقل تعداد کارها، در زمان کوتاه، سریع، کارآمد و با کمترین هزینه است.

اساسا، این نشان دهنده ایده کارایی است فعالیت آموزشیدر زمینه کنترل دانش من می خواهم فکر کنم که هیچ کس نیست و نیازی به اعتراض به این ایده نیست. اگر استاد ما می تواند توضیح دهد مطالب آموزشیبدتر از همکار خارجی خود نیست، پس خوب است دانش مورد نیاز را آزمایش کند، برای همه دانش آموزان، برای همه مطالب مطالعه شده، به دلیل سیستم کلاسی-درسی حاکم بر کلاس ها در کشور ما، کمبود تجهیزات کامپیوتر، آزمون ها و برنامه هایی برای سازماندهی خودکنترلی خودکار - انسانی ترین شکل کنترل دانش. او از نظر فیزیکی نیز قادر به انجام این کار نیست. به دلیل، به بیان خفیف، اشتباه است سیاست اجتماعیحقوق معلمان ما مدتهاست که قادر به جبران هزینه حتی انرژی بدنی لازم برای تدریس خوب نبوده است، به غیر از مصرف فزاینده انرژی فکری، که تنها با تفکر آرام و بدون مشغول شدن به جستجو می توان به دست آورد. برای نان همانطور که در ادبیات ذکر شده است، یک کارگر واجد شرایط سه تا چهار برابر کمتر از سطح حقوق دریافت می کند که پس از آن فعالیت عادی زندگی مختل شده و نابودی پتانسیل کار آغاز می شود.

اگرچه صدها نمونه از تعاریف آزمون در ادبیات وجود دارد که توافق با آنها دشوار یا غیرممکن است، اما این به هیچ وجه به این معنا نیست که این تعریفآزمون سنتی - حقیقت نهایی مانند همه مفاهیم دیگر، نیاز به بهبود مداوم دارد. فقط به نظر نویسنده این است که تا کنون بیشتر از برخی دیگر از مفاهیم شناخته شده آزمون آموزشی مستدل است. با این حال، تمایل به بهبود مفاهیم یک پدیده کاملاً عادی و برای توسعه عادی عمل و علم ضروری است. تلاش های سازنده برای ارائه تعاریف دیگر از آزمون یا به چالش کشیدن تعاریف موجود همیشه مفید است، اما این دقیقاً همان چیزی است که ما فاقد آن هستیم.

تست های سنتی شامل تست های همگن و ناهمگن است. یک آزمون همگن سیستمی از وظایف افزایش دشواری، فرم خاص و محتوای خاص است - سیستمی که به منظور روشی عینی، با کیفیت و مؤثر برای ارزیابی ساختار و اندازه گیری سطح آمادگی دانش آموزان در یک دانشگاه ایجاد شده است. انضباط. به راحتی می توان فهمید که در هسته آن، تعریف آزمون همگن با تعریف آزمون سنتی مطابقت دارد.

تست های همگن رایج تر از بقیه هستند. در آموزش، آنها برای کنترل دانش در یک رشته دانشگاهی یا در یک بخش، مانند، برای مثال، یک رشته حجیم ایجاد می شوند. رشته دانشگاهیمثل فیزیک در یک آزمون آموزشی همگن، استفاده از وظایفی که ویژگی های دیگر را نشان می دهد مجاز نیست. حضور دومی ناقض شرط خلوص انضباطی آزمون آموزشی است. از این گذشته، هر آزمایشی چیزی از پیش تعیین شده را اندازه گیری می کند.

به عنوان مثال، آزمونی در فیزیک، دانش، مهارت ها و ادراک آزمون شوندگان را در این علم اندازه گیری می کند. یکی از مشکلات چنین اندازه گیری این است که دانش فیزیکی به شدت با دانش ریاضی همراه است. بنابراین، آزمون فیزیک به طور ماهرانه سطح دانش ریاضی مورد استفاده در حل مسائل فیزیک را مشخص می کند. فراتر رفتن از سطح پذیرفته شده منجر به سوگیری در نتایج می شود. با فراتر رفتن از آنها، این دومی به طور فزاینده ای نه چندان به دانش فیزیک، که به دانش یک علم دیگر، یعنی ریاضیات، وابسته می شود. یکی دیگر جنبه مهم- تمایل برخی از نویسندگان برای گنجاندن در آزمون ها نه به اندازه توانایی حل مشکلات فیزیکی، بلکه درگیر کردن مؤلفه فکری در اندازه گیری آمادگی در فیزیک.

آزمون ناهمگن سیستمی از وظایف افزایش دشواری، فرم خاص و محتوای خاص است - سیستمی که به منظور روشی عینی، با کیفیت و مؤثر برای ارزیابی ساختار و اندازه گیری سطح آمادگی دانش آموزان در چندین دانشگاه ایجاد شده است. رشته ها اغلب چنین آزمون هایی شامل وظایف روانشناختی برای ارزیابی سطح رشد فکری نیز می شود.

معمولاً از آزمون‌های ناهمگن برای ارزیابی جامع فارغ‌التحصیلان مدرسه، ارزیابی شخصیت در هنگام درخواست شغل و برای انتخاب آماده‌ترین متقاضیان برای پذیرش در دانشگاه‌ها استفاده می‌شود. از آنجایی که هر آزمون ناهمگن از آزمون های همگن تشکیل شده است، تفسیر نتایج آزمون بر اساس پاسخ به تکالیف هر آزمون (در اینجا مقیاس نامیده می شود) انجام می شود و علاوه بر این، از طریق روش های مختلف تجمیع نمرات، تلاش می شود تا دادن ارزیابی کلیآمادگی آزمودنی

به یاد بیاوریم که آزمون سنتی روشی برای تشخیص آزمودنی‌ها است که در آن به تکالیف یکسان، در همان زمان، در شرایط یکسان و با یک امتیاز پاسخ می‌دهند. با این جهت گیری، وظیفه تعیین حجم و ساختار دقیق مطالب آموزشی تسلط یافته، ضرورتاً به پس زمینه می رود. این آزمون حداقل تعداد کافی از کارها را انتخاب می کند که به فرد امکان می دهد به طور نسبی دقیق، به بیان مجازی، نه "چه کسی چه چیزی را می داند" بلکه "چه کسی بیشتر می داند" تعیین کند. تفسیر نتایج آزمون عمدتاً به زبان تست شناسی انجام می شود، بر اساس میانگین حسابی، حالت یا میانه و به اصطلاح هنجارهای صدک، که نشان می دهد چند درصد از آزمودنی ها نتیجه آزمون بدتر از هر موضوعی را دارند که برای آنها انتخاب شده است. تجزیه و تحلیل با نمره آزمون او. این تفسیر را هنجارگرا می نامند. در اینجا نتیجه گیری با رتبه بندی تکمیل می شود: وظایف به نتیجه گیری در مورد دانش رتبه بندی موضوع پاسخ می دهد که به عنوان نتیجه گیری در مورد مکان یا رتبه موضوع درک می شود.

تست های یکپارچه یک آزمون یکپارچه را می توان آزمونی نامید که شامل سیستمی از وظایف است که الزامات محتوای یکپارچه، فرم آزمون و افزایش دشواری وظایف با هدف تشخیص نهایی عمومی آمادگی فارغ التحصیل را برآورده می کند. موسسه تحصیلی. تشخیص با ارائه چنین وظایفی انجام می شود که پاسخ صحیح به آنها نیاز به دانش یکپارچه (تعمیم شده، به وضوح مرتبط) دو یا چند رشته دانشگاهی دارد. ایجاد چنین آزمون هایی فقط برای معلمانی داده می شود که دانش تعدادی از رشته های تحصیلی را داشته باشند، نقش مهم ارتباطات بین رشته ای را در یادگیری درک کرده و قادر به ایجاد تکالیفی باشند که پاسخ صحیح به آنها مستلزم داشتن دانش دانش آموزان در زمینه های مختلف است. رشته ها و توانایی به کارگیری چنین دانشی.

آزمایش یکپارچه با سازماندهی آموزش یکپارچه مقدم است. متأسفانه، شکل کلاس درس فعلی برگزاری کلاس ها، همراه با پراکندگی بیش از حد رشته های دانشگاهی، همراه با سنت تدریس رشته های فردی (به جای دوره های عمومی)، برای مدت طولانی مانع اجرای یک رویکرد یکپارچه در فرآیندها خواهد شد. آمادگی یادگیری و نظارت مزیت آزمون‌های تلفیقی نسبت به آزمون‌های ناهمگن در محتوای اطلاعاتی بیشتر هر کار و تعداد کمتری از خود تکالیف است. با افزایش سطح تحصیلات و تعداد رشته های تحصیلی مورد مطالعه، نیاز به ایجاد آزمون های تلفیقی افزایش می یابد. بنابراین، تلاش برای ایجاد چنین آزمون هایی عمدتا در مورد توجه قرار می گیرد دبیرستان. آزمون های یکپارچه به ویژه برای افزایش عینیت و کارایی گواهینامه دولتی نهایی دانش آموزان مفید است.

روش ایجاد آزمون های تلفیقی مشابه روش ایجاد آزمون های سنتی است، به استثنای کار تعیین محتوای وظایف. برای انتخاب محتوای آزمون های تلفیقی، استفاده از روش های خبره الزامی است. این به این دلیل است که فقط کارشناسان می توانند کفایت محتوای وظایف را برای اهداف آزمون تعیین کنند. اما قبل از هر چیز، تصمیم گیری در مورد اهداف آموزش و مطالعه برخی از افراد، برای خود متخصصان مهم خواهد بود برنامه های آموزشی، و سپس بین خود در مورد مسائل اساسی به توافق برسند، و فقط تغییرات در درک درجه اهمیت عناصر فردی در ساختار کلی آمادگی را برای بررسی باقی می گذارند. یک ترکیب منتخب از متخصصان ادبیات خارجی که در مورد مسائل اساسی مورد توافق قرار گرفته است، اغلب یک پانل است. یا با توجه به تفاوت معنای کلمه آخر در زبان روسی، چنین ترکیبی را می توان یک گروه متخصص نماینده نامید. این گروه به گونه ای انتخاب می شود که به اندازه کافی رویکرد مورد استفاده برای ایجاد آزمون مورد نظر را نشان دهد.

آزمون های تطبیقی امکان سنجی کنترل تطبیقی ​​از نیاز به منطقی کردن آزمایش سنتی ناشی می شود. هر معلمی می‌داند که دانش‌آموزی که به خوبی آماده است نیازی به انجام وظایف آسان یا بسیار آسان ندارد. زیرا احتمال تصمیم گیری درست بسیار زیاد است. علاوه بر این، مواد سبک وزن پتانسیل توسعه قابل توجهی ندارند. به طور متقارن، به دلیل احتمال بالای تصمیم گیری اشتباه، دادن وظایف دشوار به دانش آموز ضعیف فایده ای ندارد. مشخص است که کارهای سخت و بسیار دشوار انگیزه یادگیری را در بسیاری از دانش آموزان کاهش می دهد. لازم بود مقیاسی قابل مقایسه در یک مقیاس برای دشواری کارها و معیاری برای سطح دانش پیدا شود. این معیار در نظریه اندازه گیری آموزشی یافت شد. ریاضیدان دانمارکی G. Rask این اندازه گیری را کلمه "logit" نامید. پس از ظهور رایانه ها، این معیار اساس روش شناسی کنترل دانش تطبیقی ​​را تشکیل داد که از روش هایی برای تنظیم دشواری و تعداد وظایف ارائه شده بسته به پاسخ دانش آموزان استفاده می کند. اگر پاسخ موفقیت آمیز باشد، رایانه کار بعدی را دشوارتر انتخاب می کند، اگر پاسخ ناموفق باشد، کار بعدی آسان تر خواهد بود. طبیعتاً این الگوریتم نیاز به آزمایش اولیه همه کارها، تعیین درجه سختی آنها و همچنین ایجاد بانکی از وظایف و برنامه ویژه دارد.

استفاده از وظایفی که با سطح آمادگی مطابقت دارند به طور قابل توجهی دقت اندازه گیری ها را افزایش می دهد و زمان آزمایش فردی را تقریباً به 5 تا 10 دقیقه به حداقل می رساند. احتمال پاسخ صحیح برای هر دانش آموز

در ادبیات غربی، سه گزینه برای تست تطبیقی ​​متمایز شده است. اولین مورد آزمایش هرمی نام دارد. در غیاب ارزیابی های اولیه، به همه آزمودنی ها وظیفه ای با درجه سختی متوسط ​​داده می شود و تنها پس از آن، بسته به پاسخ، به هر موضوعی کار ساده تر یا دشوارتر داده می شود. در هر مرحله استفاده از قانون تقسیم مقیاس دشواری به نصف مفید است. در گزینه دوم، کنترل با هر سطح دشواری مورد نظر آزمودنی شروع می شود، با رویکرد تدریجی به سطح واقعی دانش. گزینه سوم زمانی است که آزمایش از طریق بانکی از وظایف تقسیم بر سطوح دشواری انجام شود.

بنابراین، یک آزمون تطبیقی ​​نوعی از یک سیستم تست خودکار است که در آن پارامترهای دشواری و توانایی تمایز هر کار از قبل شناخته شده است. این سیستم در قالب یک بانک رایانه ای از وظایف ایجاد شده است که مطابق با ویژگی های وظایف مورد علاقه سفارش داده شده است. بیشترین مشخصه اصلیوظایف آزمون تطبیقی ​​سطح دشواری آنها است که به صورت تجربی به دست می آید، به این معنی که: قبل از رسیدن به بانک، هر کار تحت آزمایش تجربی بر روی تعداد کافی از دانش آموزان معمولی از جمعیت مورد علاقه قرار می گیرد. واژه‌های «مشروط منافع» در اینجا بیانگر معنای دقیق‌تر مفهوم «جمعیت عمومی» شناخته شده در علم است.

الگوی آموزشی گسترده ما از مدرسه تطبیقی ​​E.A. یامبورگ، اساساً از ایده‌های کلی یادگیری تطبیقی ​​و کنترل دانش تطبیقی ​​ناشی می‌شود. خاستگاه این رویکرد را می توان به ظهور آثار آموزشی Comenius، Pestalozzi و Disterweg جستجو کرد که با ایده های انطباق با طبیعت و انسانیت آموزش متحد شدند. دانشجو در مرکز سیستم آموزشی آنها قرار داشت. به عنوان مثال، در اثر کمتر شناخته شده A. Disterweg "قوانین تعلیمی" می توانید کلمات زیر را بخوانید: "تدریس مطابق با طبیعت... آموزش بدون فاصله... شروع تدریس از جایی که دانش آموز متوقف شد... قبل از شروع. تدریس، باید نقطه شروع را بررسی کرد... بدون دانستن اینکه دانش آموز کجا متوقف شده است، نمی توان به درستی به او آموزش داد.» عدم آگاهی از سطح واقعی دانش دانش آموزان و تفاوت های طبیعی در توانایی های آنها در جذب دانش پیشنهادی دلیل اصلی پیدایش سیستم های انطباقی مبتنی بر اصل فردی سازی یادگیری شده است. اجرای این اصل به شکل سنتی و کلاس درس دشوار است.

قبل از ظهور اولین کامپیوترها، بیشتر سیستم شناخته شدهنزدیک به یادگیری تطبیقی، به اصطلاح «سیستم جذب کامل دانش» بود.

آزمون های مبتنی بر معیار با رویکرد معیارمحور، آزمون هایی برای مقایسه دستاوردهای آموزشی هر دانش آموز با میزان دانش، مهارت ها یا توانایی های برنامه ریزی شده ایجاد می شود. در این مورد، یک حوزه محتوایی خاص به جای نمونه خاصی از دانش آموزان به عنوان چارچوب مرجع تفسیری استفاده می شود. تأکید بر این است که دانش آموز چه کاری می تواند انجام دهد و چه می داند، نه اینکه چگونه با دیگران مقایسه می کند.

همچنین با رویکرد معیار محور مشکلاتی وجود دارد. به عنوان یک قاعده، آنها با انتخاب محتوای آزمون همراه هستند. در چارچوب رویکرد مرجع معیار، آزمون سعی می کند کل محتوای درس کنترل شده یا حداقل آنچه را که می توان به عنوان این حجم کامل در نظر گرفت، منعکس کند. درصد انجام صحیح وظایف به عنوان میزان آمادگی یا میزان تسلط بر حجم کل مطالب درسی در نظر گرفته می شود. البته، در چارچوب رویکرد معیارمحور، هر دلیلی برای تفسیر اخیر وجود دارد، زیرا آزمون شامل همه چیزهایی است که می‌توان به صورت مشروط به عنوان 100٪ پذیرفت.

آزمون های مبتنی بر معیار طیف نسبتاً گسترده ای از وظایف را پوشش می دهند. به ویژه، آنها به جمع آوری اطلاعات کامل و عینی در مورد دستاوردهای آموزشی هر دانش آموز به صورت جداگانه و گروهی از دانش آموزان کمک می کنند. دانش، مهارت ها و توانایی های دانش آموز را با الزامات مندرج در ایالت مقایسه کنید استانداردهای آموزشی; دانش آموزانی را انتخاب کنید که به سطح آمادگی برنامه ریزی شده رسیده اند. ارزیابی اثربخشی فعالیت حرفه ایمعلمان فردی و گروهی از معلمان؛ ارزیابی اثربخشی برنامه های آموزشی مختلف

تأکید بر رویکرد مبتنی بر محتوا ممکن است تأثیر مفیدی بر آزمون معلمان به عنوان یک کل داشته باشد. این رویکرد، برای مثال، تفسیر نمرات آزمون در حین نظارت مستمر سودمند است. دانش آموز اطلاعاتی را دریافت نمی کند که در مقایسه با دیگران چگونه به نظر می رسد، بلکه در مورد آنچه که می تواند انجام دهد و آنچه می داند در مقایسه با الزامات داده شده برای سطح آموزش در موضوع، اطلاعاتی دریافت می کند. البته، چنین تفسیری ترکیبی با انتساب نتایج به هنجارها را که معمولاً در حین نظارت مستمر دانش دانش آموزان در زندگی روزمره رخ می دهد، رد نمی کند. فرآیند آموزشی. در این صورت تست زنی با یادگیری ادغام می شود و به دانش آموز کمک می کند تا مشکلات احتمالی را شناسایی کند و همچنین اشتباهات را در تسلط بر محتوای آموزشی به موقع تصحیح کند.



در طول استدلال دانش آموز، زنجیره قطع می شود (ناسازگاری مفهوم یا توضیح)، سپس تعداد عملیات مهم قبل از شکستن زنجیره منطقی تعیین می شود. ویژگی تدوین وظایف آزمون در این سطح از تسلط این است که ایجاد یک استاندارد بدون ابهام تقریباً غیرممکن است. استاندارد را می توان در قالب یک نمودار حل مسئله ایجاد کرد. مثال: زنجیره منطقی. ...

طرح

    انواع اصلی آزمون های آموزشی.

    فرم وظایف آزمون.

    تایید تجربی و پردازش آماری نتایج.

    اصول انتخاب محتوا معیارهای ارزیابی محتوای آزمون.

    رابطه بین شکل تکلیف و نوع دانش، مهارت ها و توانایی های مورد آزمایش.

  1. انواع اصلی آزمون های آموزشی

دو نوع آزمون اصلی وجود دارد: سنتی و غیر سنتی.

آزمون دارای ترکیب، یکپارچگی و ساختار است. این شامل وظایف، قوانین برای کاربرد آنها، نمرات برای تکمیل هر کار و توصیه هایی برای تفسیر نتایج آزمون است. یکپارچگی آزمون به معنای ارتباط متقابل وظایف، تعلق آنها به یک عامل اندازه گیری مشترک است. هر کار تست نقش تعیین شده خود را انجام می دهد و بنابراین هیچ یک از آنها را نمی توان بدون از دست دادن کیفیت اندازه گیری از آزمون حذف کرد. ساختار آزمون با نحوه اتصال وظایف به یکدیگر شکل می گیرد. اساساً این ساختار به اصطلاح عاملی است که در آن هر ماده از طریق محتوای مشترک و تنوع رایج در نمرات آزمون به موارد دیگر مرتبط است.

یک آزمون سنتی وحدتی از حداقل سه سیستم است:

یک سیستم رسمی از وظایف با افزایش دشواری؛

ویژگی های آماری وظایف و نتایج آزمودنی ها.

آزمون سنتی تربیتی را باید به دو معنا در نظر گرفت: - به عنوان یک روش اندازه گیری آموزشی و در نتیجه استفاده از آزمون. تعجب آور است که متون روسی به سمت معنای روش گرایش پیدا می کنند، در حالی که در اکثر آثار نویسندگان غربی مفهوم آزمون بیشتر به معنای نتیجه در نظر گرفته می شود. در همین حال، هر دوی این معناها، آزمون را از جنبه های مختلف مشخص می کنند، زیرا آزمون باید به طور همزمان هم به عنوان یک روش و هم در نتیجه یک اندازه گیری آموزشی درک شود. یکی مکمل دیگری است. یک آزمون، به عنوان یک روش، بدون نتایجی که کیفیت خود و کیفیت ارزیابی های اندازه گیری افراد در سطوح مختلف آمادگی را تایید می کند، قابل تصور نیست.

چندین ایده در تعریف فوق از یک آزمون سنتی ایجاد شده است.

ایده اول این است که آزمون نه به عنوان یک مجموعه معمولی یا مجموعه ای از سؤالات، وظایف و غیره، بلکه در قالب مفهوم "سیستم وظایف" در نظر گرفته می شود. چنین سیستمی با هیچ کلیتی شکل نمی گیرد، بلکه تنها با چیزی که ظهور یک کیفیت یکپارچه جدید را تعیین می کند که آزمون را از یک مجموعه ابتدایی از وظایف و از سایر ابزارهای کنترل آموزشی متمایز می کند، شکل می گیرد. از میان بسیاری از سیستم‌های ممکن، بهترین سیستم توسط آن مجموعه انتگرالی شکل می‌گیرد که در آن کیفیت آزمون به میزان نسبتاً بیشتری آشکار می‌شود. از این رو ایده شناسایی اولین عامل از دو عامل اصلی تشکیل دهنده سیستم - بهترین ترکیب وظایف آزمایشی که یکپارچگی را تشکیل می دهد، به وجود آمد. بر این اساس، می‌توانیم یکی از کوتاه‌ترین تعاریف را ارائه دهیم: آزمون سیستمی از وظایف است که بهترین یکپارچگی روش‌شناختی را تشکیل می‌دهد. یکپارچگی آزمون تعامل پایدار وظایفی است که آزمون را به عنوان یک سیستم در حال توسعه تشکیل می دهد.

ایده دوم این است که در این تعریف از آزمون، از سنت ریشه‌دار نگاه کردن به آزمون به‌عنوان وسیله‌ای ساده برای بررسی، آزمایش و آزمایش فاصله گرفته می‌شود. هر آزمون شامل یک عنصر تست است، همه چیز در مورد آن نیست. زیرا یک آزمون یک مفهوم، محتوا، شکل، نتایج و تفسیر است - هر چیزی که نیاز به توجیه دارد. این نشان می دهد که آزمون یک ابزار کیفی برای اندازه گیری آموزشی است. بر اساس این تئوری، نمرات آزمون ارزیابی دقیقی از آزمودنی ها نیست. درست است که بگوییم آنها فقط این معانی را با کمی دقت نشان می دهند.

سومین ایده توسعه یافته در تعریف ما از آزمون سنتی، گنجاندن یک مفهوم جدید - اثربخشی آزمون است که قبلاً در ادبیات آزمون به عنوان معیاری برای تجزیه و تحلیل و ایجاد آزمون در نظر گرفته نشده است. ایده اصلی آزمون سنتی مقایسه دانش هر چه بیشتر دانش آموزان با حداقل تعداد کارها، در زمان کوتاه، سریع، کارآمد و با کمترین هزینه است.

اساساً این نشان دهنده ایده اثربخشی فعالیت های آموزشی در زمینه کنترل دانش است. من می خواهم فکر کنم که هیچ کس نیست و نیازی به اعتراض به این ایده نیست. اگر معلم ما نمی تواند مطالب آموزشی را بدتر از همکار خارجی خود توضیح دهد، پس خوب است که دانش مورد نیاز را بررسی کند، برای همه دانش آموزان، برای همه مطالب مطالعه شده، به دلیل سیستم کلاس-درسی حاکم بر کلاس ها قادر به انجام آن نیست. در کشور ما، فقدان تجهیزات کامپیوتری، آزمون ها و برنامه های سازماندهی خودکنترلی خودکار - انسانی ترین شکل کنترل دانش است. او از نظر فیزیکی نیز قادر به انجام این کار نیست. به دلیل، به بیان ملایم، سیاست اجتماعی نادرست، حقوق معلمان ما مدتهاست که قادر به جبران هزینه حتی انرژی بدنی لازم برای تدریس خوب نبوده است، به غیر از افزایش هزینه انرژی فکری، که فقط می تواند باشد. با تفکری انجام می شود که ممانعتی ندارد و مشغول جستجوی نان نیست. همانطور که در ادبیات ذکر شده است، یک کارگر واجد شرایط سه تا چهار برابر کمتر از سطح حقوق دریافت می کند که پس از آن فعالیت عادی زندگی مختل شده و نابودی پتانسیل کار آغاز می شود.

اگرچه صدها نمونه از تعاریف آزمون در ادبیات وجود دارد که موافقت با آنها یا دشوار یا غیرممکن است، اما این به هیچ وجه به این معنی نیست که این تعریف از آزمون سنتی حقیقت نهایی است. مانند همه مفاهیم دیگر، نیاز به بهبود مداوم دارد. فقط به نظر نویسنده این است که تا کنون بیشتر از برخی دیگر از مفاهیم شناخته شده آزمون آموزشی مستدل است. با این حال، تمایل به بهبود مفاهیم یک پدیده کاملاً عادی و برای توسعه عادی عمل و علم ضروری است. تلاش های سازنده برای ارائه تعاریف دیگر از آزمون یا به چالش کشیدن تعاریف موجود همیشه مفید است، اما این دقیقاً همان چیزی است که ما فاقد آن هستیم.

تست های سنتی شامل تست های همگن و ناهمگن است. یک آزمون همگن سیستمی از وظایف افزایش دشواری، فرم خاص و محتوای خاص است - سیستمی که به منظور روشی عینی، با کیفیت و مؤثر برای ارزیابی ساختار و اندازه گیری سطح آمادگی دانش آموزان در یک دانشگاه ایجاد شده است. انضباط. به راحتی می توان فهمید که در هسته آن، تعریف آزمون همگن با تعریف آزمون سنتی مطابقت دارد.

تست های همگن رایج تر از بقیه هستند. در پداگوژی، آنها برای کنترل دانش در یک رشته دانشگاهی یا در یک بخش از این قبیل، به عنوان مثال، یک رشته دانشگاهی حجیم به عنوان فیزیک ایجاد می شوند. در یک آزمون آموزشی همگن، استفاده از وظایفی که ویژگی های دیگر را نشان می دهد مجاز نیست. حضور دومی ناقض شرط خلوص انضباطی آزمون آموزشی است. از این گذشته، هر آزمایشی چیزی از پیش تعیین شده را اندازه گیری می کند.

به عنوان مثال، آزمونی در فیزیک، دانش، مهارت ها و ادراک آزمون شوندگان را در این علم اندازه گیری می کند. یکی از مشکلات چنین اندازه گیری این است که دانش فیزیکی به شدت با دانش ریاضی همراه است. بنابراین، آزمون فیزیک به طور ماهرانه سطح دانش ریاضی مورد استفاده در حل مسائل فیزیک را مشخص می کند. فراتر رفتن از سطح پذیرفته شده منجر به سوگیری در نتایج می شود. با فراتر رفتن از آنها، این دومی به طور فزاینده ای نه چندان به دانش فیزیک، که به دانش یک علم دیگر، یعنی ریاضیات، وابسته می شود. یکی دیگر از جنبه های مهم، تمایل برخی از نویسندگان برای گنجاندن در آزمون ها نه به اندازه توانایی حل مسائل فیزیکی، آزمون دانش است، و در نتیجه مؤلفه فکری را در اندازه گیری آمادگی در فیزیک درگیر می کند.

آزمون ناهمگن سیستمی از وظایف افزایش دشواری، فرم خاص و محتوای خاص است - سیستمی که به منظور روشی عینی، با کیفیت و مؤثر برای ارزیابی ساختار و اندازه گیری سطح آمادگی دانش آموزان در چندین دانشگاه ایجاد شده است. رشته ها اغلب چنین آزمون هایی شامل وظایف روانشناختی برای ارزیابی سطح رشد فکری نیز می شود.

معمولاً از آزمون‌های ناهمگن برای ارزیابی جامع فارغ‌التحصیلان مدرسه، ارزیابی شخصیت در هنگام درخواست شغل و برای انتخاب آماده‌ترین متقاضیان برای پذیرش در دانشگاه‌ها استفاده می‌شود. از آنجایی که هر آزمون ناهمگن از آزمون های همگن تشکیل شده است، تفسیر نتایج آزمون بر اساس پاسخ به تکالیف هر آزمون (در اینجا مقیاس نامیده می شود) انجام می شود و علاوه بر این، از طریق روش های مختلف تجمیع نمرات، تلاش می شود تا یک ارزیابی کلی از آمادگی آزمون گیرنده ارائه دهد.

به یاد بیاوریم که آزمون سنتی روشی برای تشخیص آزمودنی‌ها است که در آن به تکالیف یکسان، در همان زمان، در شرایط یکسان و با یک امتیاز پاسخ می‌دهند. با این جهت گیری، وظیفه تعیین حجم و ساختار دقیق مطالب آموزشی تسلط یافته، ضرورتاً به پس زمینه می رود. این آزمون حداقل تعداد کافی از کارها را انتخاب می کند که به فرد امکان می دهد به طور نسبی دقیق، به بیان مجازی، نه "چه کسی چه چیزی را می داند" بلکه "چه کسی بیشتر می داند" تعیین کند. تفسیر نتایج آزمون عمدتاً به زبان تست شناسی انجام می شود، بر اساس میانگین حسابی، حالت یا میانه و به اصطلاح هنجارهای صدک، که نشان می دهد چند درصد از آزمودنی ها نتیجه آزمون بدتر از هر موضوعی را دارند که برای آنها انتخاب شده است. تجزیه و تحلیل با نمره آزمون او. این تفسیر را هنجارگرا می نامند. در اینجا نتیجه گیری با رتبه بندی تکمیل می شود: وظایف به نتیجه گیری در مورد دانش رتبه بندی موضوع پاسخ می دهد که به عنوان نتیجه گیری در مورد مکان یا رتبه موضوع درک می شود.

تست های یکپارچه یک آزمون یکپارچه را می توان آزمونی نامید که شامل سیستمی از وظایف است که الزامات محتوای یکپارچه، فرم آزمون و افزایش دشواری وظایف را با هدف تشخیص نهایی عمومی آمادگی فارغ التحصیل یک موسسه آموزشی برآورده می کند. تشخیص با ارائه چنین وظایفی انجام می شود که پاسخ صحیح به آنها نیاز به دانش یکپارچه (تعمیم شده، به وضوح مرتبط) دو یا چند رشته دانشگاهی دارد. ایجاد چنین آزمون هایی فقط برای معلمانی داده می شود که دانش تعدادی از رشته های تحصیلی را داشته باشند، نقش مهم ارتباطات بین رشته ای را در یادگیری درک کرده و قادر به ایجاد تکالیفی باشند که پاسخ صحیح به آنها مستلزم داشتن دانش دانش آموزان در زمینه های مختلف است. رشته ها و توانایی به کارگیری چنین دانشی.

آزمایش یکپارچه با سازماندهی آموزش یکپارچه مقدم است. متأسفانه، شکل کلاس درس فعلی برگزاری کلاس ها، همراه با پراکندگی بیش از حد رشته های دانشگاهی، همراه با سنت تدریس رشته های فردی (به جای دوره های عمومی)، برای مدت طولانی مانع اجرای یک رویکرد یکپارچه در فرآیندها خواهد شد. آمادگی یادگیری و نظارت مزیت آزمون‌های تلفیقی نسبت به آزمون‌های ناهمگن در محتوای اطلاعاتی بیشتر هر کار و تعداد کمتری از خود تکالیف است. با افزایش سطح تحصیلات و تعداد رشته های تحصیلی مورد مطالعه، نیاز به ایجاد آزمون های تلفیقی افزایش می یابد. بنابراین، تلاش برای ایجاد چنین آزمون هایی عمدتاً در آموزش عالی مورد توجه قرار می گیرد. آزمون های یکپارچه به ویژه برای افزایش عینیت و کارایی گواهینامه دولتی نهایی دانش آموزان مفید است.

روش ایجاد آزمون های تلفیقی مشابه روش ایجاد آزمون های سنتی است، به استثنای کار تعیین محتوای وظایف. برای انتخاب محتوای آزمون های تلفیقی، استفاده از روش های خبره الزامی است. این به این دلیل است که فقط کارشناسان می توانند کفایت محتوای وظایف را برای اهداف آزمون تعیین کنند. اما قبل از هر چیز، تصمیم گیری در مورد اهداف آموزش و مطالعه برخی برنامه های آموزشی برای خود متخصصان مهم خواهد بود و سپس در مورد مسائل اساسی بین خود توافق می کنند و برای بررسی تنها تفاوت هایی در درک درجه اهمیت باقی می ماند. عناصر منفرد در ساختار کلی آمادگی یک ترکیب منتخب از متخصصان ادبیات خارجی که در مورد مسائل اساسی مورد توافق قرار گرفته است، اغلب یک پانل است. یا با توجه به تفاوت معنای کلمه آخر در زبان روسی، چنین ترکیبی را می توان یک گروه متخصص نماینده نامید. این گروه به گونه ای انتخاب می شود که به اندازه کافی رویکرد مورد استفاده برای ایجاد آزمون مورد نظر را نشان دهد.

آزمون های تطبیقی امکان سنجی کنترل تطبیقی ​​از نیاز به منطقی کردن آزمایش سنتی ناشی می شود. هر معلمی می‌داند که دانش‌آموزی که به خوبی آماده است نیازی به انجام وظایف آسان یا بسیار آسان ندارد. زیرا احتمال تصمیم گیری درست بسیار زیاد است. علاوه بر این، مواد سبک وزن پتانسیل توسعه قابل توجهی ندارند. به طور متقارن، به دلیل احتمال بالای تصمیم گیری اشتباه، دادن وظایف دشوار به دانش آموز ضعیف فایده ای ندارد. مشخص است که کارهای سخت و بسیار دشوار انگیزه یادگیری را در بسیاری از دانش آموزان کاهش می دهد. لازم بود مقیاسی قابل مقایسه در یک مقیاس برای دشواری کارها و معیاری برای سطح دانش پیدا شود. این معیار در نظریه اندازه گیری آموزشی یافت شد. ریاضیدان دانمارکی G. Rask این اندازه گیری را کلمه "logit" نامید. پس از ظهور رایانه ها، این معیار اساس روش شناسی کنترل دانش تطبیقی ​​را تشکیل داد که از روش هایی برای تنظیم دشواری و تعداد وظایف ارائه شده بسته به پاسخ دانش آموزان استفاده می کند. اگر پاسخ موفقیت آمیز باشد، رایانه کار بعدی را دشوارتر انتخاب می کند، اگر پاسخ ناموفق باشد، کار بعدی آسان تر خواهد بود. طبیعتاً این الگوریتم نیاز به آزمایش اولیه همه کارها، تعیین درجه سختی آنها و همچنین ایجاد بانکی از وظایف و برنامه ویژه دارد.

استفاده از وظایفی که با سطح آمادگی مطابقت دارند به طور قابل توجهی دقت اندازه گیری ها را افزایش می دهد و زمان آزمایش فردی را تقریباً به 5 تا 10 دقیقه به حداقل می رساند. احتمال پاسخ صحیح برای هر دانش آموز

در ادبیات غربی، سه گزینه برای تست تطبیقی ​​متمایز شده است. اولین مورد آزمایش هرمی نام دارد. در غیاب ارزیابی های اولیه، به همه آزمودنی ها وظیفه ای با درجه سختی متوسط ​​داده می شود و تنها پس از آن، بسته به پاسخ، به هر موضوعی کار ساده تر یا دشوارتر داده می شود. در هر مرحله استفاده از قانون تقسیم مقیاس دشواری به نصف مفید است. در گزینه دوم، کنترل با هر سطح دشواری مورد نظر آزمودنی شروع می شود، با رویکرد تدریجی به سطح واقعی دانش. گزینه سوم زمانی است که آزمایش از طریق بانکی از وظایف تقسیم بر سطوح دشواری انجام شود.

بنابراین، یک آزمون تطبیقی ​​نوعی از یک سیستم تست خودکار است که در آن پارامترهای دشواری و توانایی تمایز هر کار از قبل شناخته شده است. این سیستم در قالب یک بانک رایانه ای از وظایف ایجاد شده است که مطابق با ویژگی های وظایف مورد علاقه سفارش داده شده است. مهمترین ویژگی وظایف آزمون تطبیقی ​​سطح دشواری آنها است که به صورت تجربی به دست می آید، به این معنی که: قبل از رسیدن به بانک، هر کار تحت آزمایش تجربی بر روی تعداد کافی از دانش آموزان معمولی جمعیت مورد نظر قرار می گیرد. واژه‌های «مشروط منافع» در اینجا بیانگر معنای دقیق‌تر مفهوم «جمعیت عمومی» شناخته شده در علم است.

الگوی آموزشی گسترده ما از مدرسه تطبیقی ​​E.A. یامبورگ، اساساً از ایده‌های کلی یادگیری تطبیقی ​​و کنترل دانش تطبیقی ​​ناشی می‌شود. خاستگاه این رویکرد را می توان به ظهور آثار آموزشی Comenius، Pestalozzi و Disterweg جستجو کرد که با ایده های انطباق با طبیعت و انسانیت آموزش متحد شدند. دانشجو در مرکز سیستم آموزشی آنها قرار داشت. به عنوان مثال، در اثر کمتر شناخته شده A. Disterweg "قوانین تعلیمی" می توانید کلمات زیر را بخوانید: "تدریس مطابق با طبیعت... آموزش بدون فاصله... شروع تدریس از جایی که دانش آموز متوقف شد... قبل از شروع. تدریس، باید نقطه شروع را بررسی کرد... بدون دانستن اینکه دانش آموز کجا متوقف شده است، نمی توان به درستی به او آموزش داد.» عدم آگاهی از سطح واقعی دانش دانش آموزان و تفاوت های طبیعی در توانایی های آنها در جذب دانش پیشنهادی دلیل اصلی پیدایش سیستم های انطباقی مبتنی بر اصل فردی سازی یادگیری شده است. اجرای این اصل به شکل سنتی و کلاس درس دشوار است.

قبل از ظهور اولین کامپیوترها، معروف ترین سیستم نزدیک به یادگیری تطبیقی، به اصطلاح "سیستم جذب دانش کامل" بود.

آزمون های مبتنی بر معیار با رویکرد معیارمحور، آزمون هایی برای مقایسه دستاوردهای آموزشی هر دانش آموز با میزان دانش، مهارت ها یا توانایی های برنامه ریزی شده ایجاد می شود. در این مورد، یک حوزه محتوایی خاص به جای نمونه خاصی از دانش آموزان به عنوان چارچوب مرجع تفسیری استفاده می شود. تأکید بر این است که دانش آموز چه کاری می تواند انجام دهد و چه می داند، نه اینکه چگونه با دیگران مقایسه می کند.

همچنین با رویکرد معیار محور مشکلاتی وجود دارد. به عنوان یک قاعده، آنها با انتخاب محتوای آزمون همراه هستند. در چارچوب رویکرد مرجع معیار، آزمون سعی می کند کل محتوای درس کنترل شده یا حداقل آنچه را که می توان به عنوان این حجم کامل در نظر گرفت، منعکس کند. درصد انجام صحیح وظایف به عنوان میزان آمادگی یا میزان تسلط بر حجم کل مطالب درسی در نظر گرفته می شود. البته، در چارچوب رویکرد معیارمحور، هر دلیلی برای تفسیر اخیر وجود دارد، زیرا آزمون شامل همه چیزهایی است که می‌توان به صورت مشروط به عنوان 100٪ پذیرفت.

آزمون های مبتنی بر معیار طیف نسبتاً گسترده ای از وظایف را پوشش می دهند. به ویژه، آنها به جمع آوری اطلاعات کامل و عینی در مورد دستاوردهای آموزشی هر دانش آموز به صورت جداگانه و گروهی از دانش آموزان کمک می کنند. مقایسه دانش، مهارت ها و توانایی های دانش آموز با الزامات مندرج در استانداردهای آموزشی دولتی؛ دانش آموزانی را انتخاب کنید که به سطح آمادگی برنامه ریزی شده رسیده اند. ارزیابی اثربخشی فعالیت های حرفه ای معلمان فردی و گروهی از معلمان. ارزیابی اثربخشی برنامه های آموزشی مختلف

تأکید بر رویکرد مبتنی بر محتوا ممکن است تأثیر مفیدی بر آزمون معلمان به عنوان یک کل داشته باشد. این رویکرد، برای مثال، تفسیر نمرات آزمون در حین نظارت مستمر سودمند است. دانش آموز اطلاعاتی را دریافت نمی کند که در مقایسه با دیگران چگونه به نظر می رسد، بلکه در مورد آنچه که می تواند انجام دهد و آنچه می داند در مقایسه با الزامات داده شده برای سطح آموزش در موضوع، اطلاعاتی دریافت می کند. البته، چنین تفسیری ترکیبی با انتساب نتایج به هنجارها را که معمولاً در حین نظارت مستمر دانش دانش آموزان در فرآیند آموزشی روزمره رخ می دهد، رد نمی کند. در این صورت تست زنی با یادگیری ادغام می شود و به دانش آموز کمک می کند تا مشکلات احتمالی را شناسایی کند و همچنین اشتباهات را در تسلط بر محتوای آموزشی به موقع تصحیح کند.

  1. فرم وظایف آزمون

در تست مدرن (Avanesov V.S.، Chelyshkova M.B.، Mayorov A.N.، و غیره) 4 نوع کار در فرم تست وجود دارد: وظایف برای انتخاب یک یا چند پاسخ صحیح، وظایف به صورت باز یا برای اضافه کردن، وظایف برای ایجاد توالی صحیح و وظایف برای ایجاد مکاتبات رایج ترین شکل اول است.

اجازه دهید هر شکل از وظایف را با توجه به طبقه بندی V.S. با جزئیات در نظر بگیریم. آوانسوا.

وظایف برای انتخاب یک یا چند پاسخ صحیح برای تست کامپیوتری دانش مناسب ترین است. تقسیم چنین وظایفی به انواع زیر راحت است: وظایف با دو، سه، چهار، پنج و بیشتر پاسخ. دستورالعمل این شکل از کارها این جمله است: "تعداد پاسخ صحیح را حلقه بزنید (بررسی کنید، نشان دهید).

مثال 1. تعداد پاسخ صحیح را علامت بزنید.

مکانی که یک رقم در یک عدد اشغال می کند نامیده می شود

    موقعیت؛

    تخلیه؛

    موقعیت؛

    آشنایی

تکلیف باید به طور مختصر و واضح فرموله شود، به طوری که معنای آن در اولین خواندن واضح باشد.

محتوای تکلیف تا حد امکان واضح و مختصر تنظیم شده است. ایجاز با انتخاب دقیق کلمات، نمادها، و گرافیک تضمین می‌شود که به حداقل ابزار برای دستیابی به حداکثر وضوح معنای کار اجازه می‌دهد. باید به طور کامل تکرار کلمات، استفاده از کلمات مبهم، به ندرت استفاده می شود و همچنین نمادهای ناشناخته برای دانش آموزان و کلمات خارجی که درک معنی را دشوار می کند، حذف شود. وقتی تکلیف بیش از یک بند فرعی نداشته باشد خوب است.

برای رسیدن به اختصار، بهتر است در هر کار در مورد یک چیز بپرسید. سنگین‌تر کردن کارها با تقاضا برای یافتن چیزی، حل آن و سپس توضیح آن تأثیر منفی بر کیفیت کار دارد، اگرچه از دیدگاه آموزشی درک دلیل این فرمول‌بندی آسان است.

وقتی هم تکلیف و هم پاسخ کوتاه باشد، حتی بهتر است. یک پاسخ نادرست اما قابل قبول در ادبیات آزمون آمریکایی حواس پرتی نامیده می شود (از فعل انگلیسی حواس پرتی - حواس پرتی). به طور کلی، هر چه عوامل حواس پرتی بهتر انتخاب شوند، کار بهتری انجام می شود. استعداد توسعه دهنده در درجه اول خود را در توسعه عوامل حواس پرتی موثر نشان می دهد. معمولاً اعتقاد بر این است که هر چه درصد انتخاب های پاسخ نادرست بیشتر باشد، فرمول بندی بهتری دارد. لازم به ذکر است که این تنها تا حدی صادق است. در جست‌وجوی جذابیت حواس‌پرتی‌ها، اغلب حس تناسب از بین می‌رود. جذابیت هر پاسخ به صورت تجربی آزمایش می شود.

وظایف با انتخاب یک یا چند پاسخ بیشترین انتقاد را دارند. طرفداران رویکردهای مرسوم استدلال می کنند که دانش تنها در فرآیند ارتباط مستقیم با دانش آموز به طور واقعی آزمایش می شود و از او سؤالات روشنی می پرسد، که به روشن شدن بهتر عمق، قدرت و اعتبار دانش کمک می کند. باید با چنین اظهاراتی موافق بود. با این حال، مسائل مربوط به صرفه جویی در نیروی کار معیشتی معلمان و دانش آموزان، صرفه جویی در هزینه های زمانی و مشکل افزایش کارایی فرآیند آموزشی نیز وجود دارد.

اغلب اعتقاد بر این است که یافتن پاسخ مناسب بسیار ساده تر از فرمول بندی آن است. با این حال، در کارهایی که به خوبی انجام می شود، پاسخ های نادرست اغلب برای دانش آموز ناآگاه محتمل تر از پاسخ های صحیح به نظر می رسند. استعداد توسعه دهنده آزمون در فرآیند ایجاد پاسخ های دقیقاً نادرست، اما بسیار قابل قبول آشکار می شود. اعتراض دیگر این است که یک تکلیف تستی با انتخاب یک یا چند پاسخ صحیح فقط برای ارزیابی دانش در سطح به اصطلاح پایین مناسب است.

گونه ای از کارها با انتخاب یکی، صحیح ترین پاسخ از میان موارد پیشنهادی، برجسته شده است. دستورالعمل چنین کارهایی بر این اساس نوشته شده است: "تعداد صحیح ترین پاسخ را دایره بزنید." طبیعتاً فرض بر این است که سایر پاسخ‌ها به تکالیف صحیح هستند، اما به درجات مختلف.

سه دلیل برای معرفی چنین وظایفی در عمل وجود دارد.

اولی ایده قدیمی حذف پاسخ های نادرست از وظایف است که ظاهراً دانش آموزان ضعیف می توانند آن را به خاطر بسپارند. اگر این تز بسیار بحث برانگیز را دنبال کنیم، به هیچ وجه نمی توان پاسخ های نادرستی در طول تست داد.

دلیل دوم برای معرفی چنین وظایفی در عمل واقع بینانه تر است. این به لزوم توسعه در دانش آموزان نه تنها توانایی تشخیص پاسخ های صحیح از پاسخ های نادرست، بلکه همچنین توانایی تمایز اندازه گیری درستی پاسخ ها مربوط می شود. این واقعاً مهم است، چه در آموزش متوسطه عمومی و چه در آموزش عالی حرفه ای.

دلیل سوم استفاده از وظایف با انتخاب صحیح ترین پاسخ، تمایل به استفاده از آنها برای بررسی کامل بودن دانش است.

مهم نیست که دلایل معرفی چنین وظایفی در عمل چقدر قانع کننده باشد، بعید است که دومی کاربرد گسترده ای پیدا کند.

در تکالیف فرم باز، پاسخ های آماده داده نمی شود: آزمون شونده باید خودش آنها را بیاورد یا دریافت کند. گاهی اوقات، به جای اصطلاح "تکلیف فرم باز"، از اصطلاحات "وظایف برای اضافه کردن" یا "وظایف با پاسخ ساخته شده" استفاده می شود. برای یک فرم باز، مرسوم است که از دستورالعمل های متشکل از یک کلمه استفاده کنید: "افزودن".

مثال 2. اضافه کنید.

در سیستم اعداد باینری 10-1=_________.

وظایف اضافی در دو نوع کاملاً متفاوت وجود دارد:

1) با محدودیت های اعمال شده برای پاسخ ها، امکان دریافت که به طور مناسب با محتوا و شکل ارائه تعیین می شود.

2) کارهایی با پاسخی که آزادانه ساخته شده است، که در آن باید یک پاسخ مفصل در قالب یک راه حل کامل برای مسئله تنظیم کرد یا در قالب یک مقاله خرد پاسخ داد.

در کارهای با محدودیت، از قبل مشخص می شود که چه چیزی به وضوح پاسخ صحیح در نظر گرفته می شود و درجه کامل بودن پاسخ تعیین می شود. معمولاً بسیار کوتاه است - یک کلمه، عدد، نماد و غیره. گاهی اوقات - طولانی تر، اما از دو یا سه کلمه تجاوز نمی کند. به طور طبیعی، اختصار تنظیم شده پاسخ ها الزامات خاصی را برای دامنه کاربرد مطرح می کند، بنابراین وظایف نوع اول عمدتاً برای ارزیابی طیف نسبتاً محدودی از مهارت ها استفاده می شود.

یکی از ویژگی های متمایز وظایف با محدودیت در پاسخ های تکمیلی این است که آنها باید فقط یک پاسخ صحیح را ایجاد کنند که توسط توسعه دهنده برنامه ریزی شده است.

وظایف نوع دوم با پاسخ آزادانه هیچ محدودیتی در محتوا و شکل ارائه پاسخ ها ندارند. برای مدت معینی دانش آموز می تواند هر چه و هر طور که می خواهد بنویسد. با این حال، تدوین دقیق چنین وظایفی مستلزم وجود استانداردی است که معمولاً صحیح ترین پاسخ با ویژگی ها و نشانه های کیفیتی است که آن را توصیف می کند.

در تکالیف برای ایجاد مکاتبات، معلم دانش ارتباط بین عناصر دو مجموعه را بررسی می کند. عناصر برای مقایسه در دو ستون نوشته می‌شوند: در سمت چپ معمولاً عناصر مجموعه تعریف‌کننده حاوی بیانیه مشکل و در سمت راست عناصری هستند که باید انتخاب شوند.

دستورالعمل های استاندارد به وظایف داده می شود: "مطابقت را مطابقت دهید."


مثال 3: مطابقت

الف ب ج) - _____________.

لازم به ذکر است که مطلوب است که عناصر در ستون سمت راست بیشتر از سمت چپ باشد. در این وضعیت، مشکلات خاصی در ارتباط با انتخاب عناصر اضافی قابل قبول به وجود می آید. گاهی اوقات برای یک عنصر از مجموعه سمت چپ لازم است چندین پاسخ صحیح از ستون سمت راست انتخاب شود. علاوه بر این، مکاتبات را می توان به سه یا چند مجموعه افزایش داد. اگر گزینه های غیرقابل قبول حتی توسط دانش آموزان ناآگاه به راحتی تشخیص داده شوند، اثربخشی کار به میزان قابل توجهی کاهش می یابد.

در مواردی که تعداد عناصر در ستون‌های چپ و راست یکسان است و هنگام ایجاد تطابق برای آخرین عنصر سمت چپ، چیزی برای انتخاب وجود ندارد، اثربخشی کار نیز کاهش می‌یابد. آخرین تطابق صحیح یا نادرست به طور خودکار با حذف متوالی عناصر برای مسابقات قبلی ایجاد می شود.

وظایف آزمون برای ایجاد توالی صحیح برای ارزیابی سطح مهارت در توالی اقدامات، فرآیندها و غیره طراحی شده است. در وظایف، اقدامات، فرآیندها و عناصر مربوط به یک کار خاص به ترتیب دلخواه و تصادفی ارائه می شوند. دستورالعمل های استاندارد برای این کارها به شرح زیر است: "توالی صحیح اقدامات را ایجاد کنید."

مثال 4: دنباله را درست دریافت کنید

دستور شعبه کامل در UAY فرمت زیر را دارد:

    در غیر این صورت<серия 2>

    که<серия 1>

    اگر<условие>

وظایف مربوط به ایجاد توالی صحیح از حمایت دوستانه بسیاری از معلمان برخوردار است که با نقش مهم الگوریتم های تفکر و فعالیت منظم توضیح داده می شود.

هدف از ورود چنین وظایفی به فرآیند آموزشی، شکل‌گیری تفکر الگوریتمی، دانش، مهارت‌ها و توانایی‌های الگوریتمی است.

تفکر الگوریتمی را می توان به عنوان یک توانایی فکری تعریف کرد که در تعیین بهترین توالی اقدامات هنگام حل مسائل آموزشی و عملی خود را نشان می دهد. نمونه‌های بارز چنین تفکری، انجام موفقیت‌آمیز وظایف مختلف در زمان کوتاه، توسعه مؤثرترین برنامه رایانه‌ای و غیره است.

انتخاب فرم‌های کار توسط بسیاری از عوامل بسیار متناقض، از جمله ویژگی‌های محتوا، اهداف آزمون و همچنین ویژگی‌های جامعه آزمون تعیین می‌شود. بررسی در هنگام استفاده از وظایف فرم بسته آسان تر است، با این حال، چنین کارهایی اطلاعات کمتری دارند. وظایف فرم باز آموزنده تر هستند، اما سازماندهی تأیید آنها دشوارتر است. یک کار حتی دشوارتر، ایجاد برنامه های رایانه ای برای بررسی صحت پاسخ به چنین وظایفی است. این به دلیل غنای واژگان آزمودنی ها (در هنگام پاسخ دادن می توان از مترادف ها استفاده کرد)، توجه (اشتباهات تایپی، عدم تطابق حروف کوچک) و غیره است.

برای پیمایش موفقیت آمیز در فرم های کار، می توانید از یک جدول ویژه (به جدول 1 مراجعه کنید) برای تجزیه و تحلیل مقایسه ای وظایف، پیشنهاد شده توسط M.B. استفاده کنید. چلیشکووا.

به گفته توسعه دهنده، این جدول صرفاً نشانگر است؛ با این حال، استفاده از آن می تواند روند انتخاب موارد آزمایشی از اشکال مختلف را برای حل مشکلات تشخیصی خاص تسهیل کند.


میز 1

تجزیه و تحلیل مقایسه ای ویژگی های تکلیف آزمون

ویژگی ها وظایف فرم بسته وظایف تکمیلی وظایف انطباق توالی وظایفبررسی دانش خود از حقایق Passable Passable Passable Passableکاربرد دانش بر اساس مدل Passed Pass Passedکاربرد دانش در شرایط غیر استاندارد نامناسب قابل قبول نامناسب قابل قبولسهولت طراحی بله بله خیر خیرحدس زدن استثنا مستثنی نشدن مستثنی نشدن مستثنی نشدن مستثنی نشدعینیت ارزیابی بله خیر بله بلهحذف غلط املایی خیر بله خیر خیرامکان پاسخ اصلی خیر بله بله/خیر خیر

انطباق تکالیف در فرم آزمون با الزامات صحت آموزشی محتوا و فرم شرط لازم اما کافی نیست تا آنها را تست نامید.

تبدیل وظایف در فرم آزمایشی به وظایف آزمایشی از لحظه تأیید آماری هر کار برای وجود ویژگی های تشکیل دهنده آزمون آغاز می شود.

  1. تایید تجربی و پردازش آماری نتایج

وجود تعداد کافی از وظایف آزمون به ما اجازه می دهد تا به سمت توسعه آزمون به عنوان یک سیستم با یکپارچگی، ترکیب و ساختار حرکت کنیم. در مرحله سوم، وظایف انتخاب شده و آزمون ها ایجاد می شود، کیفیت و اثربخشی آزمون بهبود می یابد.

یکپارچگی آزمون با رابطه بین پاسخ های آزمون شوندگان به وظایف آزمون و وجود یک عامل قابل اندازه گیری مشترک که بر کیفیت دانش تأثیر می گذارد، شکل می گیرد.

ترکیب آزمون انتخاب صحیح وظایف را تشکیل می دهد و به حداقل تعداد مورد نیاز اجازه می دهد تا عناصر اساسی صلاحیت زبان شرکت کنندگان در آزمون را منعکس کند.

سطح و ساختار دانش با تجزیه و تحلیل پاسخ های هر آزمون شونده به همه موارد آزمون آشکار می شود. هر چه پاسخ های صحیح بیشتر باشد، نمره آزمون انفرادی آزمودنی ها بیشتر می شود. به طور معمول، این نمره آزمون با مفهوم "سطح دانش" همراه است و بر اساس یک یا مدل دیگری از اندازه گیری آموزشی تحت یک روش شفاف سازی قرار می گیرد. با پاسخ دادن به وظایف مختلف می توان به همان سطح دانش دست یافت. به عنوان مثال، در یک آزمون سی ماده، آزمودنی ده امتیاز دریافت کرد. این امتیازها به احتمال زیاد از طریق پاسخ های صحیح به ده کار نسبتا آسان اول به دست می آیند. دنباله یک ها و سپس صفرهای ذاتی در چنین حالتی را می توان ساختار صحیح آمادگی سوژه نامید. اگر عکس مقابل آشکار شود، زمانی که آزمودنی به وظایف دشوار به درستی و به کارهای آسان به اشتباه پاسخ می دهد، این با منطق آزمون در تضاد است و بنابراین می توان چنین مشخصات دانشی را وارونه نامید. به ندرت و اغلب به دلیل خطای آزمون رخ می دهد که در آن وظایف بر خلاف الزامات افزایش دشواری مرتب می شوند. به شرطی که آزمون به درستی انجام شود، هر پروفایل نشان دهنده ساختار دانش است. این ساختار را می توان ابتدایی نامید (چون ساختارهای عاملی نیز وجود دارد که با استفاده از روش های تحلیل عاملی شناسایی می شوند).

برای تعیین سطح آمادگی ساختاری، می‌توانید از ضریب L. Gutman استفاده کنید، که قبلاً به‌طور نادرست معیاری برای «پایایی آزمون» نامیده می‌شد.


که در آن r g ضریب ساختاری؛.

سطح دانش تا حد زیادی به تلاش ها و توانایی های شخصی بستگی دارد، در حالی که ساختار دانش به طور قابل توجهی به سازماندهی صحیح فرآیند آموزشی، به فردی سازی آموزش، به مهارت معلم، به عینیت کنترل بستگی دارد - به طور کلی، در مورد همه چیزهایی که معمولاً کمبود دارند. مسیر دستیابی به این ایده آل از طریق دشواری های ایجاد آزمون های کیفی می گذرد.

توسعه آزمون ها با تجزیه و تحلیل محتوای دانش تدریس شده و تسلط بر اصول تدوین وظایف آزمون آغاز می شود. متأسفانه، هنوز به آزمون ها به عنوان چیزی که به راحتی می توان به آن دست یافت، نگاه می شود، در حالی که نقطه قوت آزمون ها اثربخشی آنها است که از اعتبار نظری و تجربی ناشی می شود.

در مرحله سوم، توسعه دهندگان نسل جدید آزمون ها به برخی آموزش های ریاضی و آماری و دانش تئوری آزمون نیاز خواهند داشت. تئوری آزمون را می توان به عنوان مجموعه ای از مفاهیم، ​​اشکال، روش ها، بدیهیات، فرمول ها و عبارات ثابت تعریف کرد که به بهبود کارایی و کیفیت فرآیند آزمون کمک می کند. علاوه بر این، ممکن است کمی تجربه در استفاده از روش های تحلیل آماری چند متغیره و تجربه در تفسیر صحیح نتایج آزمون مورد نیاز باشد.

اغلب این سؤال مطرح می شود: "تظلمات حذف شده در گروه های دیگر موضوعات چگونه رفتار می کنند؟" پاسخ به کیفیت انتخاب گروه ها یا به طور دقیق تر به طرح آماری برای تشکیل جمعیت های نمونه بستگی دارد. پاسخ صحیح به این سوال را باید در مفهوم «گروه هدف» جستجو کرد. این مجموعه ای از آزمودنی ها در جمعیتی است که آزمون در حال توسعه برای آنها در نظر گرفته شده است.

بر این اساس، اگر وظایف آزمون طراحی‌شده در گروه‌های مختلف رفتار متفاوتی داشته باشد، به احتمال زیاد این نشانه‌ای از خطا در شکل‌گیری نمونه‌های آزمودنی است. دومی باید به اندازه افراد در گروه هدف همگن باشد. در زبان آماری به این معنی است که آزمودنی های گروه هدف و آزمایش باید از یک جامعه عمومی باشند.

تخمین‌های لگاریتمی، که لاجیت نامیده می‌شوند، از پدیده‌های به ظاهر واقعاً متفاوتی مانند سطح دانش موضوع با سطح دشواری هر کار، برای مقایسه مستقیم سطح دشواری با سطح آمادگی موضوع مورد استفاده قرار گرفتند.

به گفته Bespalko V.P. و Tatur Yu.G.، آزمون باید اندازه گیری کیفیت جذب دانش، مهارت ها و توانایی ها باشد. مقایسه قوانین تکمیل یک کار (وظیفه) ارائه شده در متن با پاسخ استاندارد به ما امکان می دهد ضریب جذب دانش (K us) را تعیین کنیم. لازم به ذکر است که در آن A تعداد پاسخ های صحیح و P تعداد وظایف در تست های پیشنهادی است.

تعریف K us عملیاتی برای سنجش کیفیت اکتساب دانش است. K ما را می توان عادی کرد (0< К us < 1), процедура же контроля усвоения легко автоматизируется. По коэффициенту судят о завершенности процесса обучения: если К us >0.7، سپس فرآیند یادگیری را می توان کامل در نظر گرفت. هنگامی که دانش آموز با K ما 0.7 ≤ تسلط پیدا می کند، به طور سیستماتیک در فعالیت های حرفه ای خود اشتباه می کند و به دلیل ناتوانی در یافتن آنها قادر به تصحیح آنها نیست. حد پایین قابل قبول برای تکمیل فرآیند آموزش به مقدار لازم از نقطه نظر ایمنی عملیاتی افزایش می یابد.

  1. اصول انتخاب محتوا معیارهای ارزیابی محتوای آزمون

هنگام ایجاد یک آزمون، توجه توسعه دهنده در درجه اول به موضوعات انتخاب محتوا جلب می شود که می تواند به عنوان بازتاب بهینه محتوای یک رشته دانشگاهی در سیستم وظایف آزمون تعریف شود. لازمه بهینه بودن، استفاده از یک روش انتخاب معین، از جمله مسائل مربوط به هدف گذاری، برنامه ریزی و ارزیابی کیفیت محتوای آزمون را پیش فرض می گیرد.

مرحله تعیین هدف دشوارترین و در عین حال مهمترین است: کیفیت محتوای آزمون در درجه اول به نتایج اجرای آن بستگی دارد. در فرآیند تعیین هدف، معلم باید تصمیم بگیرد که چه نتایج دانش آموزی را می خواهد با استفاده از آزمون ارزیابی کند.

دلایل اشتباهات در نتیجه گیری معلم همیشه به کاستی های تکنولوژیکی ابزارهای سنتی کنترل مربوط نمی شود. گاهی اوقات ناشی از کاستی های معلم در مرحله هدف گذاری است، زمانی که مرکز ثقل آزمون به اهداف یادگیری ثانویه تغییر می کند، و گاهی اوقات مرحله هدف گذاری به کلی غایب است، زیرا برخی از معلمان به خطاناپذیری آن اطمینان دارند. تجربه و شهود آنها، به خصوص اگر سال ها در مدرسه کار کرده باشند. با این حال، تا زمانی که به تنظیم صحیح اهداف کنترلی و نمایش صحیح و بی طرفانه آنها در محتوای آزمون اطمینان حاصل نشود، هیچ روش کنترلی حتی بسیار پیشرفته و هیچ تجربه ای زمینه ای برای نتیجه گیری قابل اعتماد در مورد دستیابی به اهداف یادگیری فراهم نمی کند.

هنگام ایجاد یک آزمون، وظیفه این است که در محتوای آن چیزی که دانش آموزان در نتیجه یادگیری باید بدانند منعکس شود، بنابراین نمی توان خود را به یک فهرست ساده از اهداف یادگیری محدود کرد. من می خواهم همه چیز را در آزمون لحاظ کنم، اما، متأسفانه، این غیرممکن است، بنابراین برخی از اهداف باید به سادگی کنار گذاشته شوند و میزان دستیابی دانش آموزان به آنها بررسی نشود. برای از دست ندادن مهم ترین چیز، باید اهداف را ساختار داد و سلسله مراتب خاصی را در آرایش نسبی آنها معرفی کرد. بدون شک، دستور العمل های عمومی آماده وجود ندارد و نمی تواند وجود داشته باشد، زیرا هر رشته اولویت های خاص خود را دارد. علاوه بر این، اهداف فردی به طور قابل توجهی به هم مرتبط هستند، و بنابراین یک ایده ساده از یک سیستم از اهداف به عنوان یک مجموعه منظم بدون در نظر گرفتن ارتباطات بین عناصر به وضوح کافی نیست.

پس از تعیین و مشخص شدن اهداف آزمون، باید یک برنامه آزمایشی و مشخصات آن تدوین شود.

هنگام تدوین یک طرح، تقسیم تقریبی درصد محتوای بخش ها انجام می شود و تعداد وظایف مورد نیاز برای هر بخش از رشته بر اساس اهمیت بخش و تعداد ساعات اختصاص یافته برای مطالعه آن در بخش تعیین می شود. برنامه

طرح با محاسبه تعداد اولیه برنامه ریزی شده از وظایف در آزمون آغاز می شود، که پس از آن به طور مکرر در جهت افزایش یا کاهش در طول فرآیند کار بر روی آزمون تغییر می کند. به طور معمول، حداکثر تعداد از 60 - 80 کار تجاوز نمی کند، زیرا زمان تست در محدوده 1.5 - 2 ساعت انتخاب می شود و به طور متوسط ​​بیش از 2 دقیقه برای تکمیل یک کار اختصاص داده نمی شود.

پس از اتمام مرحله اول برنامه ریزی محتوا، یک مشخصات آزمون تهیه می شود که ساختار، محتوای آزمون و درصد وظایف در آزمون را مشخص می کند. گاهی اوقات مشخصات به صورت دقیق ساخته می شود که حاوی نشانه هایی از نوع وظایفی است که برای ارزیابی دستاوردهای دانش آموز مطابق با اهداف مورد نظر از ایجاد آزمون، زمان اتمام آزمون، تعداد وظایف، ویژگی های آزمون که ممکن است تأثیر بگذارد، استفاده می شود. ویژگی های آزمون و غیره

مشخصات به صورت توسعه یافته شامل موارد زیر است:

    هدف از ایجاد آزمون، توجیه انتخاب رویکرد برای ایجاد آن، شرح زمینه های احتمالی استفاده از آزمون.

    فهرستی از اسناد هنجاری مورد استفاده در هنگام برنامه ریزی محتوای آزمون؛

    شرح ساختار کلی آزمون، از جمله فهرستی از خرده آزمون ها (در صورت وجود) که رویکردهای توسعه آنها را نشان می دهد.

    تعداد وظایف اشکال مختلف، نشان دهنده تعداد پاسخ به وظایف بسته، تعداد کل وظایف در آزمون.

    تعداد گزینه های تست موازی یا پیوند به یک خوشه حاوی تعداد و تعداد وظایف خوشه.

    نسبت وظایف در بخش های مختلف و انواع فعالیت های آموزشی دانش آموزان.

    پوشش الزامات استاندارد (برای آزمون های گواهینامه)؛

    لیست الزاماتی که در آزمون گنجانده نشده است (برای آزمون های صدور گواهینامه)؛

دانش و مهارت به شرح زیر تقسیم می شود:

الف - دانش مفاهیم، ​​تعاریف، اصطلاحات.

ب – آگاهی از قوانین و فرمولها.

ج – توانایی اعمال قوانین و فرمول ها برای حل مسائل.

د - توانایی تفسیر نتایج بر روی نمودارها و نمودارها.

E – توانایی قضاوت ارزشی.

نسبت های زیر اغلب ایجاد می شود:


A - 10٪، B - 20٪، C - 30٪، D - 30٪، E - 10٪.

علاوه بر معیارها، اصول کلی وجود دارد که تا حدودی به انتخاب صحیح محتوای آزمون کمک می کند.

اصل نمایندگی نه تنها کامل بودن نمایش، بلکه اهمیت عناصر محتوایی آزمون را نیز تنظیم می کند. محتوای تکالیف باید به گونه ای باشد که بتوان از پاسخ آنها برای نتیجه گیری در مورد دانش یا ناآگاهی از کل برنامه بخش یا دوره مورد آزمایش استفاده کرد.

اصل سازگاری شامل انتخاب عناصر محتوایی است که الزامات سازگاری را برآورده می کند و توسط ساختار کلی دانش به هم مرتبط هستند. اگر اصل سازگاری رعایت شود، می توان از آزمون نه تنها برای شناسایی میزان دانش، بلکه برای ارزیابی کیفیت ساختار دانش دانش آموزان استفاده کرد.

پس از انتخاب محتوای آزمون، مهم ترین مرحله ایجاد وظایف پیش آزمون آغاز می شود. این کار معمولاً به مجرب ترین معلمان با تجربه زیاد در مدرسه سپرده می شود. با این حال، تجربه به تنهایی برای ایجاد وظایف کافی نیست. دانش ویژه در مورد تئوری و روش شناسی توسعه آزمون های آموزشی نیز مورد نیاز است و یک رویکرد حرفه ای برای ایجاد وظایف پیش آزمون ارائه می دهد.

در مقابل. آوانسوف 3 معیار را برای انتخاب محتوای وظایف آزمون شناسایی کرد:

1) اطمینان از محتوای آزمون؛

2) سازگاری محتوای وظایف؛

3) اعتبار محتوای وظایف آزمون.

1. قطعیت محتوای آزمون موضوع سنجش تربیتی را تشکیل می دهد. در مورد یک آزمون همگن، این سؤال مطرح می شود که اطمینان حاصل شود که همه آیتم های آزمون دانش را در یک رشته دانشگاهی خاص مورد آزمایش قرار می دهند و نه در رشته های دیگر. اغلب اتفاق می افتد که پاسخ صحیح به برخی از کارها نه تنها به دانش رشته مورد علاقه، بلکه همچنین از تعدادی دیگر، معمولاً مرتبط و رشته های قبلی دانشگاهی نیاز دارد. نزدیکی و ارتباط آنها تعیین دقیق موضوع دانش مورد سنجش را دشوار می کند.

به عنوان مثال در محاسبات فیزیکی از دانش ریاضی زیادی استفاده می شود و بنابراین ریاضیاتی که در حل مسائل فیزیکی استفاده می شود معمولاً در سیستم دانش فیزیکی گنجانده می شود. شکست در محاسبات ریاضی منجر به شکست در پاسخگویی به موارد تست فیزیک می شود. بر این اساس، برای ناآگاهی از فیزیک، نمره منفی داده می شود، اگرچه آزمودنی اشتباهات ریاضی داشت. اگر چنین آزمونی شامل بسیاری از وظایف باشد که برای حل صحیح، به دانش فیزیکی نه به اندازه توانایی انجام محاسبات پیچیده نیاز دارند، در این صورت این ممکن است نمونه ای از محتوای نادرست تعریف شده یک تست فیزیک باشد. هر چه همپوشانی بین دانش یک رشته دانشگاهی و دانش دیگری کمتر باشد، محتوای رشته دانشگاهی با وضوح بیشتری در آزمون بیان می شود. مشخص بودن محتوا در سایر آزمون ها الزامی است. در یک آزمون ناهمگن، این امر با تفکیک صریح وظایف از یک رشته دانشگاهی در یک مقیاس جداگانه به دست می آید. در عین حال، اغلب وظایفی وجود دارد که نه تنها در یک، بلکه در مقیاس های دو، سه و حتی بیشتر به خوبی کار می کنند.

در هر تکلیف تستی، از قبل مشخص می شود که چه چیزی به وضوح پاسخ تکلیف محسوب می شود و پاسخ صحیح باید با چه درجه ای از کامل بودن باشد. تعریف یک مفهوم با فهرست کردن عناصری که در آن گنجانده نشده اند مجاز نیست.

2. قوام محتوای تکالیف مستلزم آن است که قضاوت هایی که همزمان آن را تأیید و نفی می کنند، در مورد یک فکر مطرح نشوند. وجود دو پاسخ انحصاری برای یک آیتم آزمایشی غیر قابل قبول است. اگر به شرکت کنندگان در آزمون دستور داده شود که «عدد پاسخ صحیح را دایره بکشند» و سپس یکی از پاسخ ها بیان کند که پاسخ صحیحی وجود ندارد، این امر نمونه ای از ناهماهنگی در تفکر طراح آزمون ایجاد می کند. در برخی از آزمون ها پاسخ هایی وجود دارد که اصلاً به محتوای تکلیف مربوط نمی شود. چنین پاسخ هایی به راحتی توسط آزمودنی ها اشتباه تشخیص داده می شوند و بنابراین آزمون بی اثر می شود. برای افزایش کارایی، آزمون ابتدا بر روی یک نمونه معمولی از افراد آزمایش می شود. و اگر چنین پاسخ هایی به وظایفی که آزمودنی ها اصلاً انتخاب نمی کنند کشف شود، آنگاه چنین پاسخ هایی از آزمون حذف می شوند. زیرا آنها عملکرد به اصطلاح حواس پرتی را که برای منحرف کردن توجه افراد ناآگاه از پاسخ صحیح طراحی شده اند، انجام نمی دهند. علاوه بر این، چنین حواس‌پرتی‌هایی برای تست مضر هستند، زیرا دقت اندازه‌گیری‌ها را کاهش می‌دهند (اما این در مقالاتی که در آن مسائل مربوط به قابلیت اطمینان تست مورد بحث قرار خواهد گرفت، مورد بحث قرار خواهد گرفت).

3. اعتبار محتوای آیتم های آزمون به این معنی است که آنها مبنایی برای صدق دارند. اعتبار مربوط به استدلال هایی است که می توان به نفع یک یا آن فرمول بندی آیتم های آزمایشی ارائه کرد. در صورتی که دلایل اثباتی به نفع صحت تکلیف تدوین شده وجود نداشته باشد، به هیچ بهانه ای در آزمون لحاظ نمی شود. همین اتفاق می افتد اگر در طول بحث کارشناسی حداقل یک استدلال متقابل مطرح شود، یا شرطی مجاز باشد که تحت آن ممکن است یک عبارت معین مبهم یا نادرست باشد. همانطور که قبلاً در مقاله قبلی مورد بحث قرار گرفت، ایده اعتبار محتوای آزمون با اصل صحت محتوایی موارد آزمون در هم تنیده است. به یاد بیاوریم که آزمون فقط شامل آن محتوایی از رشته دانشگاهی است که از نظر عینی درست است و خود را به برخی استدلال های عقلانی می رساند. بر این اساس، دیدگاه های بحث برانگیز که در علم کاملاً قابل قبول است، در محتوای تکالیف آزمون توصیه نمی شود.

نادرستی محتوای آیتم های آزمایشی با نادرستی فرمول بندی آنها متفاوت است. همانطور که در بالا ذکر شد، نادرستی با پاسخ مربوطه مشخص می شود، در حالی که یک تکلیف فرموله شده نادرست می تواند پاسخ های صحیح و نادرست را ایجاد کند و حتی باعث سردرگمی شود. این همچنین شامل وظایفی است که به طور نادرست یا مبهم فرموله شده اند که چندین پاسخ صحیح یا مشروط درست را ایجاد می کنند. از این رو نیاز به معرفی شرایط صدق اضافی وجود دارد که خود کار را طولانی می کند و معنایی آن را پیچیده می کند. نادرست بودن فرمول بندی معمولاً در فرآیند بحث در مورد محتوای تکالیف با معلمان متخصص با تجربه روشن می شود. موفقیت چنین بحثی با ایجاد فضای فرهنگی مناسب که در آن تنها قضاوت سازنده و درایتی قابل قبول باشد امکان پذیر است. افسوس، تجربه ما را متقاعد می کند که این اغلب اتفاق نمی افتد. در همین حال، تنها بحث مشترک و دوستانه در مورد مواد توسط توسعه دهندگان و کارشناسان می تواند فضای جستجوی بهترین گزینه ها برای محتوای آزمایشی را ایجاد کند. این جستجو تقریباً بی پایان است و هیچ حقیقت نهایی در اینجا وجود ندارد.

  1. رابطه بین شکل تکلیف و نوع دانش، مهارت ها و توانایی های مورد آزمایش

همانطور که در مقالات قبلی ذکر شد، برای اهداف آزمایشی، دانش را می توان به سه نوع ارائه شده، اکتسابی و آزمایش شده تقسیم کرد. حال اجازه دهید این موضوع را با جزئیات بیشتری بررسی کنیم.

دانش ارائه شده در قالب کتاب های درسی، مطالب، متون، سخنرانی ها، داستان ها و غیره به دانش آموزان داده می شود که بخش اصلی برنامه آموزشی را منعکس می کند. این دانش همچنین در سیستمی از وظایف فرموله می شود که بر اساس آن خود دانش آموزان می توانند میزان آمادگی خود را بررسی کنند.

دانش کسب شده توسط دانش آموزان معمولاً تنها بخشی از دانش ارائه شده است، کم و بیش، بسته به فعالیت یادگیری دانش آموزان. با توسعه آموزش کامپیوتر، شرایطی فراهم شده است که حجم دانش کسب شده از حجم دانش ارائه شده بیشتر شود. این وضعیت جدیدی است که با امکان غوطه ور شدن انبوه دانش آموزان در فضای آموزشی جهانی همراه است، که در آن نقش اصلی وظایف در فرآیند کسب دانش به خوبی درک شده است. حل تکالیف آموزشی مشوق اصلی برای تشدید یادگیری و فعالیت های خود دانش آموزان است. این فعالیت می تواند به صورت کار با معلم، گروهی یا به صورت مستقل انجام شود. بحث در مورد سطوح جذب رایج در ادبیات منحصراً به دانش اکتسابی اشاره دارد.

دانشی که مورد آزمایش قرار می گیرد محتوای اصلی سند را تشکیل می دهد که بسته به شکل انتخابی کنترل دانش، ممکن است برنامه آزمون یا آزمون نامیده شود. ویژگی اصلی دانش مورد آزمایش مربوط بودن آن است، که به معنای آمادگی آزمودنی ها برای کاربرد عملی دانش برای حل تکالیف مورد استفاده در زمان آزمون است. در آموزش عالی گاهی اوقات به همین ویژگی کارآمدی دانش گفته می شود.

در فرآیند تست دانش آموزان و متقاضیان، معمولاً فقط دانشی که در حافظه RAM است مورد آزمایش قرار می گیرد که نیازی به مراجعه به کتاب های مرجع، فرهنگ لغت، نقشه ها، جداول و غیره نباشد. در میان دانش های مورد آزمایش، می توان دانش هنجاری را نیز برجسته کرد که مشروط به جذب اجباری توسط دانش آموزان و کنترل بعدی توسط مقامات آموزشی از طریق سیستم تکالیف، وظایف و سایر مواد کنترلی توسط هیئت حاکمه انتخاب شده و تایید شده است.

علاوه بر این، ویژگی های دانش برجسته می شود. در و. ژینتسینسکی ویژگی های زیر دانش را شناسایی می کند:

 بازتاب (من نه تنها چیزی را می دانم، بلکه می دانم که آن را می دانم).

 گذرا (اگر من بدانم که کسی چیزی را می داند، پس نتیجه می شود که من این چیزی را می دانم).

 ضد تقارن (اگر کسی را می شناسم به این معنی نیست که او مرا می شناسد).

طبقه بندی انواع و سطوح دانش

طبقه بندی انواع و سطوح دانش فرموله شده توسط بلوم برای حل مسائل عملی اندازه گیری آموزشی.

    آگاهی از نام ها. سقراط می‌گوید: هر که اسم‌ها را بفهمد، می‌فهمد که این اسم‌ها متعلق به چه چیزی است. همانطور که فیلسوف معروف خارجی جی. آستین اشاره می کند، شناخت یک شی یا پدیده تا حد زیادی با دانستن نام آن، یا دقیق تر، نام صحیح آن تعیین می شود.

    دانستن معنای عناوین و اسامی. از قدیم شناخته شده است که همانطور که می فهمیم، عمل می کنیم. درک معنای نام ها و عناوین کمک می کند تا آنها را به خاطر بسپارید و به درستی استفاده کنید. به عنوان مثال، با نام "بایکال" برخی از دانش آموزان مقطع راهنماییشاید به دریاچه معروف، مروارید روسیه فکر نکنید، بلکه به آب میوه ای که به همین نام فروخته می شود فکر کنید. مثال دیگر را می توان از حوزه آگاهی سیاسی گرفت. همانطور که Yu.N به درستی در کتاب خود اشاره می کند. آفاناسیف، A.S. استروگانف و اس.جی. شخوفتسف، معلوم شد که آگاهی مردم شوروی سابق با در نظر گرفتن معانی مختلف انتزاعات زبانی مانند "آزادی"، "قدرت"، "دموکراسی"، "دولت"، "مردم"، "جامعه" قادر به دیدن آنها نیست. به طور پیش فرض واضح است. این یکی از دلایلی بود که باعث شد با همدستی فعال این افراد، سیستم حمایت زندگی خودشان را نابود کنند.

    دانش واقعی. دانستن حقایق به شما امکان می دهد از تکرار اشتباهات خود و دیگران اجتناب کنید و پایگاه شواهد دانش را غنی کنید. آنها اغلب در قالب متون علمی، نتایج مشاهدات، توصیه هایی مانند اقدامات احتیاطی، حکمت دنیوی، گفته ها، گفته ها ثبت می شوند. به عنوان مثال، از چین باستان گفته متفکر چینی جو شی آمده است: به امید بدست آوردن فرنی ماسه را نجوشانید.

    آشنایی با تعاریف ضعیف ترین نقطه در آموزش مدرسه این است که تعاریف را نمی توان آموزش داد. آنها را می توان تنها در نتیجه تلاش مستقل برای تسلط بر مفاهیم مورد نیاز درک و جذب کرد. دانش سیستم تعریف یکی از بهترین شواهد آمادگی نظری است. در فرآیند آموزشی، هر چهار نوع دانش در نظر گرفته شده را می توان در گروهی از دانش تولید مثلی ترکیب کرد. همانطور که توسط I.Ya اشاره شده است. لرنر، در طول سال های تحصیل، دانش آموزان بیش از 10 هزار کار را انجام می دهند. معلم مجبور است فعالیت تولیدمثلی را سازماندهی کند که بدون آن محتوا در ابتدا جذب نمی شود.

این دانشی است که هنگام جذب نیازی به دگرگونی قابل توجهی ندارد و بنابراین به همان شکلی که در آن درک شده است بازتولید می شود. با برخی قراردادها می توان آنها را دانش سطح اول نامید.

    دانش تطبیقی، تطبیقی. آنها در عمل و در علم گسترده هستند و عمدتاً مشخصه افراد دارای رشد فکری، به ویژه متخصصان هستند. آنها قادر به تجزیه و تحلیل و انتخاب بهترین گزینه ها برای دستیابی به یک هدف خاص هستند. همانطور که N. Kuzansky اشاره کرد، "همه محققین ناشناخته را با مقایسه ای متناسب با چیزی که قبلا آشنا هستند قضاوت می کنند، بنابراین همه چیز در مقایسه مورد مطالعه قرار می گیرد."

    شناخت اضداد، تضادها، متضادها و غیره. اشیاء. چنین دانشی در آموزش، به ویژه در همان ابتدا، ارزشمند است. در برخی زمینه ها، چنین دانشی ضروری است. به عنوان مثال، در یک دوره آموزشی ایمنی زندگی در مدرسه، شما باید بدانید که دانش آموزان تحت هر شرایطی دقیقاً چه کاری می توانند انجام دهند و چه کاری را نمی توانند انجام دهند.

    دانش انجمنی آنها ویژگی یک فرد از نظر فکری توسعه یافته و خلاق هستند. هر چه انجمن ها غنی تر باشند، شرایط بیشتر و احتمال خلاقیت بیشتر می شود. فرهنگ زبانی افراد، نویسندگی و آثار هنرمندان، طراحان و کارگران در سایر حرفه های خلاق تا حد زیادی بر روی ثروت انجمن ها ساخته می شود.

    دانش طبقه بندی عمدتاً در علم استفاده می شود. مثال‌ها - طبقه‌بندی‌های لینائوس، سیستم تناوبی عناصر D.I. مندلیف، طبقه بندی آزمون و غیره. دانش طبقه بندی، دانش سیستمی و تعمیم یافته است. این نوع دانشفقط برای افراد دارای رشد فکری کافی ذاتی است، زیرا نیازمند تفکر انتزاعی توسعه یافته، دیدی جامع و به هم پیوسته از کلیت پدیده ها و فرآیندها است. یک سیستم دانش، اول از همه، داشتن تعاریف مؤثر از مفاهیم اساسی علوم مورد مطالعه است.

دانش ص. 5-8 را می توان به عنوان سطح دوم طبقه بندی کرد. چنین دانشی به دانش‌آموز اجازه می‌دهد تا تکالیف استاندارد را در نتیجه قرار دادن هر تکلیف خاص تحت کلاس‌های شناخته شده پدیده‌ها و روش‌های مورد مطالعه حل کند.

    شناخت علّی، شناخت روابط علت و معلولی، شناخت مبانی. همانطور که دبلیو شکسپیر نوشت، زمان غیرقابل توضیح به پایان رسیده است؛ همه چیز را باید به دلایلی یافت. در علم مدرن، تحلیل علی جهت اصلی تحقیق است. همانطور که L. Wittgenstein اشاره کرد، آنها زمانی که آماده ارائه دلایل غیرقابل انکار هستند می گویند "من می دانم".

    دانش رویه ای، الگوریتمی، رویه ای. آنها در فعالیت های عملی اساسی هستند. تسلط بر این دانش نشانه ضروری آمادگی و فرهنگ حرفه ای است. این گروه همچنین شامل دانش فناورانه ای است که دستیابی به نتیجه برنامه ریزی شده را ناگزیر ممکن می سازد.

    دانش فناورانه. این دانش نشان دهنده نوع خاصی از دانش است که خود را در آن نشان می دهد سطوح مختلفآمادگی این می تواند دانش نسبتاً ساده ای در مورد عملیات جداگانه زنجیره فناوری یا مجموعه ای از دانش باشد که مطمئناً به شما امکان می دهد با کمترین هزینه ممکن به اهداف خود برسید.

دانش ص. 9-11 را می توان به عنوان دانش یک سطح بالاتر طبقه بندی کرد. آنها عمدتاً در سیستم آموزش متوسطه و عالی حرفه ای به دست می آیند.

بالاترین سطح چهارم دانش شامل انواع زیر است:

    دانش احتمالی چنین دانشی در موارد عدم قطعیت، فقدان دانش موجود، نادرست بودن اطلاعات موجود و در صورت لزوم برای به حداقل رساندن خطر خطا هنگام تصمیم گیری مورد نیاز است. این دانش در مورد الگوهای توزیع داده ها، پایایی تفاوت ها و درجه اعتبار فرضیه ها است.

    دانش انتزاعی اینها نوع خاصدانش، که در آن آنها با مفاهیم و اشیاء ایده آلی که در واقعیت وجود ندارند، عمل می کنند. از این قبیل اشیاء در هندسه، علوم طبیعی و در آن دسته از علوم اجتماعی که در غرب به آنها رفتاری می گویند - روانشناسی، جامعه شناسی، آموزش و پرورش وجود دارد. احتمالی، انتزاعی و خاص دانش علمیدر هر رشته فردی، دانش اساس دانش نظری را تشکیل می دهد. این سطح دانش نظری است.

    دانش روش شناختی. این دانش در مورد روش های تبدیل واقعیت، دانش علمی در مورد ایجاد فعالیت های موثر است. این دانش بالاترین سطح پنجم است.

انواع دانش ذکر شده هنوز یک سیستم طبقه بندی کامل را تشکیل نمی دهند و بنابراین امکان گسترش قابل توجه نامگذاری ارائه شده، جایگزینی برخی از انواع دانش با سایرین و ترکیب آنها در گروه های مختلف را فراهم می کند.

هر یک از انواع دانش ذکر شده با فرم مربوط به وظایف آزمون بیان می شود.

برای تعیین درجه آموزش در هر رشته دانشگاهی، میزان دانش لازم برای تسلط بر طبق برنامه درسی مشخص می شود که میزان اولیه دانش را تشکیل می دهد. دانش پایه نشان دهنده حداقل استاندارد آموزشی دولتی است. با این حال، در میان دانش های اساسی، آنهایی که باید در هر رشته ای در حافظه باقی بمانند، متمایز هستند؛ آنها با هم دانش جهان بینی را تشکیل می دهند. BOO. رودیونوف و A.O. Tatur (مرکز آزمون MEPhI) چندین بخش از دانش جهان بینی را متمایز می کند: دانش پایه، دانش برنامه، دانش فوق برنامه. آزمون های آموزشی تنها ابزاری هستند که نه تنها امکان اندازه گیری یادگیری، بلکه توانایی استفاده از دانش را نیز فراهم می کند. اگر فقط در مورد مهارت صحبت کنیم، در تمام سطوح کسب دانش می توانیم چهار نوع مهارت را تشخیص دهیم:

1) توانایی تشخیص اشیاء، مفاهیم، ​​حقایق، قوانین، مدل ها.

2) توانایی عمل بر اساس یک مدل، طبق یک الگوریتم شناخته شده، قانون؛

3) توانایی تجزیه و تحلیل یک موقعیت، جداسازی چیز اصلی و ساخت روش هایی از عملیات تسلط یافته که امکان دستیابی به یک راه حل برای یک کار آزمایشی را ممکن می سازد.

4) توانایی و توانایی یافتن راه حل های اصلی.

چهار نوع مهارت که توسط B.U. رودیونوف و A.O. تاتور، با نظریه شکل گیری تدریجی اعمال ذهنی، که مبتنی بر روش توسعه آزمایش خودکار به منظور ارزیابی جذب دانش، کسب مهارت ها و توانایی ها است، مخالفت نکنید. این امکان ایجاد نه تنها سیستم های خبره برای ارزیابی میزان یادگیری دانش آموزان، بلکه ایجاد یک سیستم رتبه بندی انعطاف پذیر و پویا برای نظارت بر دانش را نیز ممکن می سازد.

بر اساس رایج ترین طبقه بندی وظایف پیش آزمون در ادبیات داخلی و خارجی، عبارتند از:

آیتم های چند گزینه ای که در آن دانش آموزان پاسخ صحیح را از مجموعه ای از پاسخ ها انتخاب می کنند.

تکالیف پاسخی ساخته شده که دانش آموز را ملزم می کند به طور مستقل پاسخ ها را دریافت کند.

وظایف ایجاد مکاتبات، که اجرای آن با شناسایی مکاتبات بین عناصر دو مجموعه همراه است.

وظایف ترتیبی صحیح که در آن دانش آموز باید ترتیب عناصر، اقدامات یا فرآیندهای فهرست شده در شرایط را نشان دهد.

چهار شکل پیشنهادی از تکالیف تستی، اصلی ترین و رایج ترین هستند، اما دلیلی برای مطلق بودن آنها وجود ندارد. غالباً محتوای خاص موضوع کنترل شده مستلزم استفاده از اشکال جدیدی است که برای اهداف توسعه آزمون مناسب تر است. به طور معمول، چنین نوآوری هایی بر اساس ترکیبی از عناصر فردی از فرم های اساسی ذکر شده ساخته می شوند.

صرف نظر از فرم، وظایف در آزمون باید با شرایط عمومی مطابقت داشته باشد:

هر کار شماره سریال خاص خود را دارد که می تواند پس از ارزیابی آماری دشواری کار و انتخاب استراتژی برای ارائه وظایف آزمون تغییر کند.

هر کار دارای استانداردی برای پاسخ صحیح است (استاندارد درجه بندی برای وظایف با پاسخ آزادانه).

تمام عناصر موجود در کار در مکان های مشخص و مشخصی قرار دارند که در فرم انتخاب شده ثابت شده اند.

برای وظایف، دستورالعمل های استاندارد برای تکمیل ایجاد می شود که در هر فرم تغییر نمی کند و قبل از تدوین وظایف در آزمون است.

برای هر کار، قاعده ای برای تعیین یک ارزیابی دوگانه یا چندگانه ایجاد می شود که برای همه وظایف یک شکل مشترک است و با دستورالعمل های تأیید با رویه های استاندارد برای محاسبه نمرات آزمون خام (اولیه) همراه است.

فرآیند اندازه گیری آزمون بسیار استاندارد است اگر:

هیچ دانش آموزی نسبت به دیگران برتری ندارد.

یک سیستم امتیاز دهی از پیش توسعه یافته برای همه پاسخ های دانش آموزان بدون استثنا اعمال می شود.

این آزمون شامل وظایفی از همان فرم یا اشکال مختلف با ضرایب وزنی تنظیم شده است که مقادیر آن از نظر آماری به دست می آید.

آزمایش گروه های مختلف افراد به طور همزمان در شرایط مشابه انجام می شود.

گروه آزمون شوندگان بر اساس انگیزه همسو می شوند.

همه آزمودنی ها وظایف یکسانی را انجام می دهند.

شرط آخر امکان تقلب، اشاره و سایر تخلفات را رد نمی کند، بنابراین معمولاً سعی می کنند چندین نسخه از یک آزمون ایجاد کنند که از نظر محتوا و دشواری موازی باشند. به طور کلی، انتخاب شکل تکالیف و تعداد گزینه های آزمون به محتوای درس کنترل شده، اهداف کنترل و سطح مورد نیاز از قابلیت اطمینان آزمون بستگی دارد. به ویژه، در طول صدور گواهینامه، آنها سعی می کنند کارهای چند گزینه ای بیشتری را شامل شوند، زیرا به دلیل فناوری بالای آنها و به لطف روش های تأیید خودکار، می توانند میزان محتوای تحت پوشش آزمون، طول آزمون، قابلیت اطمینان و محتوا را افزایش دهند. اعتبار نتایج اندازه گیری های آموزشی.

5.2. وظایف با انتخاب یک یا چند پاسخ صحیح

در وظایف با انتخاب (یا کارهای بسته - نامی که در برخی از ادبیات داخلی با ماهیت روش شناختی استفاده می شود) می توان قسمت اصلی را که شامل بیان مسئله و پاسخ های آماده تنظیم شده توسط معلم است تشخیص داد. در بین پاسخ ها، اغلب تنها یکی صحیح است، اگرچه گزینه های دیگر با انتخاب چندین پاسخ صحیح، از جمله به درجات مختلف، مستثنی نیستند.

به پاسخ های نادرست اما قابل قبول، حواس پرتی می گویند. اگر در یک کار دو پاسخ وجود داشته باشد که یکی از آنها حواس پرتی است، احتمال انتخاب تصادفی پاسخ صحیح با حدس زدن 50٪ است. تعداد حواس پرتی ها به گونه ای انتخاب می شود که کار بیش از حد دست و پا گیر و خواندن آن دشوار نباشد، اما در عین حال سعی می کنند از احتمال زیاد حدس زدن پاسخ صحیح جلوگیری کنند. بنابراین، اغلب 4 یا 5 حواس پرتی در کارها وجود دارد، اگرچه در برخی موارد، زمانی که چنین نیازی وجود دارد، تعداد آنها می تواند به 6-7 برسد.

وظایف با دو پاسخ معمولاً برای تشخیص سریع استفاده می شود، به عنوان مثال، در کنترل خودکار و برنامه های آموزشی برای ورود به یک ماژول آموزشی، در طول آزمون تطبیقی، یا برای خودکنترلی، زمانی که آزمون شونده نیاز به شناسایی سریع شکاف ها در دانش خود دارد. استفاده از وظایف با دو و سه پاسخ در کنترل نهایی منجر به افزایش خطای اندازه گیری به دلیل حدس زدن می شود، بنابراین هرگز در آزمون های گواهینامه گنجانده نمی شوند، جایی که برای اطمینان بیشتر، همه وظایف با تعداد پاسخ یکسان قرار می گیرند.

اگر حواس‌پرتی‌ها به اشتباه، بدون کوچک‌ترین جذابیت حتی برای ضعیف‌ترین سوژه‌های گروه، فرموله شوند، آنها از انجام وظیفه خود دست می‌کشند و در واقع کار نه با برنامه‌ریزی‌شده، بلکه با تعداد کمتری از پاسخ‌ها مشخص می‌شود. در بدترین حالت، وقتی همه عوامل حواس پرتی در یک کار شکست می خورند، اکثر دانش آموزان تکلیف را به درستی انجام می دهند و تنها پاسخ صحیح قابل قبول را انتخاب می کنند. در حالت ایده‌آل، هر حواس‌پرتی باید به یک اندازه همه آزمودنی‌هایی را که پاسخ نادرست را انتخاب می‌کنند، جذب کند. معیار جذابیت حواس‌پرتی‌ها پس از اولین آزمایش آزمون بر روی نمونه‌ای نماینده از آزمودنی‌ها با محاسبه نسبت دانش‌آموزانی که هر یک از عوامل حواس‌پرتی را به عنوان پاسخ صحیح انتخاب کرده‌اند، ارزیابی می‌شود. البته تساوی دقیق سهام یک ایده آل سازی مشخص است که عملاً با آزمایش تجربی قابل دستیابی نیست، اما با این وجود، هنگام ایجاد وظایف، باید برای این برابری تلاش کرد.

تجزیه و تحلیل عمیق تعداد دفعات انتخاب هر عامل حواس پرتی توسط دانش آموزان با سطوح مختلف آمادگی به ما امکان می دهد تا در مورد اعتبار پاسخ های نادرست نتیجه گیری کنیم. اگر یک حواس‌پرتی بیشتر دانش‌آموزان ضعیفی را که فقط تعداد کمی از وظایف را در آزمون به درستی انجام داده‌اند جذب کند، معتبر تلقی می‌شود. در غیر این صورت، زمانی که یک عامل حواس پرتی عمدتاً برای دانش آموزان قوی جذاب به نظر می رسد، اعتبار آن کم است و باید دوباره کار شود. به طور کلی می‌توان گفت که اگر دانش‌آموزان آگاه آن را به درستی انجام دهند، یک تکلیف آزمایشی «خوب کار کردن» محسوب می‌شود و دانش‌آموزان ناآگاه هر یک از عوامل حواس‌پرتی را با احتمال مساوی انتخاب می‌کنند.

اگر آزمایش با استفاده از فرم ها انجام شود، وظایف با انتخاب یک پاسخ صحیح با این دستورالعمل همراه است: "تعداد (حرف) پاسخ صحیح را حلقه بزنید."

وظایف با چندین پاسخ صحیح معمولاً در کنترل مداوم برای آزمایش طبقه بندی و دانش واقعی استفاده می شود، اگرچه مواردی وجود دارد که محتوای خاص رشته آنها را مجبور می کند در آزمون های نهایی گنجانده شوند. آنها با دستورالعمل های ویژه ای همراه هستند که بر لزوم انتخاب همه پاسخ های صحیح تأکید می کند و دارای فرم است: "دایره اعداد همه پاسخ های صحیح را ببندید."

وقتی حواس پرتی ها خیلی کم باشد و پاسخ های درست خیلی بیشتر باشد، حدس زدن آنها آسان است. به عنوان یک راه برون رفت از این وضعیت، می توانید تنها یک پاسخ نادرست را در تعداد پاسخ ها بگنجانید و از دانش آموزان بخواهید که یک پاسخ نادرست را انتخاب کنند، در صورتی که این با اهداف آموزشی کنترل مغایرت ندارد و با محتوای موضوع مجاز است. در این مورد، دستورالعمل ها به این صورت است: "تعداد پاسخ نادرست را دایره بکشید."

گاهی اوقات، بنا به قصد نویسنده، هنگام توسعه یک کار، چندین پاسخ صحیح گنجانده می شود که در میان آنها یک پاسخ صحیح تر و یک پاسخ کمتر ترجیح داده می شود. در این مورد، این کار با این دستورالعمل همراه است: "تعداد صحیح ترین پاسخ را حلقه بزنید."

هنگام انجام وظایف در رایانه، دستورالعمل ها ممکن است به این صورت باشد: "برای پاسخ دادن، کلید را با شماره (حرف) پاسخ صحیح فشار دهید."

به طور معمول، اگر همه وظایف به یک شکل فرموله شوند، دستورالعمل ها در ابتدای آزمون ارائه می شوند. در غیر این صورت، زمانی که آزمون شامل مواردی با اشکال مختلف باشد، دستورالعمل ها با هر بار تغییر فرم تغییر می کنند. به راحتی می توان تصور کرد که جایگزینی دستورالعمل ها برای انتخاب پاسخ های صحیح و نادرست چقدر دشوار است. دانش‌آموزان بی‌توجهی که نمی‌توانند روی تغییر دستورالعمل‌ها تمرکز کنند، به ناچار گیج می‌شوند و برخی از وظایف را به اشتباه انجام می‌دهند، حتی زمانی که احتمالاً پاسخ صحیح را بدانند. بنابراین، توصیه می شود تا حد امکان به ندرت دستورالعمل های موجود در آزمون را تغییر دهید - دقیقاً هر چند بار که استراتژی ارائه موارد آزمایشی لازم است.

وظایف با انتخاب تعدادی از مزایای مربوط به سرعت تکمیل آنها، سهولت محاسبه نمرات آزمون نهایی، توانایی خودکارسازی روش ها برای بررسی پاسخ های دانش آموزان و در نتیجه به حداقل رساندن عامل ذهنی هنگام ارزیابی نتایج آزمون، دارند. با کمک آنها می توان محتوای موضوع مورد آزمون را به طور کامل تری پوشش داد و در نتیجه اعتبار محتوایی آزمون را افزایش داد. مزیت بدون شک فرم کار انتخاب، تطبیق پذیری آن است؛ تقریباً برای هر موضوعی مناسب است.

از جمله معایب تکالیف انتخابی، اثر حدس زدن است که برای آزمون‌دهندگانی که آمادگی ضعیفی دارند در هنگام پاسخ دادن به سخت‌ترین آیتم‌های آزمون معمول است. اگرچه امکان حدس زدن وجود دارد، آزمایش شناسان یاد گرفته اند که با استفاده از روش های مختلف با آن مبارزه کنند. گاهی دستورالعمل‌های ویژه‌ای معرفی می‌شود که آزمودنی‌ها را به جای پاسخگویی با حدس زدن هدایت می‌کنند تا از یک کار ناآشنا بگذرند. در سایر موارد ضرایب وزنی ویژه نزدیک به صفر در محاسبه نمرات دانش آموزان ضعیف کسب شده در سخت ترین آیتم های آزمون اضافه می شود. گاهی اوقات از فرمول خاصی برای تصحیح امتیازات فردی استفاده می شود که برای حدس و گمان تنظیم می شود. آخرین روش و فرمولی که آن را توضیح می دهد در پایان این فصل آورده شده است.

هنگام استفاده از وظایف انتخابی برای آزمایش مهارت‌های سطح تولید مرتبط با کاربرد دانش در موقعیت‌های ناآشنا، جنبه‌های خلاقانه آماده‌سازی و مواردی که لازم است شرایط تکلیف محول شده به دانش‌آموزان تغییر کند، مشکلات خاصی ایجاد می‌شود. سپس وظایف با انتخاب پاسخ های آماده اغلب غیرممکن است. در مورد آزمایش صدور گواهینامه انبوه، زمانی که لازم است از فناوری های رایانه ای مؤثر برای محاسبه نمرات آزمون و به دست آوردن عینیت بالا از نتایج اندازه گیری آموزشی استفاده شود، مزایای وظایف انتخابی به وضوح بر معایب آن بیشتر است. بنابراین، این فرم اغلب بر توسعه آزمون های گواهی نهایی غالب است.

وظایف چندگزینه ای باید تعدادی از الزامات را برآورده کند که انجام آنها می تواند کیفیت آزمون را بهبود بخشد:

هر گونه ابهام یا عبارت نامشخص باید در متن تکلیف حذف شود.

بخش اصلی کار به طور خلاصه فرموله شده است، ترجیحاً بیش از یک جمله از 7-8 کلمه نباشد.

طراحی نحوی تکلیف بدون به خطر انداختن صحت محتوا و درک روشن آن توسط دانش آموزان بسیار ساده شده است.

بخش اصلی تکلیف شامل اکثر شرایط تکلیف است و بیش از 2-3 مورد از مهمترین آنها را برای پاسخ باقی نمی گذارد. کلید واژه هابرای مشکل فرموله شده در شرایط؛

تمام پاسخ‌های یک تکلیف باید تقریباً به یک اندازه باشند، یا پاسخ صحیح ممکن است کوتاه‌تر از بقیه باشد، اما نه در همه تکالیف آزمون.

همه تداعی های کلامی که در انتخاب پاسخ صحیح با استفاده از حدس کمک می کنند از متن کار حذف می شوند.

دفعات انتخاب شماره مکان برای پاسخ صحیح در تکالیف مختلف آزمون باید تقریباً یکسان باشد یا شماره مکان برای پاسخ صحیح به طور تصادفی انتخاب شود.

همه عوامل حواس پرتی برای هر کار باید به یک اندازه برای افرادی که پاسخ صحیح را نمی دانند جذاب باشند.

هنگام توسعه وظایف، لازم است از استقلال نسبی آنها اطمینان حاصل شود، به استثنای منطق اجرای زنجیره ای، زمانی که پاسخ یک کار به عنوان شرط یک کار آزمایشی دیگر عمل می کند. آزمون‌های پیشرفت تحصیلی نمی‌توانند حاوی موارد تله‌ای باشند که در آزمون‌های روان‌شناختی یافت می‌شوند.

ساده ترین راه برای انتخاب عوامل حواس پرتی در وظایف با دو پاسخ، انکار واقعیت است. با این حال، استفاده از کلمات "بله-نه" به جای حواس پرتی توصیه نمی شود، زیرا در غیر این صورت، فرموله کردن عباراتی که می توان به آنها پاسخ روشنی داد بسیار دشوار است.

نمونه هایی از وظایف

تمرین 1

اگر تفریق 12 واحد افزایش یابد، و اختلاف نیز 15 واحد افزایش یابد، سپس کاهش می یابد.

الف. افزایش یافته است

ب- کاهش یافته است


وظایف با سه پاسخ، و همچنین با دو پاسخ، معمولا در تشخیص سریع استفاده می شود. گاهی اوقات سه پاسخ به دلیل حذف حواس‌پرتی‌های ناکارآمد ظاهر می‌شود. به طور کلی می توان آنها را ناموفق دانست زیرا به اندازه کافی مختصر نیستند و در عین حال احتمال بالایی برای حدس زدن پاسخ صحیح دارند.

وظیفه 2

نرخ بالای شهرنشینی در آمریکای لاتین با

الف- رشد سریع اقتصادی

ب- تقویت نقش شهرهای بزرگ

ب- مهاجرت دسته جمعی مردم از روستاها به شهرها


در اکثر آزمون ها وظایفی با 4 تا 5 پاسخ وجود دارد که یکی از آنها صحیح است. هنگامی که به طور ماهرانه توسعه داده شوند، بسیار کوتاه هستند و احتمال کمی برای حدس زدن پاسخ صحیح دارند (0.25 با چهار پاسخ و 0.20 با پنج).

وظیفه 3

این فرض که پول یک کالای خاص است با تئوری پول سازگار است.

الف. اسمی

ب. فلز

ب. کمی

G. Trudovoy


وظیفه 4

سازمان لاتریزه شده بر اساس اصل تسلیم مضاعف مجریان چه ساختاری دارد؟

یک طراحی

ب. سیستم

ب. ماتریس

G. عملکردی

د.جغرافیایی


وظیفه 5

عملکرد اندازه گیری هزینه توسط:

الف. پول فلزی

ب. پول ایده آل

ب. پول واقعی

د. تصور ذهنی پول

د. پول اعتباری


گاهی اوقات یک کار انتخابی ساختاری دوگانه دارد و مجموعه‌ای از گزاره‌ها یا عبارات را ارائه می‌دهد که با مقایسه با پاسخ‌های پیشنهادی ارزیابی می‌شوند. به عنوان مثال، در کار 6، عباراتی که مفهوم "مدیریت" را مشخص می کنند باید با گزینه های مختلف برای صحت آنها مقایسه شوند.

وظیفه 6

چه بیانیه هایی ویژگی های مفهوم "مدیریت" را ارائه می دهند؟

1. فرآیند توزیع و جابجایی منابع در یک سازمان با هدف از پیش تعیین شده، طبق برنامه از پیش تدوین شده و با نظارت مستمر بر نتایج عملکرد.

2. مجموعه ای از روش ها، اصول، وسایل و اشکال مدیریت سازمان ها با هدف افزایش کارایی فعالیت ها.

الف. فقط اولی

ب. فقط دومی

ب- نه اولی و نه دومی


علیرغم جذابیت ظاهری آن، از نظر محتوا، تکلیف 6 به خوبی فرمول بندی نشده است، زیرا می تواند منجر به تفسیر مبهم از پاسخ های دانش آموزان شود. انتخاب دو پاسخ A و B معادل انتخاب پاسخ D است، اگرچه پاسخ های تکلیف باید همیشه دارای خاصیت استقلال نسبی باشند و به بیان مجازی، یکدیگر را نفی کنند.

مثال دیگری از تغییر شکل یک تکلیف با انتخاب پاسخ ها در تکلیف 7 آورده شده است، جایی که از پاسخ انتخاب شده خواسته می شود به صورت ذهنی به جای خط تیره در قسمت اصلی جایگزین شود.

وظیفه 7

مدیریت، هماهنگی _________ منابع برای هدف حل وظایف مدیریت مجموعه است.

الف. اطلاعات

ب. انسان

ب. موقت

G. مواد


حتی با یک فرآیند آزمایشی سازمان‌یافته، یک نسخه از یک آزمون را نمی‌توان به دلیل تقلب، اشاره و سایر اثرات نامطلوب مشابه اجرا کرد. بنابراین، شما همیشه باید 5 تا 8 نسخه موازی از آزمون را توسعه دهید، که برای آنها می توان از وظایف وجهی استفاده کرد. جنبه فرمی است که نمایش چندین نوع از یک عنصر محتوای آزمون را ارائه می دهد. هر موضوع فقط یک گزینه کار از جنبه دریافت می کند. در این حالت، همه گروه‌های آزمایشی وظایف یکسانی را انجام می‌دهند، اما با عناصر وجهی متفاوت و بر این اساس، با پاسخ‌های متفاوت. بنابراین، دو کار به طور همزمان حل می شود: امکان تقلب از بین می رود و موازی بودن گزینه های تست تضمین می شود. به عنوان مثال، وظیفه 8 شامل دو تکلیف آزمایشی است که برای هر یک از شهرهایی که در پرانتزهای مجعد آورده شده است، به دست آمده است.

وظیفه 8

به مجموعه های کاخ در اطراف

{مسکو

سنت پترزبورگ)

مربوط بودن:

1) پاولوفسک، اورانین باوم

2) Arkhangelskoye، Tsaritsino

3) پیترهوف، گاچینا

4) Tsarskoe Selo، Strelnya


در کار 9، نویسنده پیشنهاد می کند عنصری را انتخاب کنید که به موضوع مرتبط نباشد نظریه اقتصادی، که کاملاً موجه نیست اهداف آموزشیکنترل، اما در این مورد توسط محتوای موضوع مجاز است.

وظیفه 9

مقررات غیر مرتبط با موضوع نظریه اقتصاد

الف- خوب اقتصادی

ب- منابع نامحدود

ب. به حداکثر رساندن ارضای نیاز د. استفاده کارآمد از منابع

د-روابط حقوقی


چنین وظایفی و همچنین وظایفی که دارای چندین پاسخ صحیح هستند، مانند تکلیف 10، معمولاً از قرار گرفتن در آزمون های گواهینامه که از نتایج آن برای تصمیم گیری های اداری و مدیریتی در آموزش استفاده می شود، اجتناب می شود.

وظیفه 10

مشخص كردن سهپارامترهای محیطی جامع مؤثر بر عملکرد تصمیم گیری

الف. عدم قطعیت

ب. پیچیدگی

ب- پویایی

د. قطعیت

D. محدود


ظهور پاسخ‌های تا حدی صحیح توسط دانش‌آموزان، که زمانی به وجود می‌آیند که همه پاسخ‌های صحیح برنامه‌ریزی‌شده در هر یک از این تکالیف آزمون انتخاب نشده باشند، منجر به کاهش عینیت و مقایسه نمرات آزمون می‌شود. اگر اجتناب از چندین پاسخ صحیح غیرممکن باشد، پس برای افزایش استانداردسازی رویه های ارزیابی، مشخص است قاعده تعیین کننده. به عنوان مثال، اگر آزمودنی تمام پاسخ های صحیح را انتخاب کند، 1 امتیاز دریافت می کند، در همه موارد دیگر - 0 امتیاز.

هنگام محاسبه نتایج وظایف با انتخاب یک پاسخ صحیح، معمولاً ارزیابی دوگانه ترجیح داده می شود. برای انجام صحیح یک کار، آزمودنی 1 امتیاز و برای پاسخ نادرست یا حذف - 0 دریافت می کند. مجموع همه واحدها به فرد اجازه می دهد تا نمره فردی (اولیه یا خام) موضوع را محاسبه کند، که در مورد یک ارزشیابی دوگانه به سادگی برابر است با تعداد وظایفی که در آزمون به درستی انجام شده است. اگر پاسخ صحیح تنها پاسخ نباشد، اغلب از یک ارزیابی چندگانه استفاده می شود که متناسب با تعداد پاسخ های صحیح انتخاب شده تنظیم می شود.

اگر آزمون از آیتم های چند گزینه ای تشکیل شده باشد، نمرات فردی آزمون شوندگان به طور قابل توجهی با اثر حدس زدن تصادفی پاسخ ها تحریف می شود. از این رو سعی می کنند با انجام اصلاحاتی برای حدس و گمان، نمرات خام را تصحیح کنند. فرمول تصحیح امتیازهای به دست آمده در نتیجه انجام وظایف با پاسخ هایی که تنها یکی از آنها صحیح است دارای فرم است.

ایکس" من = ایکس من – [دبلیو من / (ک – 1)]

جایی که من- تعداد هر موضوع در گروه؛ ایکس" من - امتیاز تعدیل شده من-ام موضوع ایکس من - نمره آزمون قبل از تصحیح؛ دبلیو من- تعداد تکالیف آزمون انجام نشده (به اشتباه تکمیل، از دست رفته و محقق نشده) و X+W من = n، جایی که n-تعداد وظایف در آزمون

هنگام تکمیل وظایف با دو پاسخ k – 1 = 1، بنابراین، برای هر موضوع، تفاوت بین تعداد وظایف آزمون به درستی انجام شده و شکست خورده محاسبه می شود. با افزایش تعداد عوامل حواس پرت کننده به یک کار، تعداد امتیازهای کسر شده کاهش می یابد، که کاملا طبیعی است، زیرا هر چه تعداد حواس پرت کننده ها بیشتر باشد، حدس زدن پاسخ صحیح دشوارتر می شود.

فرمول تصحیح خود دارای معایب خاصی است که باعث کاهش دقت اندازه گیری های تست می شود. این به دلیل این واقعیت است که ساخت آن بر اساس تعدادی فرضیات مصنوعی است که اغلب با رویه واقعی برای انجام آزمایش ناسازگار است. به ویژه، این فرض که همه پاسخ‌های نادرست نتیجه حدس‌زنی تصادفی هستند، کاملاً برآورده نشده است. به طور مساوی شرطی فرض دیگری در مورد احتمال مساوی انتخاب هر پاسخ برای یک تکلیف تستی است.

در فرآیند ایجاد وظایف، الزامات فرم خاصی ناآگاهانه نقض می شود. به عنوان یک قاعده، این به این دلیل است که تمام توجه توسعه دهنده توسط محتوا جذب می شود و نه فرم. نقض برخی از الزامات منجر به تعدادی از کاستی های مشخصه می شود که حتی در بین نویسندگان باتجربه در فرآیند کار بر روی وظایف آزمون ایجاد می شود. رایج ترین کاستی های وظایف پیش آزمون عبارتند از:

عدم صحت منطقی در جمله بندی موارد آزمون، منجر به پاسخ های صحیح بدون برنامه ریزی می شود.

نقض نسبت های صحیح در فرم کار، زمانی که پاسخ ها بسیار طولانی تر از قسمت اصلی کار است.

نقض اختصار ناشی از شمول کلمات غیر ضرورییا با ارائه محتوایی در فرم تستی که برای تست از طریق آزمون مناسب نیست.

انتخاب پاسخ ها به دلایل مختلف؛

محاسبات نادرست توسعه دهندگان کار که به حدس زدن پاسخ های صحیح بدون تکمیل وظایف آزمون کمک می کند.

به عنوان مثال، وظیفه 11، که شامل یک بخش اصلی کوتاه و پاسخ های طولانی است، می تواند ناموفق در نظر گرفته شود، زیرا توسعه دهنده آشکارا آنها را بیهوده تنظیم کرده است. اگر خود تعریف گردش سرمایه که در وهله دوم در زیر حرف "B" آورده شده است، در ابتدای کار قرار گیرد، پاسخ ها می توانند فقط از یک یا چند کلمه تشکیل شوند.

وظیفه 11

گردش سرمایه است

الف- حرکت مستمر و منسجم سرمایه پولی

ب- تبدیل مداوم سرمایه از یک شکل کارکردی به شکل دیگر

ب. بازپرداخت ارزش پیش پرداخت

د. کارکرد سرمایه کالایی


اگر آنها را بدون در نظر گرفتن اشتباهات اساسی نویسنده در نظر بگیریم، پاسخ‌های تکلیف 12 ضعیف انتخاب شدند. اگر سه پاسخ اول حجم خروجی انحصارگر و رقابت را با هم مقایسه کنند، پاسخ چهارم با هدف ایجاد رابطه علی بین اشیاء است.

وظیفه 12

حجم تولید محصول انحصار با رقابت کامل مقایسه خواهد شد

ب. کمتر

ب. همان

د. بستگی به شرایط بازار دارد


در تکلیف 13 هیچ صحت ماهوی و منطقی وجود ندارد، جایی که از هشت پارامتر داده شده، تنها پنج پارامتر در پاسخ ها استفاده شده است.

وظیفه 13

چه دو پارامتری برای تجزیه و تحلیل تفاوت فرهنگ کشورها از یکدیگر استفاده نمی شود؟

1. رابطه انسان و محیط

2. تخمین زمان

3. طبیعت افراد

4. سبک ارتباط

5. ارزیابی میزان فعالیت

6. آزادی دسترسی به اطلاعات

7. روابط بین افراد

8. نگرش نسبت به مالکیت فضا


الف. چهارم و ششم

ب- سوم و ششم

ب- سوم و پنجم

د- چهارم و هفتم


وظیفه 14

الف- پاسخگو به تغییرات محیط خارجی و تغییرات متناسب با آنها

ب- تمامی روندهای جدید را از محیط بیرونی درک می کند و لزوماً آنها را در فعالیت های خود به کار می گیرد

ب. برای هرگونه نوآوری مورد نیاز مالک باز باشد

د- نسبت به رفتار رقبا با حساسیت واکنش نشان می دهد و مؤثرترین اصول را برای حل مشکلات مدیریتی درک می کند.


وظیفه 15، اگرچه نسبتاً دست و پا گیر به نظر می رسد، اما با بسیاری از مثال های ذکر شده در بالا تفاوت های مثبتی دارد، زیرا حاوی بیانی از مسئله است، و هدف آن، مانند اغلب موارد، آزمایش مطالب واقعی یا مفهومی نیست.

وظیفه 15

تابع هدف در مدل ریاضی فرآیند کنترل در کاربرد برای مسئله زیر چگونه خواهد بود:

این شرکت دو نوشیدنی "تونیک" و "ترخون" تولید می کند. حجم تولید با تعداد افزودنی های کمکی و ظرفیت تولید محدود می شود. تولید 1 لیتر "تونیک" 0.02 ساعت کارکرد تجهیزات و تولید 1 لیتر "ترخون" 0.04 ساعت طول می کشد. مصرف افزودنی های کمکی برای تونیک 01/0 کیلوگرم در لیتر و برای ترخون 04/0 کیلوگرم در لیتر می باشد. زمان کارکرد روزانه تجهیزات 24 ساعت می باشد. منبع افزودنی های کمکی 16 کیلوگرم در روز است. سود حاصل از فروش 1 لیتر تونیک 0.1 روبل در لیتر و ترخون 0.3 روبل در لیتر است.

روزانه چند محصول تونیک و ترخون باید تولید شود تا سود روزانه به حداکثر برسد؟

A.0.01 ایکس 1 + 0,04 ایکس 2 > حداکثر

B. 0.02 ایکس 1 + 0,03 ایکس 2 > حداکثر

B.0.02 ایکس 1 + 0,04 ایکس 2 > حداکثر

G. 0.03 ایکس 1 + 0,01 ایکس 2 > حداکثر

5.3. سوالات پاسخ ساخته شده

در وظایف با پاسخ ساخته شده (همچنین به نام: وظایف جمع، وظایف باز)، پاسخ های آماده داده نمی شود؛ آنها باید توسط خود دانش آموز اختراع یا به دست آیند. دو نوع کار با پاسخ ساخته شده وجود دارد که یکی از آنها مستلزم دریافت پاسخ های صحیح آزمودنی است که از نظر محتوا و شکل ارائه کاملاً تنظیم شده است. دوم تکالیفی با پاسخ‌های آزادانه است که در آن آزمودنی‌ها پاسخ‌های تفصیلی، دلخواه در محتوا و شکل ارائه می‌دهند و شامل راه‌حل کامل مسئله با توضیحات، ریز مقاله (مقاله) و غیره است.

دانش‌آموزان پاسخ‌های ساخته شده را دشوارتر می‌دانند، زیرا آنها حدس و گمان را حذف می‌کنند. در واقع، انتخاب پاسخ صحیح از بین موارد پیشنهادی آسانتر است، گاهی اوقات نه بر اساس دانش بلکه بر اساس شهود، تا اینکه خودتان آن را فرموله کنید یا آن را در فرآیند حل مشکلات مطرح شده بیابید. اما دقیقاً همین ویژگی است که برای معلمان بسیار جذاب است، به ویژه برای کسانی که عادت دارند در کار خود به ابزارهای سنتی کنترل تکیه کنند و به تست ها اعتماد ندارند.

در وظایف نوع اول، پاسخ معمولاً بسیار کوتاه است: به صورت کلمه، عدد، فرمول، نماد و غیره. برای ایجاد تکالیف با پاسخی منظم و منظم، باید به صورت ذهنی یک سوال را فرموله کنید، سپس یک پاسخ واضح و مختصر را بنویسید، که در آن یک خط تیره به جای کلمه کلیدی، نماد یا عدد قرار می گیرد. با توجه به عدم ابهام پاسخ صحیح، بررسی نتایج کارها با یک پاسخ تنظیم شده ساخته شده کاملاً عینی است؛ این کار به صورت رایانه ای و با بررسی مجدد بعدی همه پاسخ های نادرست دانش آموزان با ابزار کارشناسی انجام می شود. پاسخ تکالیف به جای خط تیره داده می شود یا توسط دانش آموزان در فرم مخصوص وارد می شود.

مثلا: پاسخ صحیح را وارد کنید.

تمرین 1

تعیین نتایج نهایی که باید به دست آیند و وسایل مربوطه لازم برای به دست آوردن نتایج نهایی معین شامل کارکردهای ___________________ است.


وظیفه 2

شکلی از نفوذ که شامل پوشاندن مقاصد و اهداف واقعی است - _______________.


هنگام انجام وظایف با یک پاسخ تنظیم شده ساخته شده، پاسخ های تا حدی درست و صحیح به درجات مختلف اغلب ظاهر می شوند. با افزودن پاسخ به جای خط تیره، آزمون‌دهنده می‌تواند مترادف‌هایی را برای کلمه گمشده برنامه‌ریزی‌شده توسط توسعه‌دهنده ارائه دهد یا ترتیب عناصر در فرمول گمشده را تغییر دهد، که به‌طور قابل‌توجهی تأیید و ارزیابی خودکار نتایج آزمون‌کنندگان را پیچیده می‌کند. به این دلایل، ایجاد قراردادهای امتیازدهی اضافی برای پاسخ های تا حدی صحیح در فرآیند بازنگری غیرمعمول نیست.

وظایف با پاسخ های تنظیم شده ساخته شده باید تعدادی از الزامات را برآورده کنند:

هر کار باید فقط یک کلمه مکمل، نماد و غیره را هدف قرار دهد، جایی که توصیه می شود با یک خط تیره یا نقطه مشخص شود.

یک خط تیره در محل عنصر کلیدی قرار می گیرد که آگاهی از آن برای ماده ای که کنترل می شود بسیار ضروری است.

توصیه می شود که تمام خط تیره ها در تکالیف یک آزمون دارای طول مساوی باشند.

بهتر است در انتهای کار یا تا حد امکان نزدیک به پایان، مکانی را برای پاسخ اختصاص دهید.

بعد از خط تیره، در صورت امکان، واحدهای اندازه گیری نشان داده شده است.

متن تکلیف باید ساختار نحوی بسیار ساده ای داشته باشد و حاوی حداقل مقداراطلاعات لازم برای انجام صحیح کار

وظایف نوع دوم با پاسخ آزادانه هیچ محدودیتی در محتوا و شکل ارائه پاسخ ها ندارند. در طول زمان تعیین شده، آزمون‌دهنده می‌تواند هر چیزی را که می‌خواهد در فرم‌های پاسخ ویژه بنویسد. بدون شک چنین شرایطی از بسیاری جهات به سنتی نزدیک است کار مکتوب، و بنابراین وظایف با پاسخ های آزادانه توسط اکثریت مطلق معلمان مثبت درک می شود. آنها از نظر محتوا جالب و متنوع هستند.

توسعه وظایف نوع دوم ممکن است غیرمنطقی آسان به نظر برسد. در واقع، تدوین نکردن تکلیف، بلکه ارائه استانداردی از پاسخ بهینه همراه با قوانین استاندارد شده برای ارزیابی نتایج اجرای آن دشوار است. به عنوان مثال، جمله بندی یک تکلیف تاریخچه با پاسخ مفصل کاملاً مختصر است.

وظیفه 3

وظایف اصلی را که در سیاست خارجی روسیه در قرن هفدهم حل شد نام ببرید (حداقل دو وظیفه را مشخص کنید). نمونه هایی از جنگ ها، لشکرکشی ها و لشکرکشی ها در قرن هفدهم را که برای حل این مشکلات انجام شده است (حداقل سه مثال) ذکر کنید.


اما برای اینکه یک کار در آزمون گنجانده شود، نویسنده آن نیاز به استانداردسازی رویه تأیید دارد و این کار حجیمی است که گاهی به دلیل ابهام در نتایج اجرای آن انتقادات زیادی را به همراه دارد.

که در علوم طبیعیپیشنهاد یک استاندارد عملکرد همراه با معیارهای ارزیابی بسیار ساده تر است. به عنوان مثال، برای کار 4 می توانید معیارهای زیر را برای ارزیابی نتایج تکمیل ارائه دهید

وظیفه 4

با چه ارزش هایی ایکسمقادیر تابع متناظر f(ایکس) = ثبت 2 ایکسو g(ایکس) = گزارش 2 (3 - ایکس) آیا تفاوت آنها کمتر از 1 خواهد بود؟


آزمایش وظایف با پاسخ های دقیق توسط کارشناسان مطابق با دستورالعمل های استاندارد شده حاوی استاندارد پاسخ بهینه با ویژگی ها و ویژگی های کیفی آن، مانند مثال ارائه شده، انجام می شود. این استاندارد باید با دسته‌های ارزیابی برای صدور یک ارزیابی چندتومی همراه باشد، که نیاز به آزمایش و اثبات آماری کیفیت دارد، زیرا ممکن است در بین آنها مواردی وجود داشته باشند که کارایی نداشته باشند و آنهایی که اثر تمایز آزمون را کاهش دهند.

وظایف با پاسخ های دقیق به کار آموزشی قابل توجهی در هنگام بررسی نیاز دارند، زمانی که کارشناسان باید بسیاری از پاسخ های صحیح را به درجات مختلف تجزیه و تحلیل کنند و آنها را با استاندارد مقایسه کنند، بدون در نظر گرفتن کامل بودن، قالب خارجی پاسخ ها، اشتباهات املایی و همه چیزهایی که وجود دارد. در ضوابط تعیین یک ارزیابی چندگانه گنجانده نشده است. گاهی اوقات آنها سعی می کنند با توسعه برنامه های متخصص رایانه، تأیید را استاندارد کنند.

در خارج از سیستم‌های خودکار، بررسی نتایج تکمیل وظایف با پاسخ‌های دقیق کاملاً ذهنی است و هماهنگ کردن ارزیابی‌های چند متخصص دشوار است، بنابراین معمولاً چنین وظایفی بیش از 10-15٪ از کل طول آزمون گواهینامه را اشغال نمی‌کند.

آیتم های پاسخ آزاد در درجه اول برای ارزیابی مهارت های شناختی طراحی شده اند. آنها باید فقط در مواردی توسعه یابند که اشکال ساده تر قابل استفاده نباشد.

طول و پیچیدگی پاسخ می تواند بسیار متفاوت باشد (تا چندین صفحه متن پاسخ، توجیه راه حل داده شده برای مسئله، و غیره). توصیه می شود محدودیت هایی در مورد حداکثر طول پاسخ برای هر کار در دستورالعمل ها ایجاد کنید.

فرمول بندی تکلیف باید شامل بیان مسئله، استاندارد عملکرد و معیارهای ارزیابی باشد. بخش تولید باید به قدری واضح باشد که انحرافات احتمالی در پاسخ های صحیح دانش آموزان از استاندارد اجرای برنامه ریزی شده توسط توسعه دهنده به حداقل برسد.

انتخاب چارچوب زمانی برای تکمیل هر تکلیف باید به دانش آموز اجازه دهد تا پاسخی به اندازه کافی دقیق فرموله کند و زمان برای نوشتن آن داشته باشد.

قابلیت اطمینان ارزیابی نتایج وظایف با پاسخ های آزادانه را می توان افزایش داد اگر:

با توجه به توصیه های فوق، کار را به درستی تنظیم کنید.

هنگام بررسی، فقط از طرح ارزیابی استاندارد توسعه یافته با حداکثر سه دسته ارزیابی (0، 1، 2) استفاده کنید.

آموزش بازبینان تکالیف برای استفاده از معیارهای ارزیابی استاندارد؛

حداقل دو کارشناس را برای بررسی هر کار درگیر کنید و اگر امتیازات دو کار اول بیش از یک امتیاز متفاوت بود، از یک کارشناس سوم دعوت کنید.

استفاده از اصول ناشناس بودن اثر در حال بررسی و استقلال از قضاوت کارشناسان؛

هنگام نمره دادن به تکلیف بعدی به نمره ای که به تکلیف قبلی داده شده است نگاه نکنید.

تکالیف نوع انشا را می توان بر اساس موارد زیر درجه بندی کرد:

طرح‌های ارزیابی ساده، زمانی که معیارها با تمرکز بر محتوای پاسخ‌های دانش‌آموزان ساخته می‌شوند.

طرح‌های ارزیابی پیچیده که در طول امتحان محتوای پاسخ‌ها، ویژگی‌های کیفی متن، کامل بودن و سبک آن یا هر عامل دیگری که برای توسعه‌دهنده کار مهم به نظر می‌رسد را در نظر می‌گیرد.

تحت هر طرح درجه‌بندی، موارد با پاسخ‌های آزادانه نیاز به امتیازدهی چندگانه دارند، که گاهی به طور غیرقابل توجیهی وزن کلی آنها را در نمره آزمون افزایش می‌دهد. به منظور اجتناب از چنین برآوردهای بیش از حد و کاهش تأثیر مؤلفه ذهنی، آنها معمولاً سعی می کنند تعداد معیارهای ارزیابی را بسیار کم کنند و خود را به ارزیابی های چندگانه محدود کنند، به عنوان مثال، از 0 تا 3 یا از 0 به 2.

برای کارهایی با پاسخ کوتاه و منظم، که به شکل عبارات ناتمام فرموله شده و بدون فرم های پاسخ خاص ارائه شده است، معمولاً از دستورالعملی متشکل از یک کلمه استفاده می شود: "ADD". در مواردی که برای پاسخ به تکالیف با یک پاسخ تنظیم شده کوتاه، لازم است پاسخ‌ها در فرم‌های خاص و نه در کنار تکالیف ارائه شود، دستورالعمل‌ها ممکن است به این صورت باشد: «پاسخ به وظایف را در فرم پاسخ‌ها به سمت راست بنویسید. شماره وظایف مربوطه. با توجه به نمونه های ارائه شده در فرم پاسخ، هر نامه را در یک کادر جداگانه بنویسید.»

دستورالعمل‌های وظایف با پاسخ‌های آزادانه معمولاً یک فرم آزاد دارند. نکته اصلی این است که تا حد امکان برای تسهیل و استاندارد کردن کار متخصصان هنگام بررسی نتایج آزمون برای کاهش تأثیر عوامل ذهنی و افزایش قابلیت اطمینان اندازه گیری های آموزشی صحبت کنیم. در کلی‌ترین شکل، برای موضوعات علوم انسانی، دستورالعمل‌ها ممکن است به این صورت باشد: «برای پاسخ به وظایف، از یک فرم پاسخ جداگانه استفاده کنید. ابتدا شماره کار را بنویسید و سپس یک پاسخ مفصل به آن را بنویسید. پاسخ های خود را واضح بنویسید.»

5.4. وظایف انطباق

وظایف مکاتبه شکل خاصی دارند، که در آن تحت دستورالعمل، عناصر دو مجموعه وجود دارد که مطابقت بین آنها توسط موضوع درخواست می شود. در سمت چپ معمولاً عناصر مجموعه تعریف کننده حاوی بیان مسئله هستند، در سمت راست عناصری هستند که باید انتخاب شوند.

مطابقت بین عناصر دو ستون زمانی می تواند یک به یک باشد که هر عنصر در سمت راست دقیقاً با یک عنصر در سمت چپ مطابقت داشته باشد. اگر تعداد عناصر در دو ستون یکسان باشد، آخرین عنصر مجموعه تعیین‌کننده انتخاب نخواهد شد. مواردی وجود دارد که با محتوای خاص موضوع مشخص می شود، زمانی که عناصر مشابه در سمت راست برای چندین عنصر از ستون سمت چپ انتخاب می شوند، بنابراین ممکن است تعداد آنها کمتر از سمت چپ باشد. در نهایت، کار بهینه کاری است که در آن مجموعه مناسب حاوی عناصر بیشتری باشد که هر کدام فقط یک بار انتخاب می شوند. به عنوان مثال، موفقیت 1 است، نه موفقیت 2، زیرا تعداد مواردی که باید در سمت راست انتخاب کنید، برابر با تعداد موارد در ستون سمت چپ است.

تمرین 1

برای هر یک از سه عنصر (1، 2، 3)، یک عنصر متناظر از سمت راست با حروف (A، B، C، D، E، E، G، Z، I، K) انتخاب می شود.

مطابقت نقش های مدیر را با سه بلوک طبق مدل G. Mintzberg تعیین کنید


پاسخ ها را می توان در قالب یک جدول ارائه کرد که در این صورت نیازی به دستورالعمل های دقیق مانند آنچه برای تکلیف 1 داده شده است نیست.


وظیفه 2

همخوانی داشتن



عناصر اضافی در ستون سمت راست که در صورت صحیح بودن پاسخ ها قابل انتخاب نیستند، حواس پرتی نامیده می شوند. همانطور که در وظایف چند گزینه ای، بزرگترین مشکلات در توسعه با انتخاب عناصر اضافی قابل قبول در مجموعه مناسب همراه است. معیار اعتبار هر عامل حواس پرتی به صورت تجربی تعیین می شود.

هنگام توسعه وظایف انطباق، باید با قوانین زیر هدایت شوید:

وظیفه به گونه ای تنظیم شده است که تمام مطالب را می توان در قالب دو مجموعه با نام های مناسب بیان کرد.

عناصر ستون مشخص در سمت چپ و عناصر برای انتخاب در سمت راست قرار دارند.

مطلوب است که هر ستون یک نام خاص داشته باشد که تمام عناصر ستون را خلاصه کند.

لازم است که ستون سمت راست حداقل حاوی چندین حواس پرت کننده باشد. حتی بهتر است که تعداد عناصر در مجموعه سمت راست تقریباً دو برابر تعداد عناصر موجود در ستون سمت چپ باشد.

لازم است که همه عوامل حواس پرتی در یک کار به یک اندازه قابل قبول باشند.

آیتم های ستون باید بر اساس یک پایه انتخاب شوند تا اطمینان حاصل شود که فقط مواد همگن در هر مورد آزمایشی گنجانده شده است.

در آزمون صدور گواهینامه، وظایف انطباق به دلیل دست و پا گیر بودن آنها بی اثر است، که اجازه نمی دهد حجم زیادی از محتوا را پوشش دهد.

تطبیق وظایف با یک دستورالعمل استاندارد دو کلمه ای ارائه می شود: "MATCH". گاهی اوقات دستورالعمل ها گسترش می یابد، به خصوص در مواردی که فرم پاسخ جداگانه وجود دارد. به عنوان مثال، دستورالعمل ممکن است به این صورت باشد: "ابتدا حروف را مطابق با عناصر مشخص شده در جدول ارائه شده در متن وظیفه بنویسید و سپس آنها را به فرم منتقل کنید."

عملکرد در وظایف تطبیق با استفاده از یک ارزیابی دوگانه یا چندگانه ارزیابی می شود. در امتیاز دهی دوگانه، 1 امتیاز برای تمام مسابقاتی که به درستی شناسایی شده اند در آیتم آزمایشی داده می شود. اگر حداقل یک تطابق نادرست باشد، آزمودنی برای یک کار تطبیق تا حدی به درستی انجام شده 0 امتیاز دریافت می کند. راه دیگر این است که برای هر تطابق صحیح یک امتیاز اختصاص دهید، سپس هنگام بررسی موارد برای مطابقت، از امتیاز دهی چندتومی استفاده می شود و تعداد کل امتیازات مورد برابر با تعداد موارد منطبق شده است.

5.5. وظایف برای ایجاد توالی صحیح

وظایف آزمون فرم چهارم برای ارزیابی سطح مهارت در یک توالی از اقدامات، فرآیندها و غیره در نظر گرفته شده است. در چنین وظایفی، عناصر مربوط به یک کار خاص به ترتیب تصادفی ارائه می شوند و آزمودنی باید ترتیب صحیح عناصر پیشنهادی را تعیین کند و آن را به روشی مشخص در مکانی مشخص شده نشان دهد.

دستورالعمل های استاندارد برای وظایف فرم چهارم عبارتند از: "تأمین ترتیب صحیح". گاهی دستورالعمل ها در متن تکلیف گنجانده می شود.

تمرین 1

نام فرماندهان روسی را در ترتیب زمانی فعالیت های آنها قرار دهید. در جدول ارائه شده در متن تکلیف، حروفی را که اسامی را به ترتیب صحیح نشان می دهند، بنویسید و سپس آنها را به فرم منتقل کنید.

الف) دیمیتری پوژارسکی

ب) الکسی ارمولوف

ب) میخائیل اسکوبلف

د) الکسی اورلوف


وظیفه 2

توالی صحیح مکانیزم بازدم را با قرار دادن اعداد در مکان های تعیین شده تعیین کنید:

? - فروپاشی ریه ها

? - مهار مرکز ماهیچه های تنفسی در نخاع

? - تحریک مرکز بازدم در بصل النخاع

? - شل شدن دیافراگم و عضلات کمکی

? - کاهش حفره قفسه سینه


در بسیاری از موارد، وظایف برای ایجاد توالی صحیح بسیار کم فناوری هستند یا به دلیل محتوای خاص موضوع قابل اجرا نیستند. آنها دست و پا گیر هستند و اغلب به دنباله ای مبهم از پاسخ ها اجازه می دهند، بنابراین برای استفاده در آزمون های گواهینامه توصیه نمی شوند.

5.6. ویژگی های مقایسه ای فرم های تکلیف آزمون

در فرآیند توسعه یک آزمون، نویسنده همیشه یک سوال دارد: آیا باید فقط به یک شکل از کارها پایبند باشد یا تصمیم بگیرد که اشکال مختلف را در یک آزمون ترکیب کند؟ و اگر روی یکی متوقف شوید، کدام یک را ترجیح می دهید؟ انتخاب نویسنده تا حد زیادی با محتوای خاص رشته دانشگاهی، اهداف ایجاد و استفاده از آزمون تعیین می شود. در اینجا چیزهای زیادی به فناوری آزمایش، جمع‌آوری و پردازش داده‌های تجربی، به پشتیبانی فنی و مادی برای فرآیند اعمال آزمون بستگی دارد. سازماندهی جمع آوری رایانه ای و تجزیه و تحلیل نتایج آزمون در مواردی که همه وظایف چند گزینه ای هستند آسان است.

نتایج تکمیل وظایف با پاسخ های ساخته شده نیاز به پردازش دستی دارد. به عنوان یک قاعده، کارشناسان باید برای ارزیابی نتایج اجرای آنها مشارکت داشته باشند و این مستلزم هزینه های مواد اضافی و زمان برای تأیید است.


مزایا و معایب اشکال مختلف تکالیف

1. وظایف با دو پاسخ

مزایای: به دلیل مختصر بودن آنها به شما امکان پوشش حجم زیادی از مواد را می دهند، توسعه آن آسان است (فقط یک حواس پرت کننده) و نتایج اجرا به سرعت با عینیت بالا پردازش می شوند.

ایرادات: تحریک حفظ حروف، تشویق به حدس زدن، نیاز به افزایش تعداد کارها و بر این اساس، زمان آزمایش برای جبران تأثیر حدس زدن.

2. وظایف با انتخاب چهار تا پنج پاسخ

مزایای: مناسب برای طیف گسترده ای از موضوعات تحصیلی، به دلیل مختصر بودن عبارت در آزمون، می توان حجم زیادی از مطالب را پوشش داد، امکان تست خودکار و عینیت بالای ارزیابی دانش آموزان را فراهم می کند، امکان ارائه جزئیات را فراهم می کند. تحلیل آماریویژگی های آنها، آنها را تنظیم می کند و به طور قابل توجهی قابلیت اطمینان اندازه گیری های آموزشی را افزایش می دهد.

ایرادات: هنگام انتخاب عوامل حواس‌پرتی و تصحیح نمرات دانش‌آموزان نیازمند کار قابل توجهی از سوی نویسندگان است؛ آنها برای آزمایش سطح تولیدی فعالیت و مهارت‌های شناختی مناسب نیستند.

3. وظایف با پاسخ های تنظیم شده ساخته شده

مزایای: توسعه آسان، حدس زدن را حذف می کند، تا حدی برای تأیید خودکار مناسب است.

ایرادات: آنها عمدتاً دانش مواد واقعی یا دستگاه مفهومی را بررسی می کنند، معمولاً (در موضوعات بشردوستانه) بسیار آسان هستند، گاهی اوقات به پاسخ های مبهم درست و تا حدی صحیح منجر می شوند.

4. وظایف با پاسخ های آزادانه ساخته شده است

مزایای: به شما امکان می دهد دستاوردهای آموزشی پیچیده از جمله مهارت های ارتباطی را ارزیابی کنید. سطح خلاقفعالیت ها، به راحتی به عنوان وظایف سنتی فرموله می شوند و حدس زدن را حذف می کنند.

ایرادات: آنها به یک روش تأیید طولانی و پرهزینه نیاز دارند، زمان اجرای قابل توجهی دارند، اجازه نمی دهند مقدار قابل توجهی از محتوای موضوع را پوشش دهند و قابلیت اطمینان اندازه گیری های آموزشی را کاهش می دهند.

5. وظایف انطباق

مزایای: توسعه آسان، ایده آل برای ارزیابی دانش انجمنی و انجام نظارت مداوم، کاهش اثر حدس زدن.

ایرادات: اغلب هنگام بررسی سطح فعالیت تولیدمثلی و مهارت های الگوریتمی استفاده می شود، آنها در قالب ارائه دست و پا گیر هستند.


ویژگی های مقایسه ای خواص تکنولوژیکی اشکال مختلف آزمایش در جدول ارائه شده است. 5.1.


جدول 5.1ویژگی های فنی مقایسه ای قالب ها





انتخاب فرم وظایف پیش آزمون با توجه به ویژگی های محتوای کنترل شده و اهداف ایجاد آزمون تعیین می شود. هر شکلی از وظایف مزایا و معایب خاص خود را دارد، دامنه کاربرد خود را دارد.

توسعه وظایف پیش آزمون مطابق با الزامات استاندارد انجام می شود که محتوای آن به مشخصات فرم آزمون بستگی دارد. وظایف با پاسخ های چند گزینه ای به دلیل تعدادی از مزایای تکنولوژیکی که کارایی فرآیندهای اعمال آزمون نهایی و ارزیابی نتایج دانش آموز را افزایش می دهد برای کنترل نهایی راحت تر هستند. وظایف تکمیلی برای کنترل یادگیری ارجحیت دارند.

روندهای مدرن در توسعه آزمون های نهایی با خروج از یکنواختی و استفاده گسترده از وظایف تکمیلی همراه است، زیرا تنوع دانش و مهارت های مورد آزمایش مستلزم معرفی اشکال مختلف در آزمون است.

تمرینات و سوالات بحث را تمرین کنید

1. دایره شماره پاسخ صحیح را بکشید.

استفاده از موارد آزمون با دو پاسخ در کنترل مؤثرتر است:

1) جریان

2) موضوعی

3) نهایی

4) ورودی

2. دایره شماره پاسخ صحیح را بکشید.

1) جریان

2) نهایی

3) ورودی

3. دایره شماره پاسخ صحیح را خط بکشید.

احتمال حدس زدن شماره محل پاسخ صحیح در یک کار با پنج حواس پرت کننده خواهد بود:

4. دو کاستی قابل توجه در کار پیدا کنید، کار را مجدداً فرموله کنید تا کاستی ها برطرف شود.

کدام دسته از حیوانات دارای ویژگی های زیر هستند: خونسرد، زندگی در آب و خشکی، پرورش در آب؟

1. کلاس ماهی

2. کلاس خزندگان

3. دسته دوزیستان

4. طبقه پستانداران

5. روشی برای بهبود جمله بندی وظایف پیشنهاد کنید.

کدام یک از موارد زیر با اصلاحات دهه 60 قرن 19 در روسیه حذف شد؟

1. خودکامگی

2. رعیت

3. املاک

4. مالکیت زمین

5. ستم ملی

کارشناس:در فناوری اطلاعات و فیلم آموزشی

قبل از اینکه وارد اصول طراحی تست شویم، باید به چند نکته اشاره کرد.

تفاوت بین آزمون و وظایف در فرم آزمون

مفاهیم به طور مداوم در آگاهی روزمره اشتباه گرفته می شوند تستو تست سیستم های وظیفه(یا کارهای پیش آزمون).

به عنوان یک قاعده، این آزمون توسط تیمی از محققان توسعه داده می شود و در یک دوره زمانی مشخص آزمایش می شود. پس از آزمایش، تنظیمات مربوط به تست انجام می شود. این آزمون شامل وظایف تستی است. در ادبیات انگلیسی زبان، اصطلاح "Quiz" (اما نه "Test"!) برای اشاره به یک آزمون استفاده می شود.

بنابراین معلم (معلم) نمی تواند تست ایجاد کند. درعوض، او وظایفی را به شکل آزمایشی توسعه می‌دهد که ظاهراً شبیه آزمون هستند، اما تحت آزمایش‌های آماری یا آزمون‌های دیگر قرار نمی‌گیرند. چنین وظایفی را می توان در فرآیند آموزشیبرای حل مشکلات آموزشی خاص

از این نتیجه می شود که اساساً استفاده از تعدادی ویژگی تست غیرممکن است. به عنوان مثال، دشواری یک تکلیف آزمایشی بر اساس نتایج یک نمونه بزرگ از دانش آموزان به صورت تجربی تعیین می شود. در عمل معلم هم زمان انجام آزمایش و هم حجم نمونه لازم را ندارد. بنابراین، دشواری اغلب "با چشم" تعیین می شود.

به طور کلی، وظایف در فرم آزمون (و همچنین وظایف آزمون) شرایط زیر را برآورده می کند:

  • اختصار؛
  • قابلیت ساخت؛
  • قطعیت هدف؛
  • شکل منطقی بیانیه؛
  • قطعیت مکان برای پاسخ ها؛
  • قوانین مشابه برای ارزیابی پاسخ ها؛
  • مکان صحیح عناصر وظیفه؛
  • دستورالعمل های یکسان برای همه موضوعات؛
  • کفایت دستورالعمل ها با شکل و محتوای کار.

بنابراین، اختصاروظایف در فرم آزمون با انتخاب دقیق کلمات، نمادها و گرافیک ها تضمین می شود که با حداقل ابزار امکان دستیابی به حداکثر وضوح محتوای معنایی کار را فراهم می کند.قابلیت ساخت وظایف به عنوان خاصیتی تعریف می‌شود که اجازه می‌دهد فرآیند آزمایش با استفاده از ابزارهای فنی انجام شود و این کار را با دقت، سریع، اقتصادی و عینی انجام دهد.شکل منطقی بیانیه وسیله ای برای ساده سازی و سازماندهی مؤثر محتوای یک کار است.

فرم وظایف آزمون

علاوه بر این، اصول تدوین تکالیف آزمون (وظایف در فرم آزمون) با فرم آنها مرتبط است. نویسندگان مختلفاشکال وظایف آزمون به طور متفاوتی طبقه بندی می شوند. بدتر از همه، هر سیستم تست خودکار، فرم‌های مشابهی را متفاوت نام‌گذاری می‌کند. اجازه دهید انواع اشکال تکالیف آزمون را با طبقه بندی زیر خلاصه کنیم.

  1. درست غلط (درست یا غلط، از انگلیسی درست یا غلط)- حاوی عبارتی است که دانش آموز باید با آن موافق باشد یا مخالف.

مثلا:

اولین رئیس جمهور آمریکا جورج واشنگتن بود

  1. درست
  2. اشتباه

در آزمون یکپارچه دولتی، وظایف مشابه در KIMها بر اساس زبان های خارجیدر وظایف گوش دادن: دانش آموزان به متن گوش می دهند، سپس به کارهایی از نوع True یا False می روند.

این شکل از تکالیف تستی هم برای معلم و هم برای پاسخگویی دانش آموزان ساده ترین است. چنین اشکال انتساب مشخص می شود درجه بالاحدس زدن پاسخ صحیح

2. چند گزینه ای (وظایف با انتخاب یک یا چند پاسخ صحیح).این رایج ترین شکل وظایف آزمون است. این شامل یک بیانیه (سوال) و پاسخ های جایگزین است.

برای کارهایی با انتخاب یک پاسخ صحیح، توصیه می شود حداقل از 4 (اگر کمتر باشد، احتمال حدس زدن پاسخ صحیح افزایش می یابد) و نه بیشتر از 6 (دستیابی به جایگزین های قابل قبول دشوار است).

برای کارهایی که دارای چندین پاسخ صحیح هستند، حداقل 6 گزینه پیشنهاد می شود.

3. وظایف برای ایجاد انطباق.این مجموعه ای از عناصر در دو ستون است - دانش آموز باید یک تناظر بین عناصر ستون چپ و راست برقرار کند. داشتن عنوان برای هر مجموعه از ستون‌ها یک امر ضروری است—این به دانش‌آموز اجازه می‌دهد تا از اتلاف وقت برای خلاصه‌بندی موارد در ستون‌ها جلوگیری کند و مستقیماً به فعالیت بپردازد.

مقایسه کنید:

  1. یک برچسب
  2. ب) اولوس
  3. ج) ولوستن
  4. د) معاون
  5. ه) پلینتا
  1. ساختار دیوار باتری
  2. آجر
  3. منشور خان
  4. فرماندار وولست
  5. مالکیت

همچنین یک کار، با در نظر گرفتن الزامات خاص دوباره قالب بندی شده است:

همانطور که می بینیم، در مورد دوم تکلیف خواناتر است، معنای آن به راحتی قابل درک است. لطفاً توجه داشته باشید که به عنوان مثال، سرویس OnlineTestPad و برخی دیگر به شما اجازه می دهند چنین هدرهایی را اضافه کنید. دیگران (مانند Moodle) این قابلیت را ندارند. در این صورت لازم است یک دستورالعمل کامل بنویسید، مثلاً «مطابقت بین .... و ... را مطابقت دهید».

در آزمون های کاغذی این شکل از وظایف برای پاسخ صحیحاز شما خواسته می شود که فرم خاصی را پر کنید. گزینه ای که دارای فلش است برای آزمایش از نظر تکنولوژیکی کمتر پیشرفته در نظر گرفته می شود، بنابراین باید از آن اجتناب شود.

2 3 4

همچنین مطلوب است تعداد فرد عنصر را تنظیم کنیدستون های چپ و راست به طوری که آخرین عنصر با حذف انتخاب نشود.

به این تکلیف نگاه کنید:

نام فرماندهان روسی را به ترتیب زمانی (به ترتیب صعودی) فعالیت های آنها ترتیب دهید

دیمیتری پوژارسکی

الکسی ارمولوف

میخائیل اسکوبلف

الکسی اورلوف

این نیز وظیفه ای است برای ایجاد مکاتبات، یا دقیق تر، تنوع آن - وظیفه ای برای ایجاد توالی صحیح. تعدادی از محققان خارجی به چنین اتحادیه ای تمایل دارند. به همین دلیل است که مثلاً در مودل چنین فرمی پیدا نمی کنیم. اما می توان آن را به راحتی از یک کار تطبیق ساخت. برای وضوح، اجازه دهید کار قبلی را کمی اصلاح کنیم:

ما یک کار تطبیق کلاسیک را می بینیم، فقط ستون سمت چپ نشان دهنده ترتیب عددی است. همچنین دانش آموز باید پاسخ های صحیح را در جدول مخصوص وارد کند.

2 3

گاهی اوقات کارهایی که در بالا توضیح داده شد درست یا نادرست هستند، چند گزینه ایو مکاتبات ترکیب می شوند به یک گروه کاری بسته، که دارای ویژگی های مشترک زیر هستند:

  • پاسخ صحیح به وضوح وجود دارد، فقط باید آن را به روشی انتخاب کنید.
  • پاسخ به سؤالات را می توان حدس زد (احتمال حدس زدن با کاهش تعداد گزینه ها افزایش می یابد).
  • پاسخ ها قابل یادآوری هستند
  • پاسخ ها را می توان به صورت منطقی انتخاب کرد و جایگزین های آشکارا نادرست را کنار گذاشت.

5. اضافه (پاسخ کوتاه).در این تکالیف دانش آموز باید پاسخ صحیح را تکمیل کند. گاهی اوقات این نوع کار نامیده می شود وظایف نوع بازبرخلاف اشکال تکالیف تستی که در بالا مورد بحث قرار گرفت، راهبردهایی مانند حدس زدن، به خاطر سپردن پاسخ صحیح و غیره «کار نمی‌کنند». بنابراین این نوع کار برای دانش آموزان دشوارتر تلقی می شود.

6. انشا- پاسخ کوتاهی از دانش آموز به اصل سوال. به بیان دقیق، انشا یک نوع آزمون نیست، زیرا ... معیارهای لازم اختصار، قابلیت ساخت و غیره را برآورده نمی کند. به نظر ما، این مقاله برای غلبه بر مشکلات شناخته شده در نوشتن تکالیف تست معمولی معرفی شده است که اصلی ترین آنها ناتوانی در ارائه است.همهمواد آموزشی در قالب آزمون و ماهیت تولید مثلی وظایف آزمون معمولی.

با این حال، تکالیف مقاله باید استاندارد(های) یک پاسخ بهینه را همراه با قوانین استاندارد شده برای ارزیابی نتایج اجرای آن پیشنهاد کنند.

برای چه مقادیری از x مقادیر مربوط به توابع f(x)=log هستند 2 x و g(x) = log2 (3 – x) کمتر از 1 متفاوت خواهد بود؟

معیارهای ارزیابی پاسخ صحیح

نکته ها معیارهای ارزیابی تکمیل تکلیف 9
2 دنباله صحیح مراحل حل داده شده است:

1) کامپایل یک نابرابری حاوی یک ماژول.

2) حل نابرابری

تمام تبدیل ها و محاسبات به درستی انجام شد، پاسخ صحیح به دست آمد

1 توالی صحیح مراحل حل داده شده است. هنگام حل نابرابری در مرحله 2، یک اشتباه تایپی و/یا یک خطای محاسباتی جزئی ایجاد شد که بر صحت پیشرفت بیشتر راه حل تأثیری نمی گذارد. این خطای اداری و/یا خطا ممکن است منجر به پاسخ نادرست شود.
0 کلیه موارد حلی که معیارهای فوق را برای کسب 1 یا 2 امتیاز ندارند

اصول توسعه وظایف در فرم آزمون

نکته بعدی که باید روی آن تمرکز کنیم، اصول توسعه وظایف در فرم تست است.

برای مدت طولانی این باور وجود داشت که خود آزمون وسیله ای عینی برای کنترل است. با این حال، سپس این درک حاصل شد که آزمون، اول از همه، عینیت رویه ای را ارائه می دهد. برای ارزیابی کیفیت یک آزمون، تعدادی زمینه مرتبط وجود دارد - قابلیت اطمینان (تضمین عدم وجود خطاهای تصادفی در آزمون)، اعتبار (تضمین اینکه آزمون دقیقاً همان چیزی را که قرار است اندازه‌گیری کند)، دشواری، و غیره. همانطور که در بالا اشاره کردیم، تمام این پارامترها بر اساس مدل های مختلف ریاضی در طول توسعه داده می شوند کار تجربیتیم نویسنده هستند و در دسترس معلمان و اساتید نیستند. بنابراین، ما فقط بر روی تعدادی از الزامات نظری برای توسعه وظایف در فرم آزمون می پردازیم.

  1. شروع به ساختن یک کار با پاسخ صحیح کنید. اغلب اتفاق می افتد که یک کار به طور رسمی حاوی پاسخ های صحیح بیشتری نسبت به برنامه ریزی شده باشد. موارد مخالف نیز وجود دارد - کار به هیچ وجه حاوی پاسخ صحیح نیست.
  2. محتوای تکلیف بر اساس الزامات برنامه است و محتوای موضوعی (فرا موضوعی) را منعکس می کند. گاهی اوقات آنها سعی می کنند سؤالاتی را در آزمون بگنجانند که به سادگی پاسخ صحیحی برای آنها وجود ندارد.

مثلا:

مامطالعه خواهیم کرد زبان لاتینزیرا…

  1. در بسیاری از کشورهای جهان صحبت می شود
  2. ما می خواهیم بهتر بفهمیم زبان مادری، زیرا حاوی کلمات بسیاری است که از لاتین وام گرفته شده اند
  3. ما می خواهیم تاریخ و فرهنگ دنیای باستان را بهتر درک کنیم

این آفرین. اما باید در یک نظرسنجی جامعه‌شناختی استفاده شود، نه در وظایفی برای آزمایش دستاوردهای آموزشی.

  1. هدف این سوال باید شناسایی یک عنصر دانش، یک فکر کامل باشد. در غیر این صورت، تشخیص دلیل شکست کار دشوار است.

کنفوسیوس..

  1. در آفریقا زندگی می کرد
  2. در چین زندگی می کرد
  3. دکتر بود
  4. حاکم بود
  5. فیلسوف بود

این کار با هدف شناسایی دو عنصر به طور همزمان انجام می شود - محل زندگی کنفوسیوس و کیست. جداسازی این دو موضوع ضروری است.

  1. هنگام نوشتن سوالات، باید از کلمات "گاهی"، "اغلب"، "همیشه"، "کمی"، "بیشتر" و غیره اجتناب کنید. چنین کلماتی معنای ذهنی دارند و ممکن است به پاسخ های اشتباه منجر شوند. تکالیف تستی (وظایف در فرم تست) باید پاسخ روشن و بدون ابهام داشته باشند.
  2. از عبارات یا جملات مقدماتی که ارتباط چندانی با ایده اصلی ندارند پرهیز کنید و به اظهارات طولانی متوسل نشوید.

مثلا:

«افسردگی آنادیر. خیلی مسطح است، و آنادیر مانند یک بوآی بزرگ در امتداد آن حرکت می‌کند... «آنادیر رودخانه‌ای زرد است،» این مقاله را می‌توان بعداً به این ترتیب نامید. توندرا و دریاچه ها در سراسر افسردگی. درک چیزهای بیشتر دشوار است: دریاچه یا خشکی» (O. Kuvaev). این رودخانه به کدام دریا می ریزد؟

  1. پاسخ‌های صحیح باید قابل قبول باشند، با مهارت انتخاب شوند، نباید پاسخ‌های اشتباه آشکاری وجود داشته باشد (آنها نوعی اشاره هستند - این پاسخ مطمئناً اشتباه است). به پاسخ های نادرستی که شباهت زیادی به پاسخ های صحیح دارند گفته می شودحواس پرتی هامثلا:

زادگاه کارل مارکس:

  1. تریر
  2. کارل-مارکس-اشتات
  3. استورگارد
  4. مونیخ

در اینجا می توان فرض کرد که شهر کارل-مارکس-اشتاد به این دلیل نام خود را گرفت که در آن محل تولد کارل مارکس بود. با این حال، پاسخ صحیح تریر است.

  1. سوالات حقه بازی نپرسید - تواناترین یا داناترین دانش‌آموزانی که به اندازه کافی می‌دانند که در دام بیفتند، احتمالاً گمراه می‌شوند و هدف تعیین سطح دانش و درک را نیز ناکام می‌گذارند.
  2. از سؤالات طولانی تر و پاسخ های کوتاه تر باید استفاده شود که از نظر گرامری با بخش اصلی کار سازگار باشد. .

مثلا:

کدام بیان صحیح است؟

  1. جملات ناقص- اینها جملاتی هستند که در آن یکی از اعضای اصلی غایب است
  2. جملات ناقص جملاتی هستند که در آنها یکی از اعضای جزئی غایب است
  3. جملات ناقص جملاتی هستند که در آنها یکی از اعضای جمله وجود ندارد - اصلی یا فرعی

به راحتی می توان فهمید که یک عبارت تکرار شده در اینجا وجود دارد که باید در جمله بندی کار گنجانده شود:

جملات ناقص جملاتی هستند که گم شده اند

  1. یکی از اعضای اصلی
  2. یکی از اعضای خردسال
  3. هر عضوی از جمله - اصلی یا فرعی
  1. در متن سوال از منفی استفاده نکنید. اولاً، این منجر به سوء تفاهم از ماهیت کار می شود. ثانیاً، موضوع کنترل باید عناصر دانش باشد، نه عناصر جهل.

مثلا:

این که آیا این افراد واقعاً در آن زندگی می کردند یا نه یونان باستان?

  1. هومر
  2. آشیل
  3. زئوس
  4. پریکلس
  5. فیدیاس
  6. ارسطو
  7. سقراط

که در در این موردروشن نیست چگونه پاسخ دهیم - بله آنها زندگی کردند یا بله آنها زندگی نکردند. بنابراین، این سؤال باید با دقت بیشتری صورت بندی شود، به عنوان مثال: شخصیت های اساطیری یونان باستان را نام ببرید.

  1. هنگام جایگزین کردن پاسخ های صحیح در سؤالات، نباید سیستم واضحی وجود داشته باشد – به عنوان مثال، همیشه فقط 1 گزینه صحیح است یا گزینه های صحیح به ترتیب گزینه اول، دوم، سوم، چهارم هستند. در تست کامپیوتر این مشکل معمولا وجود ندارد زیرا کامپیوتر به طور خودکار گزینه های جایگزین را به هم می زند.
  2. اگر سؤال ماهیت کمی دارد، باید ترتیب (از حداقل به اکثر یا بالعکس) انتخاب پاسخ های صحیح را مشخص کرد. .

مثلا:

فاصله از خورشید

الف) زحل

ب) جیوه

ج) زمین

د) اورانیوم

ه) زهره

و) مریخ

در این مثال، همانطور که بود، دو مجموعه از گزینه های پاسخ صحیح وجود دارد - یک دنباله از نزدیکترین سیاره به خورشید، دیگری از دورترین سیاره.

  1. سوال و پاسخ باید از نظر فونت و طراحی فضایی متفاوت باشد. به عنوان مثال، یک سوال (وظیفه) به صورت پررنگ برجسته شده است، پاسخ با فونت معمولی است. برای ثبت پاسخ ها از تورفتگی اضافی استفاده می شود. اما این قانون فقط برای تست های کاغذی اعمال می شود - در سیستم های خودکار رایانه ای، طراحی توسط نرم افزار تنظیم می شود که تغییر آن توصیه نمی شود.

و به یاد داشته باشید - هر کار نمی تواند به عنوان یک کنترل آزمایشی ارائه شود.

هنگام نوشتن مقاله، از نمونه هایی استفاده شد http://koi.tspu.ru/koi_books/samolyuk/

همانطور که مشخص است، واحد آزمون، عنصر ساختاری آن، وظیفه آزمون است. می توان آن را به عنوان «ساده ترین و در عین حال کل نگر» تعریف کرد عنصر ساختاریتست. وظایفی که در آزمون گنجانده شده اند می توانند هم از نظر ارائه و هم در محتوا متفاوت باشند. روش های مختلفی برای طبقه بندی وظایف آزمون بر اساس شکل ارائه آنها وجود دارد. رایج ترین انواع وظایف تست در شکل 3.1 نشان داده شده است.

عامل اصلی مؤثر در شکل تکلیف آزمون، روش به دست آوردن پاسخ (انتخاب از بین گزینه های ارائه شده یا به طور مستقل فرمول بندی پاسخ) است. سپس این طبقه بندی را می توان با طرح زیر نشان داد.


لازم به ذکر است که تکالیف تست دارای یک سری ویژگی هستند. هر آزمایشی شماره سریال خاص خود را دارد. به عنوان یک قاعده، وظایف در آزمون به ترتیب سختی فزاینده مرتب می شوند، اگرچه ممکن است با پیشرفت در آزمون، پیچیدگی وظایف در جهات مختلف تغییر کند.

هر تکلیف تستی دارای یک پاسخ صحیح استاندارد است. به عنوان یک قاعده، وظایفی که پاسخ صحیح ندارند در آزمون لحاظ نمی شوند.

موارد آزمون یک فرم معمولاً با دستورالعمل های استاندارد همراه هستند که قبل از فرمول بندی موارد در آزمون قرار می گیرند.

برای هر تکلیف آزمون، یک قانون برای درجه بندی (اعطای امتیاز) تدوین می شود.

تستاز نظر فرم ارائه و زمان اجرا، معمولاً بسیار کوتاه است. هنگام تنظیم یک تکلیف، به این نکته توجه داشته باشید که تمام عبارات آزمون برای همه دانش آموزان بدون استثنا قابل درک است (به صورت عبارات ساده با واژگان رایج، بدون عبارات با استفاده از کلمات خارجی یا به ندرت استفاده می شود. در صورت امکان، در وظایف، عباراتی با از نفی «نه» اجتناب می شود، زیرا در نظر گرفته می شود که تأیید چیزی (اعم از مثبت و منفی) ترجیح داده می شود.

وظایف تایپ را باز کنید. در کارهای باز (وظایف برای اضافه کردن)، پاسخ های آماده داده نمی شود؛ آنها باید به دست آیند. دو نوع کار باز وجود دارد:

  • 1) با محدودیت های اعمال شده در پاسخ؛
  • 2) بدون محدودیت در پاسخ، که در آن آزمون شوندگان باید پاسخ مفصلی را در قالب راه حلی برای مسئله تنظیم کنند.

وظایف نوع دوم کمی با تست های سنتی متفاوت است، به هزینه های تست بیشتری نیاز دارد و استانداردسازی آنها دشوارتر است.

دانش‌آموز هنگام پاسخ دادن به یک تکلیف باز با پاسخ محدود، کلمه، فرمول یا عدد غایب را به جای خط تیره یا در فضای مشخص شده روی فرم پاسخ پر می‌کند.

دستورالعمل‌های مربوط به کارهای باز معمولاً با عبارت‌های زیر همراه می‌شوند: «کلمه گمشده را به جای خط تیره بنویسید» یا «جواب را در فرم پاسخ بگیرید و بنویسید» و غیره.

وظایف نوع بسته وظایف چند گزینه ای یک کار بسته با انتخاب پاسخ، به عنوان یک قاعده، شامل یک سوال و چندین پاسخ ممکن برای آن است (آنها با حروف A، B، C، D، ... یا اعداد: 1،2،3،4 نشان داده می شوند. ،...). دانش آموز باید پاسخ های صحیح را از بین پاسخ ها انتخاب کند. در اکثر تست ها فقط یکی درست است. اما گاهی اوقات توسعه دهندگان تست چندین پاسخ صحیح را در میان پاسخ ها قرار می دهند. به پاسخ های قابل قبول، حواس پرتی می گویند. تعداد آنها در یک کار معمولاً بیش از پنج نیست. عوامل حواس پرتی با در نظر گرفتن انتخاب می شوند اشتباهات معمولیدانش آموزان

در صورتی که دانش آموزانی که مطالب آموزشی را به درستی می دانند و آنهایی که نمی دانند هر یک از پاسخ ها را با احتمال مساوی انتخاب کنند، یک تکلیف تست بسته با انتخاب پاسخ ها "خوب کار می کند" در نظر گرفته می شود.

وظایف با پاسخ های چند گزینه ای معمولاً با دستورالعمل های زیر انجام می شود: شماره (حرف) پاسخ صحیح (برای آزمایش خالی) را مشخص کنید یا: کلید شماره (حرف) پاسخ صحیح (برای تست رایانه) را فشار دهید.

موارد آزمون با انتخاب یک پاسخ صحیح، به عنوان یک قاعده، دارای ویژگی های زیر هستند:

از ابهام و ابهام در متن تکلیف اجتناب شود.

کار ساختار نحوی ساده ای دارد.

بخش اصلی تا حد امکان حاوی کلمات است و بیش از 2-3 کلمه کلیدی برای پاسخ برای یک مشکل باقی نمی ماند. تمام کلمات تکرار شده با وارد کردن آنها در متن اصلی کار از پاسخ ها حذف می شوند.

پاسخ به یک کار معمولاً طول یکسانی دارد.

آنها سعی می کنند تمام تداعی های کلامی را که به انتخاب پاسخ صحیح با استفاده از حدس کمک می کنند حذف کنند.

تعداد دفعات انتخاب همان تعداد پاسخ صحیح در تکالیف متنی مختلف معمولاً یکسان است یا این تعداد تصادفی است.

  • *آزمون‌هایی که حاوی قضاوت‌های ارزشی و نظرات آزمون‌شونده در مورد هر موضوعی هستند معمولاً حذف می‌شوند.
  • *تعداد گزینه های پاسخ در هر کار یکسان است و معمولاً بیش از پنج نیست (به ندرت - 7)؛
  • *هنگام فرمول‌بندی عوامل حواس‌پرتی (پاسخ‌های قابل قبول)، از عبارات «هیچ‌کدام از فهرست‌شده‌ها»، «همه موارد فهرست‌شده» و غیره که به حدس زدن کمک می‌کنند خودداری کنید؛ در پاسخ‌ها سعی کنید از کلماتی مانند «همه»، «هیچکدام» استفاده نکنید. "هرگز" "همیشه" و غیره به عنوان تسهیل کننده حدس زدن.
  • * حواس پرتی ها به گونه ای ارائه می شوند که برای افرادی که پاسخ صحیح را نمی دانند به همان اندازه جذاب باشند.

هیچ یک از عوامل حواس پرتی پاسخ تا حدی صحیح نیست که تحت شرایط خاصی به پاسخ صحیح تبدیل می شود.

پاسخ هایی که از یکدیگر دنبال می شوند از لیست پاسخ های نادرست حذف می شوند.

پاسخ ها به گونه ای انتخاب می شوند که کلید یک کار به عنوان کلید پاسخ های صحیح یک کار دیگر عمل نکند، یعنی حواس پرتی از یک کار به عنوان پاسخ های صحیح کار دیگر استفاده نشود.

همه پاسخ ها، به عنوان یک قاعده، از نظر طراحی موازی هستند و از نظر گرامری با بخش اصلی تکلیف آزمون مطابقت دارند.

*اگر پاسخ های جایگزین در یک کار وجود داشته باشد، آنها در کنار پاسخ صحیح قرار نمی گیرند، زیرا این بلافاصله توجه را روی آنها متمرکز می کند.

ویژگی های مقایسه ای انواع تکالیف آزمون. انتخاب انواع کار تست توسط پارامترهای زیادی تعیین می شود: محتوای خاص موضوع آکادمیک، اهداف آزمون، سطح پیچیدگی وظایف، حرفه ای بودن توسعه دهنده و غیره.

هر یک از انواع تست ها مزایا و معایب خاص خود را دارند. به عنوان مثال، وظایف چند گزینه ای بسته با مزایایی که همه آزمون ها دارند، مشخص می شوند:

  • - عینیت در ارزیابی نتایج کار؛
  • - سرعت بررسی وظایف انجام شده؛
  • - آزمایش سیستماتیک حجم کافی از مواد آموزشی.

در عین حال دارند ویژگی های مثبت، فقط ذاتی است این گونهوظایف به عنوان مثال، آنها ساده ترین پردازش هستند، به شما امکان می دهند مجموعه رایانه ای و تجزیه و تحلیل نتایج و غیره را بدون هزینه زیاد سازماندهی کنید. اما چنین تست هایی دارای معایبی نیز هستند:

بررسی فقط نتایج نهایی کار؛

ناتوانی در ردیابی منطق استدلال دانش آموز هنگام تکمیل وظایف؛

احتمال انتخاب یک پاسخ به صورت تصادفی؛

عدم امکان آزمایش انواع خاصی از فعالیت های آموزشی (به عنوان مثال، یافتن مستقل جهت راه حل ها).

تعداد نسبتاً زیادی از وظایف در آزمون (معمولاً بیش از 20) و عدد بزرگگزینه های پاسخ (بیش از 4).

برخی از این معایب (به عنوان مثال، حدس زدن پاسخ) را می توان با آزمون های باز اجتناب کرد. اما در عین حال، پردازش آماری نتایج این وظایف دشوارتر است و برای ارزیابی وظایف با پاسخ دقیق، نیاز به مشارکت کارشناسان است که به نوبه خود، عینیت کنترل را کاهش می‌دهد و استانداردسازی را پیچیده می‌کند. آزمون، و هزینه های زمانی و مالی پردازش نتایج آزمون را افزایش می دهد.

در تئوری آزمون، این دیدگاه به طور فزاینده ای بیان می شود که در یک آزمون مطلوب است تا حد امکان از اشکال مختلف آیتم های آزمون استفاده شود. آزمون‌های حرفه‌ای اغلب با تک‌شکل بودن وظایفشان متمایز می‌شوند. با این حال، این الزام همیشه به دلیل ویژگی های یک موضوع خاص امکان پذیر نیست. بنابراین، توسعه دهندگان اغلب در یک آزمایش ترکیب می شوند انواع مختلفوظایف تست (به عنوان مثال، بسته و باز).

مثلا تست ها تست متمرکزشامل دو بخش (قسمت A و بخش B) است. بخش A شامل وظایف تست نوع بسته و بخش B شامل تست های نوع باز است.

جداول 1.2 و 1.3 ویژگی های مقایسه ای تکالیف آزمون در انواع مختلف را نشان می دهد.

جدول 1.2. تحلیل تطبیقی ​​وظایف آزمون مطابق با سطوح تسلط بر مطالب آموزشی

بر اساس برخی از این ویژگی ها، سازندگان آزمون می توانند شکلی از آیتم های آزمایشی را انتخاب کنند که برای اهداف خاصی مناسب است. همچنین باید توجه داشت که تنها ترکیب معقول آزمون ها با اشکال سنتی و روش های کنترل، امکان دستیابی به تصویری جامع از سطح دانش را فراهم می کند.

جدول 1.3. تجزیه و تحلیل مقایسه ای وظایف آزمون مطابق با شاخص های طراحی آزمون

شاخص های طراحی

انواع وظایف

بسته شد

باز کن

چند گزینه ای

برای ایجاد انطباق

برای ایجاد توالی صحیح

با پاسخ محدود

پاسخ رایگان

سهولت طراحی

نه همیشه

نه همیشه

نه همیشه

اثر حدس زدن

عینیت در ارزیابی نتیجه اجرا

بستگی به کیفیت کار دارد

نه، رتبه بندی ذهنی است

احتمال خطای دانش آموز هنگام نوشتن پاسخ

با دوستان به اشتراک بگذارید یا برای خود ذخیره کنید:

بارگذاری...