Tipi di test di esempi di attività di test aperti. Tipi di test e forme di compiti di prova - lezione. Classificazione dei compiti di prova

TIPI DI PROVE E FORME DI COMPITI DI PROVA

1. Principali tipologie di prove pedagogiche.

2. Forme di compiti di prova.

3. Verifica empirica ed elaborazione statistica dei risultati.

4. Principi di selezione dei contenuti. Criteri di valutazione del contenuto del test.

5. La relazione tra la forma del compito e il tipo di conoscenze, abilità e abilità da testare.


1. Principali tipologie di prove pedagogiche

Esistono due tipi principali di test: tradizionali e non tradizionali.

Il test ha composizione, integrità e struttura. Consiste in compiti, regole per la loro applicazione, voti per il completamento di ciascun compito e raccomandazioni per interpretare i risultati dei test. L'integrità del test significa l'interrelazione dei compiti, la loro appartenenza a un fattore misurato comune. Ciascuna attività di test svolge il ruolo assegnato e pertanto nessuna di esse può essere rimossa dal test senza perdita di qualità della misurazione. La struttura del test è formata dal modo in cui i compiti sono collegati tra loro. Fondamentalmente, questa è la cosiddetta struttura fattoriale, in cui ogni elemento è correlato agli altri attraverso contenuti comuni e variazioni comuni nei punteggi dei test.

Un test tradizionale è un'unità di almeno tre sistemi:

Un sistema formale di compiti di difficoltà crescente;

Caratteristiche statistiche dei compiti e risultati dei soggetti del test.

Il test pedagogico tradizionale deve essere considerato in due sensi significativi: - come metodo di misurazione pedagogica e come risultato dell'utilizzo del test. È sorprendente che i testi in russo gravitino verso il significato del metodo, mentre nella maggior parte delle opere di autori occidentali il concetto di test è più spesso considerato nel senso di risultato. Nel frattempo, entrambi questi significati caratterizzano il test da diversi lati, perché il test deve essere inteso contemporaneamente sia come metodo che come risultato di una misurazione pedagogica. Uno completa l'altro. Un test, come metodo, non può essere immaginato senza che i risultati confermino la qualità stessa e la qualità delle valutazioni delle misurazioni di soggetti a vari livelli di preparazione.

Diverse idee sono sviluppate nella definizione di test tradizionale sopra riportata.

La prima idea è che il test non sia considerato come un insieme ordinario di domande, compiti, ecc., ma nella forma del concetto di “sistema di compiti”. Un tale sistema non è formato da alcuna totalità, ma solo da ciò che determina l'emergere di una nuova qualità integrativa che distingue la prova da un insieme elementare di compiti e da altri mezzi di controllo pedagogico. Dei tanti sistemi possibili, il migliore è costituito da quell'insieme integrale in cui la qualità della prova si manifesta in misura relativamente maggiore. Da qui l'idea di identificare il primo dei due principali fattori di formazione del sistema: la migliore composizione dei compiti di test che ne costituiscono l'integrità. Sulla base di ciò, possiamo dare una delle definizioni più brevi: un test è un sistema di compiti che formano la migliore integrità metodologica. L'integrità del test è l'interazione stabile dei compiti che costituiscono il test come sistema in via di sviluppo.

La seconda idea è che in questa definizione di test c'è un allontanamento dalla tradizione profondamente radicata di vedere un test come un semplice mezzo per verificare, testare, testare. Ogni test include un elemento di test; non è tutto. Perché un test è anche concetto, contenuto, forma, risultati e interpretazione: tutto ciò che richiede una giustificazione. Ciò implica che il test è uno strumento qualitativo di misurazione pedagogica. In conformità con le disposizioni della teoria, punteggi dei test non sono valutazioni accurate dei soggetti. È corretto dire che rappresentano questi significati solo con una certa accuratezza.

La terza idea sviluppata nella nostra definizione di test tradizionale è l'inclusione di un nuovo concetto: l'efficacia del test, che non era stato precedentemente considerato nella letteratura sui test come criterio per l'analisi e la creazione del test. L'idea guida di un test tradizionale è confrontare le conoscenze del maggior numero possibile di studenti con un numero minimo di compiti, in breve tempo, rapidamente, in modo efficiente e al minor costo.

Essenzialmente, questo riflette l’idea di efficienza attività pedagogica nel campo del controllo della conoscenza. Mi piacerebbe pensare che non ci sia nessuno e non ci sia bisogno di opporsi proprio a questa idea. Se il nostro insegnante può chiarire materiale didattico non peggio del suo collega straniero, allora è bene testare le conoscenze richieste, per tutti gli studenti, per tutto il materiale studiato, non è in grado di farlo a causa del sistema di lezioni in classe prevalente nel nostro paese, della mancanza apparecchiature informatiche, test e programmi per l'organizzazione dell'autocontrollo automatizzato: la forma più umana di controllo della conoscenza. Nemmeno lui è fisicamente in grado di farlo. A causa, per usare un eufemismo, errato politica sociale Da tempo gli stipendi dei nostri insegnanti non riescono a compensare nemmeno il dispendio dell’energia fisica necessaria per un buon insegnamento, per non parlare del maggiore dispendio di energia intellettuale, che può essere raggiunto solo pensando in modo rilassato e non preoccupato dalla ricerca per il pane. Come notato in letteratura, un lavoratore qualificato riceve da tre a quattro volte meno del livello salariale oltre il quale viene interrotta la normale attività della vita e inizia la distruzione del potenziale lavorativo.

Sebbene in letteratura siano presenti centinaia di esempi di definizioni di test con cui è difficile o impossibile concordare, ciò non significa affatto che questa definizione test tradizionale: la verità ultima. Come tutti gli altri concetti, necessita di miglioramenti costanti. All'autore sembra solo che finora sia più ragionato di altri concetti ben noti del test pedagogico. Tuttavia, il desiderio di migliorare i concetti è un fenomeno del tutto normale e necessario per lo sviluppo normale della pratica e della scienza. Tentativi costruttivi di dare altre definizioni del test o di sfidare quelle esistenti sono sempre utili, ma è proprio questo che ci manca.

I test tradizionali includono test omogenei ed eterogenei. Un test omogeneo è un sistema di compiti di difficoltà crescente, forma specifica e contenuto specifico - un sistema creato allo scopo di un metodo obiettivo, di alta qualità ed efficace per valutare la struttura e misurare il livello di preparazione degli studenti in un accademico disciplina. È facile intuire che, nella sua essenza, la definizione di test omogeneo coincide con la definizione di test tradizionale.

I test omogenei sono più comuni di altri. In pedagogia, sono creati per controllare la conoscenza in una disciplina accademica o in una sezione, come, ad esempio, un voluminoso disciplina accademica come la fisica. In un test pedagogico omogeneo non è consentito l'uso di compiti che rivelino altre proprietà. La presenza di quest'ultimo viola il requisito della purezza disciplinare della prova pedagogica. Dopotutto, ogni test misura qualcosa di predeterminato.

Ad esempio, un test di fisica misura le conoscenze, le abilità e le percezioni dei partecipanti al test in questa scienza. Una delle difficoltà di tale misurazione è che la conoscenza fisica è fortemente associata alla conoscenza matematica. Pertanto, il test di fisica stabilisce in modo esperto il livello di conoscenza matematica utilizzato per risolvere i problemi di fisica. Il superamento del livello accettato porta a una distorsione dei risultati; man mano che vengono superati, questi ultimi cominciano sempre più a dipendere non tanto dalla conoscenza della fisica, ma dalla conoscenza di un'altra scienza, la matematica. Un altro aspetto importante- il desiderio di alcuni autori di includere nei test non tanto una prova di conoscenza quanto la capacità di risolvere problemi fisici, coinvolgendo così la componente intellettuale nella misurazione della preparazione in fisica.

Un test eterogeneo è un sistema di compiti di difficoltà crescente, forma specifica e contenuto specifico - un sistema creato allo scopo di un metodo obiettivo, di alta qualità ed efficace per valutare la struttura e misurare il livello di preparazione degli studenti in diversi ambiti accademici discipline. Spesso tali test includono anche compiti psicologici per valutare il livello di sviluppo intellettuale.

Di solito, i test eterogenei vengono utilizzati per una valutazione completa dei diplomati, per la valutazione della personalità quando si fa domanda per un posto di lavoro e per selezionare i candidati più preparati per l'ammissione alle università. Poiché ogni prova eterogenea è costituita da prove omogenee, l'interpretazione dei risultati della prova viene effettuata in base alle risposte ai compiti di ciascuna prova (qui vengono chiamate scale) e, inoltre, attraverso vari metodi di aggregazione dei punteggi, si tenta di Dare valutazione complessiva preparazione del soggetto del test.

Ricordiamo che un test tradizionale è un metodo di diagnosi dei soggetti in cui rispondono agli stessi compiti, contemporaneamente, nelle stesse condizioni e con lo stesso punteggio. Con questo orientamento il compito di determinare l'esatto volume e la struttura del materiale didattico acquisito passa necessariamente in secondo piano. Il test seleziona un numero minimo sufficiente di compiti che consente di determinare con relativa precisione, in senso figurato, non "chi sa cosa", ma "chi sa di più". L'interpretazione dei risultati dei test viene effettuata principalmente nel linguaggio testologico, basandosi sulla media aritmetica, moda o mediana e sulle cosiddette norme percentili, che mostrano quale percentuale di soggetti ha un risultato del test peggiore di quello di qualsiasi soggetto preso per esame. analisi con il punteggio del test. Questa interpretazione è detta orientata alla normativa. Qui la conclusione è completata da una valutazione: i compiti rispondono a conclusioni sulla conoscenza della materia valutazione, intesa come conclusione sulla posizione o il grado della materia.

Prove integrative. Un test integrativo può essere definito un test costituito da un sistema di compiti che soddisfano i requisiti di contenuto integrativo, una forma di test e una difficoltà crescente dei compiti volti a una diagnosi finale generalizzata della preparazione del laureato Istituto d'Istruzione. La diagnostica viene effettuata presentando tali compiti, le cui risposte corrette richiedono una conoscenza integrata (generalizzata, chiaramente interrelata) di due o più discipline accademiche. La creazione di tali test è affidata solo a quegli insegnanti che hanno conoscenza di una serie di discipline accademiche, comprendono l'importante ruolo delle connessioni interdisciplinari nell'apprendimento e sono in grado di creare compiti, le cui risposte corrette richiedono che gli studenti abbiano la conoscenza di vari discipline e la capacità di applicare tali conoscenze.

Il test integrativo è preceduto dall'organizzazione della formazione integrativa. Sfortunatamente, l’attuale forma di lezione in classe, combinata con l’eccessiva frammentazione delle discipline accademiche, insieme alla tradizione di insegnare singole discipline (piuttosto che corsi generalizzati), ostacolerà a lungo l’attuazione di un approccio integrativo nei processi dell’apprendimento e del monitoraggio della preparazione. Il vantaggio dei test integrativi rispetto a quelli eterogenei risiede nel maggior contenuto informativo di ciascun compito e nel minor numero dei compiti stessi. La necessità di creare test integrativi aumenta con l’aumentare del livello di istruzione e del numero di discipline accademiche studiate. Pertanto, i tentativi di creare tali test sono segnalati principalmente in scuola superiore. Le prove integrative sono particolarmente utili per aumentare l'obiettività e l'efficienza della certificazione statale finale degli studenti.

La metodologia per la creazione di test integrativi è simile alla metodologia per la creazione di test tradizionali, ad eccezione del lavoro di determinazione del contenuto dei compiti. Per selezionare il contenuto delle prove integrative è obbligatorio l'uso di metodi esperti. Ciò è dovuto al fatto che solo gli esperti possono determinare l'adeguatezza del contenuto dei compiti ai fini della prova. Ma, prima di tutto, sarà importante che gli esperti stessi decidano sugli obiettivi dell'educazione e dello studio di alcuni programmi educativi, per poi concordare tra loro le questioni fondamentali, lasciando all'esame solo le variazioni nella comprensione del grado di importanza dei singoli elementi nella struttura complessiva della preparazione. Spesso un panel è una composizione selezionata di esperti di letteratura straniera, concordati su questioni fondamentali. Oppure, date le differenze nel significato dell'ultima parola in lingua russa, tale composizione può essere definita un gruppo rappresentativo di esperti. Il gruppo viene selezionato per rappresentare adeguatamente l'approccio utilizzato per creare il test in questione.

Test adattativi. La fattibilità del controllo adattivo nasce dalla necessità di razionalizzare i test tradizionali. Ogni insegnante capisce che uno studente ben preparato non ha bisogno di dare compiti facili o molto facili. Perché la probabilità di prendere la decisione giusta è troppo alta. Inoltre, i materiali leggeri non hanno un notevole potenziale di sviluppo. Simmetricamente, a causa dell'elevata probabilità di una decisione sbagliata, non ha senso affidare compiti difficili a uno studente debole. È noto che i compiti difficili e molto difficili riducono la motivazione all'apprendimento di molti studenti. Era necessario trovare una misura comparabile, su una scala, della difficoltà dei compiti e una misura del livello di conoscenza. Questa misura è stata trovata nella teoria della misurazione pedagogica. Il matematico danese G. Rask chiamò questa misura la parola “logit”. Dopo l’avvento dei computer, questa misura ha costituito la base della metodologia di controllo adattivo della conoscenza, che utilizza metodi per regolare la difficoltà e il numero di compiti presentati, a seconda della risposta degli studenti. Se la risposta è positiva, il computer seleziona il compito successivo più difficile; se la risposta non ha successo, il compito successivo sarà più semplice. Naturalmente, questo algoritmo richiede un test preliminare di tutte le attività, la determinazione del loro grado di difficoltà, nonché la creazione di una banca di attività e di un programma speciale.

L'uso di compiti che corrispondono al livello di preparazione aumenta significativamente la precisione delle misurazioni e riduce al minimo il tempo dei test individuali a circa 5 - 10 minuti.Il test adattivo consente l'emissione di compiti computerizzati al livello ottimale, circa il 50% di probabilità della risposta corretta per ogni studente.

Nella letteratura occidentale si distinguono tre opzioni per il test adattivo. Il primo si chiama test piramidale. In assenza di valutazioni preliminari, a tutti i soggetti viene assegnato un compito di media difficoltà e solo successivamente, a seconda della risposta, a ciascun soggetto viene assegnato un compito più facile o più difficile; Ad ogni passaggio è utile utilizzare la regola di dividere a metà la scala di difficoltà. Nella seconda opzione, il controllo inizia con qualsiasi livello di difficoltà desiderato dal soggetto in prova, con un avvicinamento graduale al livello reale di conoscenza. La terza opzione è quando il test viene effettuato attraverso una serie di compiti divisi per livelli di difficoltà.

Pertanto, un test adattivo è una variante di un sistema di test automatizzato in cui i parametri di difficoltà e capacità di differenziazione di ciascun compito sono noti in anticipo. Questo sistema viene creato sotto forma di una banca informatica di compiti, ordinata in base alle caratteristiche dei compiti di interesse. Più caratteristica principale i compiti di test adattivi è il loro livello di difficoltà, ottenuto empiricamente, il che significa: prima di arrivare in banca, ogni compito viene sottoposto a test empirici su un numero sufficientemente ampio di studenti tipici della popolazione di interesse. Le parole “contingente di interesse” vogliono qui rappresentare il significato del concetto più rigoroso di “popolazione generale” conosciuto in scienza.

Il nostro modello educativo diffuso della scuola adattiva E.A. Yamburg, procede essenzialmente dalle idee generali di apprendimento adattivo e controllo adattivo della conoscenza. Le origini di questo approccio possono essere ricondotte alla nascita delle opere pedagogiche di Comenio, Pestalozzi e Disterweg, accomunati dalle idee di conformità alla natura e di umanità dell'insegnamento. Lo Studente era al centro dei loro sistemi pedagogici. Ad esempio, nell'opera poco conosciuta “Regole didattiche” di A. Disterweg si leggono le seguenti parole: “Insegnare secondo natura... Insegnare senza interruzioni... Iniziare a insegnare da dove lo studente ha interrotto... Prima di iniziare Nell’insegnamento, bisogna esaminare il punto di partenza… Senza sapere dove si è fermato lo studente, è impossibile insegnargli adeguatamente”. La mancanza di consapevolezza del reale livello di conoscenza degli studenti e le naturali differenze nelle loro capacità di assimilare le conoscenze proposte sono diventate la ragione principale dell'emergere di sistemi adattivi basati sul principio di individualizzazione dell'apprendimento. Questo principio è difficile da implementare nella tradizionale forma di lezione in classe.

Prima dell'avvento dei primi computer, la maggior parte sistema conosciuto, vicino all’apprendimento adattivo, era il cosiddetto “Sistema di completa assimilazione della conoscenza”.

Test basati su criteri. Con un approccio basato su criteri, vengono creati test per confrontare i risultati scolastici di ciascuno studente con la quantità di conoscenze, abilità o abilità che si prevede di acquisire. In questo caso, come quadro interpretativo di riferimento viene utilizzata un’area di contenuto specifica piuttosto che un particolare campione di studenti. L'enfasi è su ciò che lo studente può fare e ciò che sa, piuttosto che su come si confronta con gli altri.

Ci sono anche difficoltà con l’approccio orientato ai criteri. Di norma, sono associati alla selezione del contenuto del test. Nell'ambito dell'approccio basato su criteri, il test cerca di riflettere l'intero contenuto del corso controllato, o almeno quello che può essere considerato questo volume intero. La percentuale di corretto completamento dei compiti è considerata come il livello di preparazione o come il grado di padronanza del volume totale dei contenuti del corso. Naturalmente, nell'ambito di un approccio orientato ai criteri, ci sono tutte le ragioni per quest'ultima interpretazione, poiché il test include tutto ciò che può essere accettato con riserva al 100%.

I test basati su criteri coprono una gamma abbastanza ampia di compiti. In particolare, aiutano a raccogliere informazioni complete e obiettive sui risultati scolastici di ogni studente individualmente e di un gruppo di studenti; confrontare le conoscenze, le competenze e le abilità dello studente con i requisiti stabiliti dallo stato standard educativi; selezionare gli studenti che hanno raggiunto il livello di preparazione previsto; valutare l'efficacia attività professionale singoli insegnanti e gruppi di insegnanti; valutare l’efficacia dei vari programmi di formazione.

L’enfasi su un approccio basato sui contenuti può avere un effetto benefico sulla valutazione degli insegnanti nel suo complesso. Questo approccio avvantaggia, ad esempio, l’interpretazione dei punteggi dei test durante il monitoraggio continuo. Lo studente riceve informazioni non su come appare rispetto agli altri, ma su cosa può fare e cosa sa rispetto ai requisiti forniti per il livello di formazione in materia. Naturalmente, tale interpretazione non esclude una combinazione con l’attribuzione dei risultati a norme, che, di regola, avviene durante il monitoraggio continuo delle conoscenze degli studenti nella vita di tutti i giorni. processo educativo. In questo caso, il test è integrato con l'apprendimento e aiuta lo studente a identificare possibili difficoltà, nonché a correggere tempestivamente errori nella padronanza del contenuto del materiale didattico.



Durante il ragionamento dello studente, la catena viene interrotta (incoerenza del concetto o della spiegazione), quindi viene determinato il numero di operazioni significative prima che la catena logica si rompa. La particolarità della compilazione delle attività di test a questo livello di padronanza è che è quasi impossibile creare uno standard inequivocabile. Lo standard può essere creato sotto forma di diagramma della soluzione del problema. Esempio: catena logica. ...

Piano

    Principali tipologie di test pedagogici.

    Forme di compiti di prova.

    Verifica empirica ed elaborazione statistica dei risultati.

    Principi di selezione dei contenuti. Criteri di valutazione del contenuto del test.

    La relazione tra la forma del compito e il tipo di conoscenze, abilità e abilità testate.

  1. Principali tipologie di test pedagogici

Esistono due tipi principali di test: tradizionali e non tradizionali.

Il test ha composizione, integrità e struttura. Consiste in compiti, regole per la loro applicazione, voti per il completamento di ciascun compito e raccomandazioni per interpretare i risultati dei test. L'integrità del test significa l'interrelazione dei compiti, la loro appartenenza a un fattore misurato comune. Ciascuna attività di test svolge il ruolo assegnato e pertanto nessuna di esse può essere rimossa dal test senza perdita di qualità della misurazione. La struttura del test è formata dal modo in cui i compiti sono collegati tra loro. Fondamentalmente, questa è la cosiddetta struttura fattoriale, in cui ogni elemento è correlato agli altri attraverso contenuti comuni e variazioni comuni nei punteggi dei test.

Un test tradizionale è un'unità di almeno tre sistemi:

Un sistema formale di compiti di difficoltà crescente;

Caratteristiche statistiche dei compiti e risultati dei soggetti del test.

Il test pedagogico tradizionale deve essere considerato in due sensi significativi: - come metodo di misurazione pedagogica e come risultato dell'utilizzo del test. È sorprendente che i testi in russo gravitino verso il significato del metodo, mentre nella maggior parte delle opere di autori occidentali il concetto di test è più spesso considerato nel senso di risultati. Nel frattempo, entrambi questi significati caratterizzano il test da diversi lati, perché il test deve essere inteso contemporaneamente sia come metodo che come risultato di una misurazione pedagogica. Uno completa l'altro. Un test, come metodo, non può essere immaginato senza che i risultati confermino la qualità stessa e la qualità delle valutazioni delle misurazioni di soggetti a vari livelli di preparazione.

Diverse idee sono sviluppate nella definizione di test tradizionale sopra riportata.

La prima idea è che il test non sia considerato come un insieme ordinario di domande, compiti, ecc., ma nella forma del concetto di “sistema di compiti”. Un tale sistema non è formato da alcuna totalità, ma solo da ciò che determina l'emergere di una nuova qualità integrativa che distingue la prova da un insieme elementare di compiti e da altri mezzi di controllo pedagogico. Dei tanti sistemi possibili, il migliore è costituito da quell'insieme integrale in cui la qualità della prova si manifesta in misura relativamente maggiore. Da qui l'idea di identificare il primo dei due principali fattori di formazione del sistema: la migliore composizione dei compiti di test che ne costituiscono l'integrità. Sulla base di ciò, possiamo dare una delle definizioni più brevi: un test è un sistema di compiti che formano la migliore integrità metodologica. L'integrità del test è l'interazione stabile dei compiti che costituiscono il test come sistema in via di sviluppo.

La seconda idea è che in questa definizione di test c'è un allontanamento dalla tradizione profondamente radicata di vedere un test come un semplice mezzo per verificare, testare, testare. Ogni test include un elemento di test; non è tutto. Perché un test è anche concetto, contenuto, forma, risultati e interpretazione: tutto ciò che richiede una giustificazione. Ciò implica che il test è uno strumento qualitativo di misurazione pedagogica. Secondo la teoria, i punteggi dei test non sono valutazioni accurate delle materie. È corretto dire che rappresentano questi significati solo con una certa accuratezza.

La terza idea sviluppata nella nostra definizione di test tradizionale è l'inclusione di un nuovo concetto: l'efficacia del test, che non era stato precedentemente considerato nella letteratura sui test come criterio per l'analisi e la creazione del test. L'idea guida di un test tradizionale è confrontare le conoscenze del maggior numero possibile di studenti con un numero minimo di compiti, in breve tempo, rapidamente, in modo efficiente e al minor costo.

Essenzialmente, ciò riflette l’idea dell’efficacia delle attività pedagogiche nel campo del controllo della conoscenza. Mi piacerebbe pensare che non ci sia nessuno e non ci sia bisogno di opporsi proprio a questa idea. Se il nostro insegnante può spiegare il materiale didattico non peggio del suo collega straniero, allora è bene verificare le conoscenze richieste, per tutti gli studenti, per tutto il materiale studiato, non è in grado a causa del sistema di lezione prevalente delle lezioni nel nostro paese, la mancanza di apparecchiature informatiche, test e programmi per l'organizzazione dell'autocontrollo automatizzato, la forma più umana di controllo della conoscenza. Nemmeno lui è fisicamente in grado di farlo. A causa, per usare un eufemismo, di una politica sociale errata, gli stipendi dei nostri insegnanti non sono stati per lungo tempo in grado di compensare il dispendio nemmeno dell’energia fisica necessaria per un buon insegnamento, per non parlare dell’aumento del dispendio di energia intellettuale, che può essere solo compiuto pensando senza inibizioni e senza preoccuparsi della ricerca del pane. Come notato in letteratura, un lavoratore qualificato riceve da tre a quattro volte meno del livello salariale oltre il quale viene interrotta la normale attività della vita e inizia la distruzione del potenziale lavorativo.

Sebbene in letteratura siano presenti centinaia di esempi di definizioni di test con cui è difficile o impossibile concordare, ciò non significa affatto che questa definizione di test tradizionale sia la verità ultima. Come tutti gli altri concetti, necessita di miglioramenti costanti. All'autore sembra solo che finora sia più ragionato di altri concetti ben noti del test pedagogico. Tuttavia, il desiderio di migliorare i concetti è un fenomeno del tutto normale e necessario per lo sviluppo normale della pratica e della scienza. Tentativi costruttivi di dare altre definizioni del test o di sfidare quelle esistenti sono sempre utili, ma è proprio questo che ci manca.

I test tradizionali includono test omogenei ed eterogenei. Un test omogeneo è un sistema di compiti di difficoltà crescente, forma specifica e contenuto specifico - un sistema creato allo scopo di un metodo obiettivo, di alta qualità ed efficace per valutare la struttura e misurare il livello di preparazione degli studenti in un accademico disciplina. È facile intuire che, nella sua essenza, la definizione di test omogeneo coincide con la definizione di test tradizionale.

I test omogenei sono più comuni di altri. In pedagogia, sono creati per controllare la conoscenza in una disciplina accademica o in una sezione di essa, ad esempio, una disciplina accademica voluminosa come la fisica. In un test pedagogico omogeneo non è consentito l'uso di compiti che rivelino altre proprietà. La presenza di quest'ultimo viola il requisito della purezza disciplinare della prova pedagogica. Dopotutto, ogni test misura qualcosa di predeterminato.

Ad esempio, un test di fisica misura le conoscenze, le abilità e le percezioni dei partecipanti al test in questa scienza. Una delle difficoltà di tale misurazione è che la conoscenza fisica è fortemente associata alla conoscenza matematica. Pertanto, il test di fisica stabilisce in modo esperto il livello di conoscenza matematica utilizzato per risolvere i problemi di fisica. Il superamento del livello accettato porta a una distorsione dei risultati; man mano che vengono superati, questi ultimi cominciano sempre più a dipendere non tanto dalla conoscenza della fisica, ma dalla conoscenza di un'altra scienza, la matematica. Un altro aspetto importante è il desiderio di alcuni autori di includere nei test non tanto una prova di conoscenza quanto la capacità di risolvere problemi fisici, coinvolgendo così la componente intellettuale nella misurazione della preparazione in fisica.

Un test eterogeneo è un sistema di compiti di difficoltà crescente, forma specifica e contenuto specifico - un sistema creato allo scopo di un metodo obiettivo, di alta qualità ed efficace per valutare la struttura e misurare il livello di preparazione degli studenti in diversi ambiti accademici discipline. Spesso tali test includono anche compiti psicologici per valutare il livello di sviluppo intellettuale.

Di solito, i test eterogenei vengono utilizzati per una valutazione completa dei diplomati, per la valutazione della personalità quando si fa domanda per un posto di lavoro e per selezionare i candidati più preparati per l'ammissione alle università. Poiché ogni prova eterogenea è costituita da prove omogenee, l'interpretazione dei risultati della prova viene effettuata in base alle risposte ai compiti di ciascuna prova (qui vengono chiamate scale) e, inoltre, attraverso vari metodi di aggregazione dei punteggi, si tenta di fornire una valutazione complessiva della preparazione del candidato.

Ricordiamo che un test tradizionale è un metodo di diagnosi dei soggetti in cui rispondono agli stessi compiti, contemporaneamente, nelle stesse condizioni e con lo stesso punteggio. Con questo orientamento il compito di determinare l'esatto volume e la struttura del materiale didattico acquisito passa necessariamente in secondo piano. Il test seleziona un numero minimo sufficiente di compiti che consente di determinare con relativa precisione, in senso figurato, non "chi sa cosa", ma "chi sa di più". L'interpretazione dei risultati dei test viene effettuata principalmente nel linguaggio testologico, basandosi sulla media aritmetica, moda o mediana e sulle cosiddette norme percentili, che mostrano quale percentuale di soggetti ha un risultato del test peggiore di quello di qualsiasi soggetto preso per esame. analisi con il punteggio del test. Questa interpretazione è detta orientata alla normativa. Qui la conclusione è completata da una valutazione: i compiti rispondono a conclusioni sulla conoscenza della materia valutazione, intesa come conclusione sulla posizione o il grado della materia.

Prove integrative. Un test integrativo può essere definito un test costituito da un sistema di compiti che soddisfano i requisiti di contenuto integrativo, una forma di test e una crescente difficoltà dei compiti finalizzati a una diagnosi finale generalizzata della preparazione di un laureato di un istituto di istruzione. La diagnostica viene effettuata presentando tali compiti, le cui risposte corrette richiedono una conoscenza integrata (generalizzata, chiaramente interrelata) di due o più discipline accademiche. La creazione di tali test è affidata solo a quegli insegnanti che hanno conoscenza di una serie di discipline accademiche, comprendono l'importante ruolo delle connessioni interdisciplinari nell'apprendimento e sono in grado di creare compiti, le cui risposte corrette richiedono che gli studenti abbiano la conoscenza di vari discipline e la capacità di applicare tali conoscenze.

Il test integrativo è preceduto dall'organizzazione della formazione integrativa. Sfortunatamente, l’attuale forma di lezione in classe, combinata con l’eccessiva frammentazione delle discipline accademiche, insieme alla tradizione di insegnare singole discipline (piuttosto che corsi generalizzati), ostacolerà a lungo l’attuazione di un approccio integrativo nei processi dell’apprendimento e del monitoraggio della preparazione. Il vantaggio dei test integrativi rispetto a quelli eterogenei risiede nel maggior contenuto informativo di ciascun compito e nel minor numero dei compiti stessi. La necessità di creare test integrativi aumenta con l’aumentare del livello di istruzione e del numero di discipline accademiche studiate. Pertanto, i tentativi di creare tali test sono notati principalmente nell'istruzione superiore. Le prove integrative sono particolarmente utili per aumentare l'obiettività e l'efficienza della certificazione statale finale degli studenti.

La metodologia per la creazione di test integrativi è simile alla metodologia per la creazione di test tradizionali, ad eccezione del lavoro di determinazione del contenuto dei compiti. Per selezionare il contenuto delle prove integrative è obbligatorio l'uso di metodi esperti. Ciò è dovuto al fatto che solo gli esperti possono determinare l'adeguatezza del contenuto dei compiti ai fini della prova. Ma, prima di tutto, sarà importante che gli esperti stessi decidano sugli obiettivi dell'educazione e dello studio di determinati programmi educativi, e poi concordino tra loro su questioni fondamentali, lasciando all'esame solo le variazioni nella comprensione del grado di importanza dei singoli elementi nella struttura complessiva della preparazione. Spesso un panel è una composizione selezionata di esperti di letteratura straniera, concordati su questioni fondamentali. Oppure, date le differenze nel significato dell'ultima parola in lingua russa, tale composizione può essere definita un gruppo rappresentativo di esperti. Il gruppo viene selezionato per rappresentare adeguatamente l'approccio utilizzato per creare il test in questione.

Test adattativi. La fattibilità del controllo adattivo nasce dalla necessità di razionalizzare i test tradizionali. Ogni insegnante capisce che uno studente ben preparato non ha bisogno di dare compiti facili o molto facili. Perché la probabilità di prendere la decisione giusta è troppo alta. Inoltre, i materiali leggeri non hanno un notevole potenziale di sviluppo. Simmetricamente, a causa dell'elevata probabilità di una decisione sbagliata, non ha senso affidare compiti difficili a uno studente debole. È noto che i compiti difficili e molto difficili riducono la motivazione all'apprendimento di molti studenti. Era necessario trovare una misura comparabile, su una scala, della difficoltà dei compiti e una misura del livello di conoscenza. Questa misura è stata trovata nella teoria della misurazione pedagogica. Il matematico danese G. Rask chiamò questa misura la parola “logit”. Dopo l’avvento dei computer, questa misura ha costituito la base della metodologia di controllo adattivo della conoscenza, che utilizza metodi per regolare la difficoltà e il numero di compiti presentati, a seconda della risposta degli studenti. Se la risposta è positiva, il computer seleziona il compito successivo più difficile; se la risposta non ha successo, il compito successivo sarà più semplice. Naturalmente, questo algoritmo richiede un test preliminare di tutte le attività, la determinazione del loro grado di difficoltà, nonché la creazione di una banca di attività e di un programma speciale.

L'uso di compiti che corrispondono al livello di preparazione aumenta significativamente la precisione delle misurazioni e riduce al minimo il tempo dei test individuali a circa 5 - 10 minuti.Il test adattivo consente l'emissione di compiti computerizzati al livello ottimale, circa il 50% di probabilità della risposta corretta per ogni studente.

Nella letteratura occidentale si distinguono tre opzioni per il test adattivo. Il primo si chiama test piramidale. In assenza di valutazioni preliminari, a tutti i soggetti viene assegnato un compito di media difficoltà e solo successivamente, a seconda della risposta, a ciascun soggetto viene assegnato un compito più facile o più difficile; Ad ogni passaggio è utile utilizzare la regola di dividere a metà la scala di difficoltà. Nella seconda opzione, il controllo inizia con qualsiasi livello di difficoltà desiderato dal soggetto in prova, con un avvicinamento graduale al livello reale di conoscenza. La terza opzione è quando il test viene effettuato attraverso una serie di compiti divisi per livelli di difficoltà.

Pertanto, un test adattivo è una variante di un sistema di test automatizzato in cui i parametri di difficoltà e capacità di differenziazione di ciascun compito sono noti in anticipo. Questo sistema viene creato sotto forma di una banca informatica di compiti, ordinata in base alle caratteristiche dei compiti di interesse. La caratteristica più importante dei compiti di test adattivi è il loro livello di difficoltà, ottenuto empiricamente, il che significa: prima di arrivare al banco, ogni compito viene sottoposto a test empirico su un numero sufficientemente ampio di studenti tipici della popolazione di interesse. Le parole “contingente di interesse” vogliono qui rappresentare il significato del concetto più rigoroso di “popolazione generale” conosciuto in scienza.

Il nostro modello educativo diffuso della scuola adattiva E.A. Yamburg, procede essenzialmente dalle idee generali di apprendimento adattivo e controllo adattivo della conoscenza. Le origini di questo approccio possono essere ricondotte alla nascita delle opere pedagogiche di Comenio, Pestalozzi e Disterweg, accomunati dalle idee di conformità alla natura e di umanità dell'insegnamento. Lo Studente era al centro dei loro sistemi pedagogici. Ad esempio, nell'opera poco conosciuta “Regole didattiche” di A. Disterweg si leggono le seguenti parole: “Insegnare secondo natura... Insegnare senza interruzioni... Iniziare a insegnare da dove lo studente ha interrotto... Prima di iniziare Nell’insegnamento, bisogna esaminare il punto di partenza… Senza sapere dove si è fermato lo studente, è impossibile insegnargli adeguatamente”. La mancanza di consapevolezza del reale livello di conoscenza degli studenti e le naturali differenze nelle loro capacità di assimilare le conoscenze proposte sono diventate la ragione principale dell'emergere di sistemi adattivi basati sul principio di individualizzazione dell'apprendimento. Questo principio è difficile da implementare nella tradizionale forma di lezione in classe.

Prima dell’avvento dei primi computer, il sistema più famoso vicino all’apprendimento adattivo era il cosiddetto “Complete Knowledge Assimilation System”.

Test basati su criteri. Con un approccio basato su criteri, vengono creati test per confrontare i risultati scolastici di ciascuno studente con la quantità di conoscenze, abilità o abilità che si prevede di acquisire. In questo caso, come quadro interpretativo di riferimento viene utilizzata un’area di contenuto specifica piuttosto che un particolare campione di studenti. L'enfasi è su ciò che lo studente può fare e ciò che sa, piuttosto che su come si confronta con gli altri.

Ci sono anche difficoltà con l’approccio orientato ai criteri. Di norma, sono associati alla selezione del contenuto del test. Nell'ambito dell'approccio basato su criteri, il test cerca di riflettere l'intero contenuto del corso controllato, o almeno quello che può essere considerato questo volume intero. La percentuale di corretto completamento dei compiti è considerata come il livello di preparazione o come il grado di padronanza del volume totale dei contenuti del corso. Naturalmente, nell'ambito di un approccio orientato ai criteri, ci sono tutte le ragioni per quest'ultima interpretazione, poiché il test include tutto ciò che può essere accettato con riserva al 100%.

I test basati su criteri coprono una gamma abbastanza ampia di compiti. In particolare, aiutano a raccogliere informazioni complete e obiettive sui risultati scolastici di ogni studente individualmente e di un gruppo di studenti; confrontare le conoscenze, le competenze e le capacità dello studente con i requisiti stabiliti negli standard educativi statali; selezionare gli studenti che hanno raggiunto il livello di preparazione previsto; valutare l'efficacia dell'attività professionale dei singoli insegnanti e dei gruppi di insegnanti; valutare l’efficacia dei vari programmi di formazione.

L’enfasi su un approccio basato sui contenuti può avere un effetto benefico sulla valutazione degli insegnanti nel suo complesso. Questo approccio avvantaggia, ad esempio, l’interpretazione dei punteggi dei test durante il monitoraggio continuo. Lo studente riceve informazioni non su come appare rispetto agli altri, ma su cosa può fare e cosa sa rispetto ai requisiti forniti per il livello di formazione in materia. Naturalmente, tale interpretazione non esclude una combinazione con l’attribuzione dei risultati a norme, che, di regola, avviene durante il monitoraggio continuo delle conoscenze degli studenti nel processo educativo quotidiano. In questo caso, il test è integrato con l'apprendimento e aiuta lo studente a identificare possibili difficoltà, nonché a correggere tempestivamente errori nella padronanza del contenuto del materiale didattico.

  1. Forme di compiti di prova

Nei test moderni (Avanesov V.S., Chelyshkova M.B., Mayorov A.N., ecc.) ci sono 4 tipi di compiti in forma di test: compiti per scegliere una o più risposte corrette, compiti in forma aperta o per addizione, compiti per stabilire la sequenza corretta e compito di stabilire corrispondenze. La più comune è la prima forma.

Consideriamo in dettaglio ciascuna forma di compiti secondo la classificazione di V.S. Avanesova.

I compiti per scegliere una o più risposte corrette sono più adatti per la verifica computerizzata della conoscenza. È conveniente dividere tali compiti nei seguenti tipi: compiti con due, tre, quattro, cinque e più risposte. L'istruzione per questo tipo di compiti è la frase: "Cerchia (controlla, indica) il numero della risposta corretta".

Esempio 1. Segna il numero della risposta corretta.

Si chiama il posto occupato da una cifra in un numero

    posizione;

    scarico;

    posizione;

    conoscenza.

Il compito dovrebbe essere formulato in modo breve e chiaro, in modo che il suo significato sia chiaro fin dalla prima lettura.

Il contenuto del compito è formulato nel modo più chiaro e breve possibile. La brevità è assicurata da un'attenta selezione di parole, simboli e grafica, consentendo il minimo dei mezzi per ottenere la massima chiarezza del significato del compito. È necessario eliminare completamente le ripetizioni di parole, l'uso di simboli oscuri, usati raramente, nonché sconosciuti agli studenti e parole straniere che rendono difficile la percezione del significato. È positivo quando l'attività non contiene più di una clausola subordinata.

Per raggiungere la brevità, è meglio chiedere una cosa in ogni attività. Appesantire i compiti con la richiesta di trovare qualcosa, risolverlo e poi spiegarlo ha un impatto negativo sulla qualità del compito, anche se da un punto di vista pedagogico è facile comprendere il motivo di questa impostazione.

È ancora meglio quando sia il compito che la risposta sono brevi. Una risposta errata ma plausibile nella letteratura di prova americana è chiamata distrattore (dal verbo inglese distrarre - distrarre). In generale, migliore è la selezione dei distrattori, migliore sarà il compito. Il talento dello sviluppatore si manifesta principalmente nello sviluppo di distrattori efficaci. Di solito si ritiene che maggiore è la percentuale di scelte di risposta errate, migliore è la formulazione. Va notato che questo è vero solo fino a un certo punto; Nel perseguire l’attrattiva dei distrattori, spesso si perde il senso delle proporzioni. L'attrattiva di ciascuna risposta è testata empiricamente.

I compiti con la scelta di una o più risposte sono la forma più criticata. I sostenitori degli approcci convenzionali sostengono che la conoscenza può essere veramente testata solo nel processo di comunicazione diretta con lo studente, ponendogli domande chiarificatrici, che aiutano a chiarire meglio la vera profondità, forza e validità della conoscenza. Bisogna essere d'accordo con tali affermazioni. Tuttavia, ci sono anche problemi relativi al risparmio del lavoro vivo di insegnanti e studenti, al risparmio dei costi in termini di tempo e al problema di aumentare l'efficienza del processo educativo.

Si crede spesso che trovare la risposta giusta sia molto più semplice che formularla da soli. Tuttavia, nei compiti ben svolti, le risposte errate spesso sembrano più plausibili per uno studente inconsapevole rispetto a quelle corrette. Il talento dello sviluppatore del test si rivela nel processo di creazione di risposte precisamente errate, ma molto plausibili. Un'altra obiezione è che un compito di prova con la scelta di una o più risposte corrette è adatto solo per valutare la conoscenza al cosiddetto livello inferiore.

Viene evidenziata una variante dei compiti con la scelta di una, la risposta più corretta tra quelle proposte. Le istruzioni per tali attività sono scritte di conseguenza: "Cerchia il numero della risposta più corretta". Naturalmente si presuppone che tutte le altre risposte ai compiti siano corrette, ma in misura diversa.

Ci sono tre ragioni per introdurre tali compiti nella pratica.

Il primo è la vecchia idea di escludere le risposte errate dai compiti, che gli studenti deboli presumibilmente riescono a ricordare. Se seguiamo questa tesi molto controversa, non è possibile fornire risposte errate durante i test.

La seconda ragione per introdurre tali compiti nella pratica è più realistica. Riguarda la necessità di sviluppare negli studenti non solo la capacità di distinguere le risposte corrette da quelle errate, ma anche la capacità di differenziare la misura della correttezza delle risposte. Questo è davvero importante, sia nell’istruzione secondaria generale che in quella professionale superiore.

Il terzo motivo per utilizzare le attività con la scelta della risposta più corretta è il desiderio di utilizzarle per verificare la completezza della conoscenza.

Non importa quanto siano convincenti le ragioni per introdurre tali compiti nella pratica, è improbabile che questi ultimi trovino ampia applicazione.

Nelle attività in formato aperto non vengono fornite risposte già pronte: il candidato deve inventarle o riceverle lui stesso. A volte, invece del termine “attività in modulo aperto”, vengono utilizzati i termini “attività con addizione” o “attività con risposta costruita”. Per un modulo aperto, è consuetudine utilizzare istruzioni costituite da una parola: "Aggiungi".

Esempio 2. Aggiungi.

Nel sistema numerico binario 10-1=_________.

Le attività di aggiunta sono di due tipi notevolmente diversi:

1) con limitazioni delle risposte, la cui possibilità di ottenimento è opportunamente determinata dal contenuto e dalla forma di presentazione;

2) compiti con una risposta costruita liberamente, in cui è necessario comporre una risposta dettagliata sotto forma di una soluzione completa al problema o dare una risposta sotto forma di un micro-saggio.

Nei compiti con restrizioni, viene determinato in anticipo quale è chiaramente considerata la risposta corretta e viene impostato il grado di completezza della risposta. Di solito è piuttosto breve: una parola, un numero, un simbolo, ecc. A volte - più a lungo, ma non superiore a due o tre parole. Naturalmente, la brevità regolamentata delle risposte propone determinati requisiti per l'ambito di applicazione, quindi i compiti del primo tipo vengono utilizzati principalmente per valutare una gamma abbastanza ristretta di competenze.

Una caratteristica distintiva delle attività con restrizioni sulle risposte complementari è che devono generare una sola risposta corretta, pianificata dallo sviluppatore.

I compiti del secondo tipo con una risposta costruita liberamente non hanno restrizioni sul contenuto e sulla forma di presentazione delle risposte. Per un certo tempo lo studente può scrivere quello che vuole e come vuole. Tuttavia, l'attenta formulazione di tali compiti presuppone la presenza di uno standard, che solitamente è la risposta più corretta con caratteristiche e segni di qualità che la descrivono.

Nei compiti per stabilire la corrispondenza, l'insegnante verifica la conoscenza delle connessioni tra elementi di due insiemi. Gli elementi per il confronto sono scritti in due colonne: a sinistra ci sono solitamente gli elementi dell'insieme di definizione contenente l'enunciazione del problema, e a destra ci sono gli elementi da selezionare.

Ai compiti vengono fornite istruzioni standard: "Abbina la corrispondenza".


Esempio 3: corrispondenza

a B C) - _____________.

Va notato che è auspicabile che ci siano più elementi nella colonna di destra che in quella di sinistra. In questa situazione sorgono alcune difficoltà legate alla selezione di elementi ridondanti plausibili. A volte per un elemento dell'insieme di sinistra è necessario selezionare più risposte corrette dalla colonna di destra. Inoltre, le corrispondenze possono essere estese a tre o più insiemi. L'efficacia del compito viene significativamente ridotta se le opzioni non plausibili vengono facilmente distinte anche da studenti ignoranti.

L'efficacia dell'attività è ridotta anche nei casi in cui il numero di elementi nelle colonne di sinistra e di destra è lo stesso e semplicemente non c'è nulla da cui scegliere quando si stabilisce una corrispondenza per l'ultimo elemento a sinistra. L'ultima corrispondenza corretta o errata viene stabilita automaticamente eliminando in sequenza gli elementi delle corrispondenze precedenti.

Le attività di test per stabilire la sequenza corretta sono progettate per valutare il livello di competenza nella sequenza di azioni, processi, ecc. Nei compiti, le azioni, i processi e gli elementi relativi a un compito specifico sono indicati in un ordine arbitrario e casuale. Le istruzioni standard per queste attività sono le seguenti: "Stabilire la sequenza corretta di azioni".

Esempio 4: ottieni la sequenza giusta

Il comando di ramo completo su UAY ha il formato:

    Altrimenti<серия 2>

    Quello<серия 1>

    Se<условие>

I compiti per stabilire la sequenza corretta ricevono il sostegno amichevole di molti insegnanti, il che si spiega con l'importante ruolo del pensiero ordinato e degli algoritmi di attività.

Lo scopo di introdurre tali compiti nel processo educativo è la formazione del pensiero algoritmico, della conoscenza, delle abilità e delle abilità algoritmiche.

Il pensiero algoritmico può essere definito come un'abilità intellettuale che si manifesta nel determinare la migliore sequenza di azioni nella risoluzione di problemi educativi e pratici. Esempi tipici di tale pensiero sono il completamento con successo di vari compiti in breve tempo, lo sviluppo del programma per computer più efficace, ecc.

La scelta delle forme del compito è determinata da molti fattori molto contraddittori, comprese le specificità del contenuto, gli obiettivi del test e anche le specificità della popolazione del test. Il controllo è più semplice quando si utilizzano attività in formato chiuso, tuttavia tali attività sono meno informative. Le attività in formato aperto sono più informative, ma è più difficile organizzarne la verifica. Un compito ancora più difficile è creare programmi per computer per verificare la correttezza delle risposte a tali compiti. Ciò è dovuto alla ricchezza del vocabolario dei soggetti (è possibile utilizzare sinonimi durante la risposta), all’attenzione (errori di battitura, mancata corrispondenza tra maiuscole e minuscole), ecc.

Per navigare con successo nei moduli delle attività, è possibile utilizzare una tabella speciale (vedi Tabella 1) per un'analisi comparativa delle attività, proposta da M.B. Čelishkova.

Secondo lo sviluppatore, questa tabella è puramente indicativa; tuttavia, il suo utilizzo può facilitare il processo di selezione degli elementi di prova di varie forme per risolvere determinati problemi diagnostici.


Tabella 1

Analisi comparativa delle caratteristiche del compito di test

Caratteristiche Attività a forma chiusa Attività di complemento Attività di conformità Attività di sequenziazioneVerifica della tua conoscenza dei fatti Passabile Passabile Passabile PassabileApplicazione delle conoscenze secondo il modello Superato Superato Superato SuperatoApplicazione della conoscenza in situazioni non standard Non idoneo Superabile Non idoneo SuperabileFacilità di progettazione Sì Sì No NoIndovinare eccezioni Non escluso Non escluso Non escluso Non esclusoObiettività della valutazione Sì No Sì SìEliminazione degli errori di battitura No Sì No NoPossibilità di risposta originale No Sì Sì/No No

Il rispetto dei compiti sotto forma di test con i requisiti di correttezza pedagogica del contenuto e della forma sono condizioni necessarie ma non sufficienti per chiamarli test.

La trasformazione dei compiti in forma di test in compiti di test inizia dal momento della verifica statistica di ciascun compito per la presenza di proprietà di formazione del test.

  1. Verifica empirica ed elaborazione statistica dei risultati

La presenza di un numero sufficiente di attività di test ci consente di passare allo sviluppo del test come sistema con integrità, composizione e struttura. Nella terza fase vengono selezionati i compiti e creati i test, la qualità e l'efficacia del test vengono migliorate.

L’integrità del test è formata dalla relazione tra le risposte dei partecipanti al test ai compiti del test e la presenza di un fattore misurabile comune che influenza la qualità della conoscenza.

La composizione del test determina la corretta selezione dei compiti, consentendo al numero minimo richiesto di riflettere gli elementi essenziali della competenza linguistica dei candidati.

Il livello e la struttura della conoscenza vengono rivelati analizzando le risposte di ciascun partecipante al test a tutti gli elementi del test. Più risposte sono corrette, più alto sarà il punteggio del test individuale dei soggetti. Di solito, questo punteggio del test è associato al concetto di "livello di conoscenza" e viene sottoposto a una procedura di chiarimento basata sull'uno o l'altro modello di misurazione pedagogica. Lo stesso livello di conoscenza può essere ottenuto rispondendo a compiti diversi. Ad esempio, in un test di trenta item, il soggetto ha ricevuto dieci punti. Questi punti si ottengono molto probabilmente attraverso le risposte corrette ai primi dieci compiti relativamente facili. La sequenza di uno e poi di zero insita in un caso del genere può essere definita la struttura corretta della preparazione del soggetto. Se si rivela il quadro opposto, quando il soggetto risponde correttamente ai compiti difficili e in modo errato a quelli facili, allora ciò contraddice la logica del test e quindi tale profilo di conoscenza può essere definito invertito. Ciò si verifica raramente, e molto spesso, a causa dell'errore del test, in cui i compiti sono organizzati in violazione dei requisiti di difficoltà crescente. A condizione che il test sia svolto correttamente, ogni profilo indica la struttura della conoscenza. Questa struttura può essere definita elementare (poiché esistono anche strutture fattoriali identificate utilizzando metodi di analisi fattoriale).

Per determinare il livello di strutturazione della preparazione, è possibile utilizzare il coefficiente di L. Gutman, precedentemente erroneamente chiamato misura di "affidabilità del test".


dove r g coefficiente di strutturazione;.

Il livello di conoscenza dipende in gran parte dagli sforzi e dalle capacità personali, mentre la struttura della conoscenza dipende in modo significativo dalla corretta organizzazione del processo educativo, dall'individualizzazione della formazione, dall'abilità dell'insegnante, dall'obiettività del controllo - in generale, su tutto ciò che solitamente manca. Il percorso per raggiungere questo ideale passa attraverso le difficoltà di creare test di qualità.

Lo sviluppo dei test inizia con l'analisi del contenuto delle conoscenze insegnate e la padronanza dei principi di formulazione dei compiti di test. Sfortunatamente, i test sono ancora visti come qualcosa di facile da realizzare, mentre la forza dei test è la loro efficacia, che deriva dalla validità teorica ed empirica.

Nella terza fase, gli sviluppatori della nuova generazione di test avranno bisogno di una formazione matematica e statistica e di conoscenze della teoria dei test. La teoria dei test può essere definita come un insieme di concetti, forme, metodi, assiomi, formule e affermazioni coerenti che aiutano a migliorare l’efficienza e la qualità del processo di test. Inoltre, potrebbe essere richiesta una certa esperienza nell'uso di metodi di analisi statistica multivariata ed esperienza nell'interpretazione corretta dei risultati dei test.

Spesso sorge la domanda: "Come si comporteranno le attività cancellate in altri gruppi di argomenti?" La risposta dipende dalla qualità della selezione dei gruppi, o più precisamente dal piano statistico per la formazione delle popolazioni campione. La risposta corretta a questa domanda va ricercata nel senso del concetto di “gruppo target”; è l'insieme dei soggetti della popolazione a cui è destinato il test in corso di sviluppo.

Di conseguenza, se i compiti del test progettato si comportano in modo diverso in gruppi diversi, ciò è molto probabilmente un'indicazione di errori nella formazione di campioni di soggetti. Questi ultimi dovrebbero essere omogenei quanto i soggetti del gruppo target. Nel linguaggio statistico ciò significa che i soggetti dei gruppi target e sperimentale devono appartenere alla stessa popolazione generale.

Stime logaritmiche, chiamate logit, di fenomeni apparentemente disparati come il livello di conoscenza della materia con il livello di difficoltà di ciascun compito, sono state utilizzate per confrontare direttamente il livello di difficoltà con il livello di preparazione della materia.

Secondo Bespalko V.P. e Tatur Yu.G., i test dovrebbero essere una misurazione della qualità dell'assimilazione di conoscenze, abilità e abilità. Confrontando le regole per completare un compito (compito) proposto nel testo con la risposta standard ci consente di determinare il coefficiente di assimilazione della conoscenza (K us). Va notato che , dove A è il numero di risposte corrette e P è il numero di compiti nelle prove proposte.

Definizione K us è un'operazione per misurare la qualità dell'acquisizione della conoscenza. Kus può essere normalizzato (0< К us < 1), процедура же контроля усвоения легко автоматизируется. По коэффициенту судят о завершенности процесса обучения: если К us >0.7, allora il processo di apprendimento può considerarsi completo. Quando padroneggia la conoscenza con K us ≤ 0,7, uno studente commette sistematicamente errori nelle sue attività professionali e non è in grado di correggerli a causa della sua incapacità di trovarli. Il limite inferiore accettabile per il completamento del processo di formazione è aumentato al valore necessario dal punto di vista della sicurezza operativa.

  1. Principi di selezione dei contenuti. Criteri di valutazione del contenuto del test

Quando si crea un test, l'attenzione dello sviluppatore è rivolta principalmente alle questioni relative alla selezione del contenuto, che può essere definita come la riflessione ottimale del contenuto di una disciplina accademica nel sistema di attività del test. Il requisito di ottimalità presuppone l'uso di una determinata metodologia di selezione, comprese le questioni relative alla definizione degli obiettivi, alla pianificazione e alla valutazione della qualità del contenuto del test.

La fase di definizione degli obiettivi è la più difficile e allo stesso tempo la più importante: la qualità del contenuto del test dipende principalmente dai risultati della sua implementazione. Nel processo di definizione degli obiettivi, l'insegnante deve decidere quali risultati degli studenti desidera valutare utilizzando il test.

Le ragioni degli errori nelle conclusioni di un insegnante non sono sempre legate alle carenze tecnologiche dei mezzi di controllo tradizionali. A volte sono causati da carenze dell'insegnante nella fase di definizione degli obiettivi, quando il centro di gravità del test si sposta sugli obiettivi di apprendimento secondari, e talvolta la fase di definizione degli obiettivi è del tutto assente, poiché alcuni insegnanti sono fiduciosi nell'infallibilità di la loro esperienza e intuizione, soprattutto se hanno lavorato nella scuola per molti anni. Tuttavia, nessun metodo di controllo, nemmeno molto avanzato, e nessuna esperienza potranno fornire basi per conclusioni affidabili sul raggiungimento degli obiettivi di apprendimento finché non si avrà fiducia nella corretta impostazione degli obiettivi di controllo e nella loro corretta e imparziale visualizzazione nel contenuto del test.

Quando si crea un test, il compito è riflettere nel suo contenuto la cosa principale che gli studenti dovrebbero sapere come risultato dell'apprendimento, quindi è impossibile limitarsi a un semplice elenco di obiettivi di apprendimento. Vorrei includere tutto nel test, ma sfortunatamente questo è impossibile, quindi alcuni obiettivi devono essere semplicemente scartati e non viene verificato il grado in cui gli studenti li hanno raggiunti. Per non perdere la cosa più importante, è necessario strutturare gli obiettivi e introdurre una certa gerarchia nella loro relativa disposizione. Senza dubbio non esistono e non possono esistere ricette generali già pronte, poiché ogni disciplina ha le sue priorità. Inoltre, gli obiettivi individuali sono notevolmente interconnessi, e quindi la semplice idea di un sistema di obiettivi come un insieme ordinato senza considerare le connessioni tra gli elementi chiaramente non è sufficiente.

Una volta determinati e specificati gli obiettivi del test, è necessario sviluppare un piano di test e una specifica.

Quando si sviluppa un piano, viene effettuata una ripartizione approssimativa della percentuale di contenuto delle sezioni e viene determinato il numero richiesto di compiti per ciascuna sezione della disciplina in base all'importanza della sezione e al numero di ore assegnate per il suo studio nel programma.

Il layout inizia calcolando il numero iniziale pianificato di attività nel test, che verrà poi modificato ripetutamente in direzione di aumento o diminuzione durante il processo di lavoro sul test. In genere, il numero massimo non supera le 60 - 80 attività, poiché il tempo del test viene scelto nell'intervallo 1,5 - 2 ore e in media non vengono assegnati più di 2 minuti per completare un'attività.

Dopo aver completato la prima fase di pianificazione dei contenuti, viene sviluppata una specifica del test che fissa la struttura, il contenuto del test e la percentuale di compiti nel test. A volte la specifica viene effettuata in forma dettagliata, contenente indicazioni sul tipo di compiti che verranno utilizzati per valutare i risultati degli studenti in conformità con gli scopi previsti per la creazione del test, tempo di completamento del test, numero di compiti, caratteristiche del test che possono influenzare le caratteristiche del test, ecc.

La specifica in forma estesa comprende:

    lo scopo della creazione del test, giustificazione della scelta dell'approccio alla sua creazione, descrizione delle possibili aree di applicazione del test;

    un elenco di documenti normativi utilizzati durante la pianificazione del contenuto del test;

    descrizione della struttura generale del test, compreso un elenco di sottotest (se presenti) che indicano gli approcci al loro sviluppo;

    il numero di compiti di varie forme, indicando il numero di risposte ai compiti chiusi, il numero totale di compiti nel test;

    il numero di opzioni di test paralleli o un collegamento a un cluster contenente il numero e i numeri delle attività del cluster;

    il rapporto tra i compiti nelle varie sezioni e i tipi di attività educative degli scolari;

    copertura dei requisiti normativi (per le prove di certificazione);

    elenco dei requisiti non compresi nella prova (per le prove di certificazione);

Le conoscenze e le competenze sono così suddivise:

A – conoscenza di concetti, definizioni, termini;

B – conoscenza di leggi e formule;

C – capacità di applicare leggi e formule per risolvere problemi;

D – capacità di interpretare i risultati su grafici e diagrammi;

E – capacità di esprimere giudizi di valore.

Spesso vengono stabilite le seguenti proporzioni:


A – 10%, B – 20%, C – 30%, D – 30%, E – 10%.

Oltre ai criteri, esistono principi generali che contribuiscono in una certa misura alla corretta selezione del contenuto del test.

Il principio di rappresentatività regola non solo la completezza della presentazione, ma anche il significato degli elementi di contenuto del test. Il contenuto dei compiti dovrebbe essere tale che le risposte ad essi possano essere utilizzate per trarre una conclusione sulla conoscenza o l'ignoranza dell'intero programma della sezione o del corso in fase di test.

Il principio di coerenza implica la selezione di elementi di contenuto che soddisfano i requisiti di coerenza e sono interconnessi dalla struttura generale della conoscenza. Se viene rispettato il principio di coerenza, il test può essere utilizzato non solo per identificare la quantità di conoscenza, ma anche per valutare la qualità della struttura della conoscenza degli studenti.

Dopo aver selezionato il contenuto del test, inizia la fase più importante della creazione delle attività di pre-test. Questo lavoro è solitamente affidato agli insegnanti più esperti con una vasta esperienza nella scuola. Tuttavia, l’esperienza da sola non è sufficiente per creare compiti. È inoltre richiesta una conoscenza speciale della teoria e della metodologia di sviluppo dei test pedagogici, fornendo un approccio professionale alla creazione di compiti pre-test.

V.S. Avanesov ha identificato 3 criteri per selezionare il contenuto delle attività di test:

1) certezza del contenuto della prova;

2) coerenza del contenuto dei compiti;

3) validità del contenuto dei compiti di prova.

1. La certezza del contenuto del test costituisce oggetto di misurazione pedagogica. Nel caso di un test omogeneo, sorge la questione della fiducia che tutti gli elementi del test testino la conoscenza in una particolare disciplina accademica e non in qualche altra. Molto spesso accade che le risposte corrette ad alcuni compiti richiedano la conoscenza non solo della disciplina di interesse, ma anche di una serie di altre discipline accademiche, solitamente correlate e precedenti. La vicinanza e la connessione dei quali rendono difficile determinare con precisione l'oggetto della conoscenza da misurare.

Ad esempio, nei calcoli fisici viene utilizzata molta conoscenza matematica e quindi la matematica utilizzata per risolvere i problemi fisici è solitamente inclusa nel sistema della conoscenza fisica. Il fallimento nei calcoli di matematica si traduce in un fallimento nel rispondere agli elementi del test di fisica. Viene quindi assegnato un punteggio negativo per ignoranza della fisica, sebbene il soggetto abbia commesso errori matematici. Se un test di questo tipo include molti compiti che, per la soluzione corretta, richiedono non tanto la conoscenza fisica quanto la capacità di eseguire calcoli complessi, allora questo potrebbe essere un esempio di un contenuto di un test di fisica definito in modo impreciso. Minore è la sovrapposizione tra la conoscenza di una disciplina accademica e la conoscenza di un'altra, più chiaramente il contenuto della disciplina accademica viene espresso nel test. La specificità del contenuto è richiesta in tutti gli altri test. In un test eterogeneo, ciò si ottiene separando esplicitamente i compiti di una disciplina accademica in una scala separata. Allo stesso tempo, ci sono spesso compiti che funzionano bene non solo su una, ma anche su due, tre e anche più scale.

In qualsiasi compito di prova, viene determinato in anticipo cosa è chiaramente considerato una risposta al compito e con quale grado di completezza deve essere la risposta corretta. Non è consentito definire un concetto elencando elementi che non siano compresi in esso.

2. La coerenza del contenuto dei compiti esige che non sorgano giudizi che lo affermano e allo stesso tempo lo negano riguardo allo stesso pensiero. L'esistenza di due risposte esclusive allo stesso elemento del test è inaccettabile. Se ai partecipanti al test viene chiesto di “cerchiare il numero della risposta corretta” e poi una delle risposte afferma che non esiste una risposta corretta, ciò crea un esempio di incoerenza nel pensiero di chi ha progettato il test. In alcuni test ci sono risposte che non hanno nulla a che fare con il contenuto del compito. Tali risposte sono facilmente riconosciute dai soggetti come errate e quindi il test risulta inefficace. Per aumentare l'efficienza, il test viene prima testato su un campione tipico di soggetti. E se tali risposte vengono scoperte a compiti che i soggetti non scelgono affatto, tali risposte vengono rimosse dal test. Perché non svolgono la funzione dei cosiddetti distrattori, atti a distogliere l'attenzione dei soggetti ignari dalla risposta corretta. Inoltre, tali distrattori sono dannosi per il test, perché riducono l'accuratezza delle misurazioni (ma questo sarà discusso negli articoli in cui verranno discusse le questioni relative all'affidabilità del test).

3. La validità del contenuto degli item del test significa che hanno una base di verità. La validità è legata agli argomenti che possono essere forniti a favore dell'una o dell'altra formulazione degli elementi del test. Se non ci sono argomenti probatori a favore della correttezza del compito formulato, questo non viene incluso nel test, con nessun pretesto. Lo stesso accade se durante la discussione tra esperti emerge almeno una controargomentazione o viene consentita una condizione in base alla quale una determinata affermazione può rivelarsi ambigua o falsa. L’idea di validità del contenuto del test è strettamente intrecciata con il principio di correttezza sostanziale degli elementi del test, come già discusso nel precedente articolo. Ricordiamo che la prova comprende solo quel contenuto della disciplina accademica che è oggettivamente vero e che si presta a qualche argomentazione razionale. Di conseguenza, non è consigliabile includere punti di vista controversi, che sono abbastanza accettabili nella scienza, nel contenuto delle attività di test.

La falsità del contenuto degli elementi del test differisce dall'errata formulazione della loro. La falsità, come notato sopra, è determinata dalla risposta corrispondente, mentre un compito formulato in modo errato può produrre risposte sia corrette che errate e persino causare confusione. Ciò include anche attività formulate in modo impreciso o ambiguo che generano diverse risposte corrette o condizionatamente corrette. Nasce quindi la necessità di introdurre ulteriori condizioni di verità, che allungano il compito stesso e ne complicano la semantica. L'errata formulazione viene solitamente chiarita nel processo di discussione del contenuto dei compiti con insegnanti esperti esperti. Il successo di tale discussione è possibile creando un ambiente culturale appropriato in cui siano accettabili solo giudizi costruttivi e discreti. Purtroppo, l'esperienza ci convince che ciò non accade spesso. Nel frattempo, solo una discussione congiunta e amichevole sui materiali da parte di sviluppatori ed esperti può creare un'atmosfera di ricerca delle migliori opzioni per i contenuti di prova. Questa ricerca è quasi infinita e qui non esiste una verità ultima.

  1. La relazione tra la forma del compito e il tipo di conoscenze, abilità e abilità testate

Come accennato negli articoli precedenti, ai fini del test, la conoscenza può essere divisa in tre tipologie: offerta, acquisita e testata. Ora diamo un'occhiata a questo problema un po' più in dettaglio.

La conoscenza offerta viene fornita agli studenti sotto forma di libri di testo, materiali, testi, lezioni, storie, ecc., che riflettono la parte principale del programma educativo. Questa conoscenza è anche formulata in un sistema di compiti, in base al quale gli studenti stessi possono verificare il grado della loro preparazione.

La conoscenza acquisita dagli studenti è solitamente solo una parte della conoscenza offerta, più o meno, a seconda dell'attività di apprendimento degli studenti. Con lo sviluppo della formazione informatica sono emerse le condizioni affinché il volume delle conoscenze acquisite superi il volume delle conoscenze offerte. Questa è una nuova situazione associata alle possibilità di immersione di massa degli studenti nello spazio educativo globale, in cui il ruolo guida dei compiti nel processo di acquisizione della conoscenza è già abbastanza ben compreso. La risoluzione dei compiti educativi è il principale incentivo per intensificare l’apprendimento e le attività degli studenti. Questa attività può svolgersi sotto forma di lavoro con un insegnante, in gruppo o in modo indipendente. Le discussioni sui livelli di assimilazione comuni in letteratura si riferiscono esclusivamente alla conoscenza acquisita.

La conoscenza sottoposta a test costituisce il contenuto principale del documento, che può essere chiamato esame o programma di test, a seconda della forma scelta di controllo della conoscenza. La caratteristica principale della conoscenza sottoposta a test è la sua pertinenza, il che significa la disponibilità dei soggetti del test all’applicazione pratica della conoscenza per risolvere i compiti utilizzati al momento del test. Nell’istruzione superiore, questa stessa caratteristica è talvolta chiamata efficienza della conoscenza.

Nel processo di test di scolari e candidati, viene solitamente testata solo la conoscenza che si trova nella RAM, quella che non richiede riferimento a libri di consultazione, dizionari, mappe, tabelle, ecc. Tra le conoscenze testate si può evidenziare anche la conoscenza normativa, che è soggetta all'assimilazione obbligatoria da parte degli studenti e al successivo controllo da parte delle autorità educative attraverso un sistema di incarichi, compiti e altri materiali di controllo sapientemente selezionati e approvati dall'organo di governo.

Inoltre, vengono evidenziate le proprietà della conoscenza. IN E. Ginetsinsky identifica le seguenti proprietà della conoscenza:

 riflessività (non solo so qualcosa, ma so anche di saperla);

 transitività (se so che qualcuno sa qualcosa, allora ne consegue che so questo qualcosa);

 antisimmetria (se conosco qualcuno, questo non significa che mi conosca).

Classificazione dei tipi e dei livelli di conoscenza

Classificazioni di tipologie e livelli di conoscenza formulate da Bloom per risolvere problemi pratici di misurazione pedagogica.

    Conoscenza dei nomi. Socrate diceva: chi comprende i nomi capirà anche a cosa appartengono questi nomi. Come osserva il famoso filosofo straniero J. Austin, la conoscenza di un oggetto o fenomeno è in gran parte determinata dal fatto che ne conosciamo il nome o, più precisamente, il nome corretto.

    Conoscere il significato di titoli e nomi. È noto da tempo che come comprendiamo, così agiamo. Comprendere il significato dei nomi e dei titoli aiuta a ricordarli e ad usarli correttamente. Ad esempio, con il nome "Baikal" alcuni di scolari più piccoli Forse non pensate al famoso lago, la perla della Russia, ma all'acqua di frutta venduta con lo stesso nome. Un altro esempio può essere tratto dal campo della coscienza politica. Come giustamente nota Yu.N. nel suo libro. Afanasyev, A.S. Stroganov e S.G. Shekhovtsev, la coscienza dell'ex popolo sovietico si è rivelata incapace di vedere i vari significati di astrazioni linguistiche come "libertà", "potere", "democrazia", ​​"stato", "popolo", "società", considerandole come se fosse chiaro per impostazione predefinita. Questo è stato uno dei motivi che hanno permesso, con la complicità attiva di queste persone, di distruggere il loro stesso sistema di supporto vitale.

    Conoscenza fattuale. Conoscere i fatti permette di evitare di ripetere errori, propri e altrui, e di arricchire la base empirica della conoscenza. Sono spesso registrati sotto forma di testi scientifici, risultati di osservazioni, raccomandazioni come precauzioni di sicurezza, saggezza mondana, detti, detti. Ad esempio, dall'antica Cina venne il detto del pensatore cinese Ju Xi: non far bollire la sabbia nella speranza di ottenere il porridge.

    Conoscenza delle definizioni. Il punto più debole dell’istruzione scolastica è che le definizioni non possono essere insegnate; possono essere compresi e assimilati solo come risultato di sforzi indipendenti per padroneggiare i concetti richiesti. La conoscenza del sistema di definizione è una delle migliori prove di preparazione teorica. Nel processo educativo, tutti e quattro i tipi di conoscenza considerati possono essere combinati in un gruppo di conoscenze riproduttive. Come notato da I.Ya. Lerner, nel corso degli anni di scuola, gli studenti completano oltre 10mila compiti. L'insegnante è costretta a organizzare l'attività riproduttiva, senza la quale il contenuto non viene inizialmente assorbito.

Questa è una conoscenza che non richiede trasformazioni evidenti una volta assimilata, e quindi viene riprodotta nella stessa forma in cui è stata percepita. Possono, con qualche convenzione, essere chiamate conoscenze di primo livello.

    Conoscenza comparativa e comparativa. Sono diffusi nella pratica e nella scienza e sono caratteristici principalmente di individui intellettualmente sviluppati, in particolare di specialisti. Sono in grado di analizzare e scegliere le migliori opzioni per raggiungere un particolare obiettivo. Come ha osservato N. Kuzansky, "tutti i ricercatori giudicano l'ignoto mediante un confronto commisurato con qualcosa di già familiare, quindi tutto viene studiato in confronto".

    Conoscenza degli opposti, delle contraddizioni, dei contrari, ecc. oggetti. Tale conoscenza è preziosa nella formazione, soprattutto all'inizio. In alcune aree, tale conoscenza è essenziale. Ad esempio, in un corso sulla sicurezza nella vita scolastica, è necessario sapere esattamente cosa gli studenti possono fare e cosa non possono fare, in ogni circostanza.

    Conoscenza associativa. Sono caratteristici di una persona intellettualmente sviluppata e creativa. Più ricche sono le associazioni, maggiori sono le condizioni e maggiore è la probabilità di creatività. In larga misura, è sulla ricchezza di associazioni che si costruisce la cultura linguistica dell'individuo, la scrittura e il lavoro di artisti, designer e lavoratori in altre professioni creative.

    Conoscenza della classificazione. Utilizzato principalmente nella scienza; Esempi - Classificazioni di Linneo, sistema periodico degli elementi di D.I. Mendeleev, classificazioni dei test, ecc. La conoscenza della classificazione è una conoscenza generalizzata e sistemica. Questo tipo di conoscenzaè inerente solo alle persone con sufficiente sviluppo intellettuale, poiché richiede un pensiero astratto sviluppato, una visione olistica e interconnessa della totalità dei fenomeni e dei processi. Un sistema di conoscenza è, innanzitutto, il possesso di definizioni efficaci dei concetti fondamentali delle scienze oggetto di studio.

Conoscenza pag. 5-8 possono essere classificati come il secondo livello. Tale conoscenza consente agli studenti di risolvere compiti standard come risultato della sussunzione di ciascun compito specifico nelle classi conosciute di fenomeni e metodi studiati.

    Conoscenza causale, conoscenza delle relazioni di causa-effetto, conoscenza dei fondamenti. Come scrisse W. Shakespeare, il tempo dell'inspiegabile è finito: tutto deve essere trovato per una ragione. Nella scienza moderna, l'analisi causale è la direzione principale della ricerca. Come ha notato L. Wittgenstein, dicono “lo so” quando sono pronti a fornire ragioni innegabili.

    Conoscenza procedurale, algoritmica, procedurale. Sono fondamentali nelle attività pratiche. La padronanza di queste conoscenze è un segno essenziale di preparazione professionale e di cultura. Questo gruppo comprende anche la conoscenza tecnologica che consente di ottenere inevitabilmente il risultato pianificato.

    Conoscenza tecnologica. Questa conoscenza rappresenta un tipo speciale di conoscenza che si manifesta in diversi livelli preparazione. Può trattarsi di una conoscenza relativamente semplice su un'operazione separata della catena tecnologica o di un insieme di conoscenze che ti consentiranno sicuramente di raggiungere i tuoi obiettivi al minor costo possibile.

Conoscenza pag. 9-11 può essere classificato come conoscenza di un terzo livello superiore. Si acquisiscono principalmente nel sistema dell'istruzione professionale secondaria e superiore.

Il quarto livello di conoscenza più alto comprende i seguenti tipi di conoscenza:

    Conoscenza probabilistica. Tale conoscenza è necessaria in casi di incertezza, mancanza di conoscenza disponibile, inesattezza delle informazioni disponibili e, se necessario, per ridurre al minimo il rischio di errore nel prendere decisioni. Si tratta della conoscenza dei modelli di distribuzione dei dati, dell'affidabilità delle differenze e del grado di validità delle ipotesi.

    Conoscenza astratta. Questi tipo speciale conoscenza, in cui operano con concetti e oggetti idealizzati che non esistono nella realtà. Ci sono molti di questi oggetti nella geometria, nelle scienze naturali e in quelle scienze sociali che in Occidente sono chiamate comportamentali: psicologia, sociologia, pedagogia. Probabilistico, astratto e speciale conoscenza scientifica in ogni singola disciplina, la conoscenza costituisce la base della conoscenza teorica. Questo è il livello di conoscenza teorica.

    Conoscenza metodologica. Questa è conoscenza sui metodi per trasformare la realtà, conoscenza scientifica sulla costruzione di attività efficaci. Questa è la conoscenza del quinto livello più alto.

I tipi di conoscenza elencati non formano ancora un sistema di classificazione completo e quindi consentono la possibilità di un notevole ampliamento della nomenclatura presentata, sostituendo alcuni tipi di conoscenza con altri e combinandoli in vari gruppi.

Ciascuno dei tipi di conoscenza elencati è espresso dalla forma corrispondente di compiti di prova.

Per determinare il grado di formazione in ciascuna disciplina accademica, viene identificata la quantità di conoscenze necessaria per padroneggiarla secondo il curriculum, che costituisce la quantità di conoscenza di base. Le conoscenze di base rappresentano lo standard educativo minimo statale. Tuttavia, tra le conoscenze di base, si distinguono quelle che devono rimanere nella memoria in qualsiasi disciplina; insieme formano la conoscenza della visione del mondo. BOO. Rodionov e A.O. Tatur (centro di test MEPhI) distingue diverse parti della conoscenza della visione del mondo: conoscenza di base, conoscenza del programma, conoscenza del superprogramma. I test pedagogici sono l’unico strumento che permette di misurare non solo l’apprendimento, ma anche la capacità di utilizzare le conoscenze. Se parliamo solo di abilità, allora a tutti i livelli di acquisizione della conoscenza possiamo distinguere quattro tipi di abilità:

1) la capacità di riconoscere oggetti, concetti, fatti, leggi, modelli;

2) la capacità di agire secondo un modello, secondo un algoritmo noto, regola;

3) la capacità di analizzare una situazione, isolare la cosa principale e costruire procedure da operazioni padroneggiate che consentano di ottenere una soluzione a un compito di test;

4) l'abilità e la capacità di trovare soluzioni originali.

Quattro tipi di abilità, nominate da B.U. Rodionov e A.O. Tatur, non contraddicono la teoria della formazione graduale delle azioni mentali, che si basa sul metodo di sviluppo di test automatizzati allo scopo di valutare l'assimilazione della conoscenza, l'acquisizione di abilità e abilità. Ciò consente di creare non solo sistemi esperti per valutare il grado di apprendimento degli studenti, ma anche di costruire un sistema di valutazione flessibile e dinamico per il monitoraggio della conoscenza.

Secondo la classificazione più comune dei compiti pre-test nella letteratura nazionale e straniera, ci sono:

Elementi a scelta multipla in cui gli studenti selezionano la risposta corretta da un dato insieme di risposte;

Compiti di risposta costruiti che richiedono allo studente di ottenere risposte in modo indipendente;

Compiti per stabilire la corrispondenza, la cui implementazione è associata all'identificazione della corrispondenza tra elementi di due insiemi;

Corretta sequenza di compiti in cui allo studente è richiesto di indicare l'ordine di elementi, azioni o processi elencati nella condizione.

Le quattro forme proposte di attività di test sono le principali e le più comuni, ma non vi è motivo di renderle assolute. Spesso il contenuto specifico del soggetto controllato richiede l'uso di nuove forme più adeguate agli scopi dello sviluppo del test. Tipicamente, tali innovazioni sono costruite sulla base di una combinazione di singoli elementi delle forme base elencate.

Indipendentemente dalla forma, i compiti del test devono essere conformi ai requisiti generali:

Ogni compito ha il proprio numero di serie, che può cambiare dopo una valutazione statistica della difficoltà del compito e la scelta di una strategia per presentare i compiti del test;

Ogni compito ha uno standard per la risposta corretta (standard di valutazione per compiti con una risposta costruita liberamente);

Tutti gli elementi del compito si trovano in luoghi chiaramente definiti, fissati all'interno della forma scelta;

Per i compiti vengono sviluppate istruzioni standard per il completamento, che non cambiano all'interno di ciascun modulo e precedono la formulazione dei compiti nel test;

Per ogni compito viene sviluppata una regola per l'assegnazione di una valutazione dicotomica o politomica, comune a tutti i compiti della stessa forma e accompagnata da istruzioni di verifica con procedure standardizzate per il calcolo dei punteggi grezzi (primari) dei test.

Il processo di misurazione del test è estremamente standardizzato se:

A nessuno studente viene concesso alcun vantaggio rispetto agli altri;

Un sistema di punteggio pre-sviluppato viene applicato a tutte le risposte degli studenti senza eccezioni;

La prova comprende compiti della stessa forma o di forme diverse con coefficienti di ponderazione regolamentati, i cui valori sono ottenuti statisticamente;

Il test su diversi gruppi di soggetti viene effettuato contemporaneamente in condizioni simili;

Il gruppo dei candidati è allineato in base alla motivazione;

Tutti i soggetti svolgono gli stessi compiti.

L'ultima condizione non esclude la possibilità di imbrogli, suggerimenti e altre violazioni, quindi di solito cercano di creare diverse versioni di un test parallele nel contenuto e nella difficoltà. In generale, la scelta della forma dei compiti e il numero di opzioni di test dipendono dal contenuto del corso controllato, dagli obiettivi del controllo e dal livello richiesto di affidabilità del test. In particolare, durante la certificazione cercano di includere più compiti a scelta multipla, poiché grazie alla loro alta tecnologia e grazie a procedure di verifica automatizzate, possono aumentare la quantità di contenuti trattati nel test, la durata del test, l'affidabilità e il contenuto validità dei risultati delle misurazioni pedagogiche.

5.2. Compiti con la scelta di una o più risposte corrette

Nei compiti con scelta (o compiti chiusi - un nome usato in alcune letterature domestiche di natura metodologica), si può distinguere la parte principale contenente l'enunciazione del problema e le risposte già pronte formulate dall'insegnante. Tra le risposte, molto spesso solo una è corretta, sebbene non siano escluse altre opzioni con la scelta di più risposte corrette, anche a vari livelli.

Le risposte errate ma plausibili sono chiamate distrattori. Se in un compito sono presenti due risposte, una delle quali è un distrattore, la probabilità di selezionare casualmente la risposta corretta indovinando è del 50%. Il numero di distrattori viene scelto in modo che il compito non diventi troppo complicato e difficile da leggere, ma allo stesso tempo cercano di evitare una probabilità troppo alta di indovinare la risposta corretta. Pertanto, molto spesso ci sono 4 o 5 distrattori nei compiti, anche se in alcuni casi, quando ce n'è bisogno, il loro numero può raggiungere 6-7.

I compiti con due risposte vengono solitamente utilizzati per la diagnostica rapida, ad esempio nei programmi di controllo e formazione automatizzati per l'inserimento in un modulo di formazione, durante i test adattivi o per l'autocontrollo, quando il candidato al test deve identificare rapidamente le lacune nelle proprie conoscenze. L'utilizzo di compiti con due e tre risposte nel controllo finale porta ad un aumento dell'errore di misurazione dovuto all'ipotesi, quindi non vengono mai inclusi nei test di certificazione, dove, per maggiore affidabilità, vengono inseriti tutti i compiti con lo stesso numero di risposte.

Se i distrattori vengono formulati in modo errato, senza il minimo appello anche per i soggetti più deboli del gruppo, allora cessano di adempiere alla loro funzione, e infatti il ​​compito risulta non con quello previsto, ma con un numero minore di risposte. Nel peggiore dei casi, quando tutti i distrattori in un compito falliscono, la maggior parte degli studenti completerà il compito correttamente, scegliendo l’unica risposta corretta plausibile. Idealmente, ogni distrattore dovrebbe attrarre equamente tutti i soggetti che scelgono la risposta sbagliata. La misura dell'attrattiva dei distrattori viene valutata dopo la prima sperimentazione del test su un campione rappresentativo di soggetti calcolando la proporzione di studenti che hanno scelto ciascuno dei distrattori come risposta corretta. Naturalmente, l'esatta uguaglianza delle azioni è una certa idealizzazione, praticamente irraggiungibile con test empirici, ma tuttavia, quando si creano compiti, è necessario lottare per questa uguaglianza.

Un'analisi approfondita della frequenza di scelta di ciascun distrattore da parte di studenti con diversi livelli di preparazione ci consente di trarre una conclusione sulla validità delle risposte errate. Se un distrattore attira più spesso studenti deboli che hanno completato correttamente solo un numero limitato di compiti nel test, allora è considerato valido. Altrimenti, quando un distrattore sembra attraente soprattutto per gli studenti forti, la sua validità è bassa e il compito deve essere rielaborato. In generale, possiamo dire che un compito di prova è considerato “funzionante” se gli studenti esperti lo eseguono correttamente e gli studenti ignoranti scelgono uno qualsiasi dei distrattori con la stessa probabilità.

Se il test viene eseguito utilizzando moduli, le attività con la scelta di una risposta corretta sono accompagnate dall'istruzione: "CERCHIA IL NUMERO (LETTERA) DELLA RISPOSTA CORRETTA".

I compiti con più risposte corrette vengono solitamente utilizzati nel controllo continuo per testare la classificazione e la conoscenza fattuale, sebbene ci siano casi in cui il contenuto specifico della disciplina li obbliga a essere inclusi nelle prove finali. Sono accompagnati da apposite istruzioni che sottolineano la necessità di selezionare tutte le risposte corrette e hanno la forma: “CERCHIA I NUMERI DI TUTTE LE RISPOSTE CORRETTE”.

Quando ci sono troppo pochi distrattori e ci sono molte più risposte corrette, è facile indovinarle. Per uscire da questa situazione, è possibile includere solo una risposta errata nel numero di risposte e chiedere agli studenti di sceglierne una, se ciò non contraddice gli obiettivi didattici del controllo ed è consentito dal contenuto dell'argomento. In questo caso, le istruzioni sono del tipo: “CERCHIA IL NUMERO DELLA RISPOSTA ERRATA”.

A volte, secondo l'intenzione dell'autore, quando si sviluppa un compito, vengono incluse più risposte corrette, tra le quali ce n'è una più corretta e una meno preferibile. In questo caso, il compito è accompagnato dall'istruzione: “CERCHIARE IL NUMERO DELLA RISPOSTA PIÙ CORRETTA”.

Quando si eseguono attività su un computer, le istruzioni potrebbero essere simili: "PER RISPONDERE, PREMERE IL TASTO CON IL NUMERO (LETTERA) DELLA RISPOSTA CORRETTA".

Di solito, se tutte le attività sono formulate nella stessa forma, le istruzioni vengono fornite all'inizio del test. Altrimenti, quando il test include elementi di forma diversa, le istruzioni cambiano ogni volta che cambia la forma. È facile immaginare quanto sarebbe difficile alternare le istruzioni per scegliere le risposte corrette e quelle errate. Gli studenti disattenti che non riescono a concentrarsi nel modificare le istruzioni inevitabilmente si confonderanno e completeranno alcuni compiti in modo errato, anche quando probabilmente conoscono la risposta corretta. Pertanto, si consiglia di modificare le istruzioni nel test il più raramente possibile, esattamente il numero di volte richiesto dalla strategia di presentazione degli elementi del test.

I compiti con scelta presentano una serie di vantaggi legati alla velocità del loro completamento, alla facilità di calcolo dei punteggi finali dei test, alla capacità di automatizzare le procedure di controllo delle risposte degli studenti e alla conseguente minimizzazione del fattore soggettivo nella valutazione dei risultati dei test. Con il loro aiuto è possibile coprire in modo più completo il contenuto dell'argomento sottoposto a test e, di conseguenza, aumentare la validità del contenuto del test. L'indubbio vantaggio del modulo del compito di scelta è la sua versatilità; è adatto a quasi tutti gli argomenti.

Tra gli svantaggi dei compiti di scelta c'è l'effetto di indovinare, tipico dei partecipanti al test scarsamente preparati quando rispondono agli elementi del test più difficili. Sebbene esista la possibilità di indovinare, i testologi hanno imparato a combatterla utilizzando vari metodi. A volte vengono introdotte istruzioni speciali che invitano i soggetti a saltare un compito non familiare invece di rispondere indovinando. In altri casi, vengono aggiunti speciali coefficienti di ponderazione prossimi allo zero nel calcolo dei punteggi degli studenti deboli ottenuti nelle prove più difficili. A volte viene utilizzata una formula speciale per correggere i punteggi individuali, adattata per supposizioni. L'ultimo metodo e la formula che lo spiega sono riportati alla fine di questo capitolo.

Alcune difficoltà sorgono quando si utilizzano compiti di scelta per testare abilità di livello produttivo associate all'applicazione delle conoscenze in una situazione non familiare, aspetti creativi della preparazione e casi in cui è necessario trasformare le condizioni del compito assegnato agli studenti. Quindi le attività con una scelta di risposte già pronte sono spesso impossibili da utilizzare. Nel caso dei test di certificazione di massa, quando è necessario utilizzare tecnologie computerizzate efficaci per calcolare i punteggi dei test e ottenere un'elevata oggettività dei risultati della misurazione pedagogica, i vantaggi dei compiti di scelta superano chiaramente gli svantaggi. Pertanto, questa forma spesso domina lo sviluppo dei test di certificazione finale.

I compiti a scelta multipla devono soddisfare una serie di requisiti, il cui adempimento può migliorare la qualità del test:

Eventuali ambiguità o diciture poco chiare dovranno essere eliminate nel testo dell'incarico;

La parte principale del compito è formulata in modo estremamente breve, preferibilmente non più di una frase di 7-8 parole;

La progettazione sintattica del compito è estremamente semplificata senza compromettere la correttezza del contenuto e la sua inequivocabile comprensione da parte degli studenti;

La parte principale dell'attività comprende la maggior parte delle condizioni dell'attività e non lascia più di 2-3 di quelle più importanti per la risposta. parole chiave per il problema formulato nella condizione;

Tutte le risposte a un'attività devono avere all'incirca la stessa lunghezza, oppure la risposta corretta potrebbe essere più breve delle altre, ma non in tutte le attività del test;

Tutte le associazioni verbali che contribuiscono alla scelta della risposta corretta mediante ipotesi sono escluse dal testo del compito;

La frequenza di scelta del numero del posto per la risposta corretta in diverse attività di test dovrebbe essere approssimativamente la stessa, oppure il numero del posto per la risposta corretta viene scelto in modo casuale;

Tutti i distrattori per ciascun compito dovrebbero avere la stessa probabilità di attrarre i soggetti che non conoscono la risposta corretta.

Quando si sviluppano attività, è necessario garantire la loro relativa indipendenza, escludendo la logica di esecuzione a catena, quando la risposta di un'attività funge da condizione per un'altra attività di test. I test sui risultati accademici non possono contenere elementi trappola trovati nei test psicologici.

Il modo più semplice per selezionare i distrattori nei compiti con due risposte è negare ciò che è vero. Tuttavia, non è consigliabile utilizzare parole "sì-no" invece di distrattori, poiché altrimenti è abbastanza difficile formulare affermazioni alle quali si possa dare una risposta inequivocabile.

ESEMPI DI COMPITI

Esercizio 1

SE LA SOTTRAZIONE VIENE AUMENTATA DI 12 UNITÀ, ED ANCHE LA DIFFERENZA AUMENTA DI 15 UNITÀ, ALLORA DIMINUISCE

R. Aumentato

B. Diminuito


Le attività con tre risposte, nonché con due risposte, vengono solitamente utilizzate nella diagnostica rapida. A volte compaiono tre risposte a causa della rimozione dei distrattori disfunzionali. In generale, possono essere considerati infruttuosi perché non sono sufficientemente brevi e allo stesso tempo hanno un'alta probabilità di indovinare la risposta corretta.

Compito 2

GLI ALTI TASSI DI URBANIZZAZIONE IN AMERICA LATINA SONO ASSOCIATI A

A. Crescita economica rapida

B. Rafforzare il ruolo delle grandi città

B. Migrazione di massa di persone dai villaggi alle città


Nella maggior parte dei test ci sono compiti con 4-5 risposte, di cui una corretta. Se sviluppati abilmente, sono piuttosto brevi e hanno una bassa probabilità di indovinare la risposta corretta (0,25 con quattro risposte e 0,20 con cinque).

Compito 3

L'ASSUNZIONE CHE LA MONETA SIA UNA MERCE SPECIFICA È COERENTE CON LA TEORIA DELLA MONETA

A. Nominalistico

B. Metallo

B. Quantitativo

G. Trudovoy


Compito 4

QUALE STRUTTURA È UN'ORGANIZZAZIONE LATRIZZATA COSTRUITA SUL PRINCIPIO DELLA DOPPIA SOTTOSOTTOMISSIONE DEGLI ESECUTORI?

R. Progettazione

B. Sistema

B. Matrice

G. Funzionale

D. Geografico


Compito 5

LA FUNZIONE DELLA MISURAZIONE DEL COSTO È SVOLTA DA:

A. Moneta metallica

B. Denaro ideale

B. Soldi veri

D. Immaginare mentalmente il denaro

D. Moneta di credito


A volte un compito di scelta ha una struttura duplice, offrendo una serie di affermazioni o affermazioni che vengono valutate rispetto alle risposte proposte. Ad esempio, nel compito 6, le affermazioni che caratterizzano il concetto di "gestione" devono essere confrontate con varie opzioni per verificarne la verità.

Compito 6

QUALI AFFERMAZIONI FORNISCONO LE CARATTERISTICHE DEL CONCETTO DI “GESTIONE”?

1. Il processo di distribuzione e movimento delle risorse in un'organizzazione con un obiettivo predeterminato, secondo un piano pre-sviluppato e con il monitoraggio continuo dei risultati delle prestazioni.

2. Un insieme di metodi, principi, mezzi e forme di gestione delle organizzazioni con l'obiettivo di aumentare l'efficienza delle attività.

R. Solo il primo

B. Solo il secondo

B. Né il primo né il secondo


Nonostante la sua apparente attrattiva, in termini di contenuto, il compito 6 è mal formulato, poiché può portare a un’interpretazione ambigua delle risposte degli studenti. La scelta di due risposte A e B equivale alla scelta della risposta D, sebbene le risposte al compito dovrebbero sempre avere la proprietà di relativa indipendenza e, in senso figurato, negarsi a vicenda.

Un altro esempio di modifica della forma di un compito con una scelta di risposte è dato nel compito 7, dove si chiede di sostituire mentalmente la risposta selezionata al posto del trattino nella parte principale.

Compito 7

LA GESTIONE È IL COORDINAMENTO DI _________ RISORSE ALLO SCOPO DI RISOLVERE I COMPITI DI GESTIONE DEL SET.

R. Informazioni

B. Umano

B. Temporaneo

G. Materiale


Anche con un processo di test ben organizzato, una versione di un test non può essere somministrata a causa di trucchi, suggerimenti e altri effetti indesiderati simili. Pertanto, è sempre necessario sviluppare 5-8 versioni parallele del test, per le quali è possibile utilizzare compiti sfaccettati. Una sfaccettatura è una forma che fornisce la rappresentazione di diverse varianti dello stesso elemento del contenuto del test. Ogni soggetto riceve solo un'opzione di attività dal facet. In questo caso, tutti i gruppi di test eseguono lo stesso tipo di compiti, ma con aspetti diversi e, di conseguenza, con risposte diverse. Pertanto, due compiti vengono risolti contemporaneamente: viene eliminata la possibilità di imbrogliare e viene garantito il parallelismo delle opzioni di test. Ad esempio, l'attività 8 contiene due attività di prova ottenute per ciascuna delle città indicate tra parentesi graffe.

Compito 8

AI COMPLESSI PALAZZI NEI DINTORNI

{Mosca

San Pietroburgo)

RELAZIONARE:

1) Pavlovsk, Oranienbaum

2) Arcangelo, Caritsino

3) Peterhof, Gatchina

4) Carskoe Selo, Strelnya


Nell'attività 9, l'autore suggerisce di scegliere un elemento non correlato all'argomento teoria economica, il che non è del tutto giustificato scopi didattici controllo, ma in questo caso è consentito dal contenuto dell'oggetto.

Compito 9

DISPOSIZIONI NON CONNESSE ALLA MATERIA DI TEORIA ECONOMICA

A. Bene economico

B. Risorse illimitate

B. Massimizzare la soddisfazione dei bisogni D. Uso efficiente delle risorse

D. Rapporti giuridici


Tali compiti, così come quelli con più risposte corrette, come nel compito 10, vengono solitamente evitati dall'inclusione nei test di certificazione, i cui risultati vengono utilizzati per prendere decisioni amministrative e gestionali nel campo dell'istruzione.

Compito 10

SPECIFICARE TRE PARAMETRI AMBIENTALI INTEGRALI CHE INFLUENZANO LA FUNZIONE DECISIONALE

R. Incertezza

B. Complessità

B. Dinamismo

D. Certezza

D. Limitato


La comparsa di risposte parzialmente corrette da parte degli studenti, che si verificano quando non tutte le risposte corrette pianificate vengono selezionate in ciascuna di queste attività di test, porta a una diminuzione dell'obiettività e della comparabilità dei punteggi dei test. Se è impossibile evitare più risposte corrette, è certo che è necessario aumentare la standardizzazione delle procedure di valutazione regola decisiva. Ad esempio, se il soggetto sceglie tutte le risposte corrette, riceve 1 punto, in tutti gli altri casi - 0 punti.

Quando si calcolano i risultati dei compiti con la scelta di una risposta corretta, di solito si preferisce una valutazione dicotomica. Per il corretto completamento di un compito, il soggetto riceve 1 punto, per una risposta errata o un'omissione - 0. La somma di tutte le unità consente di calcolare il punteggio individuale (primario o grezzo) del soggetto, che nel caso di un la valutazione dicotomica è semplicemente uguale al numero di compiti completati correttamente nel test. Se la risposta corretta non è l'unica, viene spesso utilizzata una valutazione politomica, impostata in proporzione al numero di risposte scelte correttamente.

Se il test consiste in elementi a scelta multipla, i punteggi individuali dei partecipanti al test saranno significativamente distorti dall'effetto dell'ipotesi casuale delle risposte. Pertanto, cercano di correggere i punteggi grezzi introducendo correzioni per congetture. La formula per correggere i punti ottenuti come risultato del completamento di compiti con risposte di cui solo una è corretta ha la forma

X" io = X io – [W io / (K – 1)]

Dove io– numero di eventuali soggetti presenti nel gruppo; X" io - punteggio corretto io-esimo soggetto; X io - punteggio del test prima della correzione; W io– il numero di attività di test non completate (completate in modo errato, mancate e non completate), e X+L io =n, Dove N- numero di compiti nel test.

Quando si completano le attività con due risposte K - 1 = 1, quindi, per ciascun soggetto, viene calcolata la differenza tra il numero di attività di test completate correttamente e quelle fallite. All’aumentare del numero di distrattori in un compito, il numero di punti detratti diminuisce, il che è del tutto naturale, poiché più distrattori ci sono, più difficile sarà indovinare la risposta corretta.

La stessa formula di correzione presenta alcuni svantaggi che riducono l'accuratezza delle misurazioni di prova. Ciò è dovuto al fatto che la sua costruzione si basa su una serie di presupposti artificiali, che spesso non sono coerenti con la procedura effettiva di esecuzione del test. In particolare, l’ipotesi che tutte le risposte errate siano il risultato di ipotesi casuali è lungi dall’essere pienamente soddisfatta. Altrettanto condizionale è un'altra ipotesi sull'eguale probabilità di scegliere ciascuna risposta a un compito di test.

Nel processo di creazione delle attività, alcuni requisiti del modulo vengono inconsapevolmente violati. Di norma, ciò è dovuto al fatto che tutta l'attenzione dello sviluppatore è assorbita dal contenuto e non dalla forma. La violazione di determinati requisiti dà origine a una serie di carenze caratteristiche che sorgono anche tra autori esperti nel processo di lavoro su attività di test. Le carenze più comuni delle attività pre-test includono:

Mancanza di correttezza logica nella formulazione degli item del test, che porta a risposte corrette non pianificate;

Violazione delle proporzioni corrette nel modulo del compito, quando le risposte sono molto più lunghe della parte principale del compito;

Violazione della brevità causata dall'inclusione parole inutili o presentando sotto forma di test contenuti non idonei al test tramite test;

Selezione delle risposte per diversi motivi;

Errori di calcolo degli sviluppatori di attività che contribuiscono a indovinare le risposte corrette senza completare le attività di test.

Ad esempio, l'attività 11, che contiene una breve parte principale e risposte lunghe, può essere considerata non riuscita a causa del fatto che lo sviluppatore le ha ovviamente riorganizzate invano. Se all’inizio del compito si mette la definizione stessa di circolazione del capitale, data al secondo posto sotto la lettera “B”, le risposte possono consistere solo di una o più parole.

Compito 11

LA CIRCOLAZIONE DEL CAPITALE È

A. Movimento continuo e coerente di capitale monetario

B. Trasformazione coerente del capitale da una forma funzionale all'altra

B. Rimborso del valore anticipato

D. Funzionamento del capitale-merce


Le risposte al compito 12 sono state scelte male, se le consideriamo senza tenere conto degli errori sostanziali di calcolo dell’autore. Se le prime tre risposte confrontano il volume di produzione del monopolista e della concorrenza, la quarta mira a stabilire una relazione causale tra gli oggetti.

Compito 12

IL VOLUME DELLA PRODUZIONE DEI PRODOTTI DEL MONOPOLIO SARÀ PARAGONATO ALLA CONCORRENZA PERFETTA

Benedire

B. Lo stesso

D. Dipende dalle condizioni di mercato


Non c'è alcuna correttezza sostanziale e logica nel compito 13, dove degli otto parametri forniti, solo cinque vengono utilizzati nelle risposte.

Compito 13

QUALI DUE PARAMETRI NON VENGONO UTILIZZATI PER ANALIZZARE LE DIFFERENZE DELLE CULTURE DEI PAESI L'UNO DALL'ALTRO?

1. Il rapporto tra uomo e ambiente

2. Stima del tempo

3. La natura delle persone

4. Stile di comunicazione

5. Valutare il grado di attività

6. Libertà di accesso alle informazioni

7. Relazioni tra le persone

8. Atteggiamento verso il possesso dello spazio


R. Quarto e sesto

B. Terzo e sesto

B. Terzo e quinto

D. Quarto e settimo


Compito 14

A. Rispondente ai cambiamenti dell'ambiente esterno e ai cambiamenti in conformità con essi

B. Percepisce tutte le nuove tendenze dall'ambiente esterno e le applica necessariamente nelle sue attività

B. Aperto a qualsiasi innovazione richiesta dal proprietario

D. Reagisce in modo sensibile al comportamento dei concorrenti e percepisce i principi più efficaci per risolvere i problemi di gestione


Il compito 15, sebbene sembri piuttosto complicato, differisce favorevolmente dalla maggior parte degli esempi sopra riportati, poiché contiene un'esposizione del problema e non è finalizzato, come spesso accade, a verificare materiale fattuale o concettuale.

Compito 15

COME SARÀ LA FUNZIONE OBIETTIVO NEL MODELLO MATEMATICO DEL PROCESSO DI CONTROLLO IN APPLICAZIONE AL SEGUENTE PROBLEMA:

L'azienda produce due bevande: "Tonic" e "Darragon". Il volume di produzione è limitato dal numero di additivi ausiliari e dalla capacità di produzione. La produzione di 1 litro di "Tonic" richiede 0,02 ore di funzionamento dell'attrezzatura, la produzione di 1 litro di "Dragoncello" richiede 0,04 ore. Il consumo di additivi ausiliari è di 0,01 kg/l per la Tonica e di 0,04 kg/l per il Dragoncello. Il tempo di funzionamento giornaliero dell'apparecchiatura è di 24 ore. La risorsa di additivi ausiliari è di 16 kg al giorno. Il profitto derivante dalla vendita di 1 litro di “Tonic” è di 0,1 rubli/l, quello di “Dragoncello” è di 0,3 rubli/l.

Quanti prodotti Tonic e Dragoncello dovrebbero essere prodotti ogni giorno per massimizzare i profitti giornalieri?

A.0.01 X 1 + 0,04 X 2 > massimo

B.0.02 X 1 + 0,03 X 2 > massimo

B.0.02 X 1 + 0,04 X 2 > massimo

G.0.03 X 1 + 0,01 X 2 > massimo

5.3. Domande a risposta costruita

Nei compiti con risposta costruita (chiamati anche: compiti di addizione, compiti aperti), non vengono fornite risposte già pronte, ma devono essere inventate o ottenute dallo studente stesso. Esistono due tipi di compiti a risposta costruita, uno dei quali richiede che il soggetto riceva risposte corrette che sono strettamente regolate nel contenuto e nella forma di presentazione. Il secondo sono compiti con risposte costruite liberamente, in cui i soggetti forniscono risposte dettagliate, arbitrarie nel contenuto e nella forma di presentazione e che includono una soluzione completa al problema con spiegazioni, micro-saggi (saggi), ecc.

Gli studenti trovano le domande a risposta costruita più difficili perché eliminano le congetture. Infatti, è più facile scegliere la risposta corretta tra quelle proposte, a volte basate non tanto sulla conoscenza quanto sull'intuizione, piuttosto che formularla da soli o trovarla nel processo di risoluzione dei problemi posti. Ma è proprio questa proprietà ad essere estremamente attraente per gli insegnanti, soprattutto per coloro che sono abituati a fare affidamento sui mezzi di controllo tradizionali nel proprio lavoro e non si fidano dei test.

Nei compiti del primo tipo, la risposta è solitamente piuttosto breve: sotto forma di parola, numero, formula, simbolo, ecc. Per sviluppare compiti con una risposta costruita e regolamentata, è necessario formulare mentalmente una domanda, quindi scrivere una risposta chiara e concisa, in cui viene posizionato un trattino al posto della parola chiave, del simbolo o del numero. A causa dell'univocità della risposta corretta, il controllo dei risultati dei compiti con una risposta regolamentata costruita è abbastanza oggettivo; viene effettuato in formato informatico con successivo ricontrollo di tutte le risposte errate degli studenti con mezzi esperti. Le risposte ai compiti vengono fornite al posto del trattino o inserite dagli studenti in un modulo speciale.

Per esempio: Inserisci la risposta corretta.

Esercizio 1

Determinare i risultati finali da raggiungere e i mezzi corrispondenti necessari per ottenere determinati risultati finali comprende le funzioni di ___________________.


Compito 2

Una forma di influenza che implica mascherare intenzioni e obiettivi reali – _______________.


Quando si eseguono compiti con una risposta regolamentata costruita, spesso compaiono risposte parzialmente corrette e corrette a vari livelli. Aggiungendo la risposta al posto del trattino, il candidato può offrire sinonimi per la parola mancante prevista dallo sviluppatore o modificare l'ordine degli elementi nella formula mancante, il che complica notevolmente la verifica e la valutazione automatizzate dei risultati dei candidati. Per queste ragioni, non è raro che il processo di revisione sviluppi convenzioni di punteggio aggiuntive per risposte parzialmente corrette.

I compiti con risposte regolamentate costruite devono soddisfare una serie di requisiti:

Ogni compito deve essere finalizzato a una sola parola complementare, simbolo, ecc., il cui luogo si consiglia di contrassegnare con un trattino o dei punti;

Al posto dell'elemento chiave, la cui conoscenza è fondamentale per il materiale da controllare, viene posto un trattino;

Si raccomanda che tutti i trattini nelle attività di un test abbiano la stessa lunghezza;

È meglio assegnare un posto per la risposta alla fine dell'attività o il più vicino possibile alla fine;

Dopo il trattino, se possibile, sono indicate le unità di misura;

Il testo del compito deve avere una struttura sintattica estremamente semplice e contenere importo minimo informazioni necessarie per completare correttamente l'attività.

I compiti del secondo tipo con una risposta costruita liberamente non hanno restrizioni sul contenuto e sulla forma di presentazione delle risposte. Durante il tempo assegnato, il candidato può scrivere tutto ciò che vuole su appositi moduli di risposta. Indubbiamente, tali condizioni di adempimento sono per molti versi vicine a quelle tradizionali opere scritte, e quindi i compiti con risposte liberamente costruite sono percepiti positivamente dalla maggioranza assoluta degli insegnanti. Sono interessanti e vari nei contenuti.

Sviluppare compiti del secondo tipo può sembrare irragionevolmente facile. In effetti, è difficile non formulare il compito, ma offrire uno standard di risposta ottimale insieme a regole standardizzate per valutare i risultati della sua attuazione. Ad esempio, la formulazione di un compito di storia con una risposta dettagliata è piuttosto breve.

Compito 3

NOMINARE I PRINCIPALI COMPITI RISOLTI NELLA POLITICA ESTERA DELLA RUSSIA NEL XVII SECOLO (INDICARE ALMENO DUE COMPITI). FORNIRE ESEMPI DI GUERRE, CAMPAGNE E SPEDIZIONI NEL XVII SECOLO INTRAPRESE PER RISOLVERE QUESTI PROBLEMI (ALMENO TRE ESEMPI).


Ma affinché un compito possa essere incluso nel test, il suo autore deve standardizzare la procedura di verifica, e questo è un lavoro voluminoso che a volte provoca molte critiche a causa dell'ambiguità dei risultati della sua implementazione.

IN Scienze naturaliè molto più semplice proporre uno standard di prestazione insieme a criteri di valutazione. Ad esempio, per l'attività 4 puoi offrire i seguenti criteri per valutare i risultati del completamento

Compito 4

A QUALI VALORI X VALORI DI FUNZIONE CORRISPONDENTI F(X) = registro 2 X E G(X) = ceppo 2 (3 – X) DIFFERIRANNO MENO DI 1?


Il test dei compiti con risposte dettagliate viene effettuato da esperti secondo istruzioni standardizzate contenenti lo standard della risposta ottimale con le sue caratteristiche e attributi di qualità, come nell'esempio fornito. La norma deve essere accompagnata da categorie di valutazione per emettere una valutazione politomica, che richiedono test e fondatezza statistica della qualità, poiché tra queste possono essercene alcune che non funzionano e quelle che riducono l'effetto differenziante del test.

I compiti con risposte dettagliate richiedono un lavoro didattico significativo durante il controllo, quando gli esperti devono analizzare molte risposte corrette in varia misura e confrontarle con lo standard, senza tener conto della completezza, del formato esterno delle risposte, degli errori di ortografia e di tutto ciò che è non rientrante nei criteri per l'assegnazione della valutazione politomica. A volte cercano di standardizzare la verifica sviluppando programmi informatici esperti.

Al di fuori dei sistemi automatizzati, verificare i risultati del completamento delle attività con risposte dettagliate è piuttosto soggettivo ed è difficile coordinare le valutazioni di diversi esperti, quindi di solito tali attività non occupano più del 10-15% della durata totale del test di certificazione.

Gli item a risposta libera sono progettati principalmente per valutare le abilità cognitive. Dovrebbero essere sviluppati solo nei casi in cui non è possibile utilizzare forme più semplici;

La lunghezza e la complessità della risposta possono variare notevolmente (fino a diverse pagine di testo della risposta, giustificazione per la soluzione data al problema, ecc.). Si consiglia di introdurre nelle istruzioni restrizioni sulla lunghezza massima della risposta per ciascuna attività;

La formulazione del compito dovrebbe includere una dichiarazione del problema, uno standard di prestazione e criteri di valutazione. La parte produttiva dovrà essere talmente chiara da ridurre al minimo i possibili scostamenti nelle risposte corrette degli studenti dallo standard di esecuzione previsto dallo sviluppatore;

La scelta del periodo di tempo per il completamento di ciascuna attività dovrebbe consentire allo studente di formulare una risposta sufficientemente dettagliata e avere il tempo di scriverla.

L'affidabilità delle valutazioni dei risultati dei compiti con risposte liberamente costruite può essere aumentata se:

Comporre con competenza il compito, guidato dalle raccomandazioni di cui sopra;

Durante il controllo, utilizzare solo lo schema di valutazione standardizzato sviluppato con non più di tre categorie di valutazione (0, 1, 2);

Formare i revisori degli incarichi affinché utilizzino criteri di valutazione standardizzati;

Coinvolgere almeno due esperti per verificare ogni compito e invitare un terzo esperto se i punteggi dei primi due differiscono di più di un punto;

Utilizzare i principi di anonimato del lavoro sottoposto a controllo e di indipendenza dal giudizio degli esperti;

Non guardare il voto assegnato a un compito precedente quando valuti quello successivo.

I compiti di tipo saggio possono essere valutati in base a quanto segue:

Schemi di valutazione semplici, quando i criteri sono costruiti concentrandosi sul contenuto delle risposte degli studenti;

Schemi di valutazione complessi che tengono conto durante l'esame del contenuto delle risposte, delle caratteristiche di qualità del testo, della sua completezza e stile, o di qualsiasi altro fattore che sembra importante per lo sviluppatore del compito;

In qualsiasi schema di valutazione, gli elementi con risposte costruite liberamente richiedono un punteggio politomo, che a volte aumenta ingiustificatamente il loro peso complessivo nel punteggio del test. Per evitare tale sovrastima e ridurre l’influenza della componente soggettiva, di solito si cerca di ridurre il numero dei criteri di valutazione, limitandosi a valutazioni politomiche, ad esempio da 0 a 3 o da 0 a 2.

Per compiti con una risposta breve e regolamentata, formulata sotto forma di dichiarazioni incomplete e presentate senza moduli di risposta speciali, viene solitamente utilizzata un'istruzione composta da una parola: "AGGIUNGI". Nei casi in cui, per risposte a compiti con una risposta breve regolamentata, è necessario dare risposte in moduli speciali, e non accanto ai compiti, le istruzioni potrebbero assomigliare a: “Scrivi RISPOSTE AI COMPITI NEL MODULO DI RISPOSTA A DESTRA DI I NUMERI DEL COMPITO CORRISPONDENTI. SCRIVI OGNI LETTERA IN UNA CASELLA SEPARATA SECONDO I CAMPIONI FORNITI NEL MODULO DI RISPOSTA."

Le istruzioni per attività con risposte costruite liberamente di solito hanno una forma libera. La cosa principale è dire quanto più possibile per facilitare e standardizzare il lavoro degli esperti durante il controllo dei risultati dei test per ridurre l'influenza dei fattori soggettivi e aumentare l'affidabilità delle misurazioni pedagogiche. Nella forma più generale, per le materie umanistiche, le istruzioni possono essere del tipo: “PER LE RISPOSTE AI COMPITI, UTILIZZARE UN MODULO DI RISPOSTA SEPARATO. SCRIVI PRIMA IL NUMERO DELL'ATTIVITÀ E POI UNA RISPOSTA DETTAGLIATA. SCRIVI CHIARAMENTE LE TUE RISPOSTE.

5.4. Compiti di conformità

I compiti di corrispondenza hanno una forma specifica, dove sotto le istruzioni ci sono elementi di due serie, la cui corrispondenza deve essere stabilita dal soggetto. A sinistra ci sono solitamente gli elementi dell'insieme di definizione contenente l'enunciazione del problema, a destra ci sono gli elementi da selezionare.

La corrispondenza tra gli elementi di due colonne può essere biunivoca quando ogni elemento a destra corrisponde esattamente ad un elemento a sinistra. Se il numero di elementi in due colonne è lo stesso, l'ultimo elemento dell'insieme di specificazione non verrà selezionato. Ci sono casi, determinati dal contenuto specifico dell'argomento, in cui gli stessi elementi a destra sono selezionati per più elementi della colonna di sinistra, quindi potrebbero essercene meno rispetto a quelli a sinistra. Infine, il compito ottimale è quello in cui l'insieme giusto contiene più elementi, ognuno dei quali viene selezionato una sola volta. Ad esempio, successo è 1, non successo 2, perché il numero di elementi da selezionare a destra è uguale al numero di elementi nella colonna di sinistra.

Esercizio 1

PER CIASCUNO DEI TRE ELEMENTI (1, 2, 3), SI SELEZIONA UN ELEMENTO CORRISPONDENTE DAL LATO DESTRO CON LE LETTERE (A, B, C, D, E, E, G, Z, I, K).

Determina la corrispondenza dei ruoli manageriali a tre blocchi secondo il modello di G. Mintzberg


Le risposte possono essere presentate sotto forma di tabella, nel qual caso non sono necessarie istruzioni dettagliate come quelle fornite per l'attività 1.


Compito 2

INCONTRO



Gli elementi extra nella colonna di destra che non possono essere selezionati se le risposte sono corrette sono chiamati distrattori. Come nei compiti a scelta multipla, le maggiori difficoltà nello sviluppo sono associate alla selezione di elementi ridondanti plausibili nell'insieme giusto. La misura della credibilità di ciascun distrattore è stabilita empiricamente.

Quando sviluppi attività di conformità, dovresti essere guidato dalle seguenti regole:

Il compito è formulato in modo tale che tutto il contenuto possa essere espresso sotto forma di due insiemi con nomi appropriati;

A sinistra si trovano gli elementi della colonna di specificazione, a destra gli elementi per la selezione;

È auspicabile che ogni colonna abbia un nome specifico che riassuma tutti gli elementi della colonna;

È necessario che la colonna di destra contenga almeno diversi distrattori. È ancora meglio se il numero di elementi nell’insieme di destra è circa il doppio del numero di elementi nella colonna di sinistra;

È necessario che tutti i distrattori in un compito abbiano la stessa probabilità di essere plausibili;

Gli elementi della colonna devono essere selezionati su una base unica per garantire che in ciascun elemento di prova sia incluso solo materiale omogeneo.

In un test di certificazione, i compiti di conformità sono inefficaci a causa della loro macchinosità, che non consente di coprire una grande quantità di contenuti.

Le attività di corrispondenza vengono fornite con un'istruzione standard di due parole: "MATCH". A volte le istruzioni vengono ampliate, soprattutto nei casi in cui è presente un modulo di risposta separato. Ad esempio, l'istruzione potrebbe essere simile: "SCRIVI PRIMA LE LETTERE CORRISPONDENTI AGLI ELEMENTI SPECIFICATI NELLA TABELLA FORNITA NEL TESTO DEL COMPITO, E POI TRASFERILI NEL MODULO."

Le prestazioni sui compiti di corrispondenza vengono valutate utilizzando una valutazione dicotomica o politomica. Nel punteggio dicotomico, viene assegnato 1 punto per tutte le corrispondenze identificate correttamente nell'elemento del test. Se almeno una corrispondenza non è corretta, il soggetto riceve 0 punti per un'attività di corrispondenza parzialmente completata correttamente. Un altro modo è assegnare un punto per ogni corrispondenza corretta, quindi quando si controllano le corrispondenze degli elementi, viene utilizzato il punteggio politomo e il numero totale di punti per l'elemento è uguale al numero di corrispondenze identificate correttamente.

5.5. Compiti per stabilire la sequenza corretta

I compiti di test del quarto modulo hanno lo scopo di valutare il livello di competenza in una sequenza di azioni, processi, ecc. In tali compiti, gli elementi relativi a un compito specifico sono presentati in ordine casuale e il soggetto deve stabilire l'ordine corretto degli elementi proposti e indicarlo in un dato modo in un luogo appositamente designato.

Le istruzioni standard per i compiti del quarto modulo sono: “STABILIRE LA SEQUENZA CORRETTA”. A volte le istruzioni sono incluse nel testo del compito.

Esercizio 1

INSERISCI I NOMI DEI COMANDANTI RUSSI NELLA SEQUENZA CRONOLOGICA DELLE LORO ATTIVITÀ. SCRIVERE NELLA CORRETTA SEQUENZA LE LETTERE CHE INDICANO I NOMI NELLA TABELLA FORNITA NEL TESTO DEL COMPITO, E POI TRASFERIRLE SUL MODULO.

A) Dmitrij Pozarskij

B) Alexey Ermolov

B) Michail Skobelev

D) Alexey Orlov


Compito 2

STABILIRE LA CORRETTA SEQUENZA DEL MECCANISMO DI ESPARIZIONE COLLOCANDO I NUMERI NEI POSTI DESIGNATI:

? – collasso dei polmoni

? – inibizione del centro dei muscoli respiratori nel midollo spinale

? – stimolazione del centro espiratorio nel midollo allungato

? – rilassamento del diaframma e dei muscoli ausiliari

? – riduzione della cavità toracica


In molti casi, i compiti per stabilire la sequenza corretta sono estremamente a bassa tecnologia o non applicabili a causa del contenuto specifico dell'argomento. Sono macchinosi e spesso consentono una sequenza ambigua di risposte, quindi non se ne consiglia l'uso nei test di certificazione.

5.6. Caratteristiche comparative dei moduli delle attività di test

Nel processo di sviluppo di un test, l'autore ha sempre una domanda: dovrebbe attenersi a un solo tipo di compiti o decidere di combinare diversi moduli in un unico test? E se ti fermi a uno, quale preferiresti? La scelta dell'autore è in gran parte determinata dal contenuto specifico della disciplina accademica, dagli obiettivi della creazione e dell'utilizzo del test. Molto qui dipende dalla tecnologia di test, raccolta ed elaborazione dei dati empirici, dal supporto tecnico e materiale per il processo di applicazione del test. È facile organizzare la raccolta e l'analisi computerizzata dei risultati dei test nel caso in cui tutte le attività siano a scelta multipla.

I risultati del completamento delle attività con risposte costruite richiedono l'elaborazione manuale. Di norma, è necessario coinvolgere esperti per valutare i risultati della loro attuazione, e ciò richiede costi materiali e tempo aggiuntivi per la verifica.


Vantaggi e svantaggi delle varie forme di incarico

1. Compiti con due risposte

Vantaggi: grazie alla loro brevità, consentono di coprire una grande quantità di materiale, sono facili da sviluppare (un solo distrattore) e i risultati dell'esecuzione vengono elaborati rapidamente con elevata obiettività.

Screpolatura: stimolare la memorizzazione meccanica, incoraggiare l'ipotesi, richiedere un aumento del numero di compiti e, di conseguenza, testare il tempo per compensare l'effetto dell'ipotesi.

2. Compiti con una scelta da quattro a cinque risposte

Vantaggi: adatto a un'ampia varietà di materie accademiche, grazie alla brevità della formulazione del test, è possibile coprire una grande quantità di contenuti, offre la possibilità di test automatizzati e un'elevata obiettività delle valutazioni degli studenti, consente una valutazione dettagliata analisi statistica le loro caratteristiche, adattarle e aumentare significativamente l'affidabilità delle misurazioni pedagogiche.

Screpolatura: richiedono un lavoro significativo da parte degli autori nella selezione dei distrattori e nella correzione dei punteggi degli studenti; non sono adatti per testare il livello produttivo dell’attività e le abilità cognitive.

3. Compiti con risposte regolamentate costruite

Vantaggi: facile da sviluppare, elimina le ipotesi, parzialmente adatto alla verifica automatizzata.

Screpolatura: verificano principalmente la conoscenza del materiale fattuale o dell'apparato concettuale, solitamente (in soggetti umanitari) sono troppo facili e talvolta portano a risposte ambigue, corrette e parzialmente corrette.

4. Compiti con risposte costruite liberamente

Vantaggi: consentono di valutare risultati formativi complessi, comprese le capacità di comunicazione, livello creativo attività, sono facilmente formulabili come compiti tradizionali ed eliminano le ipotesi.

Screpolatura: richiedono una procedura di verifica lunga e costosa, tempi di esecuzione significativi, non consentono di coprire una quantità significativa di contenuti della materia e riducono l'affidabilità delle misurazioni pedagogiche.

5. Compiti di conformità

Vantaggi: facile da sviluppare, ideale per valutare la conoscenza associativa e condurre un monitoraggio continuo, riducendo l'effetto di indovinare.

Screpolatura: utilizzati più spesso per verificare il livello di attività riproduttiva e le capacità algoritmiche, sono ingombranti sotto forma di presentazione.


Le caratteristiche comparative delle proprietà tecnologiche di varie forme di prova sono presentate nella tabella. 5.1.


Tabella 5.1Caratteristiche tecnologiche comparative degli stampi





La scelta della forma delle attività pre-test è determinata dalle specificità del contenuto controllato e dagli obiettivi della creazione del test. Ogni forma di compito ha i suoi vantaggi e svantaggi, il suo ambito di applicazione.

Lo sviluppo delle attività pre-test viene effettuato in conformità con requisiti standardizzati, il cui contenuto dipende dalle specifiche del modulo di test. I compiti con risposte a scelta multipla sono più convenienti per il controllo finale a causa di una serie di vantaggi tecnologici che aumentano l'efficienza dei processi di applicazione del test finale e di valutazione dei risultati degli studenti. I compiti di complementazione sono preferibili per il controllo dell'apprendimento.

Le tendenze moderne nello sviluppo dei test finali sono associate all'abbandono della monoformità e all'uso diffuso di compiti aggiuntivi, poiché la varietà delle conoscenze e delle abilità testate richiede l'introduzione di varie forme nel test.

Esercizi pratici e domande di discussione

1. Cerchia il numero della risposta corretta.

È più efficace utilizzare gli elementi del test con due risposte in controllo:

1) corrente

2) tematico

3) finale

4) ingresso

2. Cerchia il numero della risposta corretta.

1) corrente

2) finale

3) ingresso

3. Cerchia il numero della risposta corretta.

La probabilità di indovinare il numero della posizione della risposta corretta in un compito con cinque distrattori sarà:

4. Trova due carenze significative nel compito, riformula il compito per eliminare le carenze.

Quale classe di animali è caratterizzata dalle seguenti caratteristiche: a sangue freddo, che vivono nell'acqua e sulla terra, che si riproducono nell'acqua?

1. Classe di pesce

2. Classe dei rettili

3. Classe di anfibi

4. Classe dei mammiferi

5. Suggerire un metodo per migliorare la formulazione dei compiti.

Quale dei seguenti è stato eliminato dalle riforme degli anni '60 del XIX secolo in Russia?

1. Autocrazia

2. Servitù

3. Proprietà

4. Proprietà fondiaria dei terreni

5. Oppressione nazionale

Esperto: in informatica e video didattici

Prima di entrare nei principi della progettazione dei test, è necessario sottolineare alcuni punti.

Differenze tra il test e le attività nel modulo del test

I concetti sono costantemente confusi nella coscienza quotidiana test E testare i sistemi di attività(o attività pre-test).

Di norma, il test viene sviluppato da un team di ricercatori e testato per un certo periodo di tempo. Dopo il test, vengono apportate modifiche al test. Il test consiste in compiti di prova. Nella letteratura in lingua inglese, il termine “Quiz” (ma non “Test”!) viene utilizzato per riferirsi a un test.

Pertanto, l'insegnante (insegnante) non può creare test. Invece, sviluppa compiti sotto forma di test che sono superficialmente simili al test, ma non sono sottoposti a test statistici o di altro tipo. Tali compiti possono essere utilizzati in processo educativo risolvere alcuni problemi pedagogici.

Ne consegue che è fondamentalmente impossibile utilizzare una serie di caratteristiche di prova. Ad esempio, la difficoltà di un compito di prova viene determinata sperimentalmente, sulla base dei risultati di un ampio campione di studenti. In pratica, l’insegnante non ha né il tempo per condurre l’esperimento né la dimensione del campione richiesta. Pertanto, la difficoltà è spesso determinata “a occhio”.

In generale, le attività in forma di test (così come le attività di test) soddisfano i seguenti requisiti:

  • brevità;
  • producibilità;
  • certezza di scopo;
  • forma logica dell'affermazione;
  • certezza del posto per le risposte;
  • le stesse regole per valutare le risposte;
  • corretta posizione degli elementi del compito;
  • istruzioni identiche per tutti i soggetti;
  • adeguatezza delle istruzioni alla forma e al contenuto del compito.

COSÌ, brevità compiti nella forma del test è assicurata da un'attenta selezione di parole, simboli e grafica, consentendo, con un minimo di mezzi, di raggiungere la massima chiarezza del contenuto semantico del compito.Producibilità dei compiti è definita come una proprietà che consente di eseguire il processo di test utilizzando mezzi tecnici e di farlo in modo accurato, rapido, economico e obiettivo.Forma logica dell'enunciato è un mezzo per razionalizzare e organizzare in modo efficace il contenuto di un'attività.

Forme di compiti di prova

Inoltre, i principi per lo sviluppo delle attività di test (attività in forma di test) sono correlati alle loro forme. Vari autori Le forme delle attività di test sono classificate in modo diverso. A peggiorare le cose, ogni sistema di test automatizzato nomina gli stessi moduli in modo diverso. Riassumiamo la varietà delle forme di attività di test con la seguente classificazione.

  1. Vero falso (Vero o falso, dall'inglese Vero o falso)– contiene un'affermazione con la quale lo studente deve essere d'accordo o in disaccordo.

Per esempio:

Il primo presidente degli Stati Uniti fu George Washington

  1. Giusto
  2. Sbagliato

Nell'esame di stato unificato, compiti simili si trovano nei KIM secondo lingue straniere nei compiti di ascolto: gli studenti ascoltano il testo, poi passano ai compiti di tipo Vero o Falso.

Questa forma di test è la più semplice da compilare sia per l'insegnante che per gli studenti a cui rispondere. Tali forme di incarico sono caratterizzate alto grado indovinando la risposta corretta.

2. Scelta multipla (compiti con la scelta di una o più risposte corrette). Questa è la forma più comune di attività di test. Contiene un'affermazione (domanda) e risposte alternative.

Per le attività con la scelta di una risposta corretta, si consiglia di utilizzarne almeno 4 (se inferiore, aumenta la probabilità di indovinare la risposta corretta) e non più di 6 (è difficile trovare alternative plausibili).

Per attività con più risposte corrette, si consigliano almeno 6 alternative.

3. Compiti per stabilire la conformità.È un insieme di elementi su due colonne: lo studente deve stabilire una corrispondenza tra gli elementi delle colonne sinistra e destra. Avere un'intestazione per ogni serie di colonne è d'obbligo: consente allo studente di evitare di perdere tempo nel riassumere gli elementi nelle colonne e di passare direttamente all'attività.

Confrontare:

  1. un'etichetta
  2. b) Ulus
  3. c) Volosten
  4. d) Vizio
  5. e) Plinta
  1. Struttura della parete della batteria
  2. Mattone
  3. Lo statuto di Khan
  4. Governatore del volost
  5. Possesso

Anche un compito, riformattato tenendo conto dei requisiti specifici:

Come vediamo, nel secondo caso il compito è più leggibile, il suo significato è facilmente comprensibile. Tieni presente che, ad esempio, il servizio OnlineTestPad e alcuni altri ti consentono di aggiungere tali intestazioni. Altri (come Moodle) non hanno questa funzionalità. In questo caso è necessario scrivere un'istruzione completa, ad esempio "Abbina la corrispondenza tra .... e ...."

Nei test cartacei di questa forma di compiti per la risposta corretta Ti viene chiesto di compilare un modulo speciale. L'opzione con le frecce è considerata tecnologicamente meno avanzata per i test, quindi dovrebbe essere evitata.

2 3 4

Anche auspicabile impostare un numero dispari di elementi colonne sinistra e destra in modo che l'ultimo elemento non venga selezionato per eliminazione.

Guarda questo compito:

Disporre i nomi dei comandanti russi in ordine cronologico (in ordine crescente) delle loro attività

Dmitrij Pozarskij

Alexey Ermolov

Michail Skobelev

Alexey Orlov

Questo è anche il compito di stabilire la corrispondenza o, più precisamente, la sua varietà: il compito di stabilire la sequenza corretta. Un certo numero di ricercatori stranieri sono propensi a tale unione. Ecco perché, ad esempio, non troveremo un modulo del genere in Moodle. Ma può essere facilmente costruito da un'attività di corrispondenza. Per chiarezza, riformattiamo leggermente l'attività precedente:

Vediamo un classico compito di corrispondenza, solo la colonna di sinistra rappresenta l'ordine numerico. Lo studente dovrà inoltre inserire le risposte corrette in un'apposita tabella.

2 3

A volte i compiti sopra descritti sono veri o falsi, scelta multipla e le corrispondenze si combinano ad un gruppo di lavoro chiuso, che hanno le seguenti caratteristiche comuni:

  • La risposta corretta è chiaramente presente, basta sceglierla in un modo o nell'altro;
  • Le risposte alle domande possono essere indovinate (la probabilità di indovinare aumenta al diminuire del numero di alternative);
  • Le risposte possono essere ricordate
  • Le risposte possono essere selezionate in modo logico, scartando alternative ovviamente errate.

5. Addizione (risposta breve). In questi compiti, lo studente deve completare la risposta corretta. A volte viene chiamato questo tipo di attività attività di tipo aperto. A differenza delle forme di compiti di test discusse sopra, strategie come indovinare, ricordare la risposta corretta, ecc. “non funzionano”. Pertanto, questo tipo di compito è considerato più difficile per gli studenti.

6. Saggio– una breve risposta dello studente all’essenza della domanda. A rigor di termini, un saggio non è una forma di test, perché... non soddisfa i necessari criteri di brevità, producibilità, ecc. A nostro avviso, il saggio è stato introdotto per superare le note difficoltà nella composizione dei compiti tipici del test, la principale delle quali è l'incapacità di presentareTuttomateriale didattico sotto forma di test e la natura riproduttiva dei tipici compiti di prova.

Tuttavia, i compiti di saggio devono proporre standard di risposta ottimale insieme a regole standardizzate per valutare i risultati della sua implementazione.

Per quali valori di x sono i valori corrispondenti delle funzioni f(x)=log 2 x e g(x) = logaritmo2 (3 – x) differirà di meno di 1?

Criteri per valutare la risposta corretta

Punti Criteri per valutare il completamento del compito 9
2 Viene fornita la sequenza corretta dei passaggi della soluzione:

1) compilare una disuguaglianza contenente un modulo;

2) soluzione della disuguaglianza.

Tutte le trasformazioni e i calcoli sono stati eseguiti correttamente, è stata ottenuta la risposta corretta

1 Viene fornita la sequenza corretta dei passaggi della soluzione. Durante la risoluzione della disuguaglianza nel passaggio 2, è stato commesso un errore di battitura e/o un piccolo errore di calcolo, che non influisce sulla correttezza dell'ulteriore progresso della soluzione. Questo errore materiale e/o errore può comportare una risposta errata.
0 Tutti i casi di soluzione che non soddisfano i criteri di cui sopra per il punteggio di 1 o 2 punti

Principi per lo sviluppo di compiti sotto forma di test

La prossima cosa su cui dovremmo concentrarci sono i principi dello sviluppo di compiti sotto forma di test.

Per molto tempo si è creduto che il test stesso fosse un mezzo oggettivo di controllo. Tuttavia, poi si è capito che il test fornisce, prima di tutto, l'obiettività procedurale. Per valutare la qualità di un test, ci sono una serie di aree correlate: affidabilità (la garanzia che non ci siano errori casuali nel test), validità (la garanzia che il test misuri esattamente ciò che dovrebbe misurare), difficoltà, eccetera. Come abbiamo indicato sopra, tutti questi parametri sono sviluppati sulla base di vari modelli matematici durante lavoro sperimentale team dell'autore e non sono a disposizione di insegnanti e professori. Pertanto, ci soffermeremo solo su una serie di requisiti teorici per lo sviluppo di compiti sotto forma di test.

  1. Inizia a costruire un'attività con la risposta corretta. Accade spesso che un'attività contenga formalmente più risposte corrette del previsto. Esistono anche casi opposti: l'attività non contiene affatto la risposta corretta.
  2. Il contenuto del compito si basa sui requisiti del programma e riflette il contenuto dell'argomento (meta-soggetto). A volte cercano di includere nel test domande per le quali semplicemente non esiste una risposta corretta.

Per esempio:

Noi studieremo lingua latina Perché…

  1. Si parla in molti paesi del mondo
  2. Vogliamo capire meglio madrelingua, poiché contiene molte parole prese in prestito dal latino
  3. Vogliamo comprendere meglio la storia e la cultura del mondo antico

Questo buon lavoro. Ma dovrebbe essere utilizzato in un'indagine sociologica e non in compiti per testare i risultati educativi.

  1. La domanda dovrebbe essere mirata a individuare un elemento di conoscenza, un pensiero completo. Altrimenti, è difficile diagnosticare il motivo del fallimento dell'attività.

Confucio..

  1. vissuto in Africa
  2. vissuto in Cina
  3. era un medico
  4. era un sovrano
  5. era un filosofo

Questo compito ha lo scopo di identificare due elementi contemporaneamente: dove visse Confucio e chi era. È necessario separare queste due questioni.

  1. Quando scrivi domande, dovresti evitare le parole “a volte”, “spesso”, “sempre”, “un po’”, “di più”, ecc. Tali parole hanno un significato soggettivo e possono portare a risposte errate. Le attività di test (attività in forma di test) devono avere una risposta chiara e inequivocabile.
  2. Evita frasi introduttive o frasi che hanno poco collegamento con l'idea principale e non ricorrere ad affermazioni lunghe.

Per esempio:

“Depressione di Anadyr. È molto piatto, e l'Anadyr lo percorre dimenandosi come un enorme boa constrictor... "L'Anadyr è un fiume giallo", così si potrà intitolare il saggio in seguito. Tundra e laghi in tutta la depressione. È difficile capire cosa ci sia di più: o laghi o terra” (O. Kuvaev). In quale mare sfocia questo fiume?

  1. Le risposte corrette devono essere plausibili, abilmente selezionate, non dovrebbero esserci risposte errate evidenti (sono una sorta di suggerimento: questa risposta è certamente sbagliata). Vengono chiamate le risposte errate che sono molto simili a quelle correttedistrattori. Per esempio:

Luogo di nascita di Karl Marx:

  1. Treviri
  2. Karl-Marx-Stadt
  3. Sturgard
  4. Monaco

Qui possiamo supporre che la città di Karl-Marx-Stadt abbia preso il nome perché era il luogo in cui nacque Karl Marx. Tuttavia, la risposta corretta è Treviri.

  1. Non fare domande trabocchetto – gli studenti più capaci o informati che sanno abbastanza da cadere nella trappola rischiano di essere fuorviati e ciò vanifica anche lo scopo di determinare il livello di conoscenza e comprensione.
  2. Dovrebbero essere utilizzate domande più lunghe e risposte più brevi che siano grammaticalmente coerenti con la parte principale del compito. .

Per esempio:

Quale affermazione è corretta?

  1. Frasi incomplete- queste sono frasi in cui manca uno dei membri principali
  2. Le frasi incomplete sono frasi in cui manca uno dei membri minori
  3. Le frasi incomplete sono frasi in cui manca un membro della frase, principale o secondario

È facile vedere che qui c'è una frase ripetuta, che dovrebbe essere inclusa nella formulazione del compito:

Le frasi incomplete sono frasi mancanti

  1. uno dei membri principali
  2. uno dei membri minori
  3. qualsiasi membro della frase: principale o secondario
  1. Non utilizzare negazioni nel corpo della domanda. In primo luogo, ciò porta a un malinteso sull'essenza del compito. In secondo luogo, oggetto del controllo dovrebbero essere elementi di conoscenza, non elementi di ignoranza.

Per esempio:

Se queste persone vivessero effettivamente o meno Grecia antica?

  1. Omero
  2. Achille
  3. Zeus
  4. Pericle
  5. Fidia
  6. Aristotele
  7. Socrate

IN in questo caso Non è chiaro come rispondere: sì, hanno vissuto, oppure sì, non hanno vissuto. Pertanto, la domanda deve essere formulata in modo più preciso, ad esempio: nominare i personaggi mitologici dell'antica Grecia.

  1. Quando si alternano le risposte corrette alle domande non dovrebbe esserci un sistema ovvio – ad esempio, solo 1 opzione è sempre corretta, oppure le opzioni corrette sono in sequenza la prima, la seconda, la terza, la quarta opzione. Nei test al computer questo problema di solito non esiste perché il computer mescola automaticamente le alternative.
  2. Se la domanda è di natura quantitativa, allora è necessario indicare la sequenza (dal meno al più o viceversa) nella scelta delle risposte corrette .

Per esempio:

Distanza dal sole

a) Saturno

b) Mercurio

c) Terra

d) Uranio

e) Venere

f) Marte

In questo esempio ci sono, per così dire, due serie di opzioni di risposta corretta: una sequenza dal pianeta più vicino al Sole, l'altra da quello più distante.

  1. La domanda e la risposta dovrebbero differire nel carattere e nella progettazione spaziale. Ad esempio, una domanda (attività) è evidenziata in grassetto, la risposta è in carattere normale. Il rientro aggiuntivo viene utilizzato per registrare le risposte. Ma questa regola si applica solo ai test cartacei: nei sistemi automatizzati computerizzati, la progettazione è impostata dal software, che non è consigliabile modificare.

E ricorda: non tutte le attività possono essere presentate come test di controllo.

Durante la scrittura dell'articolo, sono stati utilizzati esempi http://koi.tspu.ru/koi_books/samolyuk/

Come è noto, l'unità del test, il suo elemento strutturale, è il compito del test. Può essere definito come “il più semplice e allo stesso tempo olistico elemento strutturale test. I compiti stessi inclusi nel test possono essere variati sia nella forma di presentazione che nel contenuto. Esistono diversi approcci per classificare i compiti del test in base alla forma della loro presentazione. I tipi più comuni di attività di test sono mostrati nella Figura 3.1.

Il fattore principale che influenza la forma dell'attività di test è il metodo per ottenere la risposta (scegliendo tra le opzioni offerte o formulando autonomamente la risposta). Quindi questa classificazione può essere rappresentata dal seguente schema.


Va notato che le attività di test hanno una serie di caratteristiche. Ogni attività di test ha il proprio numero di serie. Di norma, i compiti del test sono organizzati in ordine crescente di difficoltà, anche se è possibile che la complessità dei compiti oscilli in direzioni diverse man mano che si procede nel test.

Ogni attività di test ha una risposta corretta standard. Di norma, le attività che non hanno una risposta corretta non vengono incluse nel test.

Gli elementi del test di una forma sono solitamente accompagnati da istruzioni standard, che precedono la formulazione degli elementi del test.

Per ogni attività di test viene sviluppata una regola per la valutazione (assegnazione di punti).

Test in termini di forma di presentazione e tempo di esecuzione, di solito è piuttosto breve. Quando si formula un compito, prestare attenzione al fatto che tutte le affermazioni del test siano comprensibili a tutti gli studenti senza eccezioni (formulate in espressioni semplici con vocabolario di uso comune, senza termini che utilizzano parole straniere o usate raramente. Se possibile, nei compiti, frasi con si evita la negazione “non”, poiché si ritiene preferibile affermare qualcosa (sia positivo che negativo).

Attività di tipo aperto. Nelle attività in formato aperto (attività per addizione), non vengono fornite risposte già pronte, devono essere ottenute. Esistono due tipi di attività aperte:

  • 1) con restrizioni imposte alla risposta;
  • 2) senza restrizioni imposte alla risposta, in cui i candidati al test devono comporre una risposta dettagliata sotto forma di soluzione al problema.

I compiti del secondo tipo differiscono poco dai test tradizionali, richiedono costi di test maggiori e sono più difficili da standardizzare.

Quando si risponde a un compito a risposta aperta con una risposta limitata, lo studente inserisce la parola, la formula o il numero mancante al posto del trattino o in uno spazio appositamente designato nel modulo di risposta.

Le istruzioni per le attività di tipo aperto sono solitamente accompagnate dalle parole: "Scrivi la parola mancante al posto del trattino" o "Ottieni e scrivi la risposta sul modulo di risposta", ecc.

Attività di tipo chiuso. Compiti a scelta multipla. Un'attività chiusa con una scelta di risposta, di regola, include una domanda e diverse possibili risposte (sono indicate dalle lettere A, B, C, D,... o numeri: 1,2,3,4 ,...). Lo studente dovrà scegliere tra le risposte quelle corrette. Nella maggior parte dei test, solo uno è corretto. Ma a volte gli sviluppatori di test includono diverse risposte corrette tra le risposte. Le risposte plausibili sono chiamate distrattori. Il loro numero nell'attività di solito non è superiore a cinque. I distrattori vengono selezionati tenendo conto errori tipici scolari.

Un compito di prova chiuso con una scelta di risposte è considerato "funzionante" se gli studenti che conoscono il materiale didattico lo completano correttamente e quelli che non lo sanno scelgono una delle risposte con la stessa probabilità.

I compiti con risposte a scelta multipla sono solitamente preceduti dalle seguenti istruzioni: Indicare il numero (lettera) della risposta corretta (per test in bianco) oppure: Premere il tasto con il numero (lettera) della risposta corretta (per test computer).

Gli elementi del test con la possibilità di scegliere una risposta corretta, di norma, hanno le seguenti caratteristiche:

ambiguità e ambiguità siano evitate nel testo dell'incarico;

il compito ha una struttura sintattica semplice;

la parte principale contiene quante più parole possibile, lasciando non più di 2-3 parole chiave per la risposta ad un dato problema. Tutte le parole ripetute vengono escluse dalle risposte inserendole nel testo principale dell'attività;

le risposte a un'attività solitamente offrono la stessa lunghezza;

cercano di escludere tutte le associazioni verbali che contribuiscono a scegliere la risposta corretta mediante ipotesi;

la frequenza con cui si sceglie lo stesso numero di risposte corrette in diverse attività di testo è solitamente la stessa o questo numero è casuale;

  • *Gli elementi del test che contengono giudizi di valore e opinioni del candidato su qualsiasi questione sono generalmente esclusi;
  • *il numero di opzioni di risposta in ciascuna attività è lo stesso e solitamente non più di cinque (raramente - 7);
  • *nel formulare distrattori (risposte plausibili), evitare le espressioni “nessuno degli elencati”, “tutti gli elencati”, ecc., che contribuiscono a indovinare; nelle risposte cercare di non utilizzare parole come “tutti”, “nessuno” , “mai” ", "sempre", ecc., come facilitare l'ipotesi;
  • *i distrattori vengono offerti in modo che siano ugualmente attraenti per i soggetti che non conoscono la risposta corretta;

nessuno dei distrattori è una risposta parzialmente corretta che si trasforma in una risposta corretta in determinate condizioni;

le risposte che si susseguono sono escluse dall'elenco di quelle errate;

le risposte sono selezionate in modo tale che la chiave di un compito non serva come chiave per le risposte corrette di un altro compito, cioè i distrattori di un compito non vengono utilizzati come risposte corrette di un altro;

tutte le risposte, di regola, sono parallele nella progettazione e grammaticalmente coerenti con la parte principale del compito del test;

*se in un compito sono presenti risposte alternative, queste non vengono posizionate accanto a quella corretta, poiché ciò focalizza immediatamente l'attenzione su di esse.

Caratteristiche comparative dei tipi di attività di test. La scelta del tipo di attività di test è determinata da molti parametri: il contenuto specifico della materia accademica, gli obiettivi del test, il livello di complessità dei compiti, la professionalità dello sviluppatore, ecc.

Ogni tipo di attività di test presenta vantaggi e svantaggi. Ad esempio, i compiti a scelta multipla in forma chiusa sono caratterizzati dai vantaggi che hanno tutti i test, vale a dire:

  • - obiettività nella valutazione dei risultati del lavoro;
  • - velocità di controllo delle attività completate;
  • - verifica sistematica di un volume sufficientemente ampio di materiale didattico.

Allo stesso tempo lo hanno fatto caratteristiche positive, solo inerente questa specie compiti. Ad esempio, sono i più facili da elaborare, consentono di organizzare la raccolta computerizzata e l'analisi dei risultati, ecc., senza troppe spese. Ma tali test hanno anche i loro svantaggi:

verificare solo il risultato finale del lavoro;

incapacità di tracciare la logica del ragionamento di uno studente durante il completamento dei compiti;

una certa probabilità di scegliere una risposta a caso;

l'impossibilità di testare determinati tipi di attività educative (ad esempio, trovare autonomamente indicazioni per soluzioni).

Un numero abbastanza elevato di attività nel test (di solito più di 20) e gran numero opzioni di risposta (più di 4).

Alcuni di questi svantaggi (ad esempio, indovinare la risposta) possono essere evitati con test a risposta aperta. Ma, allo stesso tempo, i risultati di questi compiti sono più difficili da elaborare statisticamente e per valutare i compiti con una risposta dettagliata è necessario il coinvolgimento di esperti, il che, a sua volta, riduce l'obiettività del controllo, complica la standardizzazione dei risultati. il test e aumenta il tempo e i costi finanziari dell’elaborazione dei risultati del test.

Nella teoria dei test è sempre più diffusa l'opinione che in un test sia desiderabile utilizzare il minor numero possibile di forme diverse di elementi di test. I test professionali si distinguono spesso per la monoformità dei loro compiti. Tuttavia, questo requisito non è sempre realizzabile a causa delle specificità di un particolare argomento. Pertanto, gli sviluppatori spesso si uniscono all'interno di un test diversi tipi attività di test (ad esempio, chiuse e aperte).

Ad esempio, i test test centralizzato contenere due parti (parte A e parte B). La parte A contiene attività di test di tipo chiuso e la parte B contiene test di tipo aperto.

Le tabelle 1.2 e 1.3 mostrano le caratteristiche comparative dei compiti di test di vario tipo.

Tabella 1.2. Analisi comparativa dei compiti di prova in base ai livelli di padronanza del materiale didattico

Sulla base di alcune di queste caratteristiche, i creatori del test possono scegliere una forma di elementi di test adatta a determinati scopi. Va inoltre notato che solo una ragionevole combinazione di test con forme e metodi di controllo tradizionali consentirà di ottenere un quadro completo del livello di conoscenza.

Tabella 1.3. Analisi comparativa delle attività di test in conformità con gli indicatori di progettazione del test

Indicatori di progettazione

Tipi di compiti

Chiuso

Aprire

Scelta multipla

Per stabilire la conformità

Per stabilire la sequenza corretta

Con una risposta limitata

Risposta gratuita

Facilità di progettazione

Non sempre

Non sempre

Non sempre

Effetto indovinare

Obiettività nella valutazione del risultato dell'attuazione

Dipende dalla qualità del compito

No, la valutazione è soggettiva

Possibilità di errori da parte dello studente durante la scrittura di una risposta

Condividi con gli amici o salva per te stesso:

Caricamento...