Quei software sempre più sofisticati che valutano i test

Un complesso e articolato documento, elaborato congiuntamente dal Council of Chief State Schools Officers (CCSSO) e dalla National Governors Association, che rappresentano nel loro insieme la grande maggioranza dei decisori politico-amministrativi che gestiscono i sistemi educativi dei 51 Stati che formano gli USA, fa il punto sugli standard valutativi riguardanti il Common Core adottato in quasi tutti gli Stati Uniti.

Viene approfondito in particolare il tema della valutazione della produzione scritta nell’area ‘English Language Arts and Literacy’. La produzione di software valutatori capaci di offrire in tempi rapidissimi una attendibile valutazione di tali testi, paragonabile a quella data dai migliori valutatori esperti, si è molto sviluppata negli ultimi anni, ed è quindi comprensibile che i responsabili scolastici delle amministrazioni statali siano interessati a un impiego su larga scala di tali software da parte degli insegnanti per almeno due motivi: in primo luogo perché essi possono validamente supportare il lavoro dei docenti dell’area linguistico-letteraria, negli Stati Uniti spesso giovani e poco professionalizzati, fornendo ad essi valutazioni affidabili delle prove scritte assegnate agli studenti; in secondo luogo perché tali valutazioni, effettuate su larga scala, possono essere utilizzate come indicatori utili per acquisire i fondi federali messi a disposizione degli Stati a condizione che essi realizzino progressi consistenti e misurabili sul piano dell’equità e delle pari opportunità: era la logica della legge NCLB (No Child Left Behind) di George W. Bush, riscritta e resa ancora più esigente per quanto riguarda la verifica dei risultati dalla legge ESSA (Every Student Succeeds Act) fortemente voluta da Barack Obama (dicembre 2015).

Il documento indica ben sei diversi software valutatori già sviluppati e largamente impiegati, messi a punto da centri di ricerca (come il noto ETS di Princeton) e da aziende private specializzate, che danno risultati tendenzialmente convergenti. Tali software, si sostiene nel documento, sono in grado di offrire valutazioni di tipo non solo quantitativo (es. ricchezza del lessico, uso appropriato delle parole, complessità sintattica) ma anche qualitativo (es. livello di astrattezza, coerenza dei riferimenti, rigore argomentativo ecc.).

Ciò consente fra l’altro di valutare anche competenze, come la creatività e il critical thinking, che secondo molti non sono rilevabili attraverso i tradizionali test a risposta multipla.