sabato 17 dicembre 2011

Leggibilità di un testo

Gli studi sulla leggibilità

A partire dagli anni venti-trenta dello scorso secolo, in America furono studiati dei metodi per analizzare la facilità di comprensione di un testo. Dapprima si procedette sottoponendo a vari lettori delle domande, a seguito della lettura di più testi: ciò diede come risultato empirico una maggior frequenza di errori nelle risposte riguardanti i testi con le frasi più lunghe (quindi con ampia presenza di subordinate), un uso abbondante di termini specifici e di impiego non consueto, oppure i testi col numero di errori più elevato. Si decise quindi che non vi era in questo caso alcun interesse per le qualità artistiche degli scrittori analizzati, e che quindi non era giustificato l'uso di parole o forme sintattiche strane. Inoltre, non vi era preoccupazione per il rischio che un testo semplice scada nella noia, qualora questa monotonia garantisse una lettura scorrevole. Scrive infatti Miller: «Definita tramite un procedimento siffatto, la leggibilità indica la precisione con cui il lettore può rispondere a delle domande, e non la qualità artistica del brano in questione. Ci occupiamo qui dell'efficacia del processo comunicativo in quanto comunicazione, e non delle capacità dello scrittore di creare un'atmosfera, sommuovere le emozioni, o infiammare l'immaginazione. Un brano facile può essere estremamente noioso, ma questo, per il momento, non ci riguarda».1
A partire da questo presupposto si definirono quindi due variabili linguistiche di leggibilità, quella lessicale (parole impiegate e loro lunghezza) e quella sintattica (complessità della frase, quindi sua lunghezza). La matematicità di queste definizioni portò a schematizzare secondo statistiche e ricerche, che portarono all'analisi del rapporto intercorrente tra la semplicità delle parole usate e la loro brevitas, poiché – come sottolinea sempre Miller – sono prive di suffissi e affissi.2 Per quanto riguarda invece la variabile sintattica, Lucisano enuncia che «la proporzione di frasi semplici in un periodo aveva un'alta correlazione con la lunghezza del periodo espresso in numero di parole».3
In un contesto di Scienze e tecnologie multimediali dovremmo poter aggiungere, forti della conoscenza degli studi di Shannon sulla teoria dell'informazione, che più si riduce la possibilità di incertezza all'interno di un messaggio, più sicura e attendibile sarà la sua ricezione. Informazioni brevi quindi, che non superino la capacità del canale, portano, proporzionalmente alla loro brevità, meno rischi di errori, e pertanto aumenta la quantità di informazione trasmessa.
Gli studi informatici a riguardo della teoria dell'informazione non sono assolutamente da sottovalutare in campo linguistico, poiché hanno aperto nuove strade e dato una spinta decisiva alla teoria della leggibilità. Non a caso, gli strumenti che abbiamo attualmente a disposizione per valutare il grado di facile comprensione di un testo sono degli indici matematici, sussidiati da formule.


Indici di leggibilità: l'Indice di Flesch

Un indice di leggibilità è il frutto di una formula matematica che, attraverso dei calcoli statistici, è in grado di predire il grado di difficoltà di un testo basandosi su dei valori prestabiliti, i quali rientrano appunto in questo indice. Per definire queste formule si devono considerare, proprio come in ogni calcolo matematico o fisico, delle variabili che in questo caso sono variabili linguistiche, cioè misure di determinati parametri del testo, come ad esempio la lunghezza media delle parole, o la quantità media di parole all'interno delle frasi.
Variabili quali le due succitate sono indipendenti dal contenuto del testo, ma vi possono essere anche misure lessicali o sintattiche: queste ultime però non possono essere trasformate in elementi matematici semplici, e pertanto la formulazione degli indici di leggibilità le ha lasciate a un secondo momento di analisi, più specifico e dettagliato.
Il calcolo di leggibilità che ha avuto più diffusione e successo è stato quello ideato da Rudolf Flesch, noto appunto come Formula di Flesch o Indice di Flesch. Questo si basa su due sole variabili linguistiche, la lunghezza media delle parole misurata considerando la sillaba come unità di misura, e la lunghezza media delle frasi dove l'unità di misura è invece la parola. La semplicità di questa formula ha largamente contribuito alla sua diffusione, ma ne ha anche dettato i limiti: tale calcolo è infatti tarato per le strutture linguistiche inglesi ed è quindi applicabile solo ai testi in lingua inglese. Inoltre il conteggio delle sillabe non solo è ben differente tra lingua inglese e italiana, ma all'interno dello stesso Italiano non gode di regole definite in maniera assoluta (basti pensare all'accentazione dei dittonghi).
Dal 1972 si è fatto carico del problema Roberto Vacca, il quale ha adattato i parametri dell'indice Flesch alla lingua italiana. La prima versione non gli apparve definitiva: e infatti nel 1986 elabora con Franchina4 un secondo adattamento, dove vengono ponderate le costanti fornendo un indice di facilità di lettura pari a 217 – 1,3 W – 0,6 S. Con S si intende il numero medio di sillabe calcolato su un campione di cento parole, mentre W rappresenta la media di parole per frase. Il nuovo calcolo è la risultante di uno studio comparativo fatto sullo stesso testo, scritto sia in Italiano che Inglese: tuttavia per la stessa ipotesi di Vacca, i due testi avrebbero dovuto rivelare entrambi lo stesso indice di leggibilità, ma così non è stato.
A confermare l'imprecisione della nuova formula si è aggiunto il Gruppo Universitario Linguistico-Pedagogico, secondo il quale i dati ottenuti con la formula del 1972 sono più attendibili di quelli derivanti dallo studio del 1986. Il problema delle sillabe, quindi, è ancora aperto.
La formula di Flesch del 1972 enuncia che la facilità di lettura è pari a una costante 206, sottratta di 0,65 volte il numero medio di sillabe su un campione di cento parole (S) e della media di parole nelle frasi (W).


Facilità di lettura = 206 – 0,65 S – W

dove S = sillabe medie in un campione di cento parole
W = media di parole per frase


L'Indice di Gulp

Qualche anno prima della seconda formulazione di Vacca era stato lo stesso Gruppo Universitario Linguistico-Pedagogico (GULP) presso l'Istituto di Filosofia dell'Università “La Sapienza” di Roma a definire una nuova formula, denominata Gulpease. Un primo testo che ne parla è stato elaborato da Lucisano e dalla Piemontese nel 19885 e ripreso vari anni dopo da Lucisano.6 La prerogativa di questo nuovo studio è quella di essere partito direttamente dalla lingua italiana, verificando con una serie di test la reale comprensibilità di un corpus di testi. La verifica è stata inoltre eseguita su un campione eterogeneo di lettori, il che ha consentito di elaborare, accanto all'indice, una determinazione variabile dell'interpretazione dei valori. Spieghiamo meglio, partendo dalla formula:


Indice Gulpease = 89 - (Lp / 10) + (3 × Fr)

dove: Lp = (100 × totale lettere) / totale parole
Fr = (100 × totale frasi) / totale parole


Matematicamente, come nell'indice di Flesch, i risultati oscillano da un valore minimo pari a 0 a uno massimo equivalente a 100: quest'ultimo corrisponde alla massima leggibilità ottenibile. Grazie alla sua semplicità d'uso, è possibile impiegarlo sia per analizzare testi brevi che (previo campionamento) testi lunghi. Il campionamento dev'essere, sempre come per Flesch, di almeno cento parole.
La sua innovazione non è però data tanto da questa maggiore versatilità, quanto dall'essersi svincolato dal conteggio del numero di sillabe, a favore dell'analisi di un più semplice numero di lettere contenute nelle parole. Tale innovazione ha suggerito una facile traduzione in software informatico, la più famosa delle quali è stata la conversione matematica del testo proposta da Maurizio Amizzoni con il suo software AUTOGULP, distribuito dalla Èulogos SLI (www.eulogos.net).
Altra grande novità, alla quale accennavamo prima, è l'interpretazione variabile del dato ottenuto. Infatti i linguisti del GULP hanno fornito anche una scala di lettura del risultato che si basa sulla scolarizzazione del lettore al quale ci riferiamo: pertanto un valore non ha un indice di difficoltà assoluto, ma varia a seconda del destinatario che stiamo considerando.
Si considerino tre fasce di popolazione, indicabili, come nel testo di Lucisano e Piemontese,7 con le prime tre lettere dell'alfabeto italiano: parleremo quindi di popolazione A, con istruzione elementare; popolazione B, con istruzione media; popolazione C, con istruzione superiore. Riflettendo, sorge automatico valutare che un testo di difficoltà media compreso tra un indice 59 e un indice 50, sarà di difficile lettura per un lettore di fascia B e molto difficile per un lettore estratto dalla popolazione A, mentre per uno con istruzione superiore (C) la lettura risulterà abbastanza scorrevole e comprensibile. È stata poi definita, sempre nello scritto succitato, una gamma di effetti sulla popolazione derivati dal confronto con i vari livelli di difficoltà, che vedono un grado di indice 60 come spartiacque, al di sotto del quale parliamo di difficoltà frustrante per la popolazione A e di lettura scolastica (quindi con necessità di un supporto quale l'intervento di un docente) per la fascia B, mentre la popolazione C si può concedere una lettura di questi testi indipendente. Riportiamo a riguardo due schemi estrapolati sempre da Lucisano e Piemontese, pubblicati dalla stessa Piemontese.8
 




Il vocabolario di De Mauro

Il vocabolario di base (VdB) di Tullio De Mauro fornisce un'ancora a livello lessicale. Esso comprende oltre settemila parole, suddivise in Vocabolario fondamentale (duemila parole), Vocabolario di alto uso (duemilacinquecento circa), vocabolario di alta disponibilità (circa duemilatrecento). Le parole proposte sono le più comuni, e offrono quindi, come affermò lo stesso De Mauro nel 1980, una sicura comprensione, o quanto meno un'alta probabilità di essere capiti da chi ha fatto almeno la terza media. Dice il De Mauro che «se usiamo le parole del vocabolario fondamentale, possiamo sperare di essere capiti dal 90% della popolazione italiana, cioè da quelle persone che hanno almeno la licenza elementare o titoli superiori, specie se le frasi non superano le 20 parole ciascuna».9 Vari studi hanno infatti analizzato che minore è il numero di parole presenti nel VdB impiegate in qualsiasi prodotto verbale, sia esso scritto che orale, minore sarà anche la sua comprensione.
Una tesi di laurea del 1991 (N. Mastidoro, Rilevamento automatico del tasso di vocabolario di base) ha conseguito la programmazione di un software di analisi lessicale basato sul VdB, e di memorizzazione dei lessici a esso estranei. Sempre in quell'anno, e sempre con scopi universitari dovuti al redigere una tesi di laurea, sono partiti anche gli studi per compilare il già citato AUTOGULP, programma di analisi informatica della leggibilità secondo l'indice Gulpease.

______________________________________________________________

1 A. G. Miller, Language and communication, New York, McGraw-Hill Book Company, 1951, trad. it. R. Simone, Linguaggio e comunicazione, Firenze, La Nuova Italia, 1972, p. 188.
2 Ivi, pp. 190-191 della traduzione italiana.
3 Misurare le parole, a cura di P. Lucisano, Roma, Kepos, 1992, p. 32.
4 V. Franchina, R. Vacca, Taratura dell'indice di Flesch su un testo bilingue italiano-inglese di un unico autore, «Linguaggi», III, 1986, 3, pp. 47-49.
5 P. Lucisano, M. E. Piemontese, Gulpease: una formula per la predizione delle difficoltà dei testi in lingua italiana, «Scuola e città», XXXIX, 3, 31 Marzo 1988, pp. 110-124.
6 P. Lucisano (a cura di ), Misurare le parole.
7 P. Lucisano, M. E. Piemontese, Gulpease: una formula per la predizione delle difficoltà dei testi in lingua italiana, «Scuola e città», XXXIX, 3, 31 Marzo 1988, pp. 110-124.
8 M.E. Piemontese, Capire e farsi capire, Teorie e tecniche della scrittura controllata, Napoli, TECNODID, 1996.
9 T. De Mauro, Guida all'uso delle parole, Roma, Editori Riuniti, 1980.

0 commenti: