LA RICERCA

La lingua italiana rischia di scomparire dal Web

La ricerca del Cnr

Redazione Pdn

Reporter:

Redazione Pdn

Letture:

5682

La lingua italiana rischia di scomparire dal Web
ROMA. L'italiano, come la maggioranza delle lingue europee, rischia di scomparire da Internet, anche se la sua presenza in rete e' tutt'altro che marginale.

A dirlo e' il rapporto 'La lingua italiana nell'era digitale' dell'Istituto di linguistica computazionale del Consiglio nazionale delle ricerche di Pisa (Ilc-Cnr), parte della ricerca Meta-Net cui hanno lavorato piu' di 200 esperti.
«La percentuale di pagine web in italiano a livello mondiale e' raddoppiata passando dall'1,5 per cento nel 1998 al 3,05 per cento nel 2005», spiega Nicoletta Calzolari dell'Ilc-Cnr.

E' stato stimato che nel 2004 in tutto il mondo ci fossero 30,4 milioni di parlanti italiani online. Al di fuori dei confini dell'Unione Europea, parlano italiano 520.000 americani, 200.000 svizzeri e 100.000 australiani. Il numero di navigatori italiani negli ultimi cinque anni e' pero' rimasto stabile, contrariamente il numero di quelli dei paesi in via di sviluppo aumenta notevolmente, cosicche' la proporzione di coloro che parlano la nostra lingua subira' una forte diminuzione e potremmo andare incontro a un rischio di sotto-rappresentazione, specialmente in confronto all'inglese.
 Secondo i dati raccolti dai ricercatori, la penetrazione del web in Italia si attesta al 51,7 per cento, con 30 milioni di internauti (circa il 6,3 per cento di quelli dell Ue) su 58 milioni di cittadini: la loro crescita e' stata del 127,5 per cento tra il 2000 e il 2010. Se questo e' il quadro per la nostra lingua, possiamo immaginare quale sia per quelle che hanno un numero di parlanti molto inferiore.
«Il dato e' preoccupante», prosegue Claudia Soria dell Ilc-Cnr, «perche' dal momento che le tecnologie linguistiche usate in Internet si basano su approcci statistici, se i dati messi a disposizione in una lingua sono pochi, si innesta un circolo vizioso: pochi dati, tecnologie di bassa qualita', ulteriore limitazione dell uso di quella lingua».
Lo studio condotto dall'Istituto Cnr e dalla Fondazione Bruno Kessler (Bernardo Magnini e Manuela Speranza) fa parte della ricerca Meta-Net cui hanno lavorato piu' di 200 esperti e documentata in 30 volumi della Collana di libri bianchi di Meta-Net
«Ventuno lingue su 30 analizzate si collocano al livello piu' basso, con un supporto digitale 'debole o assente' in almeno una delle aree tecnologiche prese in esame (correttori ortografici e grammaticali, assistenti personali interattivi su smartphones, sistemi di traduzione automatica, motori di ricerca, etc.)», spiega Soria.
«L'islandese, il lituano, il lettone e il maltese ottengono questo voto per tutte le aree. Anche basco, bulgaro, catalano, greco, ungherese e polacco, con supporto frammentario, si collocano tra le lingue ad alto rischio. All'estremo opposto si trova l'inglese, seguito da olandese, francese, tedesco, italiano e spagnolo, con supporto modesto. Nessuna lingua, pero', ottiene supporto eccellente. Sono risultati allarmanti», conclude Hans Uszkoreit, coordinatore di Meta-Net.
«La maggior parte delle lingue europee non dispone di risorse sufficienti e alcune sono quasi completamente ignorate. Molte di esse non hanno futuro».