Risorse linguistiche digitali, Eurac centro europeo

I linguisti di Eurac Research collaborano alla creazione di Clarin, la banca dati europea che favorisce l’utilizzo digitale di dati e risorse linguistiche da parte di ricerca, istruzione e cultura. In che modo i media di diversi Paesi hanno parlato negli scorsi anni del cambiamento climatico? La lingua tedesca si sta evolvendo in modo diverso in Alto Adige rispetto all’Austria o alla Germania? Il modo in cui scriviamo sui social network ha una qualche influenza sulla nostra scrittura in altri contesti? Per rispondere a queste e ad altre domande, i ricercatori utilizzano una grande quantità di dati e risorse linguistiche: registrazioni audio, articoli di giornale e altri testi. Per garantire che questi tipi di informazioni non vadano persi e si possano continuare a utilizzare, l’Unione Europea ha lanciato un’infrastruttura di ricerca di nome Clarin: la banca dati che permette di conservare le risorse in un archivio digitale e di renderle accessibili sul lungo periodo a tutti gli interessati.

Eurac: secondo centro Clarin in Italia

Eurac Research è diventato il secondo centro Clarin in Italia, accanto al coordinatore nazionale con sede a Pisa: i linguisti del centro di ricerca bolzanino forniscono ora le risorse linguistiche digitali, di cui sono in possesso, secondo gli standard CLARIN. Esistono già collaborazioni con altre istituzioni, come la Biblioteca Provinciale Friedrich Tessmann o il servizio linguistico del Südtiroler Kulturinstitut, grazie alle quali viene testato il modo in cui diversi dati linguistici possono essere raccolti e utilizzati. «In questo modo viene raccolta una grande quantità di risorse linguistiche rilevanti che permettono di rispondere a quesiti provenienti da diverse discipline. Il network offre una pagina di ricerca centralizzata e fa in modo che i ricercatori possano condividere, ricombinare e confrontare i dati in maniera molto più semplice» commenta il linguista computazionale Alexander König, esperto Clarin di Eurac Research.

«Costruire un’infrastruttura digitale di questo tipo è molto importante. Immaginate di dover viaggiare in treno in diversi paesi: anche in questo caso ci vuole un’infrastruttura, ovvero le rotaie, le stazioni ferroviarie, i diversi paesi devono poi avere la stessa dimensione dei binari, gli orari devono corrispondere. La stessa identica cosa succede quando noi linguisti vogliamo analizzare le risorse linguistiche di un altro paese, ad esempio in Germania. Anche in questo caso dobbiamo usare dei formati comuni affinché i dati di diversi paesi siano confrontabili tra loro» spiega Andrea Abel, direttrice dell’Istituto di linguistica applicata di Eurac Research. «In generale, l’infrastruttura è poi molto importante per rafforzare il nostro impegno sul campo dell’informatica umanistica, le cosiddette Digital Humanities. Questo settore di ricerca applica metodi computazionali alle discipline umanistiche e fornisce interfacce molto utili che favoriscono la collaborazione tra istituti di ricerca e altre istituzioni come biblioteche, archivi e musei».

 

Ti potrebbe interessare