Quaderno TaLTaC

In occasione della 10^ edizione del convegno internazionale JADT 2010 è stato presentato il primo di una serie di Quaderni sull’analisi dei dati testuali. Questo numero, a cura di Sergio Bolasco, raccoglie sviluppi ed esperienze dei primi dieci anni di vita del software Taltac e presenta gli elementi essenziali dell’analisi automatica dei testi con riferimenti alla versione 2.10 di TaLTaC².

Il Quaderno è disponibile presso LED Edizioni Universitarie.

Il software per l’analisi qualitativa si è molto evoluto negli ultimi dieci anni. Da elemento di aiuto alla lettura del testo diviene sempre più strumento per l’analisi “automatica” del testo e ciò quasi a prescindere dalle scelte epistemologiche del ricercatore. Oggi si avverte infatti come preminente l’esigenza di scavare nella molteplicità e vastità di testi a disposizione, alla ricerca dell’informazione utile, in grado di creare valore ossia nuova conoscenza. In questo senso, la misurazione quantitativa di un materiale così sfumato come il linguaggio, aiuta a rendere più rigorosa ogni rappresentazione che si dà della informazione estratta dai dati testuali. Sia la Text analysis che il Text mining si servono sempre più di piattaforme in grado di discernere in maniera automatica il contenuto delle collezioni di documenti, oggetto d’interesse. Questo contributo testimonia l’evoluzione di TaLTaC – software del “Trattamento automatico lessicale e testuale per l’analisi di contenuto” – ideato dall’autore fin dal 1999, nella prospettiva di stabilizzare il risultato dell’analisi di dati non strutturati. Il lavoro è suddiviso in due parti: la prima ricostruisce la storia di questa evoluzione attraverso le esperienze e i contributi delle ricerche svolte, la seconda mette in luce i caratteri essenziali che distinguono TaLTaC da altre piattaforme.
Sergio Bolasco, già ordinario di Statistica, ha insegnato Metodi esplorativi per l’analisi dei dati alla facoltà di Economia dell’Università di Roma “La Sapienza” e svolge tuttora un corso di Text mining e analisi automatica dei testi nel Master in “Big Data – Metodi statistici per la società della conoscenza” presso la stessa università. Fra le sue pubblicazioni più recenti: Analisi automatica dei testi, fare ricerca con il text mining (Carocci), Analisi multidimensionale dei dati (Carocci), Ricerca qualitativa e computer (Angeli), Text mining (Cisu), Parole in libertà. Un’analisi statistica e linguistica dei discorsi di Berlusconi (Manifestolibri, in collaborazione con Nora Galli de’ Paratesi e Luca Giuliano).