Domande più frequenti
Registrazione e licenza
Che differenza c’è tra registrazione e licenza?
La registrazione è la procedura che consente di ottenere la licenza.
Come posso ottenere una licenza?
Per ottenere il rilascio della licenza occorre fare la registrazione dal menu <?> mediante la seguente procedura:
- Aprire Taltac
- Chiudere la finestra di gestione delle Sessioni cliccando sul pulsante Annulla
- Cliccare sul comando Registrazione nel menu <?>
- Completare la maschera di registrazione
- Inviare, all’indirizzo e-mail:license@taltac.it, il file LockKey.txt creato da Taltac nella directory in cui stato installato il programma
- Salvare sottocartella bin della cartella in cui è installato Taltac il file license.key che sarà inviato in risposta via e-mail.
Cosa è il file LockKey.txt? E’ il file della licenza?
Il file LockKey.txt è il risultato della procedura di registrazione e NON è il file della licenza. Il file LockKey.txt deve essere spedito a license@taltac.it per poter ottenere la licenza di utilizzo.
Ho effettuato la procedura di registrazione, ma non riesco a trovare il file LockKey.txt che Taltac mi dice di inviare all’indirizzo license@taltac.it per poter ottenere la licenza: in quale cartella posso trovare questo file?
Una volta completata la procedura di registrazione, Taltac salva il file LockKey.txt nella sottocartella bin della cartella in cui è installato il programma. Pertanto, se si è installato Taltac nella posizione suggerita dalla procedura di installazione, il LockKey.txt si troverà nella cartella C:\Programmi\TaLTaC2\bin oppure nella cartella personalizzata creata dall’utente (es: C:\Taltac\bin).
Dove devo copiare il file della licenza?
Il file della licenza deve essere copiato nella sottocartella bin della cartella in cui è installato il programma.
Taltac e altri sistemi operativi
E’ possibile installare Taltac su Mac?
Non esiste una versione di TaLTaC2 per Mac. Tuttavia, sarebbe possibile utilizzando un emulatore Windows. Se si possiede un Mac di ultima generazione (quella che utilizza i processori Intel) è possibile installarvi anche il sistema operativo Windows e di conseguenza TaLTaC2 (sotto il sistema operativo Windows, ovviamente).
Taltac 4.0 (versione rilasciata a febbraio 2020) è programmato per multi-piattaforma e quindi il software girerà indifferentemente su Win/Mac/Linux, sia in locale sia da remoto.
E’ possibile installare Taltac su sistemi operativi UNIX/Linux?
Non esiste una versione di TaLTaC2 per UNIX/Linux. In teoria la cosa sarebbe possibile utilizzando un emulatore Windows, ma gli emulatori Windows disponibili per questa piattaforma sono di difficile gestione e piuttosto limitati. Visto che è possibile, si consiglia di installare anche Windows su queste macchine per poter utilizzare TaLTaC2.
Errori comuni
Ho lanciato Taltac e quindi ho eseguito il parsing di un corpus e altre operazioni. Dopo aver chiuso la sessione non riesco più a trovarla nell’elenco delle sessioni che compare all’apertura del programma sessione non salvata
Questa situazione avviene quando la sessione non è stata creata prima di cominciare a lavorarci. Si può verificare questa condizione leggendo il contenuto della barra del titolo (la barra azzurra in alto sulla finestra) che recita <sessione non salvata>. Questa è in realtà una sessione “fittizia” necessaria a Taltac per potersi avviare, ma che viene resettata ad ogni nuovo lancio del programma. Pertanto, non è mai conveniente lavorare in una tale situazione (benché Taltac proponga in seguito il salvataggio della sessione) e quindi, per iniziare un nuovo lavoro, occorre prima creare una nuova sessione tramite la finestra iniziale Nuova/Apri sessione, attribuendogli un nome e salvandola in una cartella qualsiasi, e poi cominciare ad eseguire le varie operazioni (parsing, normalizzazione ecc.). Una volta chiusa la sessione, per poter continuare il lavoro in un secondo momento, basterà aprirla selezionandola dall’elenco della finestra iniziale Nuova/Apri sessione (in cui adesso sarà presente) e premendo OK.
Ho creato una sessione chiamandola Rassegna stampa e l’ho salvata nella cartella C:\Documenti\Lavoro\Analisi testuale. Ad una successiva riapertura di Taltac, nella finestra iniziale Nuova/Apri sessione accanto al nome della sessione mi appare un’icona costituita da un foglio ed una x rossa e non riesco più ad aprirla.
Quando appare questa icona significa che il file della sessione non
è più presente al percorso indicato all’atto del salvataggio (spuntando la casella
Mostra percorsi completi
della finestra Nuova/Apri
sessione è possibile verificare quale era questo percorso) . Ciò
può essere dovuto a tre cause:
1 – Il file della sessione (quello con estensione .tsdb2) è stato cancellato manualmente
(ovvero senza utilizzare l’apposita funzione di eliminazione presente in Taltac),
verosimilmente accedendo alla cartella in cui risiedeva tramite Risorse del computer/Esplora
risorse e cancellando direttamente il file. In tal caso ovviamente non è più recuperabile
e si consiglia di eliminare il riferimento ancora esistente in Taltac nella finestra
Nuova/Apri sessione
selezionandola e premendo Elimina;
2 – La sessione è stata spostata in un’altra cartella (ad es.: C:\Elaborazioni).
In tal caso rimuovere il riferimento alla vecchia posizione (dalla finestra Nuova/Apri sessioneselezionare
la sessione con l’icona incriminata e premere Elimina), e quindi recuperare la sessione
utilizzando la voce Sfoglia
per cercare una sessione non in lista…: apparirà infatti una finestra
di dialogo in cui si potrà “comunicare” a Taltac qual’è la nuova posizione
del file .tsdb2;
3 – Il percorso in cui risiede la sessione è stato rinominato oppure è stato rinominato
il file della sessione (quello con estensione .tsdb2). Ad esempio il percorso C:\Documenti\Lavoro\Analisi testuale
è stato modificato in C:\Documenti\Lavoro\Analisi,
oppure il file non si chiama più Rassegna
stampa.tsdb2 ma semplicemente Rassegna.tsdb2.
In tal caso procedere come descritto al punto 2 per eliminare il riferimento sbagliato
e per recuperare la sessione. ATTENZIONE: nel caso si sia modificato il nome del
file con estensione .tsdb2, occorre modificare allo stesso modo anche il nome della
relativa cartella di lavoro (di files temporanei) avente estensione .tswf, ovvero
si dovrà modificare Rassegna
stampa.tswf in Rassegna.tswf.
Ciò vale comunque solo se la modifica è avvenuta manualmente utilizzando Risorse
del computer/Esplora risorse: la funzione Rinomina presente nella finestra Nuova/Apri sessione modifica
coerentemente i nomi di entrambi gli elementi in modo automatico.
Sto cercando di individuare i segmenti in un mio corpus, ma ottengo sempre il messaggio d’errore “Codifica.exe ha incontrato un errore”, dopodiché Taltac si chiude. Da che cosa dipende? C’è un modo per superare il problema?
Generalmente questo errore si presenta se, dopo aver eseguito il parsing (ed eventualmente altre operazioni), si tenta di eseguire l’individuazione dei segmenti senza prima aver chiuso e riavviato la sessione. E’ un errore dovuto alla cattiva gestione della memoria che non è a tutt’oggi risolto. Per adesso, se dall’ultimo parsing effettuato non è mai intercorsa una chiusura della sessione, si suggerisce di chiuderla e riavviarla prima di eseguire l’individuazione dei segmenti. Se il problema dovesse persistere, provare a riavviare il computer. Se dovesse persistere ulteriormente allora il problema è nel corpus. In tal caso, si prega di inviare un messaggio a info@taltac.com con la descrizione dell’errore e, in allegato, il corpus su cui avviene al fine di consentire la correzione del bug.
Ho effettuato un tagging grammaticale sul vocabolario ed ho ottenuto l’ errore “Superato il numero di blocchi per la condivisione dei file. Aumentare la voce di registro MaxLocksPerFile”, dopodiché Taltac si chiude. Cosa significa?
E’ un errore dovuto ad un’impostazione predefinita del Microsoft Jet Engine, ovvero del motore di database su cui Taltac si appoggia per gestire le sessioni, e si verifica quando il corpus supera una determinata dimensione, peraltro piccola (circa 300 kB). E’ facilmente superabile modificando un’ impostazione del registro di Windows seguendo la procedura descritta di seguito (o, meglio, lanciando i corrispondenti files disponibili nel pacchetto di installazione della versione 2.11):
- Chiudere tutte i programmi aperti
- Dal menu Start di Windows cliccare su Esegui
- Comparirà una piccola finestra: scrivere regedit nella casella posta al suo interno e premere OK
- Comparirà l’editor del registro di sistema. Accedere, cliccando sulla croce accanto ad ogni cartella, alle seguenti cartelle, nell’ordine (ogni cartella è contenuta nela precedente, a parte la prima che è subito visibile, se così non fosse cliccare sulla croce accanto a Risorse del computer): HKEY_LOCAL_MACHINE\Software\Microsoft\Jet\4.0\Engines\Jet 4.0
- All’interno di questa cartella è presente un elemento che si chiama MaxLocksPerFile: cliccarvi sopra con il tasto destro e scegliere Modifica dal menu che apparirà
- Spuntare l’opzione Decimale e scrivere 50000 nella casella Dati valore, sovrascrivendo il vecchio valore (che dovrebbe essere 9500)
- Spuntare l’opzione Esadecimale e premere OK
- Chiudere l’editor del registro di sistema come un programma qualsiasi
La modifica effettuata sarà attiva fin da subito, senza dover riavviare
il computer, e garantisce il funzionamento del Tagging grammaticale anche per corpus
di grandi dimensioni. E’ possibile che l’errore si ripresenti nel caso si tenti
di effettuare un Tagging su corpus di enormi dimensioni (prossime ai 100 MB o superiori).
In tal caso ripetere la procedura suddetta inserendo un valore più elevato (ad es.
100000). La modifica è sempre reversibile, basta seguire la medesima procedura ed
inserire il valore originario (solitamente 9500), e comunque non si hanno notizie
di malfunzionamenti dovuti ad essa.
Si raccomanda la massima attenzione nell’esecuzione di queste operazioni: l’utente
si assume la totale responsabilità delle modifiche apportate al registro di sistema
e non si risponde di alcun danno che possa essere causato dalle stesse.
Lavorando in scrittura su una tabella, ovvero avendo deselezionato la casella “Sola lettura” in basso a destra, se clicco nell’area della barra di scorrimento verticale della stessa Taltac genera un errore e quindi si chiude.
E’ un errore già noto, che tenteremo di risolvere. Per adesso, si suggerisce di uscire dalla cella in cui si è appena operata una modifica (scrittura o cancellazione di dato) cliccando su un’altra cella qualsiasi prima di cliccare sull’area della barra di scorrimento verticale.
Taltac e altri software
Come si integra Taltac con altri software?
Tutti i risultati che Taltac consente di ottenere sono esportabili come file in formato testo (con estensione .txt), eventualmente con campi separati da tabulazione nel caso delle liste/tabelle. Questo formato è leggibile dalla maggior parte dei software in circolazione, e comunque da tutte le categorie di software che è ipotizzabile utilizzare in abbinamento con Taltac (software di analisi statistica, fogli elettronici, database, word processor, altri software di analisi testuale e, ovviamente, editor di testo).
Quali sono i software utilizzabili in abbinamento con Taltac?
Pur essendo una soluzione per l’analisi testuale piuttosto completa ed integrata, per sfruttare al massimo le potenzialità di Taltac si consiglia di utilizzare altre categorie di software quali: editor di testo (per il pretrattamento/pulizia del corpus), foglio elettronico (ad es. Microsoft Excel o Calc di OpenOffice – per la visualizzazione/gestione degli output di tipo tabellare), software di analisi statistica (ad es. R, SAS, SPAD, SPSS – per le ulteriori analisi sulle tabelle che Taltac consente di esportare). Nel capitolo Software utile della guida di Taltac sono presenti alcuni software suggeriti con i link ai relativi siti. Altri link sono presenti nella pagina link.
Limiti dimensionali
Qual’è la dimensione massima dei corpus processabili con Taltac?
Da prove effettuate, Taltac è in grado di processare corpus di 160 MB costituiti da 500.000 frammenti (se molto brevi). Si deve tenere presente, infatti, che oltre alla dimensione del corpus, anche il numero di frammenti in cui questo è eventualmente suddiviso costituisce un fattore determinante per il raggiungimento dei limiti di elaborazione. Ovviamente, minore è la dimensione del corpus, maggiore può essere il numero di frammenti in cui è possibile suddividerlo senza incorrere in problemi e viceversa.. Questi limiti non dipendono dalla memoria fisica (RAM) installata sulla macchina, ma da limiti intrinseci del linguaggio in cui è scritto il software.
Esiste un limite al numero di record (righe) delle liste/tabelle importabili in Taltac con il comando Importa delle finestre DB di sessione o Risorse statistco-linguistiche ?
No, è possibile importare in Taltac liste/tabelle con un numero di record anche elevatissimo. In alcune sessioni sono state importate tabelle con oltre 4 milioni di record. Si ricorda inoltre che il comando menzionato nella domanda è lo stesso a cui si può accedere dal menu File/Importa/Altra lista.
Quali procedure dipendono dalle dimensioni della memoria?
Le procedure più complesse in generale richiedono tempi di esecuzione più lunghi in funzione della potenza del processore presente sul PC (i3, i5, i7, …) e dell’ampiezza del corpus trattato. Comunque fra queste sono da segnalare: nella normalizzazione la procedura di calcolo delle locuzioni verbali, nell’analisi lessicale la procedura del calcolo dei segmenti ripetuti, il tagging semantico di liste con decine di migliaia di elementi, nell’analisi testuale la ricerca di entità con espressioni regolari molto lunghe.
La nuova versione di TaLTaC 4.0 non ha limiti dimensionali, se non quelli fisici della macchina sulla quale è installato. In particolare per elaborazioni di Big Data ha una modalità di elaborazione multi-core che sfrutta le potenzialità del calcolo parallelo per velocizzare i tempi di calcolo.
Trattamento multilingue
Taltac è in grado di trattare corpus scritti in lingue diverse dall’italiano?
L’approccio di Taltac al testo è per forme grafiche, e pertanto indipendente dalla lingua in cui lo stesso è scritto. Ciò significa che si possono trattare testi scritti in qualsiasi lingua, e addirittura corpus che contengano parti scritte ora in una lingua ora in un’altra. Ovviamente, le funzioni che si appoggiano a risorse linguistiche proprie del software (tagging grammaticale, normalizzazione) potranno essere utilizzate con profitto principalmente per la lingua italiana. Anche i confronti con lessici/liste di frequenza sono possibili: l’utente dovrà procurarsi in proprio queste risorse per la lingua desiderata, che potrà poi aggiungere alle Risorse statistico-linguistiche già presenti in Taltac. Dalla versione 2.10 del 2018 è disponibile il tagging grammaticale, secondo le modalità di Taltac, anche per corpus in lingua inglese. Più in generale, si veda fin dalla versione della Guida 2.8, l’utilizzo multilingue integrato di TreeTagger in Taltac.
Suggerimenti
Come copiare/trasferire/recuperare una sessione
TaLTaC non possiede una funzione del tipo Salva con nome. Pertanto, per poter effettuare la copia di una sessione occorre accedere, tramite Risorse del computer/Esplora risorse, alla cartella in cui la stessa risiede (per conoscere questa cartella si può sfruttare la casella Mostra percorsi completi della finestra Nuova/Apri sessione), copiare il file nomesessione.tsdb2 e la cartella nomesessione.tswf (opzionalmente si può copiare anche il file del corpus, ma non è necessario) e incollarli nella posizione desiderata (si consiglia di non incollarli nella cartella in cui risiedono i file di origine). A questo punto, per recuperare questa copia, aprire Taltac: nella finestra Nuova/Apri sessione la copia appena creata non comparirà. Assicurarsi che sia spuntata l’opzione Apri sessione esistente posta in alto sulla medesima finestra e quindi fare doppio clic sulla voce Sfoglia per cercare una sessione non in lista… presente in testa all’elenco delle sessioni. Dalla finestra di dialogo successiva accedere alla cartella in cui si è incollata la copia della sessione, selezionare il file con estensione .tsdb2 e premere il pulsante Apri. La copia delle sessione verrà aperta e sarà disponibile, alle successive riaperture di Taltac, anche dall’indice delle sessioni che compare all’inizio. Poiché avrà lo stesso nome della sessione di origine, a una successiva riapertura di Taltac si consiglia di rinominarla tramite l’apposito comando presente nella finestra Nuova/Apri sessione al fine di non confondere tra loro le due sessioni. Questa procedura è valida anche quando si copia una sessione da un computer all’altro.