La classe Convert contiene filtri che espongono il contenuto del testo in input in una forma differente senza modificarne il contenuto.
I filtri di tipo ASCII/OEM <=> ANSI consentono di convertire caratteri ASCII/OEM in caratteri ANSI e viceversa.
APPROFONDIMENTO: SET DI CARATTERI ANSI è il set di caratteri utilizzato da Windows, che include tutti i caratteri romani accentati utilizzati da lingue diverse dall'inglese, come il francese, il tedesco e lo spagnolo. ASCII/OEM è un'estensione del set di caratteri IBM originario, nel quale vari caratteri non essenziali sono sostituiti da caratteri accentati specifici della lingua corrente. |
I filtri di tipo Character cAsE permettono di trasformare lettere maiuscole in lettere minuscole, senza modificare il contenuto del testo in input. In particolare:
✓ il filtro UPPERCASE rende maiuscole tutte le lettere del testo;
✓ il filtro lowercase rende minuscole tutte le lettere del testo;
✓ il filtro Title Case trasforma la prima lettera di ogni parola in maiuscolo, rendendo minuscole tutte le altre lettere;
✓ il filtro Sentence case trasforma la prima lettera di ogni frase in maiuscolo, lasciando inalterate tutte le altre lettere.
Per ogni filtro del File Normalizer, ogni frase inizia dopo un punto, un punto esclamativo, una virgola, un punto di domanda, una doppia virgoletta o una parentesi. |
I filtri di tipo CSV consentono di trasformare qualsiasi file CSV (Comma-Separated values) in file di formati diversi, senza modificarne il contenuto. In particolare:
✓ il filtro CSV to Tab-delimited trasforma un file CSV in un file TSV (Tab-Separated values);
✓ il filtro CSV to XML trasforma un file CSV in un file XML;
✓ il filtro CSV (with column headers) to Tab-delimited trasforma un file CSV, dotato di intestazioni di colonna, in un file TSV;
✓ il filtro CSV (with column headers) to XML trasforma un file CSV, dotato di intestazioni di colonna, in un file XML.
I filtri di tipo Tab-delimited permettono di trasformare qualsiasi file TSV in file di formati diversi, senza modificarne il contenuto. In particolare:
✓ il filtro Tab-delimited to CSV trasforma un file TSV in un file CSV;
✓ il filtro Tab-delimited to XML trasforma un file TSV in un file XML;
✓ il filtro Tab-delimited (with column headers) to CSV trasforma un file TSV, dotato di intestazioni di colonna, in un file CSV;
✓ il filtro Tab-delimited (with column headers) to XML trasforma un file TSV, dotato di intestazioni di colonna, in un file XML.
I filtri di tipo Tabs consentono di convertire il carattere di tabulazione (tab) in spazi e viceversa. In particolare:
✓ il filtro Tabs to spaces trasforma ogni tab in un numero fissato di spazi;
✓ il filtro Spaces to tabs trasforma gruppi di spazi, di misura prefissata, in singoli tab.
Ogni filtro di tipo Tabs richiede di specificare il numero di spazi che equivalgono ad un singolo tab.
Il filtro Text to word list permette di creare liste di parole a partire dal testo in input, disponendo le singole parole una per riga. In particolare le parole, composte da due termini uniti da trattino, sono considerate come un'unica parola. Viceversa, virgole, a capo, tab e spazi sono considerati come separatori di parola.
Il filtro IBM drawing characters consente di convertire i caratteri grafici tipici di dispositivi IBM in caratteri ASCII standard, quali + (plus), - (minus) e | (pipe).
APPROFONDIMENTO: IBM DRAWING CHARACTERS I caratteri grafici IBM sono comunemente utilizzati per disegnare linee, riquadri, bordi a singola o doppia linea e creare effetti di ombreggiatura. Essi corrispondono a caratteri ASCII speciali, compresi nel range 128 - 255. |
Il filtro Character maths permette di modificare tutti i caratteri ASCII del file di testo in input, mediante opportune operazioni matematiche quali:
✓ addizione (plus);
✓ sottrazione (minus);
✓ moltiplicazione (times);
✓ divisione intera (integer division);
✓ divisione con resto (integer remainder);
✓ le operazioni Booleane XOR, AND, OR e NOT.
Tutte le suddette operazioni sono effettuate in modulo 256, ossia il valore 257 corrisponde al primo carattere ASCII esattamente come il valore 1. |
Il filtro Character maths richiede i parametri:
✓ Mathematical operation, operazione matematica da utilizzare per la trasformazione dei caratteri;
✓ Mathematical operand, numero intero da utilizzare come secondo operando nell'operazione da applicare sui singoli caratteri.
Il Mathematical operand viene specificato come valore decimale. Tuttavia viene esposta, per completezza, anche la sua conversione binaria ed esadecimale.
Il valore massimo ammesso per il parametro Mathematical Operand è 255. |
Il filtro End of line characters permette di convertire eventuali caratteri di fine riga, presenti nel testo in input. Esso dispone di due riquadri in cui selezionare:
✓ il carattere di fine riga del testo in input, sulla sinistra;
✓ il carattere di fine riga da sostituire nel testo in output, sulla destra.
Il riquadro di sinistra espone le seguenti opzioni:
✓ Unix/Amiga identifica il carattere di fine riga con il decimo carattere del codice ASCII;
✓ Macintosh identifica il carattere di fine riga con il tredicesimo carattere del codice ASCII;
✓ DOS identifica il carattere di fine riga con la coppia tredicesimo-decimo carattere del codice ASCII;
✓ Auto detect permette al sistema di identificare i caratteri di fine riga autonomamente;
✓ Fixed length imposta il termine di una riga con il raggiungimento di una specifica lunghezza in caratteri;
✓ Mainframe CMS Format permette di convertire file EBCDIC con righe a lunghezza variabile, in file di testo con righe delimitate da caratteri ASCII.
Il riquadro di destra dispone delle le seguenti opzioni:
✓ Unix/Amiga sostituisce il carattere di fine riga del testo in input con il decimo carattere del codice ASCII;
✓ Macintosh sostituisce il carattere di fine riga del testo in input con il tredicesimo carattere del codice ASCII;
✓ DOS sostituisce il carattere di fine riga del testo in input con la coppia tredicesimo-decimo carattere del codice ASCII;
✓ None elimina tutti i caratteri di fine riga dal testo in input;
✓ Custom consente di definire un proprio carattere di fine riga, mediante l'apposito campo di testo.
I filtri di tipo Hex Encoding permettono di convertire file da codice binario in codice esadecimale e viceversa. In particolare:
✓ il filtro Econde as Hex consente di passare dalla codifica binaria alla codifica esadecimale;
✓ il filtro Decode from Hex consente di passare dalla codifica esadecimale alla codifica binaria.
Il filtro Hex Encoding deve essere utilizzato principalmente per piccoli file, in quanto aumenta di molto la dimensione del file in output. |
filtri di tipo HTTP permettono di codificare e decodificare il testo di un Header HTTP. In particolare:
✓ il filtro HTTP Encode converte il testo in input nella codifica richiesta da un Header HTTP;
✓ il filtro HTTP Decode converte un Header HTTP in testo standard.
Un Header HTTP è un breve testo in formato HTTP, che accompagna la richiesta di una pagina web ad un Web Server. |
I filtri di tipo UUEncode permettono di codificare e decodificare file secondo la codifica UUencode. In particolare:
✓ il filtro UUEncode converte il testo in input in codifica UUencode;
✓ il filtro UUDecode converte un file con codifica UUencode in testo standard.
La codifica UUencode permette di convertire file in formato binario in un formato ASCII contenente solo caratteri compresi tra 32 e 95. Questa codifica esclude caratteri di controllo e caratteri a 8 bit, permettendo di trasmettere con sicurezza il file come allegato ad un messaggio e-mail. |
I filtri di tipo XXEncode si comportano in modo analogo ai filtri di tipo UUEncode. Tuttavia essi utilizzano, per la codifica, i caratteri alfanumerici del codice ASCII, il segno più e il segno meno.
La codifica XXencode è stato introdotta per risolvere alcuni problemi legati al trasferimento di allegati mediante mainframe IBM, che utilizzano la codifica EBCDIC. |
Il filtro Convert Code Page consente di convertire il testo in input da un particolare codice, tra cui varie forme di Unicode, in un altro e viceversa. Esso richiede di specificare i seguenti parametri:
✓ Convert FROM, codifica utilizzata nel testo in input;
✓ Convert TO, codifica da applicare sul testo in output.
Se un carattere in input non può essere convertito nel formato di destinazione, esso viene sostituito da uno specifico carattere, al fine di mantenere la corretta spaziatura tra gli elementi che compongono il testo. Tale carattere può essere specificato mediante l'opzione Error Character, la quale assume lo spazio come carattere predefinito.
Il filtro Convert Code Page dispone infine del pulsante Swap , mediante il quale invertire le impostazioni dei parametri Convert FROM e Convert TO.
Il filtro Hex dump permette di convertire il testo in input nella corrispondente visualizzazione esadecimale. Nella visualizzazione esadecimale:
✓ ogni byte è rappresentato da una numero esadecimale a due cifre;
✓ il testo è organizzato su righe di 16 byte ciascuna.
Inoltre ogni riga dispone di:
✓ un primo set di cifre che indica il numero di riga, partendo da zero, nel testo in output;
✓ un'ultima colonna di caratteri che espone il testo standard corrispondente alla codifica esadecimale della riga corrente.
Il filtro Decimal dump permette di convertire il testo in input nella corrispondente visualizzazione decimale. Nella visualizzazione esadecimale:
✓ ogni byte è rappresentato da una numero decimale a tre cifre;
✓ il testo è organizzato su righe di 10 byte ciascuna.
Inoltre ogni riga dispone di:
✓ un primo set di cifre che indica il numero di riga, partendo da zero, nel testo in output;
✓ un'ultima colonna di caratteri che espone il testo standard corrispondente alla codifica decimale della riga corrente.