Profiler Engine

Navigation:  Il Package: lavorazione dei dati > Arricchimento del Package >

Profiler Engine

Previous pageReturn to chapter overviewNext page

Il Profiler Engine DataProfilerEngine _16 è un oggetto del Package che permette di estrarre statistiche riassuntive relative ai dati contenuti in un dataset, output di un qualsiasi oggetto EAsT.

 

Il Profiler Engine è dotato dei seguenti tab:

General, consente di specificare nome e descrizione del Profiler Engine ed impostare il Cache Editor per l'eventuale definizione di una Cache;

Settings, consente di impostare le property;

Columns, espone l'elenco delle colonne che compongono la tabella in output, la cosiddetta Column List.

 

L'ulteriore tab Dynamic properites consente di definire le proprietà dinamicamente a partire dagli output di altri oggetti del Package.

 

Il tab Settings presenta, nella parte alta il campo Data Entity, ove si definisce quale oggetto del Package sarà oggetto di analisi da parte dell'engine.

 

Subito sotto il campo Data Entity, sono presenti:

Max Text Size, la larghezza massima prevista per i campi stringa;

Include Pattern Details, flag di inclusione dei dettagli di pattern dei campi sorgente (attivabile solo se ameno uno dei Frequency Indicators è selezionato);

Ignore Null Values, flag di esclusione dei valori nulli.

 

Segue la definizione dei filtri sulle colonne e sui tipi di dato, nel riquadro Column and indicator selection:

Enabled, flag di attivazione della condizione;

Column Pattern, nome o pattern di colonna;

Type, tipo di dato SQL.

info

Il carattere wildcard * inserito nel campo Column Pattern permette di calcolare le statistiche riassuntive relative a tutte le colonne del dataset.

 

Possono essere aggiunte condizioni inserendo una o più righe ulteriori semplicemente selezionando la riga grigia contrassegnata da * e posta subito sotto la griglia.

 

Nella parte inferiore del tab Settings sono presenti due ulteriori tab:

Simple Indicators

Frequency Indicators

 

Il tab Simple Indicators permette di selezionare tra i seguenti indicatori:

All, tutti i sottostanti

Gruppo Count

Blank, numero di valori blank;

Distinct, numero di valori distinti;

Duplicate, numero di duplicati;

Null, numero di valori nulli;

Unique, numero di valori unique.

Gruppo Summary

Maximum, massimo;

Mean, valore medio;

Median, mediana;

Minimum, minimo;

Standard Deviation, deviazione standard.

Gruppo Text Lenght

Average, lunghezza media del testo;

Maximal, lunghezza massimale del testo;

Minimal, lunghezza minimale del testo.

 

In esecuzione, è presentato l'elenco delle seguenti statistiche:

Fullname, nome completo del Data Engine;

Type, il tipo di Data Engine;

RowCount, il conteggio delle righe;

ColumnCount, il conteggio delle colonne;

Size, la dimensione totale del dataset;

SizeAvg, la dimensione media della riga.

 

info

Se sono stati impostati i flag di queste categorie, allora in esecuzione del Data Engine saranno presentati gli output secondari per Simple e Frequency.

Nel caso in cui sia selezionato anche il flag Include Pattern Details, allora è presentato anche l'ulteriore omonimo output secondario.

Gli output secondari sono presentati anche in preview e possono essere visualizzati selezionando gli appositi tab che compaiono in calce.

 

Per richiamare uno degli output secondari generati da un Profiler Engine (all’interno di un Query Engine o di qualsiasi altro oggetto IrionEDM che possiede un query editor), è sufficiente utilizzare la seguente sintassi:

 

 select * from [NomeProfilerEngine | NomeOutputSecondario]

 

ovvero, trascinare all'interno dell'editor della query l'output secondario stesso.