Web Service Batch

Tipologie dati di Input e Output

Input

 

Sono previste due tipologie di dati di input al Web Service Batch :

XML Standard

File Ascii sequenziale

 

Ai fini del riconoscimento da parte del normalizzatore, è importante valorizzare indirizzo e comune, mentre CAP e Sigla provincia non sono indispensabili nonostante la loro presenza migliori i risultati.

 

XML Standard

 

Il file XML standard riporta i tag dei dati da normalizzare e georeferenziare senza avere informazioni aggiuntive; affinchè possa essere riconosciuto dal Web Service è necessario che i tag dei dati abbiano dei nomi precisi, di seguito un esempio di XML Standard :

 

<?xml version="1.0" encoding="UTF-8"?>

<richiesta>

<indirizzo>via roma 1</indirizzo>

<comune>firenze</comune>

<provincia>fi</provincia>

<cap>53100</cap>

<codice>1</codice>

</richiesta>

 

I tag richiesta, indirizzo, comune, provincia, cap, codice sono tutti obbligatori;

il tag codice dovrà riportare una chiave identificativa del record.

L’XML Standard può essere rappresentato da piu tag RICHIESTA, che dovranno essere tutti tag principali che rappresenteranno ciascuno un record da trattare.

 

File ASCII Sequenziale

 

L’input di tipo Ascii sequenziale dovra’ rispettare una struttura con una sequenza ben definita dei campi da normalizzare su ciascun record sequenziale, separati dal carattere PIPE (“|”) , esempio :

 

VIA ROMA 1 | FIRENZE | FI | 53100 | 00001

La prima posizione è rappresentata dall indirizzo completo, la seconda dal comune, la terza dalla sigla provincia, la quarta dal CAP e in ultima posizione il codice identificativo del record da trattare.

Output

Sono previste 4 tipologie di dati di output dal Web Service Batch :

 

XML Standard

XML Cartografico   

File Ascii sequenziale  Standard

File Ascii sequenziale  Cartografico  

 

Per ciascun tipo di output si produrranno due files, uno con i record di indirizzi riconosciuti e georeferenziati, un altro con i record di indirizzi che per qualche motivo non sono stati riconosciuti, ad esempio gli indirizzi ambigui, le localita’ ambigue, le sole localita’ riconosciute o localita’ scartate; ciascun record presente nel file degli “scarti“ possiede comunque, quando possibile, dei valori di georeferenziazione che siano indirizzi ambigui o localita’ riconosciute (in questo caso le coordinate si riferiscono al centroide del comune).

Le strutture di entrambi i files sono identiche.

 

I messaggi presenti nella descrizione esito sono i seguenti :

 

·         Indirizzo Riconosciuto  (l’indirizzo e’ stato riconosciuto e georeferenziato possibilmente sul civico se presente o sul piu’ vicino)

·         Indirizzo Scartato e Localita' Scartata (l’indirizzo non e’ stato riconosciuto, la localita’ non e’ stata riconosciuta, non si ha nessun tipo di georeferenziazione)

·         Indirizzo Scartato e Parametri Input Errati (record non elaborato a causa di uno o piu dati di input mancanti)

·         Localita’ Ambigua (l’indirizzo non e’ stato riconosciuto, la localita’ e’ ambigua)

·         Indirizzo Ambiguo (l’indirizzo non e’ stato riconosciuto perche’ ambiguo, la localita’ e’ riconosciuta, l’elenco degli elementi ambigui presenta dati gia’ georeferenziati e normalizzati quando possibile)

·         Indirizzo Scartato e Localita' Riconosciuta (l’indirizzo non e’ stato riconosciuto perche’ ambiguo, la localita’ e’ riconosciuta, i dati di georeferenziazione si riferiscono al centroide del comune)

·         Errore Dati (non e’ stato possibile trattare il record a causa di un problema nell’accesso/lettura dei dati)

 

 

Le suddette tipologie si suddividono tra file di record riconosciuti e file di record scartati.

Nel file con record riconosciuti si trovano solo i record con descrizione esito  Indirizzo Riconosciuto, tutti gli altri tipi verranno scritti nel file scarti.

 

Gli indirizzi e le localita’ ambigue nel file degli scarti vengono presentati a “grappolo”, ossia il primo record rappresenta il record di input che ha generato l’ambiguita’, poi a seguire tutti i candidati con lo stesso valore nel campo “chiave”

e con la descrizione esito impostata a “Ambiguita’”.

Es.

|1|VIA I MAGGIO 144            |PONTEDERA      |PI|56025|00023     |       |       |           |           |     |00023     |                |INDIRIZZO AMBIGUO                                  |

|1|VIA PRIMO MAGGIO,144        |PONTEDERA      |PI|56025|00023     |1631432|4835917|43.664494  |10.629803  |RT   |00023     |RT05002901161TO |AMBIGUITA'                                         |

|1|VIA VENTIQUATTRO MAGGIO,144 |PONTEDERA      |PI|56025|00023     |1630861|4835716|43.662785  |10.622684  |RT   |00023     |RT05002901179TO |AMBIGUITA'                                         |

 

Oltre ai due file dell’elaborazione verra’ prodotto un file di statistica dove verranno presentati i vari conteggi dell’elaborazione :

 

es.

 

*** Riepilogo Elaborazione Batch ***

 

Esito Elaborazione                 : Operazione Conclusa Correttamente

Nome Progetto                      : testImpreseBioD

File di input                      : imprese_bio.txt

 

Data                               : 19 gen 2012

Ora inizio elaborazione            : 00:34:55

Ora fine elaborazione              : 00:37:23

Durata (millisec)                  : 148173

 

Record Totali                      : 3.019

 

File di indirizzi riconosciuti     : Impresebio_out.txt

Numero record riconosciuti         : 2.044

% Riconosciuti sul totale          : 67,70%

    Georeferenziati sul civico     : 2.044

    % Georeferenziati              : 100,00%

    Geocodificati Istat            : 0

    % Geocodificati                : 0,00%

 

File di indirizzi non riconosciuti : ImpreseBio_scarti.txt

Numero record non riconosciuti     : 975

% non riconosciuti sul totale      : 32,30%

 

di cui

 

           indirizzi ambigui       : 291 (9,64% sul totale)

           localita' riconosciute  : 674 (22,33% sul totale)

           localita' ambigue       : 0 (0,00% sul totale)

 

 

Totale record Georeferenziati      : 3.009

Totale record Non Georeferenziati  : 10

 

 

 

XML Standard  

Il file XML standard riporta i tag dei dati normalizzati, geocodificati e georeferenziati , di seguito un esempio di XML Standard di Output:

 

<record chiave='00022'>

   <chiave>00022</chiave>

   <indirizzo_input>VIA GIUSEPPE PIETRI 13</indirizzo_input>

   <comune_input>SIENA</comune_input>

   <provincia_input>SI</provincia_input>

   <cap_input>53100</cap_input>

   <esito>0</esito>

   <descrizione_esito>Indirizzo Riconosciuto</descrizione_esito>

   <comune>SIENA</comune>

   <provincia>SIENA</provincia>

   <cap>53100</cap>

   <dug>VIA</dug>

   <toponimo>GIUSEPPE PIETRI</toponimo>

   <civico>13</civico>

   <codiceregioneistat>09</codiceregioneistat>

   <codiceprovinciaistat>052</codiceprovinciaistat>

   <codicecomuneistat>032</codicecomuneistat>

   <codicesezistat2001>0000000</codicesezistat2001>

   <xsezione_gb>0000000</xsezione_gb>

   <ysezione_gb>0000000</ysezione_gb>

   <xcivico_gb>1688499</xcivico_gb>

   <ycivico_gb>4800582</ycivico_gb>

   <latitudine>43.334326</latitudine>

   <longitudine>11.324872</longitudine>

   <diffcivico>0</diffcivico>

   <fonte>RT   </fonte>

   <codice_strada>RT05203201072TO</codice_strada>

  </record>









 

File ASCII Sequenziale Standard  

L’Output di tipo Ascii sequenziale sarà rappresentato da una struttura fissa, con un record di testata che identifica i campi e dai record formattati secondo una sequenza precisa :

Esito

Record di Input

Sigla Provincia

Comune

DUG

Toponimo

Civico

Codice Regione Istat

Codice Provincia Istat

Codice Comune Istat

CAP

Coordinata X civico

Coordinata Y civico

Latitudine civico

Longitudine civico

Distanza civico di input da quello georeferenziato

Codice Sezione Istat 2001

Coordinata X centroide di sezione Istat 2001

Coordinata Y centroide di sezione Istat 2001

Fonte dati

Codice Chiave di input

Codice Toponimo

Descrizione esito

 

Esempio :

|0|VIA GIUSEPPE PIETRI 13                                                |SIENA                                   |SI|53100 |00022     |SI|SIENA                                   |VIA                      |GIUSEPPE PIETRI                                   |13             |09|052|032|53100|1688499|4800582|43.334326  |11.324872  |0    |0000000|0000000|0000000|RT   |00022     |RT05203201072TO |INDIRIZZO RICONOSCIUTO                             |

 











XML Cartografico

 

Il file XML Cartografico riporta i tag dei dati normalizzati e georeferenziati , di seguito un esempio di XML Cartografico di Output:

 

<record chiave='00022'>

   <chiave>00022</chiave>

   <indirizzo_input>VIA GIUSEPPE PIETRI 13</indirizzo_input>

   <comune_input>SIENA</comune_input>

   <provincia_input>SI</provincia_input>

   <cap_input>53100</cap_input>

   <esito>0</esito>

   <descrizione_esito>Indirizzo Riconosciuto</descrizione_esito>

   <xcivico_gb>1688499</xcivico_gb>

   <ycivico_gb>4800582</ycivico_gb>

   <latitudine>43.334326</latitudine>

   <longitudine>11.324872</longitudine>

   <diffcivico>0</diffcivico>

   <fonte>RT   </fonte>

   <codice_strada>RT05203201072TO</codice_strada>

  </record>

 

File ASCII Sequenziale Cartografico  

L’Output di tipo Ascii sequenziale cartografico sarà rappresentato da una struttura fissa, con un record di testata che identifica i campi e dai record formattati secondo una sequenza precisa :

 

Esito

Record di Input

Coordinata X civico

Coordinata Y civico

Latitudine civico

Longitudine civico

Fonte dati

Codice Chiave di input

Codice Toponimo

Descrizione esito

 

Esempio :

|0|VIA GIUSEPPE PIETRI 13                                                |SIENA                                   |SI|53100|00022     |1688499|4800582|43.334326  |11.324872  |RT   |00022     |RT05203201072TO |INDIRIZZO RICONOSCIUTO                             |