Web Service Batch
Tipologie dati di Input e Output
Input
Sono previste due tipologie di dati di input al Web Service Batch :
• XML Standard
• File Ascii sequenziale
Ai fini del riconoscimento da parte del normalizzatore, è importante valorizzare indirizzo e comune, mentre CAP e Sigla provincia non sono indispensabili nonostante la loro presenza migliori i risultati.
XML Standard
Il file XML standard riporta i tag dei dati da normalizzare e georeferenziare senza avere informazioni aggiuntive; affinchè possa essere riconosciuto dal Web Service è necessario che i tag dei dati abbiano dei nomi precisi, di seguito un esempio di XML Standard :
<?xml version="1.0" encoding="UTF-8"?>
<richiesta>
<indirizzo>via roma 1</indirizzo>
<comune>firenze</comune>
<provincia>fi</provincia>
<cap>53100</cap>
<codice>1</codice>
</richiesta>
I tag richiesta, indirizzo, comune, provincia, cap, codice sono tutti obbligatori;
il tag codice dovrà riportare una chiave identificativa del record.
L’XML Standard può essere rappresentato da piu tag RICHIESTA, che dovranno essere tutti tag principali che rappresenteranno ciascuno un record da trattare.
File ASCII Sequenziale
L’input di tipo Ascii sequenziale dovra’ rispettare una struttura con una sequenza ben definita dei campi da normalizzare su ciascun record sequenziale, separati dal carattere PIPE (“|”) , esempio :
VIA ROMA 1 | FIRENZE | FI | 53100 | 00001
La prima posizione è rappresentata dall indirizzo completo, la seconda dal comune, la terza dalla sigla provincia, la quarta dal CAP e in ultima posizione il codice identificativo del record da trattare.
Output
Sono previste 4 tipologie di dati di output dal Web Service Batch :
• XML Standard
• XML Cartografico
• File Ascii sequenziale Standard
• File Ascii sequenziale Cartografico
Per ciascun tipo di output si produrranno due files, uno con i record di indirizzi riconosciuti e georeferenziati, un altro con i record di indirizzi che per qualche motivo non sono stati riconosciuti, ad esempio gli indirizzi ambigui, le localita’ ambigue, le sole localita’ riconosciute o localita’ scartate; ciascun record presente nel file degli “scarti“ possiede comunque, quando possibile, dei valori di georeferenziazione che siano indirizzi ambigui o localita’ riconosciute (in questo caso le coordinate si riferiscono al centroide del comune).
Le strutture di entrambi i files sono identiche.
I messaggi presenti nella descrizione esito sono i seguenti :
· Indirizzo Riconosciuto (l’indirizzo e’ stato riconosciuto e georeferenziato possibilmente sul civico se presente o sul piu’ vicino)
· Indirizzo Scartato e Localita' Scartata (l’indirizzo non e’ stato riconosciuto, la localita’ non e’ stata riconosciuta, non si ha nessun tipo di georeferenziazione)
· Indirizzo Scartato e Parametri Input Errati (record non elaborato a causa di uno o piu dati di input mancanti)
· Localita’ Ambigua (l’indirizzo non e’ stato riconosciuto, la localita’ e’ ambigua)
· Indirizzo Ambiguo (l’indirizzo non e’ stato riconosciuto perche’ ambiguo, la localita’ e’ riconosciuta, l’elenco degli elementi ambigui presenta dati gia’ georeferenziati e normalizzati quando possibile)
· Indirizzo Scartato e Localita' Riconosciuta (l’indirizzo non e’ stato riconosciuto perche’ ambiguo, la localita’ e’ riconosciuta, i dati di georeferenziazione si riferiscono al centroide del comune)
· Errore Dati (non e’ stato possibile trattare il record a causa di un problema nell’accesso/lettura dei dati)
Le suddette tipologie si suddividono tra file di record riconosciuti e file di record scartati.
Nel file con record riconosciuti si trovano solo i record con descrizione esito Indirizzo Riconosciuto, tutti gli altri tipi verranno scritti nel file scarti.
Gli indirizzi e le localita’ ambigue nel file degli scarti vengono presentati a “grappolo”, ossia il primo record rappresenta il record di input che ha generato l’ambiguita’, poi a seguire tutti i candidati con lo stesso valore nel campo “chiave”
e con la descrizione esito impostata a “Ambiguita’”.
Es.
|1|VIA I MAGGIO 144 |PONTEDERA |PI|56025|00023 | | | | | |00023 | |INDIRIZZO AMBIGUO |
|1|VIA PRIMO MAGGIO,144 |PONTEDERA |PI|56025|00023 |1631432|4835917|43.664494 |10.629803 |RT |00023 |RT05002901161TO |AMBIGUITA' |
|1|VIA VENTIQUATTRO MAGGIO,144 |PONTEDERA |PI|56025|00023 |1630861|4835716|43.662785 |10.622684 |RT |00023 |RT05002901179TO |AMBIGUITA' |
Oltre ai due file dell’elaborazione verra’ prodotto un file di statistica dove verranno presentati i vari conteggi dell’elaborazione :
es.
*** Riepilogo Elaborazione Batch ***
Esito Elaborazione : Operazione Conclusa Correttamente
Nome Progetto : testImpreseBioD
File di input : imprese_bio.txt
Data : 19 gen 2012
Ora inizio elaborazione : 00:34:55
Ora fine elaborazione : 00:37:23
Durata (millisec) : 148173
Record Totali : 3.019
File di indirizzi riconosciuti : Impresebio_out.txt
Numero record riconosciuti : 2.044
% Riconosciuti sul totale : 67,70%
Georeferenziati sul civico : 2.044
% Georeferenziati : 100,00%
Geocodificati Istat : 0
% Geocodificati : 0,00%
File di indirizzi non riconosciuti : ImpreseBio_scarti.txt
Numero record non riconosciuti : 975
% non riconosciuti sul totale : 32,30%
di cui
indirizzi ambigui : 291 (9,64% sul totale)
localita' riconosciute : 674 (22,33% sul totale)
localita' ambigue : 0 (0,00% sul totale)
Totale record Georeferenziati : 3.009
Totale record Non Georeferenziati : 10
XML Standard
Il file XML standard riporta i tag dei dati normalizzati, geocodificati e georeferenziati , di seguito un esempio di XML Standard di Output:
<record chiave='00022'>
<chiave>00022</chiave>
<indirizzo_input>VIA GIUSEPPE PIETRI 13</indirizzo_input>
<comune_input>SIENA</comune_input>
<provincia_input>SI</provincia_input>
<cap_input>53100</cap_input>
<esito>0</esito>
<descrizione_esito>Indirizzo Riconosciuto</descrizione_esito>
<comune>SIENA</comune>
<provincia>SIENA</provincia>
<cap>53100</cap>
<dug>VIA</dug>
<toponimo>GIUSEPPE PIETRI</toponimo>
<civico>13</civico>
<codiceregioneistat>09</codiceregioneistat>
<codiceprovinciaistat>052</codiceprovinciaistat>
<codicecomuneistat>032</codicecomuneistat>
<codicesezistat2001>0000000</codicesezistat2001>
<xsezione_gb>0000000</xsezione_gb>
<ysezione_gb>0000000</ysezione_gb>
<xcivico_gb>1688499</xcivico_gb>
<ycivico_gb>4800582</ycivico_gb>
<latitudine>43.334326</latitudine>
<longitudine>11.324872</longitudine>
<diffcivico>0</diffcivico>
<fonte>RT </fonte>
<codice_strada>RT05203201072TO</codice_strada>
</record>
File ASCII Sequenziale Standard
L’Output di tipo Ascii sequenziale sarà rappresentato da una struttura fissa, con un record di testata che identifica i campi e dai record formattati secondo una sequenza precisa :
• Esito
• Record di Input
• Sigla Provincia
• Comune
• DUG
• Toponimo
• Civico
• Codice Regione Istat
• Codice Provincia Istat
• Codice Comune Istat
• CAP
• Coordinata X civico
• Coordinata Y civico
• Latitudine civico
• Longitudine civico
• Distanza civico di input da quello georeferenziato
• Codice Sezione Istat 2001
• Coordinata X centroide di sezione Istat 2001
• Coordinata Y centroide di sezione Istat 2001
• Fonte dati
• Codice Chiave di input
• Codice Toponimo
• Descrizione esito
Esempio :
|0|VIA GIUSEPPE PIETRI 13 |SIENA |SI|53100 |00022 |SI|SIENA |VIA |GIUSEPPE PIETRI |13 |09|052|032|53100|1688499|4800582|43.334326 |11.324872 |0 |0000000|0000000|0000000|RT |00022 |RT05203201072TO |INDIRIZZO RICONOSCIUTO |
XML Cartografico
Il file XML Cartografico riporta i tag dei dati normalizzati e georeferenziati , di seguito un esempio di XML Cartografico di Output:
<record chiave='00022'>
<chiave>00022</chiave>
<indirizzo_input>VIA GIUSEPPE PIETRI 13</indirizzo_input>
<comune_input>SIENA</comune_input>
<provincia_input>SI</provincia_input>
<cap_input>53100</cap_input>
<esito>0</esito>
<descrizione_esito>Indirizzo Riconosciuto</descrizione_esito>
<xcivico_gb>1688499</xcivico_gb>
<ycivico_gb>4800582</ycivico_gb>
<latitudine>43.334326</latitudine>
<longitudine>11.324872</longitudine>
<diffcivico>0</diffcivico>
<fonte>RT </fonte>
<codice_strada>RT05203201072TO</codice_strada>
</record>
File ASCII Sequenziale Cartografico
L’Output di tipo Ascii sequenziale cartografico sarà rappresentato da una struttura fissa, con un record di testata che identifica i campi e dai record formattati secondo una sequenza precisa :
• Esito
• Record di Input
• Coordinata X civico
• Coordinata Y civico
• Latitudine civico
• Longitudine civico
• Fonte dati
• Codice Chiave di input
• Codice Toponimo
• Descrizione esito
Esempio :
|0|VIA GIUSEPPE PIETRI 13 |SIENA |SI|53100|00022 |1688499|4800582|43.334326 |11.324872 |RT |00022 |RT05203201072TO |INDIRIZZO RICONOSCIUTO |