Tornant a la base: l’essència de la governança de dades

Observatoris i sistemes integrals de governança de dades

En 30 anys de funcionament de la Xarxa d’Observatoris (i 20 del Perfil de la Ciutat) hem anat passant diferents etapes marcades pels avenços tecnològics (alguns de molt trencadors) i per la disponibilitat de noves dades (o per la pèrdua de les que ja es disposaven),... com si circuléssim d’una febrada a una altra: des de l’ús summament pràctic de les eines de Microsoft (Excel, Access) i d’un variat de paquets estadístics (SPSS, Minitab, Statview, etc), a l’eclosió actual de la IA, passant per la dedicació de temps i recursos a programacions a mida, com també per la recent (i encara no conclosa) instal·lació d’aplicatius infogràfics que havien de facilitar la publicació amb certa interactivitat com l’Infogram o el propi Power BI. L’adopció d’algunes d’aquestes alternatives han implicat llargues sessions de formació i/o d’àdhuc la generació manuals o de llibres blancs.

Imatge generada pe Microsoft Bing Creador d'Imatges

 

Amb tot, poc èmfasi s’ha posat darrerament a l’observança i rigor en la construcció de les matrius de dades sobre les que han d’actuar aquells instruments, donant-se per sobreentès que aquestes havien d’estar estructuralment ben platejades, inequívoques i, molt especialment estandarditzades, seguint patrons generals establerts, així com els propis de la corporació, molt especialment en aplicar identificadors i menús tancats (p.e. pel que fa als carrerers o a la codificació de les activitats econòmiques) amb la finalitat d’evitar qualsevol equívoc de classificació i registre i de facilitar la seva interoperativitat.

Ara que es posa de relleu la necessitat d’ordenar les bases de dades creades per a la gestió de les diferents accions amb les que s’armen les polítiques públiques, en època d’assolir un control centralitzat de les dades produïdes per les corporacions, es fa més evident encara les bondats d’aquest ordre essencial en els entorns locals per a constituir, si s’escau, un model flexible, però únic, de gestió o de governança de dades interrelacionades que han de conformar els Datawarehouses o Datalakes de les organitzacions.

Tanmateix, això no sempre s’ha tractat així d’origen, llevat dels registres estandaritzats per norma superior (padró d'habitants, impostos, cadastre); és més, el més habitual és l’anarquia i batibull que ha imperat (i impera) en la construcció de bases de dades en grans organitzacions locals, sobre la qual, a posteriori, ha estat molt difícil (sovint impossible) la seva interrelació, i, per tant, la seva anàlisi més pertinent, de forma, fins i tot, estudiada ara des d’un redescobert prisma intersectorial, especialment sensible en els aspectes més socials (força d'aquestes bases de dades han operat particularment, no es compartien i no eren conegudes, ni, per tant, es consideraven pel general de l'organització, quan de fet podien ser molt transcendents, no només per al seguiment i avaluació de les accions, sinó també per a altres funcionalitats del servei públic).

Per l’experiència que estem tenint a Terrassa en abordar el coneixement i l’anàlisi de les bases de dades amb les quals els serveis municipals treballen les seves accions, aquestes circumstàncies de secretisme i (quasi) desordre o de poc ordre mediatitzen i molt la implantació pràctica d’una oficina de dades, de forma que la integració d’aquestes peces en l’engranatge de les administracions es fa molt cantellut, si no és a base de la facilitació d’unes instruccions ben concises per a la construcció/reforma de les bases de dades, que aboquin a una clara estandarització de la informació estadística (i també de la documental).

Així per tant, es posa de manifest allò que d'antuvi se li suposa a la institució: la transparència de les bases existents i el traçat clar i racional de les matrius de dades, sobre les que no es poden admetre disbauixes, i facin dels registres elements fiables per al recolzament a la presa de decisió.

De fet, importa relativament menys el suport i els formats sobre els que estiguin plantejades les bases de dades, si, al cap i a la fi, tots es podran reduir a arxius bàsics CSV, fàcilment transportables a altres formats d’anàlisi que facilitin la seva explotació estadística. Però l’estandarització no s’improvisa, ni tampoc els seus mecanismes d’interrelació (que fa relacionals les bases de dades), a través dels quals es pugui treure més suc encara de la informació, mitjançant creuaments múltiples en un entorn de grans bases de dades.

En veritat és ara que ens adonem de les bondats de tenir aquelles bases de dades ben ordenades, polides, estructurades, perquè les IA (o quasevol altre sistema d’explotació) actuïn sobre aquelles amb més celeritat i encert. I ens adonem perquè potser no estan tan ben ordenades, polides o estructurades com ara es requereix i com nosaltres crèiem que estaven. I és ara que, encetant treball prospectiu sobre l’ordenament un nou sistema de gestió de dades, ens adonem que el plantejament individualista i descoordinat de les bases de dades en funció del què ha interessat particularment per a cada acció suposa haver d’atacar una auditoria segurament mai feta abans, que doni pautes per a la seva reforma, però sense estalviar l'abordatge d’un panorama descohesionat, ben lluny dels òptims per a considerar-se un sistema integrat d’informació.

Com si quasi partíssim de les arrels (per no dir de zero), conseqüentment ens cal plantejar a l’organització:

  • Instruccions de base que permetin crear, ordenar i extraure amb facilitat taules bàsiques amb les dades desagregades o agregades  (observacions, estadístics) comprensives, fiables, seriades, estandaritzades.
  • Normes, mètodes i tècniques d’anonimització, però sí d’interrelació dels continguts de les bases de dades que evitin que la seva publicació atempti contra els més bàsics preceptes de la confidencialitat de les dades personals, però  la vegada permetin lectures intersectorialitzades.
  • Vademecums/descriptors que unifiquin allò què s’entén per a cada concepte, la seva univocitat (que un terme respongui unívocament a un concepte i no a cap altre).
  • Necessitat d’arribar a consensos per a aquesta estandarització, que afecti no només al sí de la gestió pròpia de l’organització, sinó que ho sigui per a una comunitat d’organitzacions, per a xarxes, fins i tot de caire nacional.

Alguns d’aquests passos es poden apreciar especialment quan es disposa d’una experiència dilatada en la confecció d’eines de processament, explotació i divulgació estadística, com ho ha estat la confecció d’Anuaris estadístics o d'Informes de conjuntura, que ja han implicat un gran esforç d’arrenglerament d’una multiplicitat de fonts estadístiques, recopilades en l’elaboració de catàlegs dels registres dels quals se n’extrau la informació estratègica.

Segurament per aquella experiència, amb el temps també, ens n’adonem que la formalització de la base de dades no ha estat la més eficient, especialment pel que fa als ítems que ens permetran posar-la en relació amb altres bases de dades (connectors) o que permetin reformular-los en més d’una versió atenent a demandes de l’estratègia. I no ha de fer por haver de reformar l’estructura d’aquests productes clàssics, automatitzant tot allò que sigui possible i que no entranyi especial valor afegit a la seva lectura, però conservant les formes lectores a les quals tenim acostumats als nostres clients, per no crear excessives distorsions en el seu ús.

És necessari estar a l’aguait de quins són els millors estris de tractament per a l’explotació i la publicació de les dades més significatives, conseqüentment incloent els comentaris pertinents, encara que concisos, malgrat no sigui la finalitat en si mateixa, sinó que la seva lectura “entri”, pugui ser més usable i útil, pugui derivar en noves conclusions que ajudin a acertar en aquell procés de presa de decisions, a avançar-se als esdeveniments,  fins i tot a plantejar-se noves preguntes que reclamin informació de més detall.

Potser els captadors de la IA, les noves formes tractar informació substantiva, podran “xuclar-la” sense necessitat d’un ordenament complex. Tanmateix estic segur que amb una mínima formalització de les bases de dades (una mínima lògica interna dels sistemes) podran funcionar encara molt millor i més àgilment. De fet, a l’explotació de les dades sempre, en el fons, ha precedit el seu ordenament, una pura gestió d’unitats arxivístiques, que no és precisament una tasca qualsevol, baladí, sinó una acció intel·lectual bàsica molt necessària, que ha de preveure aquells connectors.

 

Un exemple paradigmàtic a Terrassa

No és pas la primera vegada que ralentim la màquina administrativa per a reflexionar sobre com hem de procedir a continuació quan, sobre un mateix interès, s’hi aboquen (o s’organitzen) diferents sistemes d'informació estadística, formals o informals, desenvolupats per serveis o actors amb diferents metodologies, formats i també finalitats. I quan n’intervenen persones i serveis diferents, per a la integració de les dades caldrà decidir quin d’aquests sistemes ha de constituir l’eix principal sobre el que es vagin adossant els altres, en definitiva quin serà el connector principal sobre el que es basarà aquella relació.

Ara fa més de 10 anys, a Terrassa, en el marc de les actuacions lligades a la promoció econòmica de la ciutat, es plantejà desenvolupar un bell sistema de integrat d’informació sobre l’activitat econòmica del municipi.

Es posava de manifest la necessitat de dotar l’Ajuntament de Terrassa d’un sistema de visualització de la informació existent en matèria d’activitat econòmica, com una mesura desitjable en la política de concentració de tots els recursos per a la creació i consolidació d’empreses en un únic servei depenent de l’aleshores Àrea de Promoció Econòmica i Innovació. Es proposava fer encara més transparents tant la realitat de l’activitat econòmica sobre el territori, els recursos a l’activitat (per exemple en el camp de l’oferta de serveis d’assessorament i/o de disponibilitat sobre espais comercials), com els processos per a la creació i consolidació d’activitats econòmiques comercials en el municipi, a l’objecte de fomentar el manteniment i la generació de nous negocis que, a més, siguin generadors nets de treball, i això sota el ple convenciment que la transparència i maximització de l’accés sobre el coneixement del territori pot afavorir l’establiment de nous negocis i consolidar els existents, molt en especial al respecte de l'activitat comercial i de serveis en la proximitat.

Font: OESST, El sistema d’informació de l’activitat econòmica localitzada a la ciutat, 2011

Font: OESST, El sistema d’informació sobre activitat econòmica de Terrassa, 2012

 

Això interessava, doncs, facilitar de forma permanent:

  1. Informació on line sobre l’estructura econòmica comercial de la ciutat, inclosa la localització dels negocis i, de forma que sigui combinable amb altre tipus d’informació que permeti afinar la lògica de la localització, per exemple pel que fa a públics potencials, en el cas d’activitats de tipus topològic, com la seva relació amb les infraestructures o amb l’accessibilitat, en el cas d’activitats logístiques o industrials, o la detecció de l’oferta pública i privada de locals (en especial els comercials i de serveis professionals) que facilitessin la seva localització al municipi.
  2. Tota aquella informació sobre tràmits per a la creació de noves empreses comercials en el municipi o sobre modificació de les llicències d’activitat, incloent-hi també aspectes relatius a la seva fiscalitat i a possibles bonificacions.
  3. Tota aquella informació que faciliti a les empreses la seva consolidació.
  4. Vitrina de bones pràctiques comercials.
  5. Vitrina de les oportunitats de negoci comercial.
  6. Altres informacions que podessin ser d’interès per al món de l’empresa (formació, així com enllaços amb els agents econòmics i socials en el territori relacionats directament amb el comerç, i també, i molt especialment, tot allò relacionat amb les innovacions tecnològiques, els nous productes i el registre de patents i marques).

Com ja es deia en la introducció d’aquell projecte, tot això reclama un grandíssim esforç de reordenació de la mecànica dels serveis, en ares a compartir informació de primera mà sobre les empreses i sobre els processos de creació, però també dotar-se de la plataforma telemàtica més adient per difondre al màxim i de la manera més entenedora tota aquesta informació tant a emprenedors locals, com a empresaris, de forma que, a banda d’impulsar el manteniment, generació i atracció de capitals i les inversions, també es fomenti el bon veïnatge i coneixement mutu de les empreses en el territori, generant sinèrgies de km 0.

Aquells objectius es pretenien assolir mitjançant:

  • La millora en la gestió de la informació local sobre l’estructura econòmica i els recursos al seu desenvolupament, que ha de convergir en una aplicació corporativa de tipus relacional lligada amb un sistema d’informació geogràfica on fos possible contrastar informacions diverses sobre el territori, d’actualització periòdica. Aquesta plataforma havia de fer especial èmfasi al sector comercial mitjançant un apartat i utilitats específiques dedicades al seu desenvolupament.
  • L’exteriorització d’aquesta informació (tot allò que es consideri informació pública, és a dir que no atempti contra la confidencialitat de dades personals o aquella que es pot considerar com a secret industrial) per mitjà d’un portal específic que permeti la ciutadania i als sectors un accés ràpid, simple i intuïtiu a aquella informació, i que maximitzi, per tant, la seva utilitat.

L’Ajuntament de Terrassa ja comptava aleshores amb l’experiència prèvia de la implementació del Portal SIG als polígons d’activitat econòmica (2011), que havia facilitat força la difusió del coneixement sobre l’activitat econòmica en aquelles zones urbanes, i havia permès detectar inconvenients en el seu desenvolupament i molt en especial sobre la disponibilitat d’informació estratègica; així com un informe previ sobre El sistema d’informació sobre activitat econòmica de Terrassa (maig 2012). L'actuació es desenvolupà durant 2012 emprant els recursos propis, sense cap nova inversió en matèria informàtica, ni cap contractació d’assistència tècnica externa. L’actuació també pretenia desenvolupar-se emprant sistemes propis de racionalització de la informació, fent èmfasi especial al sector comercial, mitjançant un apartat de la web d'empresa que respongués a les necessitats específiques del comerç, la restauració i dels serveis a les persones en la proximitat.

L’Ajuntament de Terrassa es proposava, doncs (com ara també es pretén en els plantejaments sobre un futur sistema de governança de la informació local), la implementació d’un portal de l’activitat econòmica de Terrassa capaç tant de proporcionar informació relativa a l'estructura econòmica de la ciutat, i que aquesta estigués plenament integrada amb la resta d'informació georreferenciable existent a l'àmbit local, de manera que permetés la realització de consultes complexes sobre aquestes, com de difondre tota aquella informació relativa als diferents tràmits municipals lligats a la creació i consolidació de l'activitat empresarial en el municipi, així com qualsevol altra informació que podés ser d’interès per al món de l’empresa, com altres aspectes relatius al consum i a les rendes.

Tot això suposava la generació d’un sistema d’informació integrat sobre l’activitat econòmica a Terrassa, als efectes de facilitar coneixement actualitzat d’utilitat per a la presa de decisió, i, a la vegada, la implantació d’un sistema de publicació de la informació en entorn web, que inclogués una utilitat de visor geogràfic d’empreses que permetés la combinació gràfica de les diferents informacions, a poder ser consultables amb interfícies intuïtives. Interessà especialment, per tant, facilitar la usabilitat de l’eina. També interessà el desenvolupament d’un lloc web i dels dispositius telemàtics necessaris pera la difusió del coneixement sobre l’activitat econòmica comercial, l’emprenedorisme i l’empresa comercial a Terrassa, que permetés a la vegada la retroalimentació de la informació i la participació dels ciutadans.

Ad-hoc es creà un grup de treball específic participat pels principals actors que recollien informació relativa a l’activitat econòmica, tal com llicències ambientals (Servei de Medi Ambient); residus (taxa); activitat comercial (Servei de Comerç), a la vegada es posava de manifest el desenvolupament per part del Servei de SIG i PMH d’un nou visor del Cens d’Activitat Econòmica, emprant un esquema similar al desenvolupat per a visualitzar el Cens d’Empreses dels PAE. Es posava de manifest, doncs, la necessitat de procedir de la mateixa manera per a d’altres sistemes d’informació relatius a activitat econòmica (empresa o establiments) existents en l’entorn municipal: Cens d’empreses dels PAE (enquesta bianual de l’aleshores Observatori Econòmic i Social i de la Sostenibilitat de Terrassa); Servei de Prospecció (informació derivada de les visites a empreses per part dels tècnics prospectors); Viver d’Empresa (informació sobre emprenedors); Consultes al Servei de Consum, Integració de la informació originària d’Hisenda de l’Estat, i altres bases de dades municipals relatives a empreses.

 

Esquemes de relació entre bases de dades i outputs en el SIG municipal

Font: OESST, El sistema d’informació sobre activitat econòmica de Terrassa, 2012

 

Això exhortava els serveis a tenir les bases de dades impol.lutes, actualitzades i verificades i a emprar (a introduir) els connectors que es recomanessin per a aconseguir la interconnexió. I en aquest sentit es començà a treballar (o, com a mínim, s’hi apuntà) en la introducció dels connectors i, molt especialment, en la conversió d’arxius informals (molt amb continguts qualitatius) en bases de dades formalitzades interconnectables, que s’havien de mantenir fiables en el temps, amb la vocació de constituir sèries històriques.

 

Mapa de localització d’activitats econòmiques donades d'alta en el Sistema d'Informació Geogràfica de Terrassa

Exemple de la representació cartogràfica de la informació continguda a la base de dades un cop sotmesa al procés metodològic de depuració descrit pel sistema. La capa d’informació inclou 818 activitats econòmiques representades a partir de 772 objectes gràfics o punts (ID_PORTAL). Es tracta d'activitats en les quals hi consta [DATA_ALTA] efectuada durant l'exercici 2010. A cada punt hi correspon un apunt d'informació. Font: OESST, El sistema d’informació sobre activitat econòmica de Terrassa, 2012

 

Ràpidament es manifestà que la base de dades essencial era la que alimentava el sistema impositiu per activitat econòmica i que es concentrava en l’anomenat Cens d’Activitats, governat pels Serveis Tributaris de l’Ajuntament. Aquell havia de ser el nucli al voltant del qual s’anirien relacionant aspectes complementaris a l’activitat econòmica. Per a la gestió i explotació d’aquell Cens com a nucli de la integració de la informació que s’havia d’estandaritzar en relació a aquell s’hi assignà un tècnic informàtic avantatjat. El nexes de l’estandarització es basaven en menús unívocs emprats ja en el cadastre, en el padró d’habitants o en el cens d'activitat econòmica, com el carrerer, les cofdificacions per activitats o els NIF.

Com a output de la integració es pensava aleshores en l’emissió d’informes succints vers els continguts de la integració de les diferents bases de dades responent a models automatitzats, dissenyats prèviament o adhoc, que facilitessin la compartició del coneixement sobre les empreses, per exemple, per a la confecció del programa de visites d’Alcaldia, o per a la confecció d’estudis de sector econòmic.

La proposta fou, de fet, una primera aproximació al que avui en dia es coneix com un sistema de governança de dades, establint entre els diferents actors una disciplina de treball sistèmic, pensat en la tabulació estàndard de la informació disponible en bases estadísticament formalitzades, de forma que aquella fos usable en determinats moments de necessitat; això sí, establint ben clarament diferents estadis d’accessibilitat, per tal de protegir en tot moment la confidencialitat de dades personals no públiques, i també especificant la font del catàleg dels registres municipals perquè no hi hagi dubte al respecte del seu origen i de la seva fiabilitat.

El projecte, encara ben vàlid, es pot consultar al portal de xifres de l’Ajuntament de Terrassa.

 

Una necessària revisió de les bases de dades

Treballar la integració de les bases de dades que afecten l’activitat econòmica ha estat una bona manera d’introduir-se inductivament en els processos de generació d’un sistema de governança de dades, emprant l'experiència anterior i la regeneració dels catàlegs de registres (en actualització cotínua), malgrat no és gens simple (us ho podem dir per experiència) ... en tant que, en realitat, és entrar a executar una auditoria de les bases de dades, que és, en el fons, com entrar a valorar l’organització de cadascun dels serveis, i no tots estan disposats a ser auditats i, menys encara, a modificar la forma dels seus sistemes particulars de captar o registrar les dades, de forma que els siguin útils per a preses de decisió en endavant. Tanmateix, del què es tracta és, en tot moment, que els sistemes deixin de pensar-se “en particular” per passar a donar-los una dimensió que pugui tenir sentit en la compartició general en aspectes de gran calat per a tota l’organització i no només als efectes d’una vigilància concreta o d’una justificació d’un programa específic, com si aquell estès desvinculat de la política general de l’Ajuntament i només respongués, per exemple, a justificar externament l’aplicació d’una subvenció condicionada. Ha de ser un treball participat, cooperatiu, responsable i transparent, conscient de la rellevància del conjunt que s'està creant, com una arrel que sosté, de fet, tot l'arbre de l'organització, pel que fa a la definició d'escenaris presents i futurs (definició de problemes i objectius).

Tornem, per tant, a l’essència de la formalitat i endreça de les bases de dades i a la necessitat, molt probablement, de revisió de totes i cadascuna de les que han de conformar l’entramat relacional que volem per a un pròxim sistema de governança de les organitzacions públiques, modern i estable (sobre el qual, com veieu, no ens inventem res de nou més enllà de posar ordre racional a la captació i gestió de les dades)... Un sistema que, per cert, ha d’afavorir l’avaluació intel·ligent de l’actuació pública i a definir amb molta més claredat els problemes reals dels entorns ciutadans i de l’interès comú al qual ens devem. I en tot això, el coneixement integrat i transversal i l’experiència dels Observatoris socioeconòmics dels ens locals serà, juntament amb el corresponent suport tecnològic, la baula estratègica sobre la qual construir aquest sistema de governança de dades.

 

XAVIER MUÑOZ TORRENT, Servei d'Estudis i Observatori de la Ciutat, Ajuntament de Terrassa

 

La teva valoració d'aquest article: 
Mitjana de valoració: 5 (3 votes)
Fes clic al següent botó per enviar-ho per WhatsApp

Volem saber que en penses...

Sigues el primer en escriure un comentari