Geodemografía semántica para Smart Cities

Por Joaquín Borrego-Díaz, Antonia M. Chávez-González, Mónica A. Martín-Pérez y José A.
Zamora-Aguilera

Partially supported by TIN2009-09492 project (Spanish Ministry of Science and Innovation), cofinanced
with FEDER founds, and Proyecto de excelencia TIC-6064 “Conceptos emergentes en sistemas complejos. Aplicaciones
en entornos urbanos y en complejidad cultural” financed by Junta de Andalucía
Resumen. Es fundamental dar un tratamiento adecuado a la información producida por la ciudad si se pretende alcanzar el éxito en la gestión de las Smartcities. Es innegable que la evolución hacia una gestión inteligente de la información debe pasar por la transformación de dicha información en conocimiento. Esa transformacion consistirá, no sólo en la semantización de la información proveniente de sensores (Semantic Sensor Web). Se deberá alcanzar además la interoperabilidad con otro tipo de
fuentes de información, como por ejemplo la geodemogafía. En este artículo se plantean las líneas generales de esta integración y sus potenciales aplicaciones.
1 Introducción
La naturaleza compleja de la información generada por las ciudades y disponible para su aprovechamiento, hace necesario no sólo que ésta sea interpretada y convertida en conocimiento. También surge la imperiosa necesidad de conseguir interoperabilidad entre diversas fuentes y sistemas de información. Este requisito es indispensable para la toma de decisiones que, globalmente, incrementen la inteligencia de la ciudad (entendida como sistema complejo adaptativo y,
en cierta medida, producto de la inteligencia emergente).

La interoperabilidad, como concepto general, debe hacer encajar la naturaleza dinámica de los datos que se recopilan en tiempo real de comunidades y mediante sensores, con otros de carácter más estático, no ligados a la naturaleza cambiante de la vida en la ciudad, como son aquellos datos que, en su conjunto, representan una visión social, demográfica y ligada al espacio urbano. La geodemografía urbana se ocupa de estudiar esta información relativa a realidades sociales más complejas que son causa de fenómenos emergentes en las ciudades y que los sensores no son capaces de reflejar. Aunque se tiende a que esa información localice sectores y zonas de especial interés, el término ”local” puede ser problemático (y no sólo en una smartcity). Engloba categorías espaciales como ”comunidad”, ”entorno o vecindario” o área. En cuanto a lugar físico, se refiere al soporte físico de comunidades locales. Pero también se puede referir a comunidades que persisten en un área y en un tiempo [8].

Aunque los orígenes de la geodemografía datan del siglo XIX, no es hasta la irrupción de la geodemografía asistida por ordenador, en los años 60, cuando ésta toma un papel clave en el análisis de la relación entre lugar y sociedad [5]. La importancia de la modernización del procesamiento y representación de la información reside en que permite explorar redes, vecindarios y comunidades, hasta el punto de poder estudiar cómo los ciudadanos perciben tales elementos, y qué métodos son los más adecuados para entenderlos y potenciarlos. Esta idea, el estudio geodemográfico de las ciudades para establecer metodologías de aplicación en espacios urbanos, representa una oportunidad para tomar posiciones en las nuevas urbes que, a ritmo acelerado, crecen en las regiones emergentes [6]. Aunque las ciudades son sistemas complejos en los que se entrelazan y relacionan una serie de redes (redes físicas, redes sociales, virtuales, etc.) y que se asientan sobre principios de escalaridad y morfología de la urbe (véase por ejemplo [3]), la dimensión social ligada al espacio condiciona fuertemente las restantes redes.

El objetivo de este artículo es presentar la geodemografía semántica (o la semantización de geodemografías) como una herramienta esencial para la toma de decisiones argumentadas en el procesamiento del conocimiento extraído de la ciudad, relacionando información de naturaleza física/digital (sensores y huellas digitales) con la dimensión social del lugar.

La estructura del artículo es como sigue. En la siguiente sección describimos cómo la Web Semántica puede ayudar a la gestión urbana, y cómo las geodemografías pueden servir de herramienta para especificar espacios de conocimiento aumentado. En la sección 3 se propone la semantización de las geodemografías como una forma de alcanzar la interoperabilidad de estas con los distintos sistemas de información presentes en una SmartCity. Ello se ilustra con un caso de estudio (la semantización de MOSAIC), dejando patente la dificultad de conciliar la información de la geodemografía y la interpretación lógico-semántica de ésta en la ontología que la representa. Concluímos apuntando las aplicaciones potenciales de las ontologías provenientes de
geodemografías.

2 Web Semántica
La Web Semántica (WS) pretende ser una extensión de la Web actual en la que, gracias a la información extra añadida (metadatos), las máquinas puedan procesar el conocimiento (en el sentido de inferir, deducir) de manera fiable. Como extensión de la actual Web, la implantación de la WS debe superar grandes obstáculos [1] aunque su estructura de capas establece diferentes niveles de abstracción (véase Fig. 1) en los que las ontologías juegan un papel fundamental.

El interés en aplicar tecnologías propias de la WS estriba en que los resultados se obtienen, en cierta medida, con razonamiento automático, lo que otorga cierta confianza (argumentación) a los resultados. La tecnología WS se extiende a ámbitos muy importantes para las ciudades, como la Semantic Sensor Web [11] o el tratamiento de Linked Data.

2.1 Web Semántica y urbes
En el campo de la gestión urbana, las ontologías pueden jugar un papel esencial para entender y
racionalizar la información que se posee de la ciudad, y hacer interoperables distintos sistemas de
información urbanos [9]. Sin embargo, el propio proceso de construcción de ontologías para urbanismo
o gestión de ciudades se enfrenta con la brecha entre la pragmática asociada a conceptos
urbanos y la dificultad de su formalización en un contexto tecnológico como la WS (y su representaci
ón en estándares como OWL). Por ejemplo, el concepto de ”residencia de un individuo”
es crucial, y su formalización debería -en las geodemografías- incluir ciertas características sobre
el rol social que ésta imprime [5]. Existen otros conceptos urbanos para los que no sólo no existe
una definición consensuada, sino que en cualquier caso los límites de ésta son difusos y por tanto
susceptibles de provocar inconsistencias en la información.
Por ejemplo, el proyecto TownTology pretende entre otros objetivos, el desarrollo de una ontología sobre ingeniería civil urbana, para mejorar la interoperabilidad entre los agentes que intervienen
en ese campo. Sin embargo, Towntology no abarca aspectos (de impacto) medioambientales
en una primera fase, lo que limitará la caracterización de los entornos de residencia de los ciudadanos
en términos ecológicos o de sostenibilidad [12]. Ese tipo de limitaciones no es, en principio,
inherente a los proyectos, pues la Ingeniería Ontológica posee mecanismos para relacionar
(integrando, fusionando, alineando) ontologías.
Otro aspecto relevante a la hora de considerar la construcción de este tipo de ontologías para el
urbanismo, es la geo-ciber-infraestructura (GCI) de la que disfruta la ciudad [13]. El análisis de la
GCI es esencial no sólo para establecer la agenda de investigación y desarrollo en la smartcity. Es
esencial para capturar sus características fundamentales y la influencia y relación de ésta con los
elementos físicos, sociales y geográficos del marco urbano. Teniendo en cuenta que la integración
de todos los sistemas que componen la GCI no es viable en la práctica, se da la circunstacia de que,
usando ontologías, se puede establecer un marco semántico común donde los datos de diferentes
sistemas puedan ser relacionados y combinados. Un caso de especial interés es el de los servicios
basados en la localización, debido al espectacular incremento del número de dispositivos móviles
y de la implantación de sensores y los servicios de Sistemas de Información Geográfica (SIG)
disponibles.

2.2 Geodemografías como espacios de conocimiento aumentado

En este contexto, disponer de una capa geodemográfica aporta a los sistemas de gestión la capacidad
de relacionar datos extraídos en tiempo real con características sociales, demográficas
y económicas que permitirían tomar decisiones socialmente adecuadas con mayor información
o mejor diagn´ ostico. La CGI puede aprovechar ese tipo de información (usualmente de carácter
estático o poco dinámica) para asesorar u obtener relaciones entre el comportamiento de la ciudad
y los residentes o el tejido social de una zona concreta.
Por tanto, en el caso de las Smartcities, la geodemografía debería ser incluída como un sistema
más dentro de la GCI, para que otros sistemas del GCI puedan cruzar su información transversalmente
con cuestiones sociales, ambientales, etc. Teniendo en cuenta que la evolución del GCI
producirá plataformas donde no sólo se recopilen datos colectivamente sino que también sean utilizados
por la comunidad, la especialización y la adaptación de resultados a distintas realidades
sociodemográficas proporcionan un valor añadido a esa infraestructura.
Por otro lado, para asistir de manera fiable a la toma de decisiones facilitada por esa valiosa
capa sociológica, la geodemografía deberá aportar conocimiento que pueda ser utilizado de manera
argumentativa junto con otro conocimiento extraído de los datos que una smartcity proporciona.
Particularmente interesante es la oportunidad de potenciar los beneficios sociales al
conectar, mediante datos abiertos, residentes de los mismos barrios o de iguales intereses, reducir
el consumo energético o la emisión de gases nocivos, así como mantener informados a los ciudadanos
de los eventos que ocurren en su entorno [4].
3 Semantización de geodemografías
Llegados a este punto, nos enfrentamos al problema de construir una ontología a partir de datos
sociodemográficos. Es importante tener en cuenta que un sistema sociodemográfico se puede
contemplar desde tres puntos de vista: como conjunto de datos susceptibles de tratamiento estad
ístico, como interpretables por especialistas o, finalmente, como una representación no formalizada
de la realidad del entorno. Esta ´ ultima visión es la que se considera para la formalización
del sistema como una ontología.
El primer paso es acotar y precisar el uso pretendido de ésta. Como hemos comentado, pensando
en smarticities, el objetivo es el encaje de esa información con el flujo de información que
la ciudad genera para dotarla de calidad desde el punto de vista social. Por supuesto, este objetivo
debe contemplar que la GCI ya es un middleware entre distintas fuentes de información, y
que integra diversas funciones. Por tanto, la ontología debe reflejar y estandarizar la información
sociodemográfica disponible para poder construir sistemas que la combinen con lo que la GCI
proporciona (tanto espacial como digital, de conocimiento, etc.). Pretender que la ontología abarque
otro tipo de aspectos significaría que su ámbito de aplicación sería inestable, confuso y por
tanto no usable. Por ejemplo, la consideración de sectores demográficos geolocalizados como comunidades
de facto no implica que se pretenda considerar en la misma ontología comunidades
virtuales o construidas bajo otros criterios. En este caso, la heterogeneidad social que nos presente
la geodemografía semantizada puede diferir de la que el GCI preexistente considere.
Una vez establecido el ámbito, la ontología sí debería facilitar fusión fiable y a alto nivel de la
información, y que sea lo suficientemente robusta como para admitir los cambios sociales que se
puedan producir, incluída la recogida de información (voluntaria) por parte de residentes, pues
el propio GCI lo debe admitir. En el contexto del ecosistema de informaciones de una smartcity,
la esfera de conocimiento (social) que una ontología geodemográfica añade influiría en todos
los procesos de recogida, interpretación y feedback informacionales, tanto en el ámbito de la Inform
ática Urbana como en la gestión de la ciudad, al permitir la especialización de las decisiones
y aplicaciones (véase Fig. 1). El ciclo de vida del conocimiento en la smartcity (adquisición, verificaci
ón, documentación y decisión) puede enriquecerse con el procesamiento semántico de la
información, y no sólo desde las ontologías sociodemográficas. El valor añadido por la tecnología
semántica permite intervenir razonando a alto nivel con el conocimiento procesado. Por supuesto,
este aspecto no excluye que el origen de los datos sea de prácticas colaborativas o de crowdsourcing.
3.1 Extrayendo una ontología de una geodemografía. Ejemplo
Para ilustrar el resultado de ese proceso, presentamos algunas características de la ontología
que hemos extraído de MOSAIC, la cual agrupa una serie de sistemas de segmentación geodemogr
áfica que, mediante técnicas de clasificación estadística, permite clasificar los individuos de
una población en grupos (que a su vez se subdividen en tipos más específicos) seg ún criterios
cualitativos y cuantitativos. Los productos MOSAIC han sido creados por la organización comercial
Experian Group y algunos de los representantes de la gama MOSAIC son, por ejemplo,
MOSAIC UK, MOSAIC Public Sector, MOSAIC Global y MOSAIC Commercial. Cada uno de
estos sistemas está orientado a un tipo de negocio.

La herramienta MOSAIC Global se usa en márketing para obtener la segmentación de consumidores
enfocada al análisis y asesoramiento sobre clientes potenciales: prospectiva, reclutamiento
y fidelización. Los grupos se definen atendiendo a características demográficas y socioecon
ómicas como la edad, nivel económico, raza, etc. Características que, en general, son similares
para una considerable proporción de la población de una vecindad. Abarca los datos locales
de unos 400 millones de habitantes de 29 paises, identificando 10 tipos de zonas residenciales
que pueden encontrarse en cualquiera de esos países. También se usa en el estudio y análisis de
política de inversiones. En el dise ño de estas herramientas la tecnología empleada incluye sistemas
de información geográfica y software para administración de bases de datos.
Existen otros sistemas de segmentación como CAMEO (UK) y ACORN (UK). Tanto ACORN
como MOSAIC facilitan descripciones con mucho detalle de distintos tipos de entornos sociodemogr
áficos, explicando las razones y el ámbito de cada uno.

Desde el punto de vista ontológico,son tipos ideales que incluyen información del especialista no explícita en la documentación [5]. Son arquetipos que se pueden explicar a partir de los datos estadísticos, pero que no caracterizan totalmente cada clase. Finalmente, hay que tener en cuenta que las definiciones originales de MOSAIC reflejan dificultades para convertirlos en metadatos: mucha variación entre los individuos que componen la clase, entre los requerimientos para pertenecer a ésta o falta de algún requisito fundamental [14].

En el caso concreto de MOSAIC, para la representación de la información se usan unas 400 variables de tipo dato, 11 grupos y 61 tipos. Desde el punto de vista de su utilidad, sus puntos fuertes son que permite ejecutar de manera más específica tanto intervenciones como la implantación de servicios, localizar elmárketing social y ayudar a identificar desigualdades sociales. Como contrapartida, existe poca transparencia en la recolección de los datos para construirlas y los métodos para procesarlos (incluída la robustez estadística de algunas conclusiones reflejadas en la herramienta y la discutible vertiente ecológica) [7].
Por tanto, en muchas ocasiones, los porcentajes de la media de una determinada característica no se corresponden con la descripción del grupo. Esto es particularmente frecuente en datos como los ingresos netos de la unidad familiar, una de las características en principio más significativas para determinados grupos y tipos. En efecto, es muy habitual encontrar casos en principio caracterizados por tener ingresos altos o muy altos, pero en los que los porcentajes más significativos
corresponden a ingresos relativamente bajos. Desde el punto de vista de su uso en CGI, se deben perfilar en las definiciones condiciones más débiles pero de riqueza informativa.

Por ejemplo, en la descripción de la clase E22 de MOSAIC que presentamos en Fig. 2. se incluyen entre las características fundamentales aquellas que permiten combinar la información con aspectos de movilidad, zona geodemográfica, etc. De esta forma, esos axiomas pueden aportar información valiosa a otros sistemas de la CGI.
4 Aplicaciones de la geodemografía semántica. Conclusiones

La proyección futura de los sistemas de geodemografía semántica tiene efectos muy prometedores
el desarrollo de las smartcities. Apuntamos las siquientes líneas de innovación y desarrollo:

  • Uso combinado de la geodemografía semántica con sistemas de planificación urbanística/uso del terreno (por ejemplo, [10])
  • Explotación de la fuente fiable de conocimiento que representa las ontologías geodemográficas para intervenciones urbanísticas.
  • Reutilizar el conocimiento representado en otras ciudades,
  • especialmente en ciudades emergentes, donde la ubicación de zonas idóneas para facilitar nuevos servicios y mercados es esencial [6]
  • Facilitar el nacimiento de mercados basados en el conocimiento: emplazamientos de nuevos centros comunitarios, sanitarios, comerciales, etc. estimando el impacto social y demográfico
  • Aumentar la resiliencia urbana ante catástrofes especializando mediante geodemografía semántica el razonamiento con datos [2]
  • Interrelacionar la dimensión social de distintos modelos urbanos [9]
  • Desarrollo de aplicaciones hiperlocales con dimensión social o comunitaria
  • Desarrollo de aplicaciones para gestión inteligente del tráfico dependiendo del entorno geodemográfico

En este texto hemos recogido las líneas esenciales de nuestro trabajo en el desarrollo de ontolog
ías para geodemografía. Hemos apuntado las limitaciones, desde la Ingeniería del conocimiento,
de esta aproximación. Consideramos que las lineas indicadas representan una oportunidad
para aportar valor añadido a CGI.
Referencias
1. J. A. Alonso-Jiménez, J. Borrego-Díaz, A. M. Chávez-González, F. J. Martín-Mateos, Foundational Challenges in Automated Semantic Web Data and Ontology Cleaning. IEEE Intelligent Systems 21(1):42-52
(2006).
2. G.A. Aranda-Corral, A. Blanco-Escudero, J. Borrego-Díaz; M. Gomar-Acosta, Data-in-the-cloud City.
Proc. 7th Virtual Cities and Territories. Lisboa 2011
3. M. Batty, Cities as Complex Systems: Scaling, Interaction, Networks, Dynamics and Urban Morphologies
in Encyclopedia of Complexity and Systems Science (R.A. Meyers ed.), pp. 1041-1070. Springer, 2012
4. Smarter Neighborhoods Smarter City. Solutions for a More Sustainable New York—Today. Siemens Report.
5. R. Burrows, N. Gane, Geodemographics, Software and Class, Sociology October 40(5):793-812 (2006)
6. R. Dobbs, J. Remes, J. Manyika, C. Roxburgh, S. Smit, F. Schaer, Urban world: Cities and
the rise of the consuming class
. Report of McKinsey Global Institute June 2012. Available at
7. S. Dougan, Using MOSAIC en Islington
8. N. Ellison, R. Burrows (2007): New Spaces of (Dis)engagement? Social Politics, Urban Technologies and
the Rezoning of the City, Housing Studies, 22:3, 295-312.
9. G. Falquet, C. Métral, J. Teller, C. Tweed (Eds.) Ontologies in Urban Development Projects. Springer, 2011.
10. N. Montenegro, J.C. Gomes, P. Urbano, J. P. Duarte, A Land Use Planning Ontology: LBCS, Future Internet
2012, 4, 65-82
11. A. Sheth, C. Henson, S.S. Sahoo. Semantic Sensor Web. IEEE Internet Computing 12(4):78-83 (2008)
12. S. Lai, C. Zoppi, An Ontology of the Strategic Environmental Assessment of City Masterplans, Future
Internet 2011, 3, 362-378
13. Yang, C., Raskin R., Goodchild, M., and Gahegan M. (2010) Geospatial Cyberinfrastructure: Past, Present
and Future. Computers, Environment and Urban Systems, 34, pp. 264-277.
14. Ure J, Procter R, Lin Y, Hartswood M, Ho K, Aligning Technical and Human Infrastructures in the Semantic
Web: a socio-technical perspectiven. 3rd Int. Conf. on e-Social Science. Michigan-USA 2007.

Anuncios

Un comentario

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión /  Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión /  Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión /  Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión /  Cambiar )

w

Conectando a %s