//img.uscri.be/pth/1263c7e7cf0fd96922004800a77f14423137ff42
Cet ouvrage fait partie de la bibliothèque YouScribe
Obtenez un accès à la bibliothèque pour le lire en ligne
En savoir plus

Actualización del SIG citrícola de la Comunidad Valenciana mediante métodos automáticos supervisados (Semi-supervised scheme to update the citric GIS of the Comunidad Valenciana region)

De
10 pages
RESUMEN
La actualización de los Sistemas de Información Geográfica (SIG) es una necesidad por parte de las administraciones públicas para poder desarrollar políticas de reestructuración de cultivos, gestión eficaz de ayudas o control de superficies y producción de cultivos. Los problemas de la actualización de los SIG son el coste económico y de tiempo que requieren, ya que tradicionalmente se han realizado con técnicas de fotointerpretación y visitas al campo.
En el presente trabajo se ha desarrollado la actualización del SIG citrícola de la Comunidad Valenciana (España) mediante técnicas automáticas a partir de ortoimágenes aéreas de alta resolución con el fin de reducir la intervención humana y optimizar los recursos. La metodología propuesta realiza un análisis orientado a objetos que define los recintos catastrales como entidades individuales, extrayéndose las características principales de cada parcela y clasificándola posteriormente combinando árboles de decisión, máquinas de vectores soporte y redes neuronales artificiales. Por medio de la clasificación automática se ha podido clasificar el 87% de las parcelas procesadas de la comunidad con un acierto superior al 92% en las tres provincias.
ABSTRACT
Updating Geographic Information Systems (GIS) databases is a requirement for public administrations in order to develop crop restructuring policies, funding systems, or crop management.
The main difficulties to update the GIS are the economic and time cost involved, since the update has traditionally relied on human-based photointerpretation and visiting crop fields. This paper presents the strategy that has been developed in order to update
the citric SIG of the Comunidad Valenciana (Spain) introducing automatic methods in order to reduce the photointerpretation and field tasks. The proposed methodology carries out an object-oriented analysis that defines the cadastral precinct as the main working entity, the main features are extracted from each precinct and they are then classified with decision trees, support vector machines and multilayer perceptrons. Using automatic classification schemes, an 87% of processed parcels have been labelled with classification accuracy higher than 92% in all three provinces.
Voir plus Voir moins

Revista de Teledetección. ISSN: 1988-8740. 2008. 30: 23-32
Actualización del SIG citrícola de la Comunidad
Valenciana mediante métodos automáticos su-
pervisados
Semi-supervised scheme to update the citric
GIS of the Comunidad Valenciana region
1 1 1 1 2 1 1E. Izquierdo , J. Amorós , L. Gómez , J. Muñoz ,J. Z. Rodríguez , G. Camps y J. Calpe
emizver@alumni.uv.es
1Dept. Ingeniería Electrónica, IPL, Universidad de Valencia, Valencia, España
2Instituto Cartográfico Valenciano, Valencia, España
Recibido el 20 de Mayo de 2008 , aceptado el 30 de Mayo de 2008
ABSTRACTRESUMEN
Updating Geographic Information Systems (GIS)La actualización de los Sistemas de Información
databases is a requirement for public administra-Geográfica (SIG) es una necesidad por parte de las
tions in order to develop crop restructuring policies,administraciones públicas para poder desarrollar
funding systems, or crop management.políticas de reestructuración de cultivos, gestión
The main difficulties to update the GIS are the eco-eficaz de ayudas o control de superficies y produc-
nomic and time cost involved, since the update hasción de cultivos. Los problemas de la actualización
traditionally relied on human-based photointerpre-de los SIG son el coste económico y de tiempo que
tation and visiting crop fields. This paper presentsrequieren, ya que tradicionalmente se han realizado
the strategy that has been developed in order to up-con técnicas de fotointerpretación y visitas al
date the citric SIG of the Comunidad Valencianacampo.
(Spain) introducing automatic methods in order toEn el presente trabajo se ha desarrollado la actua-
reduce the photointerpretation and field tasks. Thelización del SIG citrícola de la Comunidad Valen-
proposed methodology carries out an object-orien-ciana (España) mediante técnicas automáticas a
ted analysis that defines the cadastral precinct as thepartir de ortoimágenes aéreas de alta resolución
main working entity, the main features are extractedcon el fin de reducir la intervención humana y op-
from each precinct and they are then classified withtimizar los recursos. La metodología propuesta re-
decision trees, support vector machines and multi-aliza un análisis orientado a objetos que define los
layer perceptrons. Using automatic classificationrecintos catastrales como entidades individuales,
schemes, an 87% of processed parcels have beenextrayéndose las características principales de cada
labelled with classification accuracy higher thanparcela y clasificándola posteriormente combi-
92% in all three provinces.nando árboles de decisión, máquinas de vectores
soporte y redes neuronales artificiales. Por medio
de la clasificación automática se ha podido clasifi-
car el 87% de las parcelas procesadas de la Comu-
nidad con un acierto superior al 92% en las tres
provincias.
KEYWORDS: Geographic Information SystemPALABRAS CLAVE: Sistema de Información
(GIS), tree detection, feature extraction/selection,Geográfica (SIG), detección de árboles,
classification, decision tree, support vector ma-extracción/selección de características, clasifica-
chine, neural networks.ción, Árboles de decisión, Máquinas de Vectores
Soporte, Redes Neuronales
Revista de Teledetección. ISSN: 1988-8740. 2008. 30: 23-32 23E. Izquierdo, J. Amorós, L. Gómez, J. Muñoz ,J. Z. Rodríguez , G. Camps y J. Calpe
son la reducción de tiempo y de coste empleado queINTRODUCCIÓN
proporciona el uso de técnicas automáticas en la ge-
neración o actualización de los SIG.Los Sistemas de Información Geográfica (SIG)
El objetivo de este trabajo es la actualización delconsisten en una base de datos (DeMers, 1999)
SIG citrícola de la Comunidad Valenciana (CV) adonde figura la información geográfica que me-
escala 1:10000, mediante un sistema de clasificacióndiante un identificador común los asocia a imágenes
automático de cada parcela catastral. Las adminis-aéreas o mapas digitales. Están diseñados para ana-
traciones territoriales exigen una alta fiabilidad enlizar la información que contienen de forma que se
la clasificación parcelaria al ser éste un factor críticopueda realizar acciones de planificación y gestión.
en el desarrollo de políticas de reestructuración deSe pueden encontrar diversos tipos de SIG, en fun-
cultivos, la gestión eficaz de ayudas o el control deción del tipo de cultivo del que se quiera obtener in-
superficies y producción de cultivos. La aproxima-formación, de los que cabe destacar: SIG citrícola,
ción utilizada combina las técnicas de procesado di-SIG vinícola, SIG oleícola (Peedell et al., 1998),
gital de imagen y de aprendizaje basado en muestrasSIGA (Sistema de Información Agraria) o SIGPAC
(machine learning) con técnicas de fotointerpreta-(Sistema de Información Geográfica de Parcelas
ción para asegurar la fiabilidad requerida mientrasAgrícolas), entre otros. En el caso del SIG citrícola,
se reduce el número de parcelas fotointerpretadas enlos atributos de tipo agrario que contiene incluyen
función de los recursos humanos disponibles y unla clasificación parcelaria indicando si el tipo de cul-
grado de error asumible. En una primera etapa lastivo es cítrico o no, aunque también puede incluir
parcelas se clasifican asignándoles un grado de fia-información adicional de las parcelas pertenecientes
bilidad y aquellas que no lo superan son etiquetadasa un territorio como la cota, superficie, etc.
para revisar. En la segunda etapa, el Instituto Carto-Debido al impacto económico que tiene el cultivo
gráfico Valenciano (ICV) realiza la fotointerpreta-de cítricos en la Comunidad Valenciana (España), el
ción de las parcelas a revisar.gobierno regional determinó la necesidad de elabo-
La primera sección describe el área de estudio y elrar el SIG citrícola de esta comunidad con objeto de
material utilizado en este trabajo. La siguiente sec-poder desarrollar acciones administrativas como: la
ción detalla la metodología empleada, donde se in-gestión eficaz de ayudas, control de la superficie del
cluye la descripción de las tipologías de parcela máscultivo de los cítricos, actualización del catastro, di-
comunes; las técnicas y selección de característicasseño de políticas de reestructuración de cultivos, etc.
empleadas; y en último lugar, la metodología de cla-El mantenimiento del SIG citrícola requiere una ac-
sificación de las parcelas citrícolas. En la tercera sec-tualización continua para poder ofrecer un conoci-
ción se detallan los resultados obtenidos en lamiento de la realidad de este sector a los agentes
actualización del SIG de la CV, finalizando con laseconómicos. El principal problema de la actualiza-
conclusiones.ción del SIG citrícola radica en la recopilación de
datos, debido a que las parcelas citrícolas cambian
MATERIALconstantemente ya sea porque se abandonan los
campos, se cambia el tipo de cultivo o la zona se ur-
Área de estudiobaniza. Por tanto, se necesita recopilar una gran can-
tidad de información cada poco tiempo.
Tradicionalmente, la generación o actualización de El área de estudio es la Comunidad Valenciana, co-
los SIG se realizaba mediante fotointerpretación, y munidad autónoma situada al este de la Península
realizando visitas al campo cuando era necesario, Ibérica (España), contiene 542 municipios divididos
haciendo que el proceso fuese muy lento y requiriese en tres provincias Castellón, Alicante y Valencia. En
gran cantidad de recursos. Actualmente, debido al 2006, la CV tenía 598.905 ha de cultivo, datos obte-
desarrollo de la tecnología y el aumento de informa- nidos del documento Informe del Sector Agrario Va-
ción y resolución de los sensores, las técnicas auto- lenciano del año 2006 realizado por Conselleria
máticas de análisis de imágenes aéreas o de satélite d’Agricultura, Pesca i Alimentació de la Generalitat
comienzan a emplearse en la extracción de informa- Valenciana, de las cuales el 31% estaban destinadas
ción geográfica como la determinación de cultivos o al cultivo de cítrico repartidas en las tres provincias,
los cambios producidos respecto a la base de datos aunque más de la mitad de las hectáreas se encontra-
anterior. Otros factores importantes para su empleo ban en la provincia de Valencia (Tabla 1).
24 Revista de Teledetección. ISSN: 1988-8740. 2008. 30: 23-32Actualización del SIG citrícola de la Comunidad Valenciana mediante métodos automáticos supervisados
Tabla 1. Hectáreas dedicadas a los principales cultivos de las provincias de la Comunidad Valenciana entre 1993 y 2005.
les a nivel parcelario, de las que posteriormente seDatos utilizados
realizó una selección para entrenar los clasificadores
automáticos. Finalmente, en la clasificación final deEl material utilizado en el presente trabajo para la
las parcelas se utilizaron varios conjuntos de entre-clasificación y posterior actualización del SIG citrí-
namiento con tres métodos de clasificación. Me-cola de la CV ha sido facilitado por el Instituto Car-
diante una combinación lineal de las salidas de lostográfico Valenciano (ICV). La información
clasificadores se obtuvo la clase final de las parcelasproporcionada es:
y un grado de fiabilidad. A continuación se describen- Ortoimágenes aéreas en el visible (rojo,
los distintos pasos utilizados para la clasificación.verde y azul, RGB) y en el infrarrojo cercano
(CIR), georreferenciadas y ortorectificadas
Caracterización de la tipología de las parcelas decorrespondientes a los recintos citrícolas de la
cítricosCV con una resolución de 0.5m.
- Archivo vectorial con la información catas-
El estudio de las parcelas más comunes de la CV setral parcelaria a escala 1:10.000.
realizó para caracterizar las tipologías de las parce-
las. Se hizo una primera clasificación atendiendo al- Clasificación del SIG citrícola de las tres
tamaño del árbol de la parcela dividiéndolos en ár-provincias de la CV del año 2001 y la clasifi-
boles adultos y árboles jóvenes. En ambos casos, lascación del SIG citrícola de la provincia de
parcelas más comunes se diferencian según la geo-Castellón del año 2006.
metría de los árboles dentro de la parcela (lineal, re-
gular, irregular y diagonal), según la masa vegetativa- Archivo vectorial de las estadísticas del tipo
de los árboles (más o menos densos) y si el suelo dede cultivo por municipio a escala 1:10.000.
la parcela tiene o no cubierta vegetal. En cualquier
caso, pueden existir parcelas que sean una mezclaMETODOLOGÍA
de las parcelas más comunes o parcelas que conten-
gan tipos de cítricos diferentes al común.En la primera fase del estudio se caracterizaron las
El ICV realizó una división de los municipios de latipologías de parcela más comunes según la variedad
CV según el tipo de cultivo mayoritario del munici-de los árboles contenidos en la parcela y según el
pio, basándose en el documento Informe del Sectorcultivo mayoritario del municipio para conocer la
Agrario Valenciano del año 2006 (Conselleria d’A-variabilidad de las parcelas con las que se trabaja.
gricultura, Pesca i Alimentació), en árboles de se-En la siguiente etapa se realizó la extracción de ca-
cano, cítricos, herbáceos y frutales (Tabla 2).racterísticas, obteniéndose 34 características inicia-
Tabla 2. Número de municipios según la tipología del municipio de los 337 municipios procesados.
Revista de Teledetección. ISSN: 1988-8740. 2008. 30: 23-32 25E. Izquierdo, J. Amorós, L. Gómez, J. Muñoz ,J. Z. Rodríguez , G. Camps y J. Calpe
En el grupo de árboles de secano, no sólo se inclu- identificación de las áreas parciales de cultivo, se-
yen la vid y el olivo sino también el almendro, el al- parando las áreas homogéneas en diferentes subgru-
garrobo, el nogal y el avellano. El grupo de pos dentro de esta parcela.
herbáceos está formado por las hortalizas, cereales, La localización de los árboles se obtuvo a partir de
leguminosa, tubérculos, cultivo forrajero y viveros. la característica del NDVI (Normalized Difference
Finalmente, en el grupo de frutales incluimos el resto Vegetation Index). El NDVI (Tucker, 1979) es una
de frutales. medida de la diferencia normalizada entre las reflec-
La mayoría de municipios con cultivo mayoritaria- tancias del rojo y del infrarrojo cercano, mostrando
mente cítrico se suelen situar a baja altitud para pre- valores altos cuando la vegetación es densa y sana,
venir el riesgo de heladas. Sin embargo, en zonas de y bajos en zonas de pobre y dis-
mayor altura podemos encontrar cítricos en lugares persa, o en ausencia de ella. Antes de obtener los
más protegidos como por ejemplo entre valles de centros de los árboles, se filtró la característica del
montañas o zonas con más humedad como la orilla NDVI con un filtro de suavizado para eliminar el
de los ríos. Por ese motivo, casi todos los municipios ruido del fondo y con un filtro de convolución circu-
con cultivo mayoritariamente cítrico se encuentran lar para realzar la localización de los árboles. La de-
cerca de la costa mediterránea, salvo la Albufera y la tección de los árboles se realizó buscando máximos
Huerta de la provincia de Valencia, donde el cultivo locales para que los centros detectados coincidiesen
mayoritario es herbáceo (Figura 1). con los centros de las copas de los árboles y no es-
tuviesen desplazados (figura 2).
Extracción de características Posteriormente a la detección de los árboles, se rea-
liza una fusión de los centros localizados a muy
La extracción de características se desarrolló a corta distancia, en zonas homogéneas, en un solo
nivel parcelario tratándose cada parcela como un árbol.
objeto representado por las características extraídas. A partir de los árboles detectados se extrajeron 34
En los casos donde la parcela era heterogénea se tra- características de cada parcela catastral que podemos
bajó a un nivel inferior que permitiese obtener una clasificar atendiendo a características estructurales,
Figura 1. Comunidad Valenciana según la tipología de los municipios procesados.
26 Revista de Teledetección. ISSN: 1988-8740. 2008. 30: 23-32Actualización del SIG citrícola de la Comunidad Valenciana mediante métodos automáticos supervisados
espectrales y de textura. cada característica seleccionada por cada método.
Finalmente, las características más votadas fueron
Estructurales (obtenidas a partir de las posiciones las elegidas para entrenar los clasificadores.
de los árboles detectados): Los métodos utilizados son (Blum et al., 1998; Ko-
• Media y desviación estándar de la distancia al havi et al., 1997):
vecino más próximo.
• Máximo y mínimo de los histogramas de vecto- • Coeficiente de correlación de cada característica
res de unión entre los vecinos más próximos. con la salida.
• Medida de distribución de los árboles o grid (re- • Mínima redundancia máxima relevancia (Peng et
gular o irregular). al., 2005).
• Distancia máxima y mínima de las direcciones • Criterio discriminante de Fisher (Bishop, 2005).
principales (separación entre lineas). • Selección mediante estadístico t (versión no ses-
Espectrales (obtenidas a partir de los valores radio- gada de Fisher) (Theodoridis et al., 1999; Liu et
métricos de las 4 bandas espectrales): al., 1998).
• Media y desviación estándar del NDVI de la • Selección mediante la cota de clasificación de
copa, de los centros de la copa y del fondo. Chernoff (Theodoridis et al., 1999; Liu et al.,
• Media y desviación estándar del índice de verde 1998).
de la copa.
• Media y desviación estándar del tono y satura- Clasificadores
ción de la copa y de los centros de la copa.
De textura (obtenidas a partir de la región que de- La gran cantidad de tipologías de parcelas que se
limita cada grupo de árboles) (Gonzalez et al., pueden encontrar en la CV hace que exista una gran
2002): variabilidad en los datos de entrada a analizar, y a
• Energía: definida como la suma del cuadrado de su vez establece la necesidad de utilizar más de un
los elementos de la matriz de coocurrencia. clasificador para asegurar un alto grado de confianza
• Correlación: definida como la medida de cómo en la clasificación. Los métodos de clasificación uti-
se correlacionan los píxeles con sus vecinos lizados se eligieron por su robustez y por su fácil in-
sobre toda la imagen. terpretación, además de ser modelos con una alta
• Contraste: definida como la medida de la inten- fiabilidad. A continuación se describen los tres mo-
sidad de contraste entre un píxel y su vecino delos de clasificación utilizados. • Árboles de decisión
• Homogeneidad: definida como el valor que mide Los árboles de decisión (Breiman et al., 1984) son
la proximidad de la distribución de elementos unos potentes y populares algoritmos de clasifica-
de la matriz de coocurrencia con la diagonal de ción cuyo aprendizaje es fácil de implementar. Son
la matriz. utilizados para predecir y clasificar mediante proce-
dimientos estadísticos, donde la relación entre el
Selección de características conjunto de entrenamiento y la respuesta del árbol
viene dada por una regresión no paramétrica.
La selección de características se realizó con diver- Un árbol de decisión considera como entrada un
sos métodos de selección, asignándole un voto a objeto o situación descrita por un conjunto de atribu-
(a) (b)
Figura 2. Detección de los árboles en la imagen del NDVI. Imagen RGB del área seleccionada de una parcela (a). Ima-
gen del NDVI con los árboles detectados marcados con un punto negro (b).
Revista de Teledetección. ISSN: 1988-8740. 2008. 30: 23-32 27E. Izquierdo, J. Amorós, L. Gómez, J. Muñoz ,J. Z. Rodríguez , G. Camps y J. Calpe
tos o características y devuelve una decisión ‘verda- • Espacio de características: Las SVM pueden
dero/falso’. El algoritmo denominado “Classifica- construir funciones de decisión no lineales trans-
tion and Regression Tree” (CART) ideado por formando los datos de entrada en un espacio de
Breiman et al. (1984), consiste en una secuencia de alta dimensionalidad llamado espacio de carac-
nodos cada uno de los cuales se separa en dos ramas. terísticas donde los datos si son separables line-
Las divisiones se realizan de forma que los nodos almente.
hijos separan mejor las clases que los nodos padres • Vectores soporte: La frontera de decisión se cal-
sin sobreajustar el modelo. cula como una combinación lineal de pocas
Las ventajas del uso de CART frente a otros méto- muestras del espacio de entrada llamadas vecto-
dos son la elevada generalización, extracción senci- res soporte.
lla de reglas e interpretabilidad del modelo. Si las distintas clases no pueden ser separadas de
• Perceptrón multicapa (MultiLayer Perceptron, forma lineal, la SVM utiliza el método de kernel
MLP) (Gualtieri et al., 2000 y Schölkopf et al., 2002).
EL MLP es un modelo de red neuronal artificial
perteneciente al grupo de las redes estáticas (Hush et Clasificación
al., 1993; Haykin, 1999), se trata de sistemas sin me-
moria que no dependen de entradas o salidas pasadas El entrenamiento de los distintos métodos de clasi-
o futuras. Los MLP están constituidos por neuronas ficación requiere un conjunto de entrenamiento (cla-
interconectadas parcial o totalmente, con recurren- sificación supervisada) que se obtuvo mediante el
cias o no, y que se encuentran organizadas en capas etiquetado de parcelas por fotointerpretadores exper-
de tal forma que las señales que lo alimentan (seña- tos. Este conjunto de entrenamiento fue realizado
les de entrada) se propagan desde los nodos de en- por el ICV y está compuesto por 109 municipios con
trada hacia los de salida. un total de 72.950 parcelas etiquetadas de la CV. Se
La metodología del MLP se realiza mediante un seleccionaron parcelas de diversos municipios cu-
mapeo complejo entre la entrada y la salida donde briendo todas las tipologías de cultivo (Tabla 2): 41
los parámetros son pesos sinápticos del modelo. El municipios de árboles secano, 43 de cítricos, 10 de
entrenamiento de la red se suele realizar empleando frutales y 15 de herbáceos.
el conocido algoritmo ‘backpropagation’ o de retro- Con todas estas muestras etiquetadas se entrenaron
propagación (Rumelhart et al., 1986). tres clasificadores globales (TREE, SVM y MLP)
El MLP entrenado con dicho algoritmo es el más para cada provincia y tres más para cada tipología
utilizado en multitud de campos, tanto en clasifica- de cultivo (TREE, SVM y MLP) de cada provincia.
ción de patrones como en predicción de series tem- Independientemente de la provincia donde se en-
porales. cuentre el municipio a clasificar, cada parcela estará
• Máquinas de Vectores Soporte (Support Vector clasificada por 6 clasificadores (los tres globales y
Machines, SVM). los tres según la tipología que tenga el municipio).
Las máquinas de Vectores Soporte (Vapnik, 1998) Se realizó una combinación lineal (Hashem, 1997)
son herramientas avanzadas para el aprendizaje en entre el resultado de los distintos clasificadores y la
máquinas. Su inspiración es bastante diferente a las clasificación del SIG citrícola anterior. Con la com-
redes neuronales artificiales. Proporcionan cuatro binación lineal se obtuvo la clase final de las parce-
características básicas: las y un grado de fiabilidad definido por la
• Elevadas capacidades de generalización: La me- discrepancia entre los distintos clasificadores y la
todología de clasificación en la SVM, se realiza clase del SIG anterior. Las parcelas con bajo grado
trazando hiperplanos de máximo margen para de fiabilidad son etiquetadas como “Revisar” para
separar las distintas clases en las que se dividen la posterior fotointerpretación por parte de ICV. Esto
los datos de entrada (Camps-Valls et al., 2005). permite aumentar la fiabilidad en la actualización del
• ‘Slack variables’: Cuando los datos no son line- SIG citrícola de la comunidad al fotointerpretarse las
almente separables, las SVM relajan las restric- parcelas con mayor probabilidad de error en la cla-
ciones asociadas a cada muestra (cada muestra sificación automática.
tiene como restricción impuesta que pertenezca
a una u otra clase) introduciendo términos posi- RESULTADOS
tivos de relajación (slack variables) para cada
muestra. La actualización citrícola de la CV se realizó en
28 Revista de Teledetección. ISSN: 1988-8740. 2008. 30: 23-32Actualización del SIG citrícola de la Comunidad Valenciana mediante métodos automáticos supervisados
dos etapas, por lo que el conjunto de entrenamiento tienen el grado de fiabilidad más bajo, también se
utilizado es distinto para cada una de las clasifica- incluyen las parcelas que presentan cultivos con ár-
ciones. En la primera etapa se clasificó la provincia boles excesivamente pequeños definidos como plan-
de Valencia (Septiembre de 2007), utilizándose solo tones. Muchas de estas parcelas presentan
las muestras etiquetadas de esta provincia como con- dificultades para ser clasificadas mediante fotointer-
junto de entrenamiento (53.796 parcelas). En la si- pretación y deberán comprobarse mediante visitas al
guiente fase se clasificaron las provincias de campo.
Alicante y Castellón (Marzo de 2008) utilizando, en El número de parcelas etiquetadas a revisar está re-
Alicante las muestras etiquetadas de la provincia de lacionado con el grado de fiabilidad de la clasifica-(11.577 parcelas), además de las que se te- ción de las parcelas, pudiéndose aumentar o
nían de la provincia de Valencia y para la clasifica- disminuir en función de los medios y recursos dispo-
ción de la provincia de Castellón las muestras nibles para fotointerpretar estas parcelas. En la fi-
fotointerpretadas de Castellón (7.577 parcelas), gura 3 vemos que si se aumenta la probabilidad
junto con las de Valencia. fijada para clasificar la provincia de Valencia se ob-
Se ha actualizado el SIG citrícola del año 2001 de tendrán más parcelas a revisar en esa provincia. Esta
322 municipios de los 542 municipios que tiene la probabilidad se puede fijar para todas las parcelas
CV y además se ha generado el SIG citrícola en 15 de la provincia o por tipologías. En el presente tra-
municipios nuevos. Por provincias, se han clasifi- bajo se han clasificado las tres provincias con sus
cado 82 municipios en Alicante, 57 en Castellón y respectivos modelos de clasificación y con el mismo
208 en Valencia, con un total de 1.636.126 parcelas. umbral en la probabilidad de acierto, fijado en el
Considerando los recursos humanos disponibles, el 35,30%.
tiempo y el alto grado de fiabilidad exigido, se han Los resultados obtenidos se detallan atendiendo a
clasificado automáticamente el 87% de las parcelas cada provincia de la CV ya que los clasificadores se
de la CV y se han etiquetado para revisar posterior- entrenaron por provincias. En la tabla 3 puede verse
mente por fotointerpretación el 13%. que se ha clasificado automáticamente el 80% en
Dentro de las parcelas a revisar, además de las que Alicante, y el 87% en Castellón y Valencia.
Figura 3. Relación entre el número de parcelas etiquetadas a revisar y la probabilidad fijada para clasificar la provincia
de Valencia.
Revista de Teledetección. ISSN: 1988-8740. 2008. 30: 23-32 29E. Izquierdo, J. Amorós, L. Gómez, J. Muñoz ,J. Z. Rodríguez , G. Camps y J. Calpe
Tabla 3. Estadísticas de la clasificación en % para las diferentes tipologías en las provincias de la CV (parcelas cítricas
(cit), no cítricas (nocit), con plantones (plantón) y parcelas etiquetadas a revisar (Rev)
La provincia de Valencia es la que más parcelas de- quetadas de ambas provincias. Además, la combina-
dica al cultivo de cítricos y por tanto es la que mayor ción lineal de los clasificadores utiliza la clasifica-
porcentaje de parcelas clasificadas como cítrico ción citrícola anterior y en Castellón es donde se
tiene en todas sus tipologías. Observamos también tenía más actualizada (2006). En cambio, el acierto
que la tipología frutal es la que contiene más parce- en Valencia es menor ya que se generaron los mode-
las etiquetadas como revisar, siendo el 32% en la los de clasificación con menos muestras (solo con
provincia de Alicante y el 26% en Valencia. las etiquetadas en Valencia) y la clasificación citrí-
En la tabla 4 se muestran los resultados obtenidos cola anterior utilizada era más antigua (2001).
en la clasificación automática de la Comunidad Va- La clasificación más baja se obtiene en la provincia
lenciana (acierto e índice estadístico Kappa pro- de Alicante. Este resultado se podría justificar de-
puesto por Cohen (Congalton et al., 1999)) usando bido a que, aunque se generaron los modelos de cla-
la misma probabilidad para las tres provincias res- sificación con las muestras de Alicante y Valencia,
pecto de las muestras fotointerpretadas según la tipo- las especies citrícolas de Alicante son bastante dife-
logía (no se incluyen las parcelas a revisar). rentes a las de Valencia. En Valencia se cultiva prin-
Los resultados muestran una gran fiabilidad en la cipalmente la especie de naranjo dulce (citrus
clasificación obtenida, siendo la Kappa total superior sinensis), mientras que en Alicante predominan
al 0.92 en las tres provincias. En la tabla 4 se ob- plantaciones de limoneros (citrus limonum risso) en
serva que los mejores resultados se han obtenido sur de la provincia (comarcas de La Vega Baja y
para la provincia de Castellón. Esto es debido a que Baix Vinalopó). Estas comarcas contienen munici-
esta tiene una tipología parecida a la de la pios mayoritariamente herbáceos, lo cual disminuye
provincia de Valencia y su modelo de entrenamiento la fiabilidad en la clasificación de esta tipología en
se ha obtenido con la combinación de muestras eti- Alicante (Kappa = 0.87).
Tabla 4. Resultado de comparar las parcelas fotointerpretadas respecto las clasificadas en las tres provincias según la
tipología del municipio de la Comunidad Valenciana.
30 Revista de Teledetección. ISSN: 1988-8740. 2008. 30: 23-32Actualización del SIG citrícola de la Comunidad Valenciana mediante métodos automáticos supervisados
En general, la tipología frutal es la que menor fia- tras fotointerpretadas de toda la Comunidad Valen-
bilidad presenta, alcanzando consecuentemente, la ciana, ya que esta provincia colinda con las otras
mayor proporción de parcelas a revisar (tabla 3). dos, y por consiguiente, tiene características muy si-
Esto es debido principalmente a ser la tipología más milares al norte de Alicante y al sur de Castellón.
parecida a la citrícola en cuanto al tamaño y forma Las dificultades encontradas en la diferenciación
de los árboles, vigorosidad de la vegetación (color y entre árboles cítricos y frutales, podrían no presen-
densidad) y estructura de la parcela. Además, el nú- tarse si se dispusiera de las imágenes de invierno ya
mero de municipios de esta tipología es el más bajo que los cítricos son árboles de hoja perenne, mien-
de la comunidad (Figura 1) y, por tanto, el conjunto tras que los frutales de la CV son de hoja caduca.
de entrenamiento para los clasificadores es bastante Los resultados muestran que el acierto obtenido en
reducido. la clasificación final esta totalmente condicionado
En la tabla 5 se observa el acierto y la Kappa de los por la calidad de las características extraídas. De
clasificadores de las tres provincias de las parcelas hecho, esta sería la primera etapa a mejorar ya que
clasificadas como ‘Revisar’ que han sido fotointer- influye directamente en la separación de las clases a
pretadas por el ICV, es decir, parcelas definidas por determinar. El primer paso sería mejorar el algo-
los clasificadores con poco grado de fiabilidad. ritmo de localización de la posición de los árboles
del cual dependen la mayoría de características, que
se debería hacer más robusto frente a la cubierta ve-
getal de fondo, incluir la posibilidad de reposicionar
los centros para mejorar las estructuras regulares, de-
tectar faltas en estas estructuras y compensarlas, etc.
Finalmente, la utilización de métodos automáticos
Tabla 5. Resultados de la validación de las parcelas eti-
junto a técnicas tradicionales de análisis de imágenesquetadas a revisar.
mediante fotointerpretación proporciona unos bue-
Se observa al aplicar los clasificadores a estas par- nos resultados a la vez que reduce el tiempo y el
celas, que si se hubiera clasificado automáticamente coste de actualizar del SIG citrícola de forma tradi-
se habría obtenido un acierto bastante bajo en las tres cional.
provincias. Este resultado pone de manifiesto la ne-
cesidad de realizar la actualización del SIG citrícola AGRADECIMIENTOS
de forma conjunta mediante técnicas de automatiza-
ción y de fotointerpretación.
Este proyecto ha sido subvencionado por el Minis-
terio de Educación y Ciencia bajo el proyecto DA-
CONCLUSIONES TASAT (ESP2005-07724-C05-03) y diversos
contratos entre el Instituto Cartográfico Valenciano
En este trabajo se ha realizado la actualización de y la Universidad de Valencia en 2007 y 2008.
los recintos citrícolas de la Comunidad Valenciana Agradecemos la colaboración del Instituto Carto-
clasificando automáticamente el 87% de las parcelas gráfico Valenciano por el cual se ha tenido acceso a
procesadas con un alto grado de confianza. Es decir, los datos utilizados para la realización del presente
en la segunda etapa se ha reducido el trabajo de fo- trabajo.
tointerpretación al 13% y por consiguiente la nece-
sidad de visitas al campo. BIBLIOGRAFIA
La metodología propuesta permite clasificar los re-
cintos parcelarios en citrícolas o no citrícolas con
BISHOP, C. M., 2005. Pattern Recognition and Ma-
gran precisión, como demuestra el acierto obtenido
chine Learning. Clarendon Press—Oxford,
del 96.54% en Alicante, 98.57% en Castellón y
2005.
97.17% en Valencia respecto de las parcelas fotoin-
BLUM, A., LANGLEY, P., 1998. Selection of Rele-
terpretadas.
vant Features and Examples in Machine Lear-
La aproximación seguida en el presente estudio
ning. Artificial Intelligence 97, 1997, pp.
para la provincia de Valencia se determinó en fun-
245-271.
ción de las fechas de entrega y la disponibilidad de
BREIMAN, L., FRIEDMAN, J., OLSHEN, R.,
los datos, pudiéndose mejorar la clasificación gene-
STONE, C., 1984. Classification and Regres-
rando los modelos de clasificación usando las mues-
Revista de Teledetección. ISSN: 1988-8740. 2008. 30: 23-32 31E. Izquierdo, J. Amorós, L. Gómez, J. Muñoz ,J. Z. Rodríguez , G. Camps y J. Calpe
sion Trees. Wadsworth and Brooks, 1984. 108-121.
CAMPS-VALLS, G., BRUZZONE, L., 2005. Ker- LIU, H., MOTODA, H., 1998. Feature Selection for
nel-based Methods for Hyperspectral Image Knowledge Discovery and Data Mining. Klu-
Classification. IEEE Transactions on Geos- wer Academic Publishers, 1998.
cience and Remote Sensing, 2005, Vol. 43, PEEDELL, S., KAY S., GIARDINO G., 1998. Se-
Issue 6, pp. 1351- 1362. eing the (olive) trees from the wood - using
CONGALTON, R. G., GREEN, K., 1999. Assessing GIS in Europe for olive tree identification.
the Accuracy of Remotely Sensed Data: Prin- ESRI User Conference, San Diego, 27th-31st
ciples and Practices. CRC Press.1999. July 1998.
CONSELLERIA D´AGRICULTURA, PESCA I PENG, H., LONG F., DING C., 2005. Feature Se-
ALIMENTACIÓ, GENERALITAT VALEN- lection Based on Mutual Information: Criteria
CIANA, 2006. Informe del Sector Agrario Va- of Max-Dependency, Max-Relevance, and
lenciano. Anexo 2, 23-34. Min-Redundancy. Pattern Analysis and Ma-
DEMERS, M. N., 1999. Fundamentals of Geogra- chine Intelligence, August 2005 Vol. 27, No. 8
phic Information Systems. John Wiley & Sons, pp. 1226-1238.
1999. 498 pags. RUMELHART, D.E., McCLELLAND, J.L., 1986.
GONZALEZ, R.C., WOODS, R.E., 2002. Digital Parallel Distributed Processing: Explorations
Image Processing (2nd Edition). Prentice Hall, in the microstructure of cognition. MA :MIT
2002. Press, 1986, Vol., 1.
GUALTIERI, J. A., CHETTRI, S., 2000. Support SCHÖLKOPF, B., SMOLA, A., 2002. Learning
vector machines for classification of hypers- with Kernels – Support Vector Machines, Re-
pectral data. IEEE 2000 International, 2000, gularization, Optimization and Beyond. MIT
Vol.2, pp. 813-815. Press Series, 2002.
HASHEM, S., 1997. Optimal Linear Combinations THEODORIDIS, S., KOUTROUMBAS, K., 1999.
of Neural Networks. Neural Networks 10, Pattern Recognition, Academic Press ,1999,
1997, pp. 599-614. pp. 341-342.
HAYKIN, S., 1999. Neural Networks: A Compre- TUCKER, C.J., 1979. Red and photographic infra-
hensive Foundation. Prentice Hall, 1999. red linear combinations for monitoring vegeta-
HUSH, D.R., HORNE, B.G., 1993. Progress in su- tion. Remote, Sens. Environ., 1979, Vol. 8, pp.
pervised neural networks. Signal Processing 127-150.
Magazine, IEEE, 1993, Vol.10, pp. 8-39. VAPNIK, V.N., 1998. Statistical Learning Theory.
KOHAVI, R., JOHN, G.H., 1997. Wrappers for fe- John Wiley & Sons, 1998.
atures subset selection. Int. J. Libr. 1, 1997, pp.
32 Revista de Teledetección. ISSN: 1988-8740. 2008. 30: 23-32