Logo GTA

Classificação de Imagens

11 de setembro de 2024
A classificação de imagens consiste na identificação de determinados elementos nelas presentes, pela associação de cada um de seus pixels a uma determinada classe, de acordo com os padrões de resposta espectral dos elementos presentes na imagem. A comparação é realizada, em geral, entre pelo menos duas bandas do espectro, para que se possa comparar o mesmo pixel por meio de possíveis diferentes respostas.

Esse processo de extração de informação em imagens, serve para reconhecer padrões e objetos homogêneos, sendo utilizado no Sensoriamento Remoto (SR) para mapear áreas da superfície terrestre que correspondem aos temas de interesse. A classificação permite, assim, a criação de imagens virtuais da área para a realização de um posterior cruzamento das informações obtidas, ou mesmo para a elaboração de mapas temáticos.

Essa técnica de manipulação de dados do SR possui vários usos. Pode ser utilizada para identificar áreas diferentes pelo tipo de uso da terra, e esses dados de uso e ocupação da área de interesse são muito utilizados para o planejamento e gestão urbano e ambiental. Já as imagens de alta resolução podem ser utilizadas durante desastres naturais, como inundações, vulcões e secas severas, para observar impactos e danos.

Nesse artigo abordaremos dois principais métodos de classificação: Não Supervisionada e Supervisionada. No método não supervisionado foram elencadas as técnicas Isodata e K-means. Já no método supervisionado destacou-se as técnicas Parallelepiped e Maximum Likelihood.

Classificação não supervisionada

Quando o usuário utiliza algoritmos para reconhecer as classes presentes na imagem, a classificação é dita não supervisionada. Normalmente é realizado com o uso de clusters (nuvens/agrupamentos). Nesse caso o próprio software procurará estabelecer padrões específicos nos pixels que compõem a imagem.

Os agrupamentos são automaticamente identificados pelo software/algoritmo e classificados a partir de comparações espectrais com os demais. O método, portanto, classifica os pixels de forma automática e por meio de uma padronização de sua reflectância. Em termos gerais, esse método é utilizado para atividades em que não se tem acesso à área trabalhada, isto é, não se tem certeza do comportamento dos alvos. Tal situação implica incertezas quanto aos produtos gerados, pois não se tem controle sobre os agrupamentos selecionados.

Ao definir áreas para a classificação não-supervisionada, o usuário não deve se preocupar com a homogeneidade das classes. As áreas escolhidas devem ser heterogêneas para assegurar que todas as possíveis classes e suas variabilidades sejam incluídas.

Técnica IsoData

Um dos métodos mais usados no sensoriamento remoto para esse tipo de classificação é o IsoData, esse algoritmo identifica padrões típicos nos níveis de cinza, esses padrões são classificados efetuando-se visitas de reconhecimento a alguns poucos exemplos escolhidos para determinar sua interpretação. Em razão da técnica usada nesse processo, os padrões são geralmente referidos como “clusters”.

Neste tipo de classificação, as classes são determinadas pela análise de agrupamentos (cluster analysis). Para tanto é necessário que o usuário determine o número de classes, a quantidade de interações, ou seja, de recalculo para os novos valores médios. O usuário ainda pode deixar o algoritmo mais preciso configurando o desvio padrão, o erro de distância mínima e outros parâmetros. Esse algoritmo é muito sensível a esses parâmetros, podendo gerar classificações muito diferentes quando são feitos variados testes para um mesmo conjunto de dados.

Técnica K-means

O K-Média é um algoritmo para partição de um conjunto de elementos em determinado número de agrupamentos (clustering) K, utilizando o método dos mínimos quadrados e o ajustamento das médias (média móvel) no decorrer dos processos de interações. O uso de um software para realizar esta operação se estrutura apenas na simples implementação de um algoritmo que se baseia nos mínimos quadrados.

No decorrer das interações, o programa tenta minimizar a soma dos resíduos do processo dos mínimos quadrados, sobre todos os grupos e dentro de cada grupo isoladamente em relação à distância de cada objeto para o respectivo centróide de seu grupo. Os agrupamentos obtidos são geometricamente os mais compactos possíveis, considerando seus respectivos centróides. Assim, o objetivo do K-Média é dividir conjuntos de elementos em K classes, da forma mais simples possível.

Classificação supervisionada

Esse método diz respeito à capacidade interpretativa do técnico. Assim, uma imagem será classificada com base em determinados parâmetros definidos pelo profissional que, necessariamente, deverá ter conhecimento das características da área de trabalho. Para a classificação supervisionada deve-se escolher as áreas ou polígonos representativos e de treinamento na imagem, vetorizados sob a forma de polígonos que definem elementos notáveis. Isso servirá como base para a padronização dos elementos de cada classe. Essas áreas de treinamento, chamadas de Regiões de Interesse – ROIs, devem conter uma quantidade suficiente de pixels, cuja reflectância representa uma feição previamente determinada.

Resumidamente, a classificação supervisionada exige que se determinem as classes que serão usadas para a classificação. Esse procedimento se resume em definir padrões na imagem ainda não classificada, que servirão de amostragem para as classes.

Técnica Parallelepiped

Essa técnica trabalha com uma área quadrada representativa, definida pelo menor e pelo maior valor de pixels contidos em um agrupamento pré-escolhido. Esses pixels, definidos por um polígono qualquer representarão uma determinada classe presente em uma imagem. Os elementos contidos dentro do quadrado ou paralelepípedo que envolve o polígono representativo definirão a classe final correspondente a todos os pixels semelhantes da imagem.

A desvantagem do uso desse tipo de classificador diz respeito à existência de pixels de classes desconhecidas fora do quadrado envolvente, que poderão ser classificados com a mesma classe do polígono representativo. E sua principal vantagem é a velocidade de processamento.

Técnica Maximum Likelihood

A classificação Maximum Likelihood ou Máxima Verossimilhança (MAXVER) considera a ponderação das distâncias entre as médias dos níveis de cinza das mesmas, utilizando parâmetros estatísticos. Essas estatísticas de treinamento servem para calcular a probabilidade de um pixel pertencer a um determinado padrão, e examina o resultado em relação a cada pixel para todas as classes definidas, atribuindo o pixel à classe com a maior hipótese de enquadramento.

Como a Parallelepiped, essa técnica baseia-se na escolha de áreas que possam ser representativas de determinadas feições conhecidas. Nessa técnica são utilizadas a média e a covariância dos pixels amostrados, sendo calculada a probabilidade de um pixel pertencer a essas amostras. Em se tratando de uma amostragem probabilística é importante um número elevado de “pixels”, para conjunto de treinamento, pois assim o resultado será mais preciso.

A classificação MAXVER (Maximum Likelihood) pixel-a-pixel detecta melhor as classes de vegetação e de água, porém há grande confusão entre as classes que apresentam comportamento espectral semelhantes: sombra de nuvem/nuvem e solo exposto; pavimentação e concreto, por exemplo.
Share by: