Distância de Minkowski: um Guia Compreensivo

Tutoriais

Python

As métricas de distância formam a base de muitos algoritmos na ciência dos dados e no aprendizado de máquina, permitindo a medição da similaridade ou dissimilaridade entre pontos de dados. Neste guia, exploraremos os fundamentos da distância de Minkowski, suas propriedades matemáticas e suas implementações. Examinaremos como ela se relaciona com outras medidas de distância comuns e demonstraremos sua utilização através de exemplos de código em Python e R.

Se você estiver desenvolvendo algoritmos de aglomerado, trabalhando em detecção de anomalias ou afinando modelos de classificação, entender a distância de Minkowski pode melhorar seu enfoque em análise de dados e desenvolvimento de modelos. Vamos dar uma olhada.

O que é a Distância de Minkowski?

A distância de Minkowski é uma métrica versátil usada em espaços vetoriais normados, nomeada em homenagem ao matemático alemão Hermann Minkowski. É uma generalização de várias medidas de distância bem conhecidas, tornando-a um conceito fundamental em várias áreas, como matemática, ciência computacional e análise de dados.

Na sua essência, a distância de Minkowski fornece uma maneira de medir a distância entre dois pontos em um espaço multi-dimensional. O que a torna particularmente útil é sua capacidade de abranger outras medidas de distância como casos especiais, principalmente através de um parâmetro p. Este parâmetro permite que a distância de Minkowski se adapte a diferentes espaços de problemas e características de dados. A fórmula geral para a distância de Minkowski é:

Onde:

x e y são dois pontos em um espaço n-dimensional
p é um parâmetro que determina o tipo de distância (p ≥ 1)
|xi - yi| representa a diferença absoluta entre as coordenadas de x e y em cada dimensão

A distância de Minkowski é útil por duas razões principais. Uma delas é que dá flexibilidade para alternar entre distância de Manhattan ou Euclidiana conforme necessário. Em segundo lugar, reconhece que nem todos os conjuntos de dados (pense em espaços de alta dimensão) são bem-sucedidos com distância de Manhattan ou Euclidiana puras.

Na prática, o parâmetro p é normalmente escolhido incorporando um workflow de treinamento/validação. Testando diferentes valores de p durante a validação cruzada, você pode determinar qual valor fornece o melhor desempenho do modelo para seu conjunto de dados específico.

Como a Distância de Minkowski Funciona

Vamos olhar como a distância de Minkowski se relaciona com outras fórmulas de distância e depois passar por um exemplo.

Generalização de outros métricos de distância

A primeira coisa a considerar é como a fórmula de distância de Minkowski contém dentro dela as fórmulas para distância de Manhattan, Euclidiana e Chebyshev.

Distância de Manhattan (p = 1):

Quando p é definido como 1, a distância de Minkowski se torna a distância de Manhattan.

Também conhecida como distância de bloco de cidade ou norma L1, Distância de Manhattan mede a soma de diferenças absolutas.

Distância Euclidiana (p = 2):

Quando p é definido como 2, a distância de Minkowski se torna a distância Euclidiana.

Distância euclidiana é a métrica de distância mais comum, representando a distância reta entre dois pontos.

Distância de Chebyshev (p → ∞):

Distância de Chebyshev, também conhecida como distância de tabuleiro de xadrez, mensura a diferença máxima em qualquer dimensão.

Trabalhando the um exemplo

Para realmente entender a funcionalidade e o poder da distância de Minkowski, vamos trabalhar em um exemplo. Esta exploração nos ajudará a entender como o parâmetro p afeta a calculadora e a interpretação de distâncias em espaços multi-dimensionais.

Consideremos dois pontos em um espaço 2D:

Ponto A: (2, 3)
Ponto B: (5, 7)

Vamos calcular a distância de Minkowski entre estes pontos para diferentes valores de p.

O parâmetro p na fórmula de distância de Minkowski controla a sensibilidade da métrica a diferenças em componentes individuais:

Quando p=1: Todas as diferenças contribuem linearmente.
Quando p=2: As diferenças maiores têm um impacto mais significativo devido à quadratura.
Quando p>2: Ainda mais ênfase é colocada em diferenças maiores.
Quando p→∞: Apenas a diferença máxima entre todas as dimensões interessa.

Ao aumentar o p, a distância de Minkowski normalmente decresce, aproximando-se da distância de Chebyshev. Isto ocorre porque valores superiores de p dão mais peso à maior diferença e menos às diferenças menores.

Para visualizar como valores diferentes de p afetam a calculação de distância entre nossos pontos A(2, 3) e B(5, 7), vamos examinar o seguinte gráfico:

Observando o gráfico, podemos ver como a medida de distância muda à medida que p aumenta:

A distância de Manhattan (p=1), representada pela cor verde, dá a maior caminhada, já que segue estritamente a grade.
A distância de Euclides (p=2), mostrada pela linha curta laranja, oferece uma linha direta e reta.
A distância de Chebyshev (p=∞), representada pelas linhas pontilhadas vermelhas, se concentra apenas na maior diferença de coordenada, criando um caminho que se move maximamente em uma dimensão antes de abordar a outra.
A distância de Minkowski com p=3, em roxo, mostra uma leve curva, sugerindo a transição entre distâncias de Euclides e Chebyshev.

Essa visualização nos ajuda a entender por que valores diferentes de p podem ser escolhidos para várias aplicações. Por exemplo, a distância de Manhattan poderia ser mais apropriada em problemas de navegação na cidade, enquanto a distância de Euclides é frequentemente usada em cálculos de espaço físico. Valores superiores de p, como no caso de Minkowski p=3, podem ser úteis em situações onde as diferenças maiores devem ser destacadas, e a distância de Chebyshev poderia ser preferida quando a diferença máxima em qualquer dimensão é o fator mais crítico.

Aplicações da Distância de Minkowski

A distância de Minkowski, com seu parâmetro ajustável p, é uma ferramenta flexível usada em vários campos. Alterando p, podemos personalizar como medimos a distância entre pontos, tornando-a adequada para diferentes tarefas. A seguir, descrevem-se quatro aplicações onde a distância de Minkowski desempenha um papel importante.

Aprendizado de máquina e ciência dos dados

No aprendizado de máquina e ciência dos dados, a distância de Minkowski é fundamental para algoritmos que dependem de medir a similaridade ou dissimilaridade entre pontos de dados. Um exemplo proeminente é o algoritmo k-Nearest Neighbors (k-NN), que classifica pontos de dados com base nas categorias das suas vizinhas mais próximas. Utilizando a distância de Minkowski, podemos ajustar o parâmetro p para alterar como calculamos a “proximidade” entre pontos.

Reconhecimento de padrões

O reconhecimento de padrões envolve a identificação de padrões e regularidades em dados, como o reconhecimento de escrita manual ou detecção de features faciais. Neste contexto, a distância de Minkowski mide a diferença entre vetores de features que representam padrões. Por exemplo, no reconhecimento de imagens, cada imagem pode ser representada por um vetor de valores de pixels. Calcular a distância de Minkowski entre estes vetores permite quantificar em que grau as imagens são similares ou diferentes.

Ao ajustar p, podemos controlar a sensibilidade da medição de distância para diferenças em características específicas. Um p mais baixo pode considerar diferenças globais entre todos os pixels, enquanto um p maior poderia enfatizar diferenças significativas em certas regiões da imagem.

Detecção de anomalias

A detecção de anomalias visa identificar pontos de dados que se desviarem significativamente do restante, o que é crítico em áreas como detecção de fraude, segurança da rede e detecção de falhas em sistemas. A distância de Minkowski é usada para medir quanto um ponto de dados se afasta de outros no conjunto de dados. Pontos com grandes distâncias são potenciais anomalias. Ao escolher um p apropriado, os analistas podem melhorar a sensibilidade dos sistemas de detecção de anomalias para os tipos de desvios que são mais relevantes ao seu contexto específico.

Geometria computacional e análise espacial

Na geometria computacional e análise espacial, a distância de Minkowski é usada para calcular distâncias entre pontos no espaço, que é a base para muitos algoritmos geométricos. Por exemplo, a detecção de colisões nesses domínios depende da distância de Minkowski para determinar quando objetos estão próximos o suficiente para interagir. Ao ajustar p, os desenvolvedores podem criar diversas fronteiras de colisão, variavel de de angular (um valor menor p) a redondeado (um valor maior p).

Além da detecção de colisões, a distância de Minkowski pode ser útil em aglomerados espaciais e análise de formas. Ao variar o valor de p, os pesquisadores podem enfatizar diferentes aspectos das relações espaciais, de distâncias entre quadras em cidades a semelhanças de formas globais.

Propriedades Matemáticas da Distância de Minkowski

A distância de Minkowski não é apenas uma ferramenta versátil em aplicações práticas, mas também um conceito importante na teoria matemática, particularmente no estudo de espaços métricos e normas.

Propriedades do espaço métrico

A distância de Minkowski satisfaz as quatro propriedades essenciais exigidas para uma função seja considerada uma métrica em um espaço métrico:

Não-negatividade: A distância de Minkowski entre qualquer dois pontos é sempre não-negativa, d(x,y)≥0. Este é evidente, pois é a raiz p-ésima de uma soma de termos não-negativos (valores absolutos elevados à potência p).
Identidade dos Indiscerníveis: A distância de Minkowski entre dois pontos é zero se e somente se os dois pontos forem idênticos. Matematicamente, d(x,y) = 0 se e somente se x=y. Isto segue porque a diferença absoluta entre componentes idênticos é zero.
Simetria: A distância de Minkowski é simétrica, significando que d(x,y)=d(y,x). Esta propriedade se mantém porque a ordem de subtração nos termos de valor absoluto não afeta o resultado.
Inércia de Triângulo: A distância de Minkowski satisfaz a inércia de triângulo, que afirma que para qualquer três pontos x, y e z, a distância de x até z é, no máximo, a soma da distância de x até y e de y até z; formalmente, d(x,z)≤d(x,y)+d(y,z). Esta propriedade é menos intuitiva para provar diretamente a partir da fórmula e normalmente requer matemática mais avançada, mas essencialmente garante que percorrer uma rota direta entre dois pontos é o caminho mais curto.

Generalização de Norma

A distância de Minkowski funciona como um framework geral que unifica várias formas de medir distâncias em espaços matemáticos através do conceito de normas. Em termos simples, uma norma é uma função que atribui uma medida de comprimento ou tamanho não negativa a um vetor em um espaço vetorial, essencialmente medição de quão “longo” o vetor é. Ao ajustar o parâmetro p na fórmula da distância de Minkowski, podemos transitar suavemente entre diferentes normas, cada uma fornecendo um método único para calcular o tamanho de um vetor.

Por exemplo, quando p=1, a distância de Minkowski torna-se a norma de Manhattan, medindo a distância como a soma das diferenças absolutas alongadas em cada dimensão — imagine navegar num grid de ruas da cidade. Com p=2, ela transforma-se na norma de Euclides, calculando a distância reta (“como voa o pássaro”) entre pontos. Enquanto p se aproxima do infinito, ela se aproxima da norma de Chebyshev, onde a distância é determinada pela maior diferença simples entre dimensões. Esta flexibilidade permite que a distância de Minkowski se adapte a vários contextos matemáticos e práticos, tornando-a uma ferramenta versátil para medir distâncias em diferentes cenários.

Calcular a Distância de Minkowski em Python e R

Vamos explorar implementações de cálculos de distância de Minkowski em Python e R. Vamos examinar pacotes e bibliotecas disponíveis prontamente que conseguem isso.

Exemplo em Python

Para calcular a distância de Minkowski em Python, podemos usar a biblioteca SciPy, que fornece implementações eficientes de várias métricas de distância. Aqui está um exemplo que calcula a distância de Minkowski para diferentes valores de p:

import numpy as np
from scipy.spatial import distance

# Ponto de exemplo
point_a = [2, 3]
point_b = [5, 7]

# Diferentes valores de p
p_values = [1, 2, 3, 10, np.inf]
print("Minkowski distances using SciPy:")

for p in p_values:
	if np.isinf(p):
	    # Para p = infinito, use a distância de Chebyshev
	    dist = distance.chebyshev(point_a, point_b)
	    print(f"p = ∞, Distance = {dist:.2f}")
	else:
	        dist = distance.minkowski(point_a, point_b, p)
	        print(f"p = {p}, Distance = {dist:.2f}")

Ao executar este código, os leitores podem observar como a distância muda com diferentes valores de p, reforçando os conceitos discutidos anteriormente no artigo.

Minkowski distances using SciPy:
p = 1, Distance = 7.00
p = 2, Distance = 5.00
p = 3, Distance = 4.50
p = 10, Distance = 4.02
p = ∞, Distance = 4.00

Este código demonstra:

Como usar as funções de distância de SciPy para distâncias de Minkowski e Chebyshev.
Calculação de distâncias para vários valores de p, incluindo o infinito.
A relação entre a distância de Minkowski e outras metricas (Manhattan, Euclidiana, Chebyshev).

Exemplo em R

Para R, utilizaremos a função dist() da biblioteca stats:

# Defina a função de distância de Minkowski usando stats::dist

minkowski_distance <- function(x, y, p) {
  points <- rbind(x, y)
  if (is.infinite(p)) {
    # Para p = Inf, use o método = "maximum" para a distância de Chebyshev
    distance <- stats::dist(points, method = "maximum")
  } else {
    distance <- stats::dist(points, method = "minkowski", p = p)
  }
  return(as.numeric(distance))
}

# Exemplo de uso
point_a <- c(2, 3)
point_b <- c(5, 7)

# Valores de p diferentes
p_values <- c(1, 2, 3, 10, Inf)
cat("Minkowski distances between points A and B using stats::dist:\n")

for (p in p_values) {
  distance <- minkowski_distance(point_a, point_b, p)
  if (is.infinite(p)) {
    cat(sprintf("p = ∞, Distance = %.2f\n", distance))
  } else {
    cat(sprintf("p = %g, Distance = %.2f\n", p, distance))
  }
}

Este código demonstra:

Como criar uma função minkowski_distance usando a função dist() do stats.
Manuseio de diferentes valores de p, incluindo o infinito para a distância de Chebyshev.
Calculo da distância de Minkowski para diferentes valores de p.
Formatação do resultado para exibição das distâncias arredondadas para 2 casas decimais.

A saída deste código será:

Minkowski distances between points A and B using stats::dist:
p = 1, Distance = 7.00
p = 2, Distance = 5.00
p = 3, Distance = 4.50
p = 10, Distance = 4.02
p = ∞, Distance = 4.00

Este exemplo R fornece um contraponto ao exemplo Python, permitindo que leitores vejam como a distância de Minkowski pode ser calculada em diferentes ambientes de programação.

Conclusão

A distância de Minkowski fornece uma abordagem flexível e adaptável para medir distâncias em espaços multi-dimensionais. Sua capacidade de generalizar outras medidas de distância comuns através do parâmetro p torna-o uma ferramenta valiosa em diversos campos da ciência de dados e aprendizado de máquina. Ao ajustar p, profissionais podem personalizar suas medições de distância às características específicas de seus dados e às exigências de seus projetos, potencialmente melhorando os resultados em tarefas que vão de aglomerar até detecção de anomalias.

Ao aplicar a distância de Minkowski em seu trabalho, encorajamos você a experimentar diferentes valores de p e observar seu impacto nos seus resultados. Para aqueles que procuram profundizar seu entendimento e habilidades, recomendamos explorar o curso Criação de Fluxos de Trabalho de Aprendizado de Máquina em Python e considerar nosso programa de certificação de Cientista de Dados. Esses recursos ajudarão você a construir sobre seu conhecimento de medidas de distância e a aplicá-las eficazmente em vários cenários.

Source:
https://www.datacamp.com/tutorial/minkowski-distance