مسافة مينكوفسكي: دليل شامل

Python

تشكيل المعادن البعدية تشكيل الأساس للعديد من الخوارزميات في العلوم البيانية والتعلم الآلي، مما يسمح لكي تقيس التشابه أو عدم التشابه بين نقاط البيانات. سوف نستكشف في هذه الدراسة الأساسيات مسافة مينكوفski، خصائصها الرياضية، وتطبيقاته. سننظر إلى كيف يتصل بمقارنات بالمعادن الأخرى الشائعة وسنبرز استخدامه من خلال أمثلة برمجية في Python و R.

سواء كنت تطور خوارزميات التقسيم، أو تعمل على الكشف عن الاستثناء، أو تنظيم نماذج التصنيف، ففهم مسافة مينكوفski يمكن أن يحسن منهجك للتحليل البياني وتطوير النماذج. دعونا ننظر إلى هذا.

ما هو مسافة مينكوفski؟

المسافة المينكوفسكية هي مقياس متنوع يستخدم في الفراغات النمطية المقياسية، وهو مُسمى بعدما توفي الرشيد الألماني هيرمان مينكوفسكي. إنها تعرف بعض مقاييس المسافة الشهيرة، مما يجعلها مبدأ أساسي في مجالات مختلفة مثل الرياضيات، والعلوم الحاسوبية، وتحليل البيانات.

في قلبها، توفير المسافة المينكوفسكية طريقة لقياس المسافة بين نقطتين في مساحة متعددة الأبعاد. ما يجعلها مفيدة بشكل خاص هو قدرتها على تضمين مقاييس أخرى كحالات خاصة من خلال ما يسمى بالمادة p. يتيح هذا الماد القيمة تأسيس المسافة المينكوفسكية للتكيف بالمجالات المختلفة وخصائص البيانات. ال公式ة العامة لمسافة المينكوفسكية هي:

حيث:

x و y هما نقاطا في مساحة متعددة الأبعاد n
p مادة تحدد نوع المسافة (p ≥ 1)
|xi - yi| تمثل الاختلاف المدني بين موارد x و y في كل محور

تعتبر مسافة Minkowski مفيدة لسببين رئيسيين. أولاً، تمنحك المرونة للتبديل بين مسافة Manhattan أو Euclidean حسب الحاجة. ثانيًا، تعترف بأنه ليس كل مجموعات البيانات (فكر في الفضاءات عالية الأبعاد) مناسبة تمامًا إما لمسافة Manhattan البحتة أو لمسافة Euclidean البحتة.

في الممارسة العملية، يتم عادة اختيار المعامل p من خلال دمج سير عمل التحقق من الصحة للتدريب/الاختبار. من خلال اختبار قيم مختلفة لـ p أثناء التحقق المتقاطع، يمكنك تحديد أي قيمة توفر أفضل أداء للنموذج لمجموعة البيانات الخاصة بك.

كيف تعمل مسافة Minkowski

دعنا نلقي نظرة على كيفية ارتباط مسافة Minkowski بصيغ المسافة الأخرى، ثم نمر عبر مثال.

تعميم لمقاييس المسافة الأخرى

أول شيء يجب مراعاته هو كيف تحتوي صيغة مسافة Minkowski بداخلها على صيغ مسافة Manhattan و Euclidean و Chebyshev.

مسافة Manhattan (p = 1):

عندما يتم تعيين p إلى 1، تصبح مسافة Minkowski مسافة Manhattan.

المعروفة أيضًا باسم مسافة كتلة المدينة أو معيار L1، تقيس مسافة Manhattan مجموع الفروق المطلقة.

مسافة Euclidean (p = 2):

عندما يتم تعيين p إلى 2، تصبح مسافة Minkowski مسافة Euclidean.

المسافة الأوكلادية هي أقوى وظيفة للمعايير المسافية، وتمثل المسافة الخط ال rectilinear بين نقطتين.

المسافة التشيبيشيف (p → ∞):

المسافة التشيبيشيف، وتدعى أيضًا مسافة اللوحة الشطرنجية، تقيس الاختلاف الأقصي على أي قطعة.

المشاركة في مثال

للتأمين الكامل لقدرات وقوة المسافة المينكوفski، دعونا نعمل على مثال. هذه التنقيبة ستساعدنا في فهم كيفية تأثير المادة p على حساب المسافات وتفسيرها في الأماكن المتعددة الأبعاد.

دعونا ننظر إلى نقطتان في مكان ثنائي الأبعاد:

النقطة A: (2, 3)
النقطة B: (5, 7)

سنحسب المسافة المينكوفski بين هذه النقاط لقيم ال p المختلفة.

المادة p في 公式 المسافة المينكوفski ت control حساسية المعيار للاختلافات في عناصر الوحدات:

عندما يكون p=1: جميع الاختلافات تساهم بشكل خطي.
عندما يكون p=2: تلوث الاختلافات الكبير يمثل تأثير أكبر بسبب التمويز.
عندما يكون p>2: يتم تأخير إعتماد أكثر على الاختلافات الكبيرة.
عندما يكون p→∞: يحدد الاختلاف الأقصي بين جميع الأبعاد المهم.

مع زيادة p، يتناقص عادةً مسافة مينكوسكي، مقتربًا من مسافة تشيبيشيف. ويرجع ذلك إلى أن قيم p الأعلى تعطي وزنًا أكبر لأكبر فرق وتقلل من الوزن للاختلافات الأصغر.

لتصور كيف تؤثر قيم p المختلفة على حساب المسافة بين نقطتي A(2, 3) و B(5, 7)، دعونا نفحص الرسم البياني التالي:

من خلال مراقبة الرسم البياني، يمكننا أن نرى كيف تتغير قياس المسافة مع زيادة p:

تقدم مسافة مانهاتن (p=1)، الممثلة بالمسار الأخضر، أطول مسار، حيث تتبع بدقة الشبكة.
بينما تقدم المسافة الإقليدية (p=2)، الموضحة بخط مستقيم برتقالي، مسارًا مباشرًا ومستقيمًا.
تركز مسافة تشيبيشيف (p=∞)، المصورة بخطوط حمراء منقطة، فقط على أكبر فرق في الإحداثيات، مما يخلق مسارًا يتحرك بشكل أقصى في بُعد واحد قبل معالجة الآخر.
تظهر مسافة مينكوسكي مع p=3 باللون الأرجواني انحناءة طفيفة، مما يشير إلى الانتقال بين المسافات الإقليدية وتشيبيشيف.

تساعدنا هذه التصورات على فهم سبب اختيار قيم p المختلفة لتطبيقات متنوعة. على سبيل المثال، قد تكون مسافة مانهاتن أكثر ملاءمة في مشاكل التنقل في المدينة، بينما تُستخدم المسافة الإقليدية غالبًا في حسابات الفضاء الفيزيائي. يمكن أن تكون قيم p الأعلى، مثل حالة مينكوسكي p=3، مفيدة في السيناريوهات التي يجب فيها التأكيد على الاختلافات الأكبر، وقد تكون مسافة تشيبيشيف مفضلة عندما يكون أكبر اختلاف في أي بُعد هو العامل الأكثر أهمية.

تطبيقات مسافة مينكوسكي

المسافة المينكوفסكية، مع خاصيتها القابلة للتعديل p، هي أداة مرنة تستخدم في مجالات متعددة. عند تغيير p، يمكننا تخصيص كيفية قياس المسافة بين النقاط، مما يجعلها مناسبة للمهام المختلفة. أدنا أربع تطبيقات حيث يلعب دور مهم مسافة المينكوفسكي.

التعلم الآلي والعلم البياني

في التعلم الآلي والعلم البياني، تبدو مسافة المينكوفسكية أساسية للخوارزميات التي تعتمد على قياس التشابه أو الاختلاف بين النقاط البيانية. مثال برجيء هو خوارزمية الجيران القريبين (k-NN)، التي تصنف النقاط البيانية وفقاً لتصنيفات أقرب الجيران. باستخدام مسافة المينكوفسكية، يمكننا تغيير ما يسمى p لتغيير كيفية حساب “القرب” بين النقاط.

التكيف الأنماطي

التكيف الأنماطي يتضمن identifying patterns and regularities in data, such as handwriting recognition or facial feature detection. In this context, Minkowski distance measures the difference between feature vectors representing patterns. For example, in image recognition, each image can be represented by a vector of pixel values. Calculating the Minkowski distance between these vectors allows us to quantify how similar or different the images are.

بعملية تنظيم p، يمكننا تحكم في حساسية مقياس المسافة بشأن الاختلافات في الميزات الخاصة. ستلمس معدل p منخفض على الاختلافات العامة عبر جميع البكسلات، بينما قد يؤكد معدل p عالٍ على الاختلافات المهمة في مناطق معينة من الصورة.

الكشف عن الانواع الخاطئة

يهدف الكشف عن الانواع الخاطئة إلى تحديد النقاط التي تختلف بشكل كبير عن الأغلبية، وهذا الأمر مهم في مجالات مثل الكشف عن الاحتيال، والأمن التليفزيوني، والكشف عن الخلل في الأنظمة. يستخدم مسافة مينكوفski لقياس مدى بعيدة نقطة البيانات عن الأخرين في المعلومات. تعتبر النقاط ذات المسافات الكبيرة محتملة أن تكون أنواع خاطئة.باختيار p مناسب، يمكن للمحليلون تحسين حساسية أنظمة الكشف عن الانواع الخاطئة بالاختلافات التي تهم من الأختلافات الخاصة بالcontext الخاص بهم.

الجمعيات الحوسية والتحليل المكاني.

في جهازية الهندسة العلمية وتحليل المساحة، يستخدم المسافة المينكوفski لحساب مسافات بين نقاط في المساحة، وهي أساس لعدة خوارزميات جيوميترية. على سبيل المثال، كشف تصادم في هذه المجالات يعتمد على المسافة المينكوفski لتحديد ما إذا كانت الأجسام بمسافة كافية للتفاعل. من خلال تنظيم p، يمكن للمطورين إنشاء حواف تصادم متنوعة، من الزاوية (أقل p) إلى المنحنية (أعلى p).

خارج كشف تصادم، يمكن أيضًا أن يكون المسافة المينكوفski مفيدة في التجميع المساحي وتحليل الأشكال. تغير قيمة pيسمح للباحثين بالتأكيد عن جوانب مختلفة من العلاقات المساحية، من مسافة المربعات الحضرية إلى تشابهات الأشكال العامة.

خصائص رياضية لمسافة المينكوفski

المسافة المينكوفski ليس فقط أداة متنوعة في التطبيقات العامة وحدها بل هي مبدأ هام في التئوريات الرياضية بالخصوص في دراسة المساحات المقياسية والمعايير.

خصائص المساحة المقياسية

تساوي المسافة المينكوفski الأربع خصائص أساسية المطلوبة للوظيفة لتكون معيارًا في مساحة مقياسية:

لا سيماً: يكون مسافة مينكوفski بين أي مركزين دوماً غير سلبية، d(x,y)≥0. وهذا واضح لأنه رقم p-ية جذر مجموعة من الأجزاء السلبية المبنية على المجموعات المنعزلة (تحديداً القيم المبنية على المجموع).
توافق المختلف: تكون مسافة مينكوفski بين نقطتين صفرة إذا وفقاً لوحدتهما. من الرياضيات، d(x,y) = 0 إذا وفقاً لوحدتهما. ويتبع هذا لأن مختلف المكونات المتشابهة هي صفر.
التماثل: تكون مسافة مينكوفski تماثلية، ما يعني d(x,y)=d(y,x). يمتلك هذه الخصائص لأن ترتيب خسارة القيم المبنية على المجموع لا يؤثر على النتيجة.
توازن المثلث: ي满意ز المسافة المينكوفski توازن المثلث ، الذي يقول أنه لأي ثلاثة نقاط x و y و z ، عندما يكون مسافة من x إلى z أقل أو يساوي ما يكون مسافة من x إلى y ومن y إلى z معاً ؛ بشكل رسمي ، d(x,z)≤d(x,y)+d(y,z). تلك الخصائص أقل واقعية للإثبات مباشرة من رياضيات الجملة وعادةً تتطلب رياضيات أكثر تقنية ولكن بالأساس يضمن أن تختار المسار المباشر بين جميع النقاط المتواجدين هو المسافة القصيرة الأقصية.

تعريف النورم

يؤدي المسافة المينكوفski إلى إطار عام يوحد طرق مختلفة لقياس المسافات في الأماكن الرياضية من خلال مفهوم الأحكام. بمعنى بسيط، تمثل الأحكام وظيفة تتخذ عدد لا أعمال لمقدار أو حجم لعبارة في مكان أعمال الأوتار، وتقيس بشكل أساسي كيف “طويل” العبارة. من خلال تغيير ما يسمى المادة p في وصف المسافة المينكوفski، يمكننا بطءًا وأسلوبًا أن ننتقل بين الأحكام المختلفة، كل منها يوفر طريقة فريدة لحساب أطوال الأوتار.

على سبيل المثال، عندما يكون p=1 يصبح مسافة مينكوفski القاعدة المانهاتن، حيث يقيس المسافة بمجموع الاختلافات المدارية لكل مستوى — تخيل تنقلك في أحجام من الشوارع الموازية. وعندما يكون p=2 يتحول الىالقاعدة الأوكلادية، حيث يحاسب المسافة الخط المستقيمة (“كما تحلق الغراب”) بين النقاط. وكلما تقرب p من الألف، يتم توافر المسافة إلىالقاعدة التشيبيشيوفية، حيث يمكن تحديد المسافة بأكبر اختلاف واحد في الأبعاد. هذه المرونة تسمح لمسافة مينكوفski بتكيفها مع وسائل 数学 المختلفة والسياسية، مما يجعلها أداة متنوعة لقياس المسافات في مختلف الأحيان.

حساب المسافة المينكوفski في Python و R

دعونا نبحث عن تطبيقات حساب المسافة المينكوفski باستخدام Python و R. سننظر في معاملات ومجموعات متاحة بسهولة التي يمكن إنجاز هذا الأمر.

مثال ل Python

لحساب المسافة المينكوفski في Python، يمكننا استخدام مكتب SciPy، وهو يقدم تطبيقات فعالة للمعاملات المختلفة للمسافات المناظر. هذا مثال يحسب المسافة المينكوفski لمقارنة القيم المختلفة ل p:

import numpy as np
from scipy.spatial import distance

# نقاط المثال
point_a = [2, 3]
point_b = [5, 7]

# قيم المختلفة ل p
p_values = [1, 2, 3, 10, np.inf]
print("Minkowski distances using SciPy:")

for p in p_values:
	if np.isinf(p):
	    # للمسافة p = للأبعاد الأعلى، يستخدم المسافة التيبيشيفيف
	    dist = distance.chebyshev(point_a, point_b)
	    print(f"p = ∞, Distance = {dist:.2f}")
	else:
	        dist = distance.minkowski(point_a, point_b, p)
	        print(f"p = {p}, Distance = {dist:.2f}")

بتنفيذ هذا الشيء، يمكن للقراء أن يراقبوا كيف تتغير المسافة مع مختلف قيم p، مما يؤكد على المبادئ التي تم دراستها مسبقاً في المقالة.

Minkowski distances using SciPy:
p = 1, Distance = 7.00
p = 2, Distance = 5.00
p = 3, Distance = 4.50
p = 10, Distance = 4.02
p = ∞, Distance = 4.00

يظهر هذا الكود:

كيف إستخدام وظائف المسافة في SciPy للمسافات المنكوسيوية والمسافة الشيبيشيفية.
حساب المسافات للأقيام المختلفة p بشكل شامل، بما في ذلك النهاية الناهية.
العلاقة بين المسافة المنكوسيوية والمعادلات الأخرى (مانهاتن، إuclidيان، شيبيشيفي).

مثال لـ R

لـ R، سنستخدم وظيفة dist() من المكتبة stats:

# تعريف وظيفة مسافة المنكوسيوية بواسطة stats::dist

minkowski_distance <- function(x, y, p) {
  points <- rbind(x, y)
  if (is.infinite(p)) {
    # للمسافة الشيبيشيفية عند p = نهاية، استخدم طريقة = "أقصى قدر" للمسافة الشيبيشيفية
    distance <- stats::dist(points, method = "maximum")
  } else {
    distance <- stats::dist(points, method = "minkowski", p = p)
  }
  return(as.numeric(distance))
}

# إستخدام مثالي
point_a <- c(2, 3)
point_b <- c(5, 7)

# قيم مختلفة لـ p
p_values <- c(1, 2, 3, 10, Inf)
cat("Minkowski distances between points A and B using stats::dist:\n")

for (p in p_values) {
  distance <- minkowski_distance(point_a, point_b, p)
  if (is.infinite(p)) {
    cat(sprintf("p = ∞, Distance = %.2f\n", distance))
  } else {
    cat(sprintf("p = %g, Distance = %.2f\n", p, distance))
  }
}

هذا الشيء يبين:

كيف تخلق وظيفة minkowski_distance باستخدام ما يلي dist() من المجموعة stats.
معالجة مختلف قيم الp، بما في ذلك النتيجة اللانهائية لمسافة Chebyshev.
حساب مسافة Minkowski لمجموعة من القيم الp المختلفة.
تنسيق الخروج لعرض المسافات المحددة إلى مقدارين عشر بعد المئة.

ستكون نتيجة هذا الشيء التالية:

Minkowski distances between points A and B using stats::dist:
p = 1, Distance = 7.00
p = 2, Distance = 5.00
p = 3, Distance = 4.50
p = 10, Distance = 4.02
p = ∞, Distance = 4.00

هذا التمثيل الR يوفر معادي للمثال البينة، مما يسمح للقارئين برؤية كيفية حساب مسافة Minkowski في بيئات البرمجة المختلفة.

ختام

توفر مسافة مينكوف斯基 طريقة مرنة وقابلة للتكيف لقياس المسافات في أماكن متعددة الأبعاد. قدرتها على تعميم معايير المسافة الشائعة من خلال ما يسمى بالمادة p جعلته أداة قيمة للمجالات المختلفة في العلوم الدارات والتعلم الآلي. بتغيير p، يمكن للممارسين تخصيص حسابات مسافاتهم لتناظر البيانات الخاصة بهم والتطبيقات الخاصة بمشاريعهم، مما قد يحسن نتائجهم في مهام تتراوح من التجميع إلى إكتشاف الاستثناء.

وأثناء تطبيق مسافة مينكوف斯基 في عملك، نحن نشجبك أن تجرب معايير p مختلفة وتراقب تأثيرها على نتائجك. لمن يرغب في تعميم فهمه ومهاراته، نوصي باستكشاف دورة التدريب تصميم خطوط العمل للتعلم الآلي في برنامج Python والنظر إلى program المهني شهادة الخبير البياني التي يمكن أن تساعدك في بناء معرفتك الحالية بشكل أكبر للمعايير البعيدة وتطبيقها بشكل فعال في أماكن مختلفة.

Source:
https://www.datacamp.com/tutorial/minkowski-distance