MariaDB Vector Edition: مصمم للعبات الذهبية

وهو مختص بتخطيط الحلول وله خبرة تتجاوز عشرين عامًا في الأنظمة ال关系ية البياناتية، بدأت مؤخرًا في استكشاف نسخة الـ MariaDB الجديدة والتي تحتوي على الوسيلة الجديدة لرؤية إذا كانت قادرة على معالجة بعض تحديات البيانات التي نواجهها الآن. وكان النظر السريع مقنعًا بشكل كبير، وخاصة مع كيفية جلبها السحر التعلمي الى مجال القاعدة البياناتية العادية. ومع ذلك، أردت إختبارها بحالة سهلة لرؤية كيف تؤدي فعلًا.

في هذا المقال، سأشارك خبرتي التجريبية وملاحظاتي حول قدرات MariaDB التوافر المبادئ الخط المتوسطبواسطة تنفيذ حالة سهلة. بالتحديد، سأقوم بتحميل مراسلات معرفية للعملاء إلى MariaDB وباءعمل بحثات تشابه سريعة لإيجاد مراسلات قريبة.

إعداد البيئة

بدأت تجربتي بإعداد حاجز Docker يستخدم MariaDB الإصدار الأخير (11.6) الذي يشمل قدرات التوافر.

Shell

 

الآن، أنشئ جدولًا وقم بتحميله بمراجعات العملاء العينة التي تتضمن درجات المشاعر والتجسيدات لكل مراجعة. لتوليد تجسيدات النص، أستخدم SentenceTransformer، الذي يتيح لك استخدام نماذج مدربة مسبقًا. على وجه التحديد، قررت أن أستخدم نموذجًا يسمى paraphrase-MiniLM-L6-v2 الذي يأخذ مراجعات العملاء لدينا ويقوم بتخريطها في مساحة بُعدها 384.

Python

 

الآن، دعونا نستفيد من قدرات المتجهات في MariaDB للعثور على مراجعات مشابهة. هذه أقرب إلى السؤال “ماذا قال عملاء آخرون مشابه لهذا المراجعة؟“. في المثال أدناه، سأجد أفضل 2 مراجعات مشابهة لمراجعة عميل تقول “أنا راضٍ جدًا!“. للقيام بذلك، أستخدم واحدة من وظائف المتجهات (VEC_Distance_Euclidean) المتاحة في الإصدار الأخير.

Python

 

الملاحظات

  • من السهل إعدادها ويمكننا دمج كل من البيانات الهيكلية (مثل معرفات المنتجات ودرجات المشاعر)، والبيانات غير الهيكلية (نص المراجعة)، وتمثيلاتها المتجهية في جدول واحد.
  • أحب قدرتها على استخدام صيغة SQL بجانب عمليات المتجهات مما يجعلها سهلة للفرق التي اعتادت بالفعل على قواعد البيانات العلائقية. إليك القائمة الكاملة لـ وظائف المتجهات المدعومة في هذا الإصدار.
  • حسن مؤشر HNSW أداء استعلام البحث عن التشابه للبيانات الكبيرة التي جربتها حتى الآن.

الخاتمة

في المجموع، أنا مُدهش! وال版本文本 الويكتوريا لماريا دبلوماسيوس ستبسم الأمور البسيطة للهياكل المقاولة بالتعلم التجازي. وهي تبني فجوة بين عالم البيانات التقليدية ومتطلبات الأدوات التعلمية التي تتطور. في الشهور القادمة، أتطلع لرؤية كيف يتطور هذه التكنولوجيا وكيف تتبنيه المجموعة في التطبيقات العالمية.

Source:
https://dzone.com/articles/mariadb-vector-edition-hands-on-review