تخطَّ إلى المحتوى
core ai

المتجهات الدلالية (Embeddings)

المتجهات الدلالية (Embeddings) هي تمثيلات رقمية للنصوص (أو الصور والصوت) تضع المعاني المتشابهة قريبة من بعضها في فضاء رياضي، مما يتيح لأنظمة الذكاء الاصطناعي مقارنة المحتوى بالمعنى لا بتطابق الكلمات الحرفي.

يحوّل نموذج التضمين قطعة نص إلى قائمة أرقام (متجه)، عادة بمئات أو آلاف الأبعاد. الخاصية الأساسية هي أن النصوص متقاربة المعنى تنتهي كمتجهات متقاربة رياضياً، حتى لو لم تشترك في أي كلمات حرفية — فعبارة "إعادة تعيين كلمة المرور" و"نسيت تسجيل الدخول" تقعان قريبتين من بعضهما، بينما تقع "إعادة تعيين كلمة المرور" و"مواعيد عمل المتجر" بعيدتين. هذا ما يشغّل البحث الدلالي: بدلاً من مطابقة الكلمات المفتاحية، يجد النظام المحتوى المخزَّن الذي يقع متجهه الأقرب لمتجه الاستعلام.

المتجهات الدلالية هي أساس التوليد المعزَّز بالاسترجاع (RAG): تُحوَّل مستندات الشركة أو أسئلتها الشائعة أو كتالوج منتجاتها إلى متجهات وتُخزَّن في قاعدة بيانات متجهية، بحيث عندما يطرح عميل سؤالاً بالعربية أو الإنجليزية، يسترجع النظام أكثر المقاطع صلة قبل أن يُولِّد النموذج اللغوي إجابة — مما يُرسِّخ الردود في محتوى الشركة الحقيقي بدلاً من تخمين النموذج. تتفاوت جودة المتجهات الدلالية العربية بشكل كبير بين المزودين، لأن كثيراً من نماذج التضمين مُدرَّبة بشكل أساسي على نصوص إنجليزية، وهي نقطة تقييم أساسية قبل بناء أي نظام بحث أو RAG باللغة العربية.

تواصل عبر واتساب