تحليل معايير التعامل المتكامل، الجزء الأول: الحرارة

ويشمل معاملات المؤلفين

كأي نموذجالتعلم الآلي، لدينا معاملات المؤلفينالنماذج الكبيرة اللغويةالتي تحكم في تنوع من النتائج المنتجة من النص المنشور. بدأنا سلسلة متعددة الجزء لشرح التأثير على هذه المعاملات بالوصف التفصيلي. سننتهي بإيجاد التوازن المثالي في توليد المحتويات باستخدام جميع هذه المعاملات التي تحدثنا عنها في سلسلتنا المتعددة الجزء.

مرحبا بك في الجزء الأول، حيث نتحدث عن أكثر المعاملات شهرة، “الحرارة.”

الحرارة

إذا كان هدفك تحكم في عشوائية التنبؤات، فإن الحرارة هي المفاتيح التي تمتلك. تأخذ قيم الحرارة منخفضة تجعل النتائج أكثر قابلية للتحديد بينما تزيد قيمتها تجعلها أكثر إبداعاً من خلال تسمح للنتائج بخيال متنوع.

دعونا نرى الحرارة في عمل ما بواسطة البرمجيات التالية والناتج. لتوضيح الأهمية ببساطة، اخترنا تحويل المؤلفين لهذه المرة ونموذج GPT2 بالتحديد.

Python

 

الناتج:

PowerShell

 

دعونا نفهم الناتج:

  • الحرارة المنخفضة (0.3):النموذج سيركز على أختيارات الكلمات الأكثر مرجحية. إذا كان لديك توجهات على إستمرارية ودقة عالية، فلا بد من تقديم الحرارة حول هذا النطاق. ولكن تذكر أن النموذج قد يتوقف عن التكرار بالعبارات المماثلة ، كما هو حال مع ناتجنا ه
  • درجة متوسطة (0.5): توفر هذه الدرجة من التوازن المثالي بين الترابوة والإبداع. إنها من المساويات الأفضل إذا كنت تريد مقدار معين من التنوع دون فقدان الهيكل. كما ترون في الناتج، تم إضافة قليل من التوازن، ومع ذلك يمكنك رؤية بعض التكرار في الناتج.
  • درجة عالية (0.9): تتسبب هذه الدرجة في تفجير النظام العام للمجموعة التعليمية ليكون أكثر إبداعاً. كما ترون، تختلف هذا الناتج عن السابقتين، ويحمل كثيرًا من العشوائية والتنوع في المحتويات.

لذا توضح المثالين أعلاه أساسيات الدرجة. دعونا ننظر الآن إليها بصورة أكثر تفاصيلًا مع بعض حالات الاستخدام: “توليد القصص الإبداعية” و”التفسير التقني.”

دعونا ننظر إلى هذا مع التعليم البرمجي تحت الدرجة لفهم كيفية تأثير الدرجة على الحالات السابقتين. نحن نراقب أيضًا كيف تعمل التعديل على الدرجة بشكل جيد لحالة وتفعل العكس لأخرى.

Python

 

الناتج:

PowerShell

 

والآن دعونا نتوقف ونتحليل الناتج لتوليد القصص الإبداعية والتفسير التقني بناءً على الدرجات التي تأثيرها على الناتج وكيف تأثيرت الدرجة. نراقب أيضًا كيف تعمل تعديل الدرجة بشكل جيد لحالة وتفعل العكس لأخرى.

توليد القصص الإبداعية

  • درجة منخفضة (تأثير سيء): كما ترون، تم إنتاج القصة بشكل تكراري وغير متنو
  • معدل عالي للحرارة (التأثير المثالي): كما ترون من الخريطة الخاملة، تتخذ القصة اتجاهات مشوقة و مبدعة للغاية. و يضيف الخريطة أيضًا جوانب متعددة للقصة، و هو ما يجعلها متنوعة و مخيلة و مثالية للخبرة الإبداعية في التحكيم في القصص.

تفسير تقني

  • معدل عالي للحرارة (التأثير السلبي): من المهم أن نتذكر أن الدقة الفائقة مهم جدًا للحالة مثل التفسير التقني. يقود الحرارة العالية إلى مجموعة كبيرة من التعجيل و الكلمات الأقل معتادية تم إدخالها إلى المحتوى المنتج مما يجعله غير مرضي للكتابة التقنية. يمكن أيضًا تساؤل من خلال الخريطة أعلاه أنه غامر و يشمل أفكار غير متعلقة.
  • تعديل الحرارة (التأثير المثالي): قمنا بتعديل الحرارة الى إعدادة توازن مثالي لإنتاج المحتوى التقني. و كما ترون، يبدو الخريطة أكثر ترتيبًا الآن. بتعديل الحرارة الى هذا الإعدادة، تتمتع النموذج بتجنب التكرار مثلما تفعل في أدنى الحرارة و تحتوي على توحد المواد المتعلقة مثلما تفعل في أعلى الحرارة.

خلاصة

لقد رأيتم كل طرق الحرارة التي يمكن أن تؤثر على توليد المحتوى و أي إعدادة الحرارة التي تكون مثالية للأغراض المختلفة. أيضًا، لا تفوت أن تلاحظ أن تعديل الحرارة ليس الجميع في العالم في التوليد المحتوى؛ سوف يتوجب عليك تغيير معا

Source:
https://dzone.com/articles/decoding-llm-parameters-temperature