הפעלת מפרמטרים של LLM, חלק 1: טמפרטורה

תכונות המונחים של המערכת

כמו כל מודל לearning מכונה, למודלים הגדולים בעזרת שפה יש מספר תכונות ששולטים בשונות ההתוצאות של הטקסט המיוצר. התחלנו סדרה רבת חלקים כדי להסביר בפירוט את ההשפעה של התכונות האלה. נסיים על-ידי להגיע לאיזון מושלם ביצירת התוצאות בעזרת כל התכונות האלה שנדבר עליהן בסדרה הרבה חלקים שלנו.

ברוך הבאה לחלק הראשון, בו אנחנו נדבר על התכונה הידועה ביותר, "טמפרטורה."

טמפרטורה

אם המטרה היא לשלוט באקראיות של ההערכות, טמפרטורה היא העניין המתאים. ערכים נמוכים יעזרו להפיק תוצאות יותר דeterministic, בעוד שערכים גבוהים יעזרו להפיק תוצאות יותר יצירתיות על-ידי אפשרות לתוצאות מגוונות.

בואו נסתכל על הפעולה של הטמפרטורה בעזרת הקוד והתוצאות הבאים. בכדי להדגיש את חשיבותה בפשטות, בחרנו להשתמש בtransformers של hugging face ובמודל GPT2 במיוחד.

Python

 

תוצאות:

PowerShell

 

בואו נבין את התוצאות:

  • טמפרטורה נמוכה (0.3): המודל יתמקד בבחירות המילים הכי סבירות. אם לך חשובות הדיוק והתאמה, אז תעניין בטמפרטורה סביב המידה הזו. אך זה עליך לזכור שהמודל עשוי להתעצבן בהשתדלות לחזור על אותן המשפטים הדומים,
  • טמפרטורת מדיום (0.5): טמפרטורה זו מאוד משווה בין התאמה ויצירתיות. זו מרחב מעניק מעניק מגוון מדי מבלי להפסיד מבנה. כפי שאתם יכולים לראות בתוצר היצירה, נוסף קצת איזון, אך עדיין יכולתם לראות חלק מהשיחזור בתוצר.
  • טמפרטורת גבוהה (0.9): טמפרטורה זו מפעילה את הלמידים המקומיים בצורה הכי יצירתית שהם יכולים. כפי שאתם יכולים לראות, התוצר הזה שונה משני התוצאות הקודמות, בעל הרבה אקראיות ומגוון בתוכו.

הדוגמא העליונה מעצבת הבנה בסיסית של הטמפרטורה. בואו נסתכל על זה בדרך קטנה יותר פורטנית עם כמה מקרים של שימוש: "יצירת סיפורים יצירתיים" ו"הסבר טכני."

בואו נסתכל על זה בעזרת הקוד הבא כדי להבין איך הטמפרטורה משפיעה על שני השימושים האלה.

Python

 

תוצר:

PowerShell

 

עכשיו בואו נעצור ונבין את התוצר ליצירת סיפורים יצירתיים והסבר טכני לפי הגדרות הטמפרטורתיות ואיך התוצאה נפגעה על ידיהן. נבחן גם איך הגדרת הטמפרטורה עובדת בדיוק טוב לשימוש אחד והפך להפך לשימוש השני.

יצירת סיפורים יצירתיים

  • טמפרטורת נמוכה (השפעה שלילית):כפי שאתם יכולים לראות, הסיפור היצירה מאוד משובך ומחסור במגוון.
  • טמפרטורה גבוהה (השפעה מושלמת): כפי שאתם יכולים לראות מהייצוא, הסיפור לוקח כיוונים מעניינים והוא מאוד יצירתי. הייצוא גם מוסיף הרבה היבטים לסיפור, שעושה אותו מגוון, דמיוני, ומושלם לסיפור חדשני.

הסבר טכני

  • טמפרטורה גבוהה (השפעה שלילית): חשוב לזכור ששמירה על הדיוק המדוייק היא מאוד חשובה עבור שימוש כמו השימוש בהסבר טכני. טמפרטורה גבוהה מובילה לרבות אקראיות ולמילים פחות סבירות שמוגדלות בתוכן התוצר המיוצר, שעושה אותו לא משנה לשירבוט טכני. אותו הדבר ניתן להסיק מהייצוא העליון שהוא יותר מוטעה וכולל רעיונות לא רלוונטיים.
  • טמפרטורה מותאמת (השפעה מושלמת): שינינו את הטמפרטורה להגדרה שמוצעת לגיוון טוב ליצירת תוכן טכני. כפי שאתם יכולים לראות, הייצוא הוא הרבה יותר סודר כעת. בהגדרה הזו של טמפרטורה, המודל מנמע מההתבססות שלו כפי שהוא עושה בטמפרטורות נמוכות יותר ולא מאבד מובניות כפי שקורה בטמפרטורות גבוהות.

סיכוי

ראיתם את כל הדרכים בהן טמפרטורה יכולה להשפיע על יצירת תוכן ובאיזה טמפרטורה מושלמת לאיזה שימוש. גם תשימו לב שההגדרה של הטמפרטורה היא לא הכל בנוגע ליצירת תוכן; ת

Source:
https://dzone.com/articles/decoding-llm-parameters-temperature