מה חדש ב YOLOv11: שינוי בחישוף האובייקטים חדשה חלק 1

הקדמה

באירוע YOLO Vision 2024, Ultralytics הציגה חדש חלק בסדרה YOLO בשם YOLOv11. המאמר הזה יספק סקירה למודל החדש, הוראות על איך לבצע הבחנה בעזרת YOLOv11, ואת ההתקדמויות העיקריות והדברים המדהימים של המודל בהשוואה לאבא הקודם שלו. המודל YOLOv11 מעוצב כדי להיות מהיר, מדוייק וקל לשימוש עבור משימות כמו זיהוי הגוף, התחלת תמונות, מיקום תמונות, הערכת התנוחה ועיקבת הגוף בזמן אמת.
המודל החדש העל במדע (SOTA) הגיע לקצב מהיר יותר ולדיוק יותר מאשר המודלים YOLO הקודמים. לפני שיתחילו, בואו נסתכל על התוצאות הבית שנתתה Ultralytics. בתרשים הבית, המודל YOLOv11 הושווה לYOLOv5, v6, v7, v8, v9, וv10.

המפה הכחול המדגישה היא הביצועים של YOLOv11 וכפי שאנחנו יכולים לראות, היא חדשה את כל המודלים YOLO או אותה דיסקים ב ממוצע הדיוק הממוצע על קבצי COCO ובמהירות ההערכה הנמצאת על הציר השני.

משימות שמסבירות על ידי YOLOv11

  • איבקובציות עצם:- איתור עצמים בתמונה או בוידאו על-ידי ציור קווים מחזירה ביחד עם ציוני הביטחון. שימושי ליישומים כמו נהיגה בעזרת מכוניות עצמוניות, מצלמות הגיוס, או קופסאות מיסים רגליים.
  • סינטיקה היחידים:- זיהוי וסידור עצמים או אנשים בתמונה. שימושי בדימות רפואי, ייצור ועוד.
  • הערכת הנוף:- זיהוי נקודות מפתח בתמונה או בשורה הזמן כדי למעקב אחר תנועות גוף או תנועות, וזה שימושי ליישומים כמו הקולנוע מדומה, אימון ריקוד, והוראת הרפואה פיזית.
  • איבקובציות מוויכוחות (OBB):- איתור עצמים עם זוו הכיוון, שמאפשר סידור מדויק יותר של חפצים מוטים או מסתובבים. תכונה זו מועילה ביישומים כמו נהיגה בעזרת מכוניות עצמוניות, בדיקה תעשייתית, וניתוח תמונות מדrones או סילוקים.
Model Tasks
YOLO11 סימנים (COCO)
YOLO11-seg סינטיקה (COCO)
YOLO11-pose הערכת ה
YOLO11-obb מציאת כיוון (DOTAv1)
YOLO11-cls קבוצת קטגוריות (ImageNet)

YOLOv11 מעניק מודלים להכרזה, לתיוג ולתפקידים מאודרים על מידע אונליין COCO, בנוסף למודלים לקבוצת קטגוריות מאודרים על מידע אונליין ImageNet. מצב עקבה גם זמין עבור כל המודלים להכרזה, תיוג ותפקידים. עבור מידע נוסף על פרטי המודלים ועל הגירסאות השונות שלהם, נא להירשם לאתר GitHub הרשמי. הציונים שלנו בנושא משאבים מופעלים בשבילכם.

דרישות קדם

הנה הדרישות הקדמיות לריציית מודלי YOLO:

  • סביבת פיתוח Python: תתקעו Python 3.8 או מאוחר יותר.
  • CUDA & cuDNN: GPU קופאי ל-CUDA (ניוויאטי) עם CUDA ו-cuDNN מו Installed על מנת להאיץ את האימון וההשלכה.
  • PyTorch: תתקעו PyTorch שתואם לגירסת ה-CUDA שלכם.
  • תשתית YOLO: תתקעו את החברה YOLO הספציפית מ-Ultralytics.
  • מערכת נתונים: מערכת מתוייגת בפורמט יולו (תמונות וקבצי תיוג).
  • דרישות חומרה: לפחות 16 ג' ביים רם וג' ביים עם הגה ב-4+ ג' ביים עבור אימון והשלכה בשיווק.

תאריכים מרכזיים של המודל החדש

YOLOv11 מביא שיפורים מספרים שהופך אותו לבחירה חזקה עבור משימות מבט ממוחשב. יש לו עיצוב עורך וצוואר טוב יותר, שעוזר לו לזהות אובייקטים בדיוק ולהתמודד עם משימות מורכבות בקלות. המודל מותאם למהירות, מעניק זמן עיבוד מהר יותר עדיין שמשמש איזון טוב בין דיוק וביצועים. אפילו עם 22% פחות פרמטרים מYOLOv8m, מודל קל זה מגיע לדיוק גבוה יותר, עושה אותו יעיל ויעיל במידה מסויימת. YOLOv11 גם מקבל זמן השעת ההערכה 2% יותר מהר מYOLOv10, ולכן הוא גמיש ביותר, פועל טוב במערכות שונות כמו מכשירי קצה, מערכות 云, וGPUים NVIDIA. בנוסף, הוא מוסיף תחום רחב של משימות, כולל זיהוי אובייקטים, קלסיפציון תמונות, הערכת תנועות, ועוד.
YOLOv11 מעוצב להתאמה בקלות עם מערכות ופלטפורמות שונות. בעזרת התמיכה בYOLOv8, הוא עובד טוב בסביבות שונות לאימון, בדיקה והשלמה. בין אם אתה משתמש בGPUים NVIDIA, מכשירי קצה, או פלטפורמות 云, YOLOv11 מתאים בעדיפות לעבודת הערבוד שלך.

התכונות האלה מעניקות לYOLOv11 את הגמישות הנחוצה לתעשיות שונות.

דמות לYOLOv11

כאשר YOLOv11 רץ על GPU Droplet של DigitalOcean, מהירות השערות מגיעה עד 5 עד 6 מיליארדיות לתמונה, גורמת לו להיות בחירה אידיאלית ליישומים בזמן אמת שדורשים עיבוד מהיר ויעיל.

!pip install ultralytics --upgrade

נתחיל עם התקנת חבילת ultralytics או בדריסתה.

from ultralytics import YOLO  
# טעינת מודל YOLO11n מאומן COCO  
model = YOLO("yolo11n.pt")  
# הכשרה של המודל על מדדת דוגמה COCO8 ל-100 עדות  
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# טעינת מודל YOLO11n מאומן COCO והכשרתו על מדדת דוגמה COCO8 ל-100 עדות  
yolo train model=yolo11n.pt data=coco8.yaml epochs=100 imgsz=640

סיפקנו את הקוד לשימוש במודל לזיהוי חפצים בוידאו.

# טעינת מודל YOLO11n מאומן COCO  
model = YOLO("yolo11n.pt")  
results = model("data/video.mp4", save=True, show=True)

בשלב הבא, ננסה את המודל לזיהוי חפצים בתמונה.

# טעינת מודל YOLO11n מאומן COCO  
model = YOLO("yolo11n.pt")  
results = model("/folder_path/image_det.jpeg")  
results[0].show()

לשימוש במודל לסגמנטציה, צריך להוריד את YOLO11 כיוון שניסיון המודל ישליך שגיאה.

# סגמנטציה  
from ultralytics import YOLO  
model = YOLO('yolo11n-seg.pt')  
results = model("/folder_path/image_seg.jpeg")  
results[0].show()

באותו אופן, למשימות קליפת תנוחה וסיווג, צריך להוריד את המודל YOLO11 ואז לנסות את המודל על תמונה.

# קליפת תנוחה  
from ultralytics import YOLO  
model = YOLO('yolo11n-pose.pt')  
results = model("/folder_path/image_pose.jpeg")  
results[0].show()

# סיווג תמונה  
from ultralytics import YOLO  
model = YOLO('yolo11n-cls.pt')  
results = model("/folder_path/image_class.jpeg")  
results[0].show()

עכשיו, זה מוכרח להשתמש בGPU עליון כדי להריץ או לאמן YOLOv11, אחרת האמן או ההערכה יכול להיות איטית ולא יעילה. כשמגיעים לריציית או לאמנות YOLOv11, בחירת GPU במקום CPU יכולה לשנות בעליית הביצועים והיעילות באופן משמעותי. YOLOv11, עם הפיתוח המעודכן של התפתחות המאפיינים והדיוק המשובע, דורש כח מחשבה גבוה, בעיקר במקרה של אמנת מאגרי נתונים גדולים. GPUים מעוצבים מיוחד עבור עיבוד מקביל, מאפשר להם לטפל בהם בהמשך המבנים המורכבים הדרושים עבור למידת עמוקה בקצב רב יותר מאשר CPUים. Droplet GPU DigitalOcean מותאמים לעבודות משקל AI/ML, ומספקים גישה לGPUים חזקים כמו H100, שמעוצבים ספציפית עבור ביצועים מתקדמים וטיפול בעיבודים כבדים.

מחשבות סיימוניות

ראינו דברים מגניבים שהמודל יכול לעשות עם תמונות וסרטונים. YOLOv11 הוא מודל חזק ומורחב למשימות ראיית מחשב. היכולות המורחבות האלה והמהירות והדיוק הגבוה הם עליה משמעותית מהקודמים שלו.
לסיכום, YOLOv11 הוא צעד גדול קדימה בזיהוי העצמים ובראיית המחשב. עם העיצוב הטוב יותר שלו, המהירות הגבוהה והדיוק הטוב יותר, הוא מועדף טוב לשימוש במגוון שימושים – זיהוי בזמן אמת על מכשירים קטנים או ניתוח יותר פירוטי בענן. היכולת שלו לפעול ברגעים בשיווקים אותם את המערכות קיימות אומר שלחברות יהיה קל יותר לשלב אותו לתפקידים היומיים שלהן, בעזרת החקלאות, הבטחה או רובוטיקה. שילוב הגמישות והביצועים של YOLOv11 הוא כלי חזק עבור כל אדם שמתמודד עם אתגרים בראיית המחשב.
אך זו חלק 1 מההדרכה, ובחלק 2 נלמד איך לעדכן ולאמן את המודל עבור זיהוי עצמים על מערך נתונים מותאם.

מקורות

Source:
https://www.digitalocean.com/community/tutorials/what-is-new-with-yolo