איך להשתמש באזור הנתונים של אזור לאחסון וניתוח

אתה כנראה תצטרך לאחסן נתונים במקום כמנהל או מפתח, ולא רק כל סוג של נתונים, אלא נתונים בכמויות עצומות. לאן תפנה? הענן הוא האפשרות הכי מעשית שלך, ובמזל, Azure Data Lake יכול לעזור לך באחסון נתונים בלתי דואג.

Azure Data Lake מאפשר לך לבצע כל סוג של עיבוד וניתוח על פני פלטפורמות ושפות במהירות רוחבית. ובמדריך הזה, תלמד איך להשתמש ב-Azure Data Lake לאחסון וניתוח.

אחסון ביעילות ובביטחון את הנתונים שלך במקום אחד עם Azure Data Lake היום!

דרישות מוקדמות

המדריך הזה יהיה הדגמה מעשית. אם ברצונך להתקדם, הקפד להפעיל חשבון Azure עם מינוי פעיל – אם אין לך עדיין, ניסיון חינם יהיה מספיק.

יצירת אגם נתונים דרך פורטל Azure

Azure Data Lake הוא שירות אחסון נתונים בענן מבוסס שמותאם לניתוח של נתונים גדולים והוא נמדד לגמרי. תוכל להתחיל בצורה קטנה ולגדול כפי שהצורך שלך גדל. אך איך ניתן ליצור את האחסון?

קח סיור מהיר בפורטל Azure וצור חשבון Azure Data Lake.

1. פתח את דפדפן האינטרנט האהוב עליך ונווט אל פורטל Azure.

2. לְבַחֵר, הַזְן אֶת פְרָטֶיךָ, לַחֲץ עַל כְפַתוּר הַכְנִיסָה, וּלְהִתְחַבֵּר לְחֶשְבּוֹן הָאַזוּר שֶׁלְךָ.

לְאַחַר שֶׁתִּתְחַבֵּר, הַדְפֵס הַדְפֵס הַדְפֵסְתָה שֶׁלְךָ יְנַתֵק לְאִתְר הָאַזוּר (צַעַד שְׁלִישִׁי).

Logging in to Azure Portal

3. בְּאִתְר הָאַזוּר שֶׁלְךָ, לַחֲץ עַל "צוֹר מַשְׁאֵב", וְזֹאת תִּפְתַח אֶת רְשִׁימַת הַמַּשְׁאֵבוֹת הַזְּמַינִים בָּאַזוּר.

תֶּרֶאֱנָה אֶת הַעֲמוּד הַבָּא כְּשֶׁתְּכַנֵּס לָרִאשׁוֹנָה אוֹ אִם אֵין לְךָ שׁוּם מַשְׁאֵבוֹת פָּעֳלִים בַּמִּינוּי שֶׁלְךָ.

Creating a Resource

4. חֵפֶש ״חֶשְׁבּוֹן אִחָסוֹן״ בְּתַיבַת הַחֵיפוֹשׁ בְּרֹאשׁ הַעֲמוּד, וּבְחֵר בִּחֲשִׁבוֹן אִחָסוֹן. כָּךְ תִּוָּתֵךְ הַדְּפֵס הַדְפֵס הַדְפֵסְתָה שֶׁלְךָ אֶל עַמוּד הַתְּמוּצָע שֶׁל חֶשְׁבּוֹן אִחָסוֹן.

תַּיבַת הַחֵיפוֹשׁ מַאֲפִשֶּׁרֶת לְךָ לִמְצוֹא בַמַּהֵרָה מַשְׁאֵבוֹת שֶׁתְּרָצֶה לִיצוֹר בְּמָקוֹם לְהִתְמַעֵד דִּרְךְ הָמַיוּחַדִים. אֲךָ לַמְּדָרָה הַזֹּאת, אַתָּה יוֹצֵר חֶשְׁבּוֹן אִגַּם נַתְקָנָה שֶׁלְךָ.

אִגַּם הַנַּתְקָנָה שֶׁלְךָ בּוֹנֶה עַל גַּבֵּי אִגַּם אִגּוּם. אָז, חֶשְׁבּוֹן אִגּוּם הוּא סוֹג הַמַּשְׁאֵב שֶׁאַתָּה צָרִיך לִיצוֹר חֶשְׁבּוֹן אִגַּם חָדָשׁ.

Searching for Storage Account Resource

5. כְּעַת, לַחֲץ עַל ״לִיצוֹר״, אֲשֶׁר מְפַנֶה אֶת הַדְּפֵס הַדְפֵסְתָה שֶׁלְךָ אֶל עַמוּד הַלִיצוֹר שֶׁל חֶשְׁבּוֹן.

Initializing Creating a Storage Account

6. לִהְגִּיד אֶת חַשְׁבּוֹן הַמַּטְמוֹן שֶׁלְךָ הַתְחִיל בִּפְרָטֵי הַפְּרוֹיֶקְט כְּכָלַל: פְּרָטִים פְּרוֹיֶקְטכָּךְ:

  • בְּחַר בַּ מִינוּי שֶׁלְךָ – אִם יֵשׁ לְךָ מִסְפָּר מִינוּיִים, וְהַפְקֵד שֶׁתִּבְחָר זֶה אֶת אֶחָד שֶׁבּוֹ אַתָּה מַעוֹדֵף לִיצוֹר אֶת חֶשְׁבּוֹן הַמִּינוּי שֶׁלְךָ. הַמַּדְרוֹן הַזֶּה מַשְׁתֵּמֵשׁ בְּמִינוּי אִגּוּם 1, כְּשֶנִצְטַף בָּהַמָּקוֹם לָמַעַלְה.
  • בחרו את קבוצת המשאבים שלכם – קבוצות משאבים הן דרך לקבץ באופן לוגי משאבי Azure. תוכלו לחשוב על קבוצות משאבים כעל תיקיות בהן אתם ממקמים משאבים קשורים. קבוצות משאבים מאפשרות לכם לנהל, לפקח ולמחוק משאבים בקלות רבה יותר.

אם עדיין אין לכם קבוצת משאבים, לחצו על הקישור צור חדש במקום זאת כדי ליצור אחת.

Setting Project Details

7. באותה הדף, קבעו את פרטי המופע עם הבאים:

  • ספקו שם חשבון אחסון ייחודי – בחירת המדריך הזה היא ataazurestorage. השם חייב להיות ייחודי בתוך Azure וחייב להיות בין שלוש ל-24 תווים ארוך.
  • בחרו את האזור שבו אתם רוצים לפרוס את חשבון האחסון שלכם – האזור הוא המקום שבו חשבון האחסון שלכם ימוקם פיזית. בחרו את האזור הקרוב ביותר אליכם או אל המשתמשים שלכם.

לדוגמה, אם אתם יוצרים חשבון אחסון עבור אפליקציית אינטרנט שמשתמשים מארה"ב יגשו אליה, בחרו באזורי מזרח או מערב ארה"ב.

  • השאירו את כל ההגדרות האחרות על ערכי ברירת המחדל ולחצו על המשך: מתקדם בתחתית הדף. בשלב זה, יהיה לכם חשבון אחסון blob סטנדרטי.
Create a Storage Account

8. בלשונית 'מתקדם', סמן את תיבת הסימון להפעלת שם מרחבי מודל ארגוני באחסון Data Lake Storage Gen2. אפשרות זו ממירה את חשבון האחסון שלך לחשבון Data Lake ומאפשרת את כל הפונקציות של Data Lake, כולל Analytics ו־Store.

לחץ על כפתור 'ביקורת ויצירה' (למטה בשמאל) כדי לאמת את ההגדרות שלך, וזה עשוי לקחת מספר דקות עד להשלמה.

Click on the Review + create button at the bottom to validate your settings.

9. לאחר אימות, לחץ על הכפתור 'יצירה' כדי לסיים את יצירת חשבון האחסון.

Creating the Storage Account

לאחר שחשבון האחסון שלך נוצר, תראה את הפרוצדורה בתהליך, כפי שמוצג למטה, וזה עשוי לקחת מספר דקות עד להשלמה.

Viewing Deployment in Progress

10. לבסוף, לחץ על הכפתור 'עבור למשאב' כדי לפתוח את חשבון האחסון שנוצר לאחר התקנה. בנקודה זו, כבר יש לך חשבון Data Lake של Azure.

Accessing the Newly-created Storage Account
Viewing the New Azure Data Lake Account

יצירת Data Lake באמצעות ה-CLI

ראית שיצירת חשבון Data Lake של Azure באמצעות פורטל Azure עובדת כשורה. אבל מה אם ברצונך לקבל דרך חוזרת ואוטומטית ליצור חשבונות Data Lake? פורטל Azure אינו האפשרות הטובה ביותר, אלא Azure CLI.

ה-CLI של Azure הוא כלי צד-צולם שניתן להשתמש בו כדי לנהל את המשאבים שלך ב-Azure ומאפשר לך לאינטגרציה עם תהליכי CI/CD האוטומטיים שלך.

אינסטרומנט קוּצְרִים של Azure זמין עבור Windows, Linux, Azure Cloud Shell וְ macOS.

כדי ליצור חשבון Azure Data Lake דרך Azure CLI:

1. בפורטל Azure, לחץ על הכפתור Cloud Shell, כפי שמוצג למטה, כדי לפתוח את ה- Azure Cloud Shell.

Opening the Azure Cloud Shell

2. בתחתית פורטל Azure, בחר באחת מהאפשרויות: Bash או PowerShell כסוג הקופסה שלך, והקופסה נפתחת.

Azure Portal

ב- Azure Cloud Shell שלך, תוכל לשנות את סוג הקופסה שלך ברצונך ל- Bash או ל- PowerShell. אך עבור המדריך הזה, שמור את הקופסה Bash פעילה.

Viewing Azure Cloud Shell

3. הפעל את הפקודה הבאה ב- Azure Cloud Shell שלך כדי לוודא את – גרסת Azure CLI המותקנת. בכל פלטפורמה שאתה משתמש בה, וודא שיש לך Azure CLI גרסה 2.6.0 או מאוחר יותר, אחרת לא תוכל ליצור חשבון Data Lake.

az --version
Verifying Azure CLI Version Installed

4. כעת, הפעל את הפקודה הבאה כדי להתחבר ל- Azure עם חשבון ה- Azure שלך.

מדריך זה משתמש בשיטת האישור של Active Directory (Azure AD) של Azure. שיטה זו היא סוג האישור המומלץ מכיוון שהיא קלה יותר ומספקת יותר אבטחה משימוש בסוכן שירות.

az login

תראו קוד ו-URL שיצורפו בחלון הטרמינל למטה. יש לרשום את ה-URL כי תזדקקו לו כדי לאמת את Azure באמצעות Azure AD בשלב הבא.

Log in to Azure using your Azure account

5. התחברו באמצעות Azure AD עם השלב הבא:

  • נווטו אל ה-URL שרשמתם בשלב הרביעי בדפדפן שלכם.
  • התחברו באמצעות הפרטים של חשבון ה-Azure שלכם והקוד שרשמתם בשלב הרביעי.
Authenticating Azure using Azure AD

6. לאחר מכן, לחצו על המשך כדי להשלים את תהליך האימות.

Logging in to Azure

7. הריצו את הפקודה הבאה: az account list כדי לרשום את המינויים עבור החשבון שמחובר.

אם החשבון שלך מקושר ליותר ממינוי אחד של Azure, עשוי להיות עליך לבחור ולהגדיר את המינוי שברצונך להשתמש בו עבור חשבון ה-Data Lake שלך.

שימו לב לשם המינוי שברצונכם להשתמש בו עבור חשבון ה-Azure Data Lake שלכם. לדוגמה, המינוי לשימוש הוא Azure subscription 1.

az account list
Getting the Subscription Name to Use for the Azure Data Lake Account

8. כעת, הריצו את הפקודה הבאה: az account set וציינו את שם המינוי שלכם. הפקודה לא מספקת פלט אך הואות את המינוי שבו ישתמש חשבון ה-Azure Data Lake שלכם.

az account set --subscription 'Azure subscription 1'

9. הפעל את הפקודה הבאה az group create כדי ליצור קבוצת משאבים. בחר שם ייחודי עבור קבוצת המשאבים שלך, אך הבחירה במדריך זה היא ataadatalakecli והגדר את –location ל-westus.

az group create --location westus --resource-group ataadatalakecli
Creating a Resource Group

10. לאחר יצירת קבוצת המשאבים, הרץ את הפקודה az storage account create למטה והעבר את הערכים לפרמטרים הבאים כדי ליצור חשבון אחסון:

  • --name – שם חשבון האחסון שלך (ataaazuredatalakecli).
  • --resource-group – שם קבוצת המשאבים שלך (ataadatalakecli).
  • --location – מיקום חשבון האחסון שלך (westus).
  • --sku – SKU האחסון עבור חשבון האחסון שלך (Standard_LRS).
  • --kind – סוג חשבון Data Lake שיווצר (StorageV2).
  • --enable-hierarchical-namespace true - הפעל את המרחב השם ההיררכי עבור החשבון שלך, שדרוש לשימוש ב-Data Lake Storage Gen2.
az storage account create  --name ataaazuredatalakecli --resource-group ataadatalakecli --location westus --sku Standard_LRS  --kind StorageV2 --enable-hierarchical-namespace true

שים לב ש-StorageV1 כעת כבר לא נתמך, ועליך להשתמש ב-StorageV2 עבור כל חשבונות Data Lake שיצרו לאחרונה. חשבונות StorageV1 קיימים עדיין יכולים לשמש לזמן מסוים אך בסופו של דבר יועברו ל-StorageV2. לכן, מומלץ בחום להעביר את הנתונים שלך לחשבונות StorageV2.

Creating a Storage Account

11. כעת, נווטו לקבוצת המשאבים שלך בפורטל Azure, ותראו את המשאבים שיצרתם לאחרונה, כפי שמוצג למטה.

לחצו על ההיפרלינק של קבוצת המשאבים שלך כדי לנווט לדף הסקירה של קבוצת המשאבים (שלב 12).

Viewing the Resource Groups

12. לבסוף, לחצו על חשבון האחסון שלכם מהרשימה כדי לגשת לדף הסקירה שלו.

Accessing Storage Account Info

זהו! כעת יש לכם חשבון אחסון פעיל.

Viewing the Storage Account’s Overview

העלאת נתונים לאחסון הגולן

הקמתם כעת את חשבון האחסון שלכם, אך כרגע הוא ריק. אז למה לא להעלות את הנתונים שלכם? ניתן להעלות ולאמת את הנתונים שלכם באמצעות פורטל Azure ו-Azure CLI, אך תחילה עליכם ליצור קונטיינר.

1. בלוח המחוונים של חשבון האחסון שלכם, לחצו על קונטיינר תחת אחסון נתונים (לוח הצד השמאל) ולחצו על קונטיינר, כפי שמוצג למטה, כדי ליצור קונטיינר חדש.

ב-Azure, קונטיינר הוא מערכת קבצים לאחסון הנתונים שלך.

Creating a Container

2. לאחר מכן, הגדירו את הקונטיינר החדש עם ההגדרות הבאות:

  • ציינו שם לקונטיינר שלכם, אך בבחירת המדריך הזה, השם הוא azuredatalakecotainer.
  • לחץ על צור בתחתית כדי ליצור את התכול.
Creating a Container

3. לחץ על שם התכול שלך מהרשימה, כפי שמוצג למטה, כדי לפתוח אותו. שים לב שהתכול שלך רק ריק כרגע.

Opening the Container

4. כעת, לחץ על העלאה בחלק העליון כדי להעלות קבצים או תיקיות לתוך התכול שלך.

Initializing Uploading Files or Folders

5. בלשון העלאת blob, לחץ על כפתור ההעלאה של התיקייה, אתה יכול לאתר את הקבצים או התיקיות שלך וללחוץ על העלאה כדי להעלות אותם.

אתה יכול לבחור מספר קבצים ותיקיות להעלאה במכה אחת.

Locating Files to Upload

תראה את מצב ההעלאה של כל קובץ/תיקייה כמו שמוצג למטה.

Viewing Upload Progress

כשההעלאה הושלמה, תראה את הקבצים מופיעים ברשימת התכול שלך.

Verifying Uploaded Files in Azure Portal

או באמצעות הפעלת פקודת az storage למטה כדי לרשום את כל הקבצים שהועלו לתוך התכול שלך. החלף בשם התכול (azuredatalakecotainer) ושם החשבון (ataaazuredatalakecli ) שלך.

az storage fs file list -f azuredatalakecotainer --account-name ataaazuredatalakecli --auth-mode login

הפלט למעלה מאמת שהקבצים הועלו בהצלחה לחשבון Azure Data Lake Storage Gen2 שלך ולמטא-נתונים שלהם.

Listing Uploaded Files in Container via Azure CLI

6. הפעל את הפקודה למטה כדי ליצור ספרייה חדשה בשם my-data-lake-directory בתוך התכול שלך (azuredatalakecotainer).

az storage fs directory create -n my-data-lake-directory -f azuredatalakecotainer --account-name ataaazuredatalakecli --auth-mode login

7. לבסוף, נווטו חזרה לתוך הקונטיינר שלך בפורטל של Azure, ותראה את התיקייה שנוצרה לאחרונה ברשימה, כפי שמוצג למטה.

משם, תוכל להעלות קבצים ותיקיות נוספים לתיקייה שנוצרה לאחרונה על פי השלבים שלשה עד חמישה.

Verifying Newly-created Directory

סיכום

בנוסף להיות יעיל מבחינת עלויות, שכן תשלום יתבצע רק על האחסון שאתה משתמש בו, מערכת Azure Data משתמשת ב-Azure Active Directory לאימות ולהרשאות. אבטחת הנתונים שלך היא עדיפות גבוהה בכל מקרה. ובמדריך זה, למדת כיצד ליצור חשבון Azure Data Lake Storage Gen2 באמצעות פורטל Azure ו-CLI.

עם Azure Data Lake, יש לך אפשרות להעלות קבצים ולאמת אותם, מבלי לבצע עיבוד מורכב של עומסי עבודה בנתונים גדולים.

בנקודה זו, כבר תוכל לאחסן בבטחה את כל הנתונים שלך במקום אחד, ולהתחיל לנתח את הנתונים שלך באמצעות הכלים והשירותים שAzure מציעה. למה לא להתחיל בשירות Data Lake Analytics ולהתחיל לשאול ולהמחיש את הנתונים שלך?

Source:
https://adamtheautomator.com/azure-data-lake/