השתמש ב-AI יצירתי לניתוח מידע באמצעות PandasAI

אי פעם בקשרת משאבות הנתונים שלך לנתח את עצמם? ובכן, אנו קרובים יותר לאותו יום. PandasAI היא כלי פורץ דרך המאפשר ניתוח נתונים מאוד מסודר. ספריית Python זו מרחיבה את היכולות של ספריית Pandas המקובלת באמצעות AI יצירתית, מה שהופך את הניתוח האוטומטי והמתוחכם של נתונים למציאות.

על ידי החלת מודלים יצירתיים כמו GPT-3.5 של OpenAI, PandasAI יכול להבין ולהגיב לשאילתות דמויות אנושיות, לבצע פעולות מסובכות של שינוי נתונים ולייצר ייצוגים חזותיים. ניתוח נתונים ו-AI משתלבים כדי ליצור תובנות שמפתחות מסלולים חדשים לעסקים ולחוקרים.

הדרכה זו תחקור איך להשתמש בספרייה החזקה הזו למטלות שונות. בואו נתחיל!

הגדרת PandasAI

כדי להגדיר את PandasAI, נצטרך להתקין אותו באמצעות pip כפי שמוצג להלן:

pip install pandasai

כדי לתקשר עם המודלים של OpenAI, תצטרך מפתח API. אם אין לך מפתח API של OpenAI, תוכל להירשם לחשבון בפלטפורמת OpenAI וליצור את המפתח שלך שם. הקוד הבא עוזר לאתחל מופע של PandasAI עם OpenAI:

Python

import pandas as pd
from pandasai import PandasAI
from pandasai.llm.openai import OpenAI

# שמירת האפיין האישי של ה-API בסביבת Open AI
# החלפת "YOUR_API_KEY" במפתח ה-API שנוצר לך
llm = OpenAI(api_token='YOUR_API_KEY')

# יצירת מופע של Pandas AI עם סביבת openAI
pandas_ai = PandasAI(llm, verbose=True, conversational=False)

AI יוצר: סקירה קצרה

AI יוצר הוא תת-קבוצה של בינה מלאכותית היוצרת נתונים חדשים הדומים לקבוצת נתונים קיימת. לעומת מודלים דיסקרימיניטיביים, שמייבאים או משערים על סמך נתונים נתונים, מודלים יוצרים יכולים לייצר תוכן חדש. AI יוצר יכול לחלופין לטקסט, תמונות ומבנים נתונים מורכבים.

לצורך ניתוח נתונים, AI יוצר יכול לייצר קבוצות נתונים מציאותיות להדרכת מודלים, למלא נקודות נתונים חסרות ואף לסייע ביצירת דוחות ניתוחיים. היכולת שלו להבין ולחקות דפוסים נתונים הופכת אותו למנוע עוצמתי.

איך PandasAI משתמש ב-AI יוצר לניקוי נתונים

PandasAI משתמש ב-AI יוצר כדי להפוך את תהליך הניקוי של הנתונים לאוטומטי ולשיפורו. במקום לזהות ולתקן טעויות באופן ידני, תוכל להשתמש בפרונטים של שפה טבעית כדי לומר ל-AI לנקות את הנתונים שלך. 

לדוגמה, תוכל לבקש ממנו ל"הסרת רשומות חוזרות" או ל"מילוי ערכים חסרים", והמנוע ה-AI ייצר קבוצת נתונים נקייה, חוסך לך זמן ומאמץ יקר.

בואו ניצור מסד נתונים עם ערכים חסרים:

Python

df = pd.DataFrame({
"country": ["United States", "United Kingdom", "France", "Germany", "Italy", "Spain", None, "Australia", "Japan", "China"],
"gdp": [19294482071552, 2891615567872, 2411255037952, None, 1745433788416, 1181205135360, 1607402389504, 1490967855104, 4380756541440, 14631844184064],
"happiness_index": [None, 7.16, 6.66, 7.07, 6.38, 6.4, 7.23, 7.22, 5.87, 5.12]
})

Now, we can prompt to get clean preprocessed data with the following code:

Python

response = pandas_ai.run(df, "Preprocess this dataframe for me")
print(response)

The output is shown below. You can see that the data has been cleaned.

ייצור תבניות עם עזרת AI יוצר

יצירת תבניות חדשות באופן ידני בקבוצת נתונים יכולה להיות משימה משעממת. תוכל לומר למנוע ה-AI לייצר תבניות חדשות מעמודות הנתונים הקיימות.

לדוגמה, עם קטע הקוד הבא, אפשר ליצור בקלות תכונות נתונים חדשות, מה שמשמעותית מרחיב את היקף ואיכות ניתוח הנתונים שלך.

Python

response = pandas_ai.run(df, "Create new features from this data")
print(response)

You can see in the output below that the new feature created by AI is a happiness rank. AI put two and two together to understand that the countries could be ranked based on the happiness index and GDP per capita!

הצגת נתונים חכמה באמצעות AI יוצר

PandasAI משפר גילוי נתונים באמצעות AI יוצר כדי להמליץ על הייצוגים המראה המתאימים ביותר למערכת הנתונים שלך. במקום להתבלבל על איזה גרף או תרשים להשתמש, אפשר לקבל הצעות מותאמות אישית שעוזרות לך להפיק את המירב מהנתונים שלך.

לדוגמה:

Python

response = pandas_ai.run(df, "Which data visualization do you recommend for this data?")
print(response)

אפשר לראות בפלט להלן שהנתונים הוצגו בדרך שמנסה לחשוב האנרגיה.

מקרה שימוש בחיים: AI יוצר בחיזוי כלכלי

בואו נבחן מקרה שימוש אמיתי של PandasAI. זה יכול להתבסס לא רק על נתוני מחירי מניות בעבר; זה יכול לדמיין תרחישים עתידיים המבוססים על מגמות השוק, ביצועי החברה ואירועים גלובליים.

אנו יכולים להשתמש במודלים יוצרים כדי ליצור מספר עתידי אפשרי של מחירי מניות, בהתחשב בוולטס וסמנים שוק אחרים. הגישה המקיפה והמבוהלת לעבר מאפשרת למשקיעים ולמומחים לנתונים להתכונן טוב יותר לתוצאות כלכליות, מה שהופך את AI היצירתי לנכס בעל ערך בלתי ניתן להעדר בחיזוי כלכלי.

Pandas מול PandasAI: היתרון של AI יוצר

בעוד שPandas היא ספרייה מפורסמת שרבים משתמשים בה להתמרת נתונים וניתוח, PandasAI לוקח את זה צעד קדימה על ידי שילוב יכולות AI יוצר. עם Pandas מסורתי, אולי תכתב קוד כדי לסנן, להפוך ולהציג נתונים, אך אתה מוגבל לנתונים שכבר יש לך.

PandasAI, לעומת זאת, יכול לייצר תובנות חדשות והדמיות ואף לתמרן נתונים על סמך פקודות שפת טבעי. מנוע הבינה המלאכותית היצירתי יכול לספק ניתוחים שיהיו קשים לקודד באופן ידני. דמיינו שאלה לנתונים שלכם, "מהי ההכנסה הפוטנציאלית לרבעון הבא?" ומקבלים דוח מיוצר כתשובה – זהו הכוח של PandasAI.

הערה: עברנו על מספר פקודות שPandasAI מקבל. אם תנסו לבדוק פקודות יצירתיות, הודעה זו מזהירה שחלקן עשויות לגרום לשגיאות. הנה קישור למסד עזר שימושי לניהול הבעיה: Crash "Invalid input data. Must be a Pandas or Polars data frame" on the "row" question.

סיכום

PandasAI אינו רק כלי נוסף לתיאוריית נתונים; זו צעדה מהותית בניתוח נתונים בזכות יכולות הבינה המלאכותית היצירתיות שלו. הוא עובר מעבר למגבלות של ממשקי הניתוח המסורתיים על ידי לא רק עבודה עם הנתונים שלכם אלא גם הבנתם לייצר תובנות חדשות. 

ממלא פערים במערכי נתונים עד לחיזוי שוק המשקיעים, האפשרויות אינן מוגבלות. כשאנו מתקדמים לעתיד שבו הנתונים הופכים יותר מורכבים, היכולת לייצר תובנות משמעותיות מהם הופכת לחיונית. PandasAI מציג מבט לעתיד כזה, הזדמנות שתרצה לחקור.

משאבים נוספים

Source:
https://dzone.com/articles/harnessing-generative-ai-in-data-analysis-with-pan