قراءة ملف CSV إلى إطارات بيانات في لغة R

بفضل الوظائف الخاصة التي يقدمها R، يصبح قراءة ملفات CSV إلى إطارات بيانات أمرًا أسهل بكثير.

ما هو ملف CSV؟

تمثل CSV اختصارًا للقيم المفصولة بفاصلة. في هذا الملف، تكون القيم المخزنة منفصلة بواسطة فاصلة. هذه العملية لتخزين البيانات تكون أسهل بكثير.


لماذا يعتبر ملف CSV هو الأكثر استخدامًا لتخزين البيانات؟

تخزين البيانات في ورقة Excel هو الممارسة الشائعة في العديد من الشركات. في معظم الشركات، يقوم الأشخاص بتخزين البيانات على هيئة “Comma-Separated-Values (CSV)”، حيث يكون العملية أسهل من إنشاء جداول بيانات عادية. فيما بعد، يمكنهم استخدام الحزم المدمجة في R لقراءة وتحليل البيانات.

كونه لغة برمجة للتحليل الإحصائي الأكثر شعبية وقوة، يقدم R وظائف محددة لقراءة البيانات إلى إطارات بيانات من ملف CSV بطريقة منظمة.


قراءة ملف CSV إلى إطار البيانات

في هذا المثال القصير، سنرى كيف يمكننا قراءة ملف CSV إلى إطارات بيانات منظمة.

أول شيء في هذه العملية هو الحصول على وإعداد دليل العمل. تحتاج إلى اختيار مسار العمل لملف CSV.

1. إعداد دليل العمل

هنا يمكنك التحقق من الدليل الافتراضي للعمل باستخدام الدالة getwd() ويمكنك أيضًا تغيير الدليل باستخدام الدالة setwd().

>getwd() # يعرض الدليل الافتراضي للعمل

---->   "C:/Users/Dell/Documents"

> setwd("C:\Users\Dell\Documents\R-test data") # لتعيين دليل العمل الجديد

> getwd() # يمكنك رؤية الدليل الجديد للعمل

---> "C:/Users/Dell/Documents/R-test data"

2. استيراد وقراءة مجموعة البيانات / ملف CSV

بعد تعيين مسار العمل، تحتاج إلى استيراد مجموعة البيانات أو ملف CSV كما هو موضح أدناه.

> readfile <- read.csv("testdata.txt")

نفذ السطر أعلاه من الكود في استوديو R للحصول على إطار البيانات كما هو موضح أدناه.

للتحقق من فئة المتغير ‘readfile’، نفذ الكود أدناه.

> class(readfile)

---> "data.frame"            

في الصورة أعلاه يمكنك رؤية إطار البيانات الذي يتضمن معلومات أسماء الطلاب، أرقامهم الجامعية، أقسامهم، جنسهم ودرجاتهم.

3. استخراج معلومات الطلاب من ملف CSV

بعد الحصول على إطار البيانات، يمكنك الآن تحليل البيانات. يمكنك استخراج معلومات معينة من إطار البيانات.

لاستخراج أعلى الدرجات التي حققها الطلاب،

>marks <- max(data$Marks.Scored) #هذا سيعطيك أعلى الدرجات

#لستخراج تفاصيل الطالب الذي حصل على أعلى الدرجات،

> data <- read.csv("traindata.csv")

> Marks <- max(data$Marks.Scored)

> retval <- subset(data, Marks.Scored == max(Marks.Scored))   #هذا سيفعل
 extract the details of the student who secured highest marks 

> View(retval)

لستخراج تفاصيل الطلاب الذين يدرسون في قسم ‘الكيمياء’،

> readfile <- read.csv("traindata.csv")

> retval <- subset( data, Department == "chemistry")  # هذا سيستخرج تفاصيل الطالب الذين في قسم الكيمياء الحيوية 
 
> View(retval)


خلاصة

به وسیله این روش، می‌توانید فایل‌های csv را در R با استفاده از تابع read.csv(” “) بخوانید. این آموزش نحوه وارد کردن فایل csv و خواندن فایل csv و استخراج برخی اطلاعات خاص از چارچوب داده را پوشش می‌دهد.

I used R studio for this project. RStudio offers great features like console, editor, and environment as well. Anyhow you are free to use other editors like Thinn-R, Crimson editor, etc. I hope this tutorial will help you in understanding the reading of CSV files in R and extracting some information from the data frame.

برای اطلاعات بیشتر می‌توانید به این لینک مراجعه کنید: https://cran.r-project.org/manuals.html

Source:
https://www.digitalocean.com/community/tutorials/r-read-csv-file-into-data-frame