إن كانت جوجل هي بوابة الدخول للإنترنت فإن لغة Python هي بوابة الدخول لـ #علم_البيانات

بايثون الأداة الأكثر استخداماً لـ 3 سنوات متتالية، بعكس R المتخصصة في البيانات فإن Python لغة برمجة عامة

بالأسفل سأشرح الطريقة الصحيحة لتعلم بايثون لعلم البيانات المصدر: https://www.kdnuggets.com/2019/06/python-data-science-right-way.html
يبدأ البعض في تعلم بايثون من خلال دورات برمجة مخصصة للمطورين، وهذا خطأ وفيه ضياع للوقت والجهد!
في مجال علم البيانات تستخدم لغة بايثون لسحب البيانات وجمعها وتنظيفها وتصويرها وبناء نماذج، وليس لتطوير تطبيقات البرمجيات، لذا يجب أن يركز الجهد على أداء تلك المهام من خلال تعلم المكتبات
يعتبر Jupyter Notebook بيئة برمجة قوية لتطوير مشاريع #علم_البيانات، وأبسط طريقة للعمل على تلك البيئة على جهاز الكمبيوتر تكون من خلال تثبيت Anaconda والطريقة على الرابط:
https://medium.com/better-programming/beginners-quick-guide-for-handling-issues-launching-jupyter-notebook-for-python-using-anaconda-8be3d57a209b
وهنا مقطع يشرح تثبيته على الوندوز:
تحتاج في البداية تعلم أساسيات لغة بايثون حتى تتأقلم مع طريقة كتابة الكود بهذه اللغة من ناحية المتغيرات والجمل الشرطية وجمل التكرار، هنا تمارين جميلة وبسيطة يقدمها موقع: https://www.w3schools.com/python/ 
الخطوة الثانية تعلم العمل مع مكتبة Numpy التي تدعم التعامل مع الأرقام وخصوصاً المصفوفات متعددة الأبعاد التي تحتاجها معظم لغات تعلم الآلة
بعد ذلك ننتقل لتعلم العمل مع مكتبة Pandas الأكثر شعبية في معالجة البيانات، والتي تساعد عالم البيانات في تنظيف البيانات وتجهيزها، هذه المكتبة أمتداد لمكتبة Numpy، وهذا الكتاب سيساعدك في معرفة طريقة العمل مع هذه المكتبتين:
https://www.amazon.com/Python-Data-Analysis-Wrangling-IPython-ebook/dp/B075X4LT6K
بعد تجهيز البيانات سنحتاج إلى تصويرها (Visualization) وهذا دور مكتبة Matplotlib التي تساعدنا في إنشاء رسوم بيانية، وهناك ايضاً مكتبة Pandas Seaborn ولكن ينصح في هذه المرحلة التركيز على Matplotlib ، عمل هذه المكتبات مشابه لعمل برامج وأدوات تصوير البيانات مثل Tableau و Power BI
يتعامل علماء البيانات مع البيانات باستخدام كل من SQL و Pandas، بعض المهام يسهل تنفيذها باستخدام SQL والبعض الآخر نحتاج Panadas، يمكن العمل بهما معاً عن طريق تثبيت قاعدة بيانات SQLite لتخزين ملف CVS فيها ومعالجته باستخدام بايثون و SQL، شرح الطريقة على: https://medium.com/analytics-vidhya/programming-with-databases-in-python-using-sqlite-4cecbef51ab9
تعلم أساسيات الإحصاء مهم قبل بناء نماذج باستخدام خوارزميات #تعلم_الآلة ، StatsModels هي أحد مكتبات بايثون شائعة الاستخاد لبناء نماذج إحصائية

موقع دروس تعليمية لشرح طريقة تنفيذ المفاهيم الإحصائية باستخدام Python: https://www.statsmodels.org/stable/index.html
وهنا مقطع فيديو: https://www.youtube.com/watch?time_continue=3&v=yaSgoGLXKOg
أخيراً لبناء نماذج نستخدم مكتبة Scikit-Learn الأكثر شعبية في بايثون، هذه المكتبة تساعد في تنفيذ العديد من خوارزميات #تعلم_الآلة الأكثر شيوعاً

مقطع فيديو لشرح العمل على هذه المكتبة:
وهنا رابط لكتاب: https://www.amazon.com/Hands-Machine-Learning-Scikit-Learn-TensorFlow/dp/1491962291
You can follow @Dr_Hmood.
Tip: mention @twtextapp on a Twitter thread with the keyword “unroll” to get a link to it.

Latest Threads Unrolled: