البيانات الضخمة وعلم البيانات: بين الخرافة والواقع

اكتسبت البيانات الضخمة أهمية كبرى في الآونة الأخيرة، ولعبت دوراً هاماً في العديد من القطاعات والمجالات لاسيما فيما يتعلق باتخاذ القرارات. ونتيجة لذلك الأثر خصوصاً على الناحية الاقتصادية، انجذب الكثيرون لهذا المصطلح الرنان والتوجه الجديد لدراسة البيانات، فأصبح مُتداولاً من قبل المختصين ومن ليس لديهم خلفية تقنية على حدٍ سواء. وبالرغم من هذا الاندفاع في استخدام مصطلح البيانات الضخمة وقضاء الوقت في تحليلها إلا أن البعض أساء فهمه واستخدامه كما يجب، فشمولية المصطلح جعلت من السهل استخدامه في غير محله واستغلاله بما يخدم أغراض وأهداف معينة.
التباين في اتجاهات الجريمة بين الأحياء

يعتبر علم البيانات من العلوم المتداخلة مع المجالات الأخرى حيث ساهم هذا التداخل إلى تحقيق نتائج مهمة في كثير من المجالات كالطبية والعلمية والإدارية وغيرها. يتميز هذا العلم باستخدام الأساليب العلمية والخوارزميات الرياضية لاستخراج الأنماط المميزة من البيانات والتي قد تساعد في تفسير الكثير من الظواهر والمشكلات من خلال الاستناد على النظريات العلمية المستمدة من […]
تحليل انتشار المعلومات المضللة حول فايروس كورونا

في منتصف فبراير أعلنت منظمة الصحة العالمية أن جائحة الفيروس التاجي الجديد كانت مصحوبة بتفشي المعلومات الخاطئة، وأيدها في ذلك العديد من الصحفيين والسياسيين والأكاديميين الذي أكّدوا أن التضليل حول العلوم والتكنولوجيا والصحة لا يُعد أمراً جديداً أو مقتصراً على COVID-19 ، خصوصاً مع تزامنها مع أزمة صحية غير مسبوقة، حيث أنّ المعلومات الخاطئة حول الوباء […]
خوارزمية K-means للتجميع بلغة R (درس تطبيقي)

تعتبر خوارزميات التجميع (Clustering) من أشهر الخوارزميات في مجال تعلم الآلة من النوع الغير موجه (Unsupervised Learning). تتمحور فكرة هذا النوع من الخوارزميات حول تجميع عناصر البيانات في مجموعات متعددة بناء ً على التشابه بين هذه العناصر. تُستخدم هذه الخوارزميات في العديد من المجالات كمشاريع تنقيب البيانات و اكتشاف الأنماط وتحليل الصور والمعلوماتية الطبية وغيرها. هناك […]
استخدام البيانات الضخمة لتحسين أداء الأسواق المركزية (تجربة ولمارت)

تعتبر سلسلة متاجر وول مارت بأنها عملاق قطاع التجزئة في العالم وأكبر شركة في العالم من حيث الإيرادات، بأكثر من مليوني موظف و 20 ألف متجر في 28 دولة حول العالم. بعمليات بهذا الحجم فإنه ليس من المستغرب أن أدركوا منذ فترة طويلة القيمة الموجودة في تحليلات البيانات. في عام 2004م، عندما ضرب إعصار ساندي […]
تحضير البيانات باستخدام مكتبة Pandas بلغة بايثون

في هذا الدرس، سنتعرف على أهمية المعالجة المسبقة للبيانات وكيفية القيام بذلك باستخدام مكتبة Pandas بلغة بايثون. سيرشدك هذا الدرس إلى بعض المفاهيم والخطوات الأساسية لتحضير البيانات باعتبارها الخطوة الأولى بعد الحصول على أي نوع من أنواع البيانات. يتركز الهدف من هذه المرحلة بمعالجة البيانات الخام وجعلها في شكل يمكن تحليله بسهولة ودقة. يؤدي التحضير الجيد للبيانات […]
استخدام البيانات الضخمة لزيادة فعالية الإعلانات (تجربة شركة فيسبوك)

فيسبوك، وبشهادة شريحة لا يستهان بها، لا تزال أكبر شبكة للتواصل الاجتماعي في العالم. حيث يستخدمها الكثير الأشخاص من الأبناء وحتى الأجداد للتواصل مع أصدقائهم، ومشاركة مناسباتهم المميزة، بالإضافة إلى تنظيم الفعاليات الاجتماعية. كما يستخدمه ملايين الأشخاص يوميا لقراءة الأخبار، والتواصل مع الشركات، واتخاذ قرارات شرائية. وكما هو الحال في جميع شبكات التواصل الاجتماعي ومحركات […]
الانحدار الخطي (بايثون)

يعتبر الانحدار الخطي أحد أشهر نماذج تعلم الآلة التي تستخدم في التحليلات التنبؤية من خلال دراسة العلاقة بين المتغير (التابع) والمتغير (المستقل). سنتعلم في هذا الدرس عدة نقاط: 1- كيفية بناء نموذج الانحدار الخطي بلغة بايثون. 2- تقييم النموذج من خلال تقييم دقة التنبؤ و قيمة R-squared. 3- كيفية التحقق من النموذج عن طريق اختبار الخطية linearity ، […]
استخدام البيانات الضخمة في القطاع الزراعي تجربة شركة (جون دير)

كانت شركة التصنيع الزراعي جون دييري شركة رائدة دائماً، حيث قام صاحب الشركة ومؤسسها شخصيا بتصميم وبناء وبيع أحد أولى المحاريث التجارية من الحديد الصلب، والتي بدورها سهلت بشكل واضح حياة المستوطنين المنتقلين إلى الغرب الأوسط خلال منتصف القرن التاسع عشر، والذي جعل من هذه الشركة أسطورة أمريكية. ولأن الشركة في أغلب الأحيان من رواد […]