استخدام البيانات الضخمة في قطاع الضيافة (تجربة شركة AIRBNB)

ترجمة: ريما فواز

تعتبر منصة اير بي ان بي (AIRBNB) من أهم منصات وتطبيقات الاقتصاد التشاركي حيث تربط المسافرين الباحثين عن مكان للإقامة مع الأفراد الذين يرغبون بتأجير وحداتهم السكنية أو جزء منها. أطلقت المنصة في عام 2008 ومنذ ذلك الوقت جمعت الشركة كمية هائلة من البيانات – تقدر بحوالي 1.5 بيتا بايت- عن عادات الناس في السفر والأعياد وتفضيلات المساكن والوجهات وغير ذلك.

ماهي المشكلة التي تساعد البيانات الضخمة بحلها في هذا القطاع؟

مع حوالي 1.5 مليون مكان إقامة متاح على المنصة من حول 34 ألف مدينة حول العالم و 50 مليون ضيف\مستخدم، فإن التحدي الذي تواجهه منصة اير بي ان بي هو الطريقة المثلى لربط العملاء\الضيوف مع الأشخاص الذين يوفرون أماكن الإقامة (سواء كانت غرفة أو شقة أو منزل). فلحل هذا التحدي بنجاح يتطلب الامر فهم تفضيلات الضيف والمضيف فيترتب على ذلك مدى توفر المسكن المناسب في المناطق المرغوبة في الأوقات المهمة وبسعر مناسب.  

كيفية استخدمت البيانات الضخمة؟

ذكر رايلي نيومان رئيس قسم علم البيانات في اير بي اند بي (AIRBNB Nerds hub) ” البيانات هنا عبارة عن سجل حول فعل او حدث ما وفي معظم الأحيان يمثل قرار ما اتخذ من قبل المستخدم. إذا كان بإمكانك إعادة وفهم تسلسل الاحداث المؤدية لاتخاذ ذلك القرار فحين اذن بإمكانك التعلم منها، فهو بذلك يعتبر طريقة غير مباشرة لمعرفة تفضيلات الضيف –هذا العقار أجمل من ذلك الاخر، أرى ان هذه الميزة مفيدة أكثر من غيرها، وهكذا. هذا النوع من التقييم والتغذية الراجعة من الممكن أن يكون كنز بالامكان استخدامه لتطوير قرارات تطور المجتمع وتطوير المنتجات وتحديد الاولويات. بهذا الامر يمكننا ترجمة صوت العملاء الى لغة مناسبة للغاية لاتخاذ القرارات”.

 تمكّن المعرفة المكتسبة من هذه التغذية الراجعة على تركيز الجهود لإضافة أصحاب العقارات في المناطق التي تشهد طلبا ً أعلى من غيرها في أوقات الذروة وتحديد الأسعار المناسبة. بناء على ذلك يمكنهم تحسين استخدام هذه الشبكة الضخمة من العقارات. فعلى سبيل المثال، تستخدم البيانات لتعيين السعر المناسب لغرفة او شقة بناءً على عدد من المعايير مثل الموقع والوقت من السنة ونوع الضيافة ووسائل النقل وغير ذلك. تستخدم اير بي ان بي الخوارزميات لمساعدة المضيفين على تحديد السعر المناسب لعروضهم. وهذا بالتحديد يعتبر تحديا كبيرا ً نظرا ً للنطاق الهائل من المساكن المتوفرة وعند رؤيتهم لهذه العقارات أو الغرف كمنازل حقيقية وليس كغرف فندقية يمكن تقييمها بسهولة عن طريق نظام النجوم. فمع ذلك، المميزات المرغوبة في شقق المدن (مثل: شبكة Wi-Fi، توفر وسائل النقل الخ..) مما قد يعتبر تواجدهم أقل أهمية في الاكواخ (حيث يفضل الضيف ديكور هادئ ورومنسي فضلا عن شبكة Wi-Fi وتوفر المترو).

فلمساعدة المضيف في تحديد الأسعار أطلقت اير بي ان بي (AIRBNB) منصة تعلم آلي تسمى (Aerosolve). تحلل هذه المنصة الصور التي يرفعها المضيف (قوائم مع صور لغرف النوم المريحة تكون أكثر نجاحا ورغبة من صور الصالات العصرية) وبشكل تلقائي تقسم المدن الى احياء صغيرة. تتضمن المنصة أيضا نصائح التسعير الديناميكية التي تحاكي نماذج تسعير الفنادق والخطوط الجوية، فباختصار خوارزمية Aerosolve هي انعكاس عن المعرفة التي اكتسبتها اير بي ان بي عن عملائها وتفضيلاتهم وكيفية تأثيرها على سعر العقار . فعلى سبيل المثال، العملاء تصبح لديهم رغبة أعلى بالشراء إذا كانت القائمة أو المساكن تحتوي على عدد كبير من التقييمات والتعليقات. كل هذه البيانات مجمعة في لوحة بيانات وواجهة عمل موحدة و التي بدورها تساعد الملاك و المضيفين لتحديد السعر المناسب لعقاراتهم.

اير بي ان بي تمتلك أيضا منصة لم يكشف عنها : منصة سهلة الاستخدام لتحليل البيانات مصممة لتمّكن جميع موظفيها بلا استثناء وليس فقط موظفيها الذين تدربوا في مجال علم البيانات فجميعهم يمكنهم الوصول لجميع معلومات الشركة وادواتها للاستفادة منها.

بالإضافة تستخدم اير بي ان بي العديد من خوارزميات تعلم الآلة للتنبؤ بالعمليات الاحتيالية قبل حدوثها، ونظام توصية قوي يحفز الضيوف والمضيفين لتقييم بعضهم البعض لبناء الثقة المتبادلة بينهم.

ماذا كانت أبرز النتائج؟

كما ذكر نيومان: “قياس تأثير فريق علم البيانات كان صعبا ً على عكس المتوقع، ولكن هناك إشارة واحدة وهي أن هناك رغبة جماعية في الرجوع إلى البيانات بالقرارات التي يجب أن يتخذها التقنيين والأشخاص غير التقنيين على حد سواء. ” كما هو موضح في نظام Airpal؛ فتم إطلاق Airpal في عام 2014 وقد تم استخدامه بالفعل من قبل أكثر من ثلث موظفي Airbnb لاتخاذ القرارات ونشر الاستفسارات. هذه الاحصائيات المثيرة للإعجاب تظهر كيف أصبحت البيانات المركزية هي الأداة الأساسية في عملية اتخاذ القرارات في Airbnb. بالتالي، يعد النمو الهائل لمنصة Airbnb في السنوات الأخيرة مؤشرا ً على فوائد الاستثمار في البيانات الضخمة والاستخدام الذكي للبيانات.

ما هي البيانات التي تم استخدامها؟

البيانات هي داخلية بشكل اساسي عبر مزيج من صيغ و اشكال منسقة وغير منسقة: منها على سبيل المثال: بيانات صور مكان الإقامة، وبيانات الموقع، وميزات العقار ومكان الضيافة (عدد الغرف / الأسرة، شبكة Wi-Fi، حوض استحمام ساخن، إلخ)، وتعليقات العملاء وتقييماتهم، وبيانات المعاملات، وما إلى ذلك. ويتم تحليل البيانات الخارجية أيضا ً فمثلا سيتم تسعير أماكن الإقامة في إدنبرة خلال مهرجان إدنبرة الشهير بسعر أعلى من نفس السكن في شهر مختلف.

ما هي التفاصيل التقنية؟

تحتفظ Airbnb بحوالي 1.5 بيتابايت من البيانات كجداول مدارة في مجموعات Hadoop Distributed File System (HDFS) مستضافة على خدمة ويب Amazon Elastic Compute Cloud (EC2. وعند الاستعلام عن البيانات اعتاد Airbnb على استخدام Amazon Redshift وبدأوا الانتقال مؤخرا ً الى قاعدة بيانات Facebook Presto.

نظرًا لأن Presto مفتوحة المصدر فهذا سمح لشركة Airbnb بتصحيح بعض المشاكل مبكرا ً. وتأمل Airbnb في المستقبل القريب في الانتقال إلى معالجة البيانات لحظيا ً على عكس ما هو معمول به في الوقت الحالي مما سيحسن اكتشاف عمليات الاحتيال في المدفوعات وتحسين نظم التوصيات و المطابقة والتخصيص.

ما هي أبرز التحديات التي تم التغلب عليها؟

كان التحدي الكبير الذي واجهه فريق علم البيانات في Airbnb هو المواكبة مع النمو الهائل للشركة. ففي بداية عام 2011 يتكون الفريق من ثلاثة علماء بيانات فقط، و نظرا ً لأن الشركة كانت ناشئة و صغيرة جدا ً، كان بإمكان الثلاثة الالتقاء مع كل الموظفين وتلبية احتياجات البيانات الخاصة بهم. بحلول نهاية العام أصبح لدى موقع Airbnb10 مكاتب دولية كبيرة مما يعني أن فريق البيانات لم يعد قادر على الالتقاء مع الجميع في مكاتب الشركة المختلفة. فكما قال نيومان: “كنا بحاجة إلى إيجاد طريقة لإضفاء الطابع الديمقراطي لعملنا، لزيادة التواصل بين الافراد لتمكين الفرق والشركة وحتى مجتمعنا “. تم تحقيق ذلك من خلال الاستثمار في تقنيات أسرع وأكثر موثوقية للتكيف مع تزايد حجم البيانات. ومع التوسع كانت فرق العمل حول كيفية استخدام هذه الأدوات عاملاً أساسيا ً لمساعدتهم على اكتساب المعرفة من البيانات.

ما هي نقاط التعلم الرئيسية؟

تعد Airbnb مثالاً ممتازًا للشركات سريعة النمو مع احتياجات البيانات الضخمة المتزايدة. أعتقد أن القدرة على التحول والتكيف مع نمو الشركة كان من أهم أسباب نجاحها. وهذ يسلط الضوء على الطبيعة غير الثابتة للبيانات الضخمة وأهمية المرونة في استراتيجيات البيانات وإمكانية تغييرها بمرور الوقت للتكيف مع المتطلبات الجديدة. إنه لمن الرائع أن ترى فريقا ً من علماء البيانات متكاملاً بشكل جيد مع الجميع من كافة أقسام المنظمة (وفهم احتياجاتهم حتى لو لم يعد بإمكانهم مقابلة كل الموظفين!). وهذا لا يساعد علماء البيانات فقط على فهم أهداف العمل ولكنه يؤكد أيضا ً على أهمية اتخاذ القرارات المبنية على البيانات في جميع أقسام الشركة. وأخيرا ً، العبرة ليست بمقدار البيانات التي تملكها الشركات إذا لم يكن لديك فريق من علماء البيانات الأكفاء للعمل عليها.

لمزيد من المعلومات والمراجع:

http://nerds.airbnb.com/aerosolve/

http://nerds.airbnb.com/architecting-machine-learning-system-risk/

http://nerds.airbnb.com/scaling-data-science/

http://thenewstack.io/airbnbs-airpal-reflects-new-ways-to-query-and-get-answers-from-hive-and-hadoop/

http://www.washingtonpost.com/news/wonkblog/wp/2015/08/27/wifi-hot-tubs-and-big-data-how-airbnb-determines-the-price-of-a-home/

http://qz.com/329735/airbnb-will-soon-be-booking-more-rooms-than-the-worlds-largest-hotel-chains/