أحدث الأخبار​

تابع أخبار شريكك الرقمي وأحدث منتجاته وخدماته المقدمة لك.

استخدام البيانات الضخمة في قطاع الضيافة (تجربة شركة AIRBNB)

ترجمة: ريما فواز

تعتبر منصة اير بي ان بي (AIRBNB) من أهم منصات وتطبيقات الاقتصاد التشاركي حيث تربط المسافرين الباحثين عن مكان للإقامة مع الأفراد الذين يرغبون بتأجير وحداتهم السكنية أو جزء منها. أطلقت المنصة في عام 2008 ومنذ ذلك الوقت جمعت الشركة كمية هائلة من البيانات – تقدر بحوالي 1.5 بيتا بايت- عن عادات الناس في السفر والأعياد وتفضيلات المساكن والوجهات وغير ذلك.

ماهي المشكلة التي تساعد البيانات الضخمة بحلها في هذا القطاع؟

مع حوالي 1.5 مليون مكان إقامة متاح على المنصة من حول 34 ألف مدينة حول العالم و 50 مليون ضيف\مستخدم، فإن التحدي الذي تواجهه منصة اير بي ان بي هو الطريقة المثلى لربط العملاء\الضيوف مع الأشخاص الذين يوفرون أماكن الإقامة (سواء كانت غرفة أو شقة أو منزل). فلحل هذا التحدي بنجاح يتطلب الامر فهم تفضيلات الضيف والمضيف فيترتب على ذلك مدى توفر المسكن المناسب في المناطق المرغوبة في الأوقات المهمة وبسعر مناسب.  

كيفية استخدمت البيانات الضخمة؟

ذكر رايلي نيومان رئيس قسم علم البيانات في اير بي اند بي (AIRBNB Nerds hub) ” البيانات هنا عبارة عن سجل حول فعل او حدث ما وفي معظم الأحيان يمثل قرار ما اتخذ من قبل المستخدم. إذا كان بإمكانك إعادة وفهم تسلسل الاحداث المؤدية لاتخاذ ذلك القرار فحين اذن بإمكانك التعلم منها، فهو بذلك يعتبر طريقة غير مباشرة لمعرفة تفضيلات الضيف –هذا العقار أجمل من ذلك الاخر، أرى ان هذه الميزة مفيدة أكثر من غيرها، وهكذا. هذا النوع من التقييم والتغذية الراجعة من الممكن أن يكون كنز بالامكان استخدامه لتطوير قرارات تطور المجتمع وتطوير المنتجات وتحديد الاولويات. بهذا الامر يمكننا ترجمة صوت العملاء الى لغة مناسبة للغاية لاتخاذ القرارات”.

 تمكّن المعرفة المكتسبة من هذه التغذية الراجعة على تركيز الجهود لإضافة أصحاب العقارات في المناطق التي تشهد طلبا ً أعلى من غيرها في أوقات الذروة وتحديد الأسعار المناسبة. بناء على ذلك يمكنهم تحسين استخدام هذه الشبكة الضخمة من العقارات. فعلى سبيل المثال، تستخدم البيانات لتعيين السعر المناسب لغرفة او شقة بناءً على عدد من المعايير مثل الموقع والوقت من السنة ونوع الضيافة ووسائل النقل وغير ذلك. تستخدم اير بي ان بي الخوارزميات لمساعدة المضيفين على تحديد السعر المناسب لعروضهم. وهذا بالتحديد يعتبر تحديا كبيرا ً نظرا ً للنطاق الهائل من المساكن المتوفرة وعند رؤيتهم لهذه العقارات أو الغرف كمنازل حقيقية وليس كغرف فندقية يمكن تقييمها بسهولة عن طريق نظام النجوم. فمع ذلك، المميزات المرغوبة في شقق المدن (مثل: شبكة Wi-Fi، توفر وسائل النقل الخ..) مما قد يعتبر تواجدهم أقل أهمية في الاكواخ (حيث يفضل الضيف ديكور هادئ ورومنسي فضلا عن شبكة Wi-Fi وتوفر المترو).

فلمساعدة المضيف في تحديد الأسعار أطلقت اير بي ان بي (AIRBNB) منصة تعلم آلي تسمى (Aerosolve). تحلل هذه المنصة الصور التي يرفعها المضيف (قوائم مع صور لغرف النوم المريحة تكون أكثر نجاحا ورغبة من صور الصالات العصرية) وبشكل تلقائي تقسم المدن الى احياء صغيرة. تتضمن المنصة أيضا نصائح التسعير الديناميكية التي تحاكي نماذج تسعير الفنادق والخطوط الجوية، فباختصار خوارزمية Aerosolve هي انعكاس عن المعرفة التي اكتسبتها اير بي ان بي عن عملائها وتفضيلاتهم وكيفية تأثيرها على سعر العقار . فعلى سبيل المثال، العملاء تصبح لديهم رغبة أعلى بالشراء إذا كانت القائمة أو المساكن تحتوي على عدد كبير من التقييمات والتعليقات. كل هذه البيانات مجمعة في لوحة بيانات وواجهة عمل موحدة و التي بدورها تساعد الملاك و المضيفين لتحديد السعر المناسب لعقاراتهم.

اير بي ان بي تمتلك أيضا منصة لم يكشف عنها : منصة سهلة الاستخدام لتحليل البيانات مصممة لتمّكن جميع موظفيها بلا استثناء وليس فقط موظفيها الذين تدربوا في مجال علم البيانات فجميعهم يمكنهم الوصول لجميع معلومات الشركة وادواتها للاستفادة منها.

بالإضافة تستخدم اير بي ان بي العديد من خوارزميات تعلم الآلة للتنبؤ بالعمليات الاحتيالية قبل حدوثها، ونظام توصية قوي يحفز الضيوف والمضيفين لتقييم بعضهم البعض لبناء الثقة المتبادلة بينهم.

ماذا كانت أبرز النتائج؟

كما ذكر نيومان: “قياس تأثير فريق علم البيانات كان صعبا ً على عكس المتوقع، ولكن هناك إشارة واحدة وهي أن هناك رغبة جماعية في الرجوع إلى البيانات بالقرارات التي يجب أن يتخذها التقنيين والأشخاص غير التقنيين على حد سواء. ” كما هو موضح في نظام Airpal؛ فتم إطلاق Airpal في عام 2014 وقد تم استخدامه بالفعل من قبل أكثر من ثلث موظفي Airbnb لاتخاذ القرارات ونشر الاستفسارات. هذه الاحصائيات المثيرة للإعجاب تظهر كيف أصبحت البيانات المركزية هي الأداة الأساسية في عملية اتخاذ القرارات في Airbnb. بالتالي، يعد النمو الهائل لمنصة Airbnb في السنوات الأخيرة مؤشرا ً على فوائد الاستثمار في البيانات الضخمة والاستخدام الذكي للبيانات.

ما هي البيانات التي تم استخدامها؟

البيانات هي داخلية بشكل اساسي عبر مزيج من صيغ و اشكال منسقة وغير منسقة: منها على سبيل المثال: بيانات صور مكان الإقامة، وبيانات الموقع، وميزات العقار ومكان الضيافة (عدد الغرف / الأسرة، شبكة Wi-Fi، حوض استحمام ساخن، إلخ)، وتعليقات العملاء وتقييماتهم، وبيانات المعاملات، وما إلى ذلك. ويتم تحليل البيانات الخارجية أيضا ً فمثلا سيتم تسعير أماكن الإقامة في إدنبرة خلال مهرجان إدنبرة الشهير بسعر أعلى من نفس السكن في شهر مختلف.

ما هي التفاصيل التقنية؟

تحتفظ Airbnb بحوالي 1.5 بيتابايت من البيانات كجداول مدارة في مجموعات Hadoop Distributed File System (HDFS) مستضافة على خدمة ويب Amazon Elastic Compute Cloud (EC2. وعند الاستعلام عن البيانات اعتاد Airbnb على استخدام Amazon Redshift وبدأوا الانتقال مؤخرا ً الى قاعدة بيانات Facebook Presto.

نظرًا لأن Presto مفتوحة المصدر فهذا سمح لشركة Airbnb بتصحيح بعض المشاكل مبكرا ً. وتأمل Airbnb في المستقبل القريب في الانتقال إلى معالجة البيانات لحظيا ً على عكس ما هو معمول به في الوقت الحالي مما سيحسن اكتشاف عمليات الاحتيال في المدفوعات وتحسين نظم التوصيات و المطابقة والتخصيص.

ما هي أبرز التحديات التي تم التغلب عليها؟

كان التحدي الكبير الذي واجهه فريق علم البيانات في Airbnb هو المواكبة مع النمو الهائل للشركة. ففي بداية عام 2011 يتكون الفريق من ثلاثة علماء بيانات فقط، و نظرا ً لأن الشركة كانت ناشئة و صغيرة جدا ً، كان بإمكان الثلاثة الالتقاء مع كل الموظفين وتلبية احتياجات البيانات الخاصة بهم. بحلول نهاية العام أصبح لدى موقع Airbnb10 مكاتب دولية كبيرة مما يعني أن فريق البيانات لم يعد قادر على الالتقاء مع الجميع في مكاتب الشركة المختلفة. فكما قال نيومان: “كنا بحاجة إلى إيجاد طريقة لإضفاء الطابع الديمقراطي لعملنا، لزيادة التواصل بين الافراد لتمكين الفرق والشركة وحتى مجتمعنا “. تم تحقيق ذلك من خلال الاستثمار في تقنيات أسرع وأكثر موثوقية للتكيف مع تزايد حجم البيانات. ومع التوسع كانت فرق العمل حول كيفية استخدام هذه الأدوات عاملاً أساسيا ً لمساعدتهم على اكتساب المعرفة من البيانات.

ما هي نقاط التعلم الرئيسية؟

تعد Airbnb مثالاً ممتازًا للشركات سريعة النمو مع احتياجات البيانات الضخمة المتزايدة. أعتقد أن القدرة على التحول والتكيف مع نمو الشركة كان من أهم أسباب نجاحها. وهذ يسلط الضوء على الطبيعة غير الثابتة للبيانات الضخمة وأهمية المرونة في استراتيجيات البيانات وإمكانية تغييرها بمرور الوقت للتكيف مع المتطلبات الجديدة. إنه لمن الرائع أن ترى فريقا ً من علماء البيانات متكاملاً بشكل جيد مع الجميع من كافة أقسام المنظمة (وفهم احتياجاتهم حتى لو لم يعد بإمكانهم مقابلة كل الموظفين!). وهذا لا يساعد علماء البيانات فقط على فهم أهداف العمل ولكنه يؤكد أيضا ً على أهمية اتخاذ القرارات المبنية على البيانات في جميع أقسام الشركة. وأخيرا ً، العبرة ليست بمقدار البيانات التي تملكها الشركات إذا لم يكن لديك فريق من علماء البيانات الأكفاء للعمل عليها.

لمزيد من المعلومات والمراجع:

http://nerds.airbnb.com/aerosolve/

http://nerds.airbnb.com/architecting-machine-learning-system-risk/

http://nerds.airbnb.com/scaling-data-science/

http://thenewstack.io/airbnbs-airpal-reflects-new-ways-to-query-and-get-answers-from-hive-and-hadoop/

http://www.washingtonpost.com/news/wonkblog/wp/2015/08/27/wifi-hot-tubs-and-big-data-how-airbnb-determines-the-price-of-a-home/

http://qz.com/329735/airbnb-will-soon-be-booking-more-rooms-than-the-worlds-largest-hotel-chains/

البيانات الضخمة في مجال تجربة العميل (تجربة المصرف الملكي الاسكوتلندي)

ترجمة: ندى العي

مراجعة: محمد كامل

مدخل

قبل الأزمة المالية التي حدثت في عام 2008، كان المصرف الملكي الاسكوتلندي (رويال بنك اوف اسكتلندا) أكبر بنك في العالم. عندما تعرض سوق القروض العقارية للتهديد بانهيار الأعمال، تدخلت حكومة المملكة المتحدة، حيث كانت تمتلك 84٪ من أسهم البنك.

يخضع البنك حاليا لعملية إعادة الخصخصة، حيث قرر البنك جعل تحسين خدمة العملاء استراتيجية مهمة من أجل بقاء حصته في سوق التجزئة المصرفية.

يلعب تحليل البيانات الضخمة دورًا رئيسيًا في هذه الاستراتيجية. وقد أعلن البنك مؤخرًا عن استثمار 100 مليون جنيه إسترليني في تقنيات تحليلات البيانات، وقام البنك بتسمية إحدى مبادراته الأولى باسم ” personology” أو “علم الشخصية” وذلك للتأكيد على التركيز على العملاء بدلاً من المنتجات المالية.

ما هي التحديات التي تساعد البيانات الضخمة في حلها في هذا القطاع؟

كما قال كريستيان نيليسن رئيس قسم التحليلات في رويال بنك اسكتلندا، خلال فترة السبعينيات والثمانينيات كانت البنوك منعزلة عن عملائها. حيث أن التركيز كان على الترويج للمنتجات وتحقيق أهداف المبيعات بدون النظر إلى الخدمات التي يحتاجها العملاء.

يقول نيليسن: “في السبعينيات، كان موظفو ومديرو فروع البنوك يعرفون عملائهم بشكل فردي. ويعرفون عوائلهم وكذلك ما يحاولون القيام به “.

أما في مرحلة ما من الثمانينيات، كما يقول، كانت هذه العلاقة الشخصية قد فُقدت حيث تحولت الخدمات المصرفية للأفراد من مساعدة العملاء والاعتناء بهم إلىالاهتمام بالموارد المالية وجميع أنواع الخدمات المالية والتأمينية من أجل مصادر جديدة للإيرادات.

بينما كانت البنوك قبل ذلك يركزون على تحقيق توقعات العملاء، تحول التركيز إلى “إخراج المنتجات من الباب” على حد تعبير نيليسن. فقد كان لدى البنوك هدف بيع محدد وعدد عمليات تحويل رصيد أو بطاقات الائتمان يسعون لتحقيقها، وكانوا يسعون لتحقيق هذه الأهداف سواء كانت ما يحتاجه العملاء أو لا.

كيف تم توظيف البيانات الضخمة والاستفادة منها؟

يستخدم المصرف الملكي الاسكوتلندي تحليلات البيانات لتحسين مستوى الخدمة الشخصية للعملاء، والذي قد يبدو غير منطقي. لكن فريق التحليلات قام بتطوير فلسفة أطلقوا عليها اسم “علم الشخصية” وذلك لفهم عملائهم بشكل أفضل وتلبية احتياجاتهم.

تمتلك البنوك كميات ضخمة من المعلومات، فسجلات البيانات توضح كيف ننفق أموالنا وندير شؤوننا المالية، وذلك يمكن أن يعطي صورة مفصلة عن كيف نعيش حياتنا، متى نأخذ الإجازات، ونتزوج، ونمرض، وعلى ماذا ننفق فائضنا من الدخل.

يقول نيليسن: “إذا نظرت إلى شركة ما مثل أمازون، فهي تعرف القليل عن عملائها مقارنةً بنا، ولكنهم يحققون الكثير من النجاحات لحسن استخدامهم للبيانات المتوفرة لديهم. ونحن نملك كمية بيانات ضخمة عن عملائنا ولكننا بدأنا للتو الاستفادة منها. لدينا بيانات غنية وهائلة ونحن بدأنا للتو في الاستفادة من إمكاناتها “.

مثال بسيط للغاية للبدء في تحسين خدمة العميل، هي تهنئة العملاء شخصيًا عند تواصلهم مع الفرع في يوم عيد ميلادهم. هذا لا يعتبر تحليلات للبيانات الضخمة ولكنه يتماشى مع مفهوم علم الشخصية.

أيضًا تم تطوير الأنظمة لإخبار العملاء بشكل فردي كيف سيستفيدون من الصفقات والعروض الترويجية المقدمة. كان في السابق، تسجيل الدخول إلى حساب البنك عبر الإنترنت أو الاتصال الهاتفي بخدمة العملاء، هي فرصة للبنك لعرض الخدمات المُربحة لهم. أما الآن يتلقى العملاء توصيات شخصية تُظهر لهم كم سيوفرون في حال قبول عرض معين.

 بالإضافة إلى ذلك، يتم تحليل بيانات العمليات التي يقوم بها العملاء لتحديد ما إذا سوف يدفع العملاء مرتين مقابل المنتجات المالية، مثل الدفع للحصول على مساعدة التأمين أو التجزئة التي تم توفيرها كجزء من خدمات الحساب المصرفي.

ماهي أبرز النتائج؟

على الرغم من أن الوقت لا يزال مبكرًا على النتائج، إلا أن نيليسن قام بالإبلاغ عن بعض النتائج الأولية. على سبيل المثال، اتصل كل عميل بخصوص المنتجات المالية المكررة وقام بطلب إلغاء منتج تابع لجهة خارجية بدلًا من منتج البنك.

يقول نيليسن: “نحن متحمسون جدًا للأشياء التي نقوم بها، نحن نرى معدلات استجابة تتحسن بشكل ملحوظ ومزيد من الترابط “.

ذكر موقع Computer Weekly أن أحد العملاء في الثمانين من العمر قام بالبكاء عندما هنئه موظف البنك بعيد ميلاده والذي لم يتذكره أحد.

 قد تبدو مثل هذه الأمثلة ليس لها علاقة بالبيانات الضخمة، ولكن هذه الطريقة تعتبر استراتيجية تؤثر على الناس بشكل فردي.

ما هي البيانات التي تم استخدامها؟

يستخدم بنك رويال اسكتلندا بيانات عن عملائه، بما في ذلك عمليات حساباتهم والمعلومات الشخصية وذلك لتحديد المنتجات أو الخدمات التي ستكون مفيدة للغاية لهم.

ما هي أبرز التقنيات المستخدمة؟

 يستخدم البنك برنامج لتحليل بيانات إدارة علاقات العملاء والذي طورته شركة Pegasys، وذلك لتقديم التوصيات والمساعدة في الوقت المباشر للموظفين في الفروع ومراكز الاتصال.  قام البنك أيضا بتطوير لوحات البيانات باستخدام SAS، وتقنيات مفتوحة المصدر مثل Hadoop (المطورة من قبل Cloudera) وCassandra.

ما هي أبرز التحديات التي واجهت المصرف الملكي الاسكوتلندي؟

 وفقًا لنيليسن، كان توظيف موظفين جدد أحد التحديات الرئيسية التي يوجهها البنك، “نحن في على وشك الوصول إلى المرحلة التي يشعر فيها الموظفون وكأنهم يجرون محادثات قيّمة مع عملائهم.

“لقد بدأ الموظفون في فهم ما تحمله البيانات، والبيانات التي تساعدهم على إجراء محادثات جيدة، وهذا التحول كبير ومختلف عما كنا عليه من قبل”

“إن إشراك الموظفين أمر بالغ الأهمية، فالأفكار التي حققت نتيجة أفضل والتي لها تأثير أفضل لدى العملاء، هي تلك الأفكار التي حصلنا عليها من موظفي الخط الأمامي أو عملنا لتطويرها مع موظفي الخط الأمامي بشكل كبير بشكل.”

الخاتمة

في مجال المبيعات والتسويق، تعتبر البيانات عديمة الفائدة إذا لم تخبرنا بشيء لا نعرفه بالفعل عن عملائنا.

فمن خلال فهم العملاء بشكل جيد، يمكن للشركات تلبية احتياجات عملائها بشكل أفضل.

يعد إشراك الموظفين وأصحاب المصلحة الآخرين أمرًا ضروريًا.  ويجب عليهم فهم سبب استخدام تحليلات بيانات العملاء إذا أرادوا أن يحققوا أقصى قدر من الفعالية في الوصول إلى رؤى مخفية.

المصدر:

Goodwin, B. (2015) Royal Bank of Scotland goes back to 1970s values/ with big data, http://www.computerweekly.com/news/4500248239/ Royal-Bank-of-Scotland-goes-back-to-1970s-values-with-big-data, accessed 5 January 2016.

استخدام البيانات الضخمة في الإعلانات (تجربة شركة سبرنت)

ترجمة: شدا محمد

مراجعة: محمد كامل

نظرة عامة

تُعد شركة سبرينت (Sprint) من أكبر أربع شركات للاتصالات المتنقلة في الولايات المتحدة، وتخدم أكثر من سبعة وخمسين مليون مشترك، مما أعطاها الوصول لكمية هائلة من بيانات عملائها الذين يعتمدون على أجهزتهم المحمولة في حياتهم اليومية.

في عام 2012م، أسست سبرنت شركة فرعية تُدعى بنسايت ميديا (Pinsight Media) بهدف أخذ مصادر هذه البيانات واستخدامها في تقسيم المستفيدين لمنصات إعلانات موجهة للهواتف المحمولة.

ما المشكلة التي ساعدت البيانات الضخمة في حلها؟

يرى الكثير من المستخدمين أن الإعلانات تعتبر إزعاجا ً واقتحاما ً، ويعلم المعلنون الشيء القليل عن من تصل إليهم إعلاناتهم بشكل عام، ولذلك ينفقون أموالاً طائلة في إيصال إعلاناتهم لأشخاص ليسوا ضمن دائرة الاهتمام، أو ليسوا قادرين على تحمل تكلفة ما يعلنون عنه. (وهذا يحصل بكثرة، فأغلبنا قد يتعرض لهذا النوع من الاعلانات بشكل دائم)، ولذلك تكون الإعلانات ليست ذات صلة، والجهود والمبالغ التي وضعها المعلن في رسالته إلى أولئك الأشخاص تضيع سدى.

فالحل الأمثل هو الإعلان المُستهدَف، بما أنه دخل في مجال التسويق المباشر وتطور خلال العصر الرقمي، فهو يستخدم البيانات الديموغرافية والسلوكية والمكانية لتقسيم المستخدمين لفئات متعددة. ولكن الأمر ليس بهذه السهولة، إذ أن الكثير من طرق تقسيم الجماهير تقوم على نسبة كبيرة من بياناتٍ مفصح عنها ذاتيًّا، فبمقدور الناس إنشاء ملفاتهم الشخصية بسهولة على مواقع التواصل الاجتماعي وبمعلومات خاطئة بهدف إخفاء هوياتهم، وكثيرٌ من البيانات المُنشأة على الإنترنت بعيدة كل البعد عن جعل الأشخاص عملاء محتَمَلِين.

كيف استُخدمت البيانات الضخمة عمليا ً؟

استخدمت شركة بنسايت ميديا بيانات المصادقة من الشبكة لبناء الوصول إلى ملفات تعريف أكثر دقة وموثوقية (وبالتالي أكثر قيمة) لسلوك المستهلك ، مما يسمح لهم بتقديم دعايات وعروض أكثر دقة للجماهير المستهدفة للمعلنين. وهذا بدوره يساهم بتقليل فرصة وضع إعلان يبدو مملًا أو غير ذي صلة لاهتمام المستهلك ، وزيادة فرصة أن يرى المستخدم شيئاً ما سيفكر في شراءه مستقبلا.

وهذا مشابه لخدمات الإعلان المستهدَف الشائعة في يومنا هذا من قبل شركات مثل فيسبوك وجوجل، ولكن بفارق رئيسي وهو أن البيانات جمعت أساساً على بيانات مشغل الشبكة.

ذكر جيسن دلكر، كبير موظفي التكنولوجيا والبيانات في بنسايت: “ركّزَ مشغلو الهاتف المحمول عموما على أعمالهم الأساسية، وهو نشر بُنى قوية للشبكة وأجهزة غنية بالميزات التقنية، ولم يركزوا كثيرا ً على كيفية الاستثمار بالثروة المعلوماتية التي لديهم، رَكّزوا على المقاييس كأداء الشبكة وتقليل نسبة إلغاء الاشتراكات ورعاية العملاء، وكل هذه في غاية الأهمية… ولكن هناك أعمال أخرى لم يستغلوها بشكل جيد.

“خدمات الهاتف المحمول وشبكات التواصل الاجتماعي وحتى الشركات المصنعة للهواتف التي يشترك معها مشغلو الهاتف المحمول قد فعّلوا تطبيقات ذكية جدا ً و أوجدوا هذا النظام البيئي المُركِّز على الإعلان المستهدَف ويُكسب مئات الملايين من الدولارات، وقد أوجدوه باستخدام البيانات الضخمة التي تُعد شيئا بسيطًا مما ينفذ إليه مشغلو الهواتف المحمولة”.

لقد طورت بنسايت ميديا أداتها الخاصة وتعرف بمنصة إدارة البيانات (DMP)، وتستخدم لإنشاء ملفات شخصية للإعلان المُستهدَف بتلك البيانات الفريدة التي لا يصل إليها غير سبرينت، تضمها مع مجموعات بيانات خارجية مشتراة أو متاحة مجانا ً ليزيدوا من دقة الوصول للشريحة المستهدفة أثناء الحملات الدعائية.

علاوة على ذلك، طورت الشركة أيضا تطبيقاتها الخاصة، كتطبيقات الطقس والرياضة ومتصفح إنترنت لتطبيق ريديت (Reddit) للمشاركة الاجتماعية ومنصة النقاش الشهيرة، مما سمح لهم بجمع المزيد من المعلومات كي تضاف إلى بطاقة تسويقية للمستخدمين كُوِّنت من معلومات أشخاص “حقيقيين”، موثقة من قبل بيانات مستخدمي سبرينت.

ماذا كانت أبرز النتائج؟

منذ أن أُسست بنسايت ميديا، تحولت سبرينت في ثلاث سنوات من الضمور في سوق إعلانات الهاتف المحمول إلى خدمة أكثر من ستة مليارات ظهور إعلاني شهريًّا، أدى ذلك إلى جعلها لاعباً أساسيا ً في لعبة إعلانات الهاتف المحمول عبر الإنترنت.

ما هي البيانات التي تم استخدامها في هذا التحول؟

تعمل خدمة بنسايت بثلاث أنواع من البيانات: مكانية وسلوكية وديموغرافية.

وضح جيسن أن البيانات المكانية: “متعددةُ الأطراف، أي أنها نتيجة أكثر من 55 مليون جهاز عندنا يتنقلون حول البلد”.

“وبذلك يتحدثون ذهابًا وإيابًا عبر أبراج الراديو – ونأخذ نحن إحداثيات خطوط الطول والعرض للبرج بالإضافة لحوالي 43 حقلاً مختلفًا ونحاول استخدامها لتحديد مكان الجهاز المحمول في وقت معين.

” إذا كان الشخص مسافراً وفعل عدة أمور خلال اليوم – سواء كانت رسائل نصية أو مكالمات هاتفية أو استخدم تطبيقات أو رسائل بريد إلكتروني، فهو يدلي بآلاف سجلات الأحداث في اليوم، فنكون قد حصلنا على بيانات مكانية وافرة كي نُفعّلها ونستفيد منها”.

تأتي البيانات السلوكية الموثقة من الطرف الأول من تحليل بيانات طبقة الحزمة التي تلتقطها مسابير تُحلل حركة مرور الشبكة، ووُضعت أصلًا لتُقيّم وتحسن أداء الشبكة. بالرغم من أن محتوى هذه الحِزم مشفر غالبا (باستخدام خدمة HTTPS)، فإن المنصات التي تصدر البيانات قابلة للتتبع. قال جيسن: “الذي حاز على اهتمامنا هو تفاصيل مستوى الناشر، ماهي الخدمات التي يستخدمونها؟” “وماذا كانت المدة الزمنية؟ هذا يعني أننا بدأنا نفهم أن الشخص الواحد ربما يكون جزء من جمهور معين، قد يكون الشخص لاعبًا إذا كان 20% من استخدامه للتطبيقات من لعبة “Clash of Clans”.

تأتي البيانات الديموغرافية من معلومات الفوترة التي يقدمها العميل عند فتح الحساب، مدعومًا ببيانات الطرف الثالث المشتراة من شركات مثل Experian.

ما هي أبرز التفاصيل التقنية في هذا التحول؟

تستقبل منصة بنسايت حول 60 تيرابايت من بيانات العملاء الجدد كل يوم، والبيانات مقسمة على نظامين، تُحفظ معلومات الملكية والمُعَرّفة شخصيًّا في نظام Hadoop الداخلي الآمن الخاص بهم، بينما تُشغَّل بيانات التطبيق ومنصات المنتجات من خلال خوادم سحابة أمازون (Amazon Web Service (AWS.

يستخدم فريق بنسايت منصة داتامير (Datameer) للتحليلات من أجل التعامل مع الأرقام، ولاعتمادهم فلسفة الإشراف على البيانات التي طرحها باتل، كبير علماء البيانات في الولايات المتحدة، بحيث يؤخذ مشرف بيانات من كل قسم بمسؤولية تأكيد أن التحليلات قد نُفذت قد الامكان، وكل مشرفي البيانات مدربون على أداة داتامير. تساعدهم البنية الأساسية لامدا التابعة لـ AWS على الاستقبال والتحكم بتدفقات البيانات فوريًّا.

ما هي أبرز التحديات؟

بالطبع ، تعتبر بيانات الهاتف المحمول حساسة وخاصة، نظرًا للتفاصيل التي يمكن أن تكشفها عن حيواتنا الخاصة. لتسوية الأمر، فإن خدمة سبرينت اختيارية، أي أن على العملاء السماح بمشاركة معلوماتهم كي تُستخدم لتزويدهم بالإعلانات المُستهدَفة.

يقول جيسن: “سبرينت هي الوحيدة من بين أربعة مشغلين لاسلكيين في الولايات المتحدة لا تُضمّن أحدًا خدمتها بالوضع الافتراضي، بل نسعى لإقناع عملائنا، وذلك أمر سهل، أنهم إذا سمحوا لنا بالاستفادة من بياناتهم ستصلهم أشياء ملائمة لهم أكثر، فتكون الإعلانات أقرب للخدمة من الإزعاج.

“يعي العملاء تماما أن هذا النوع من الخدمات يساعد في تمويل خدمات تشغيل الهاتف وتقليل تكاليفهم”.

ما الذي نستفيده ونتعلمه من هذه التجربة؟

يتمتع مشغلو الهواتف المحمولة بإمكانية الوصول إلى ثروة من البيانات النافذة الفريدة، بل والتي يمكن التحقق منها واستخدامها لجعل الإعلان أكثر صلة وفعالية.

كثير من هذه البيانات شخصية، ولا يُسمح باستخدامها دون إذن صريح من العميل، بل يُقال أن الكثيرَ راضون كفايةً لمنح هذا الإذن، إذا كان يعني ذلك الاستهداف بإعلانات أكثر صلة وأقل تدخلاً.

تُزود بيانات العملاءِ تدفقَ إيرادات إضافي وقيّم للشركات التي تفعل الاستفادة من الموارد، مما يؤدي إلى خفض التكاليف على الشركات وزيادة القيمة للعملاء.

للمراجع وقراءة المزيد:

لمزيد من المعلومات حول استخدام سبرينت للبيانات، زُر الرابط أدناه:

http://www.lightreading.com/spit-(service-provider-it)/analytics-bigdata/sprint-plays-by-its-own-rules-too/d/d-id/706402 http://www.ibmbigdatahub.com/blog/sprint-leverages-big-data-gainvaluable-business-insights

استخدام البيانات الضخمة في الترفيه (تجربة نتفلكس)

ترجمة: فاضل حمود

مراجعة: محمد كامل

تمهيد

أظهرت بعض الإحصائيات أن خدمة بث الأفلام والتلفزيون Netflix تمثل الثلث من تدفق البيانات في الإنترنت في وقت الذروة في الولايات المتحدة ، وبلغ عدد المشتركين في هذه الخدمة 65 مليون مشترك من أكثر من 50 دولة يستمتعون بأكثر من 100 مليون ساعة من البرامج التلفزيونية والأفلام يوميا ً. يتم جمع البيانات من هؤلاء الملايين من المشتركين ومراقبتها في محاولة لفهم عادات المشاهدة لديهم. لكن بيانات Netflix ليست فقط “ضخمة” بالمعنى الحرفي. إن الجمع بين هذه البيانات والتقنيات التحليلية المتطورة هو ما يجعل Netflix شركة بيانات ضخمة حقيقية.

كيف استخدمت البيانات الضخمة عمليا ً؟

يكفي إلقاء نظرة سريعة على صفحة وظائف Netflix لترى جدية التعامل مع البيانات والتحليلات. يتم تعيين المتخصصين للانضمام إلى فرق ماهرة بشكل خاص في تطبيق المهارات التحليلية على مجالات عمل معينة منها: تحليلات التخصيص (personalization analytics) ، وتحليلات الرسائل (messaging analytics) ، وتحليلات عرض المحتوى (content delivery analytics)، وتحليلات جهاز المستخدم (device analytics) . . . وغير ذلك من التحليلات. ومع ذلك ، على الرغم من استخدام البيانات الضخمة في كل جانب من جوانب أعمال Netflix ، فقد كان هدفهم المنشود دائما ً هو التنبؤ بما سيستمتع العملاء بمشاهدته. تحليلات البيانات الضخمة هي الوقود المحرك ل “محركات التوصية” (recommendation engines) المصممة لخدمة هذا الغرض.

بدأت الجهود هنا في عام 2006 ، عندما كانت الشركة لا تزال تعمل بشكل أساسي في مجال إرسال أقراص DVD (بدأ البث بعد عام). أطلقت الشركة جائزة Netflix ، حيث قدموا مليون دولار للمجموعة التي يمكنها التوصل إلى أفضل خوارزمية للتنبؤ بكيفية تقييم عملائهم لفيلم بناءً على تقييماتهم السابقة. تم الإعلان عن المشاركة الفائزة في عام 2009 ، وعلى الرغم من تحديث الخوارزميات باستمرار ، لا تزال المبادئ الأساسية عنصرا ً رئيسيا ً في محرك التوصية.

في البداية ، كان المحللون مقيدين بنقص المعلومات المتوفرة لديهم عن عملائهم – أربع سمات فقط لكل عميل (معرّف العميل ومعرف الفيلم وتصنيف وتاريخ مشاهدة الفيلم) كانت متاحة للتحليل. بمجرد أن أصبح البث هو طريقة العرض الأساسية، أصبح الوصول إلى العديد من سمات البيانات الجديدة متاحا ً. مكنت هذه البيانات الجديدة Netflix من بناء نماذج للتنبؤ بأفضل الأفلام التي سيستمتع بها العملاء. فالعملاء السعداء هم الأكثر احتمالية في مواصلة اشتراكهم.

عنصر مهم آخر في محاولة Netflix لمنحنا أفلاما ً سنستمتع بها هو وضع العلامات (Tagging). تدفع الشركة للناس مقابل مشاهدة الأفلام ثم توصيفها بالعناصر التي تحتوي عليها الأفلام. سيقترحون عليك بعد ذلك مشاهدة الإصدارات الأخرى التي تم وضع علامات عليها بشكل مشابه لتلك التي أعجبتك. هذا هو المصدر الذي تأتي منه “الاقتراحات” غير العادية في بعض الأحيان (والتي تبدو آلية إلى حد ما): “هل أنت في حالة مزاجية لكوميديا مراهقة حمقاء تظهر فيه بطلة قوية؟” وهو السبب في أن الخدمة في بعض الأحيان توصي بمشاهدة الأفلام التي تم تصنيفها بنجمة واحدة أو نجمتين فقط. قد يبدو هذا مخالفا ً للمنطق بالنسبة لهدفهم المتمثل في عرض أفلام ستعجبك. لكن ما حدث هو أن ترجيح هذه التقييمات قد فاقه التنبؤ بأن المشاهد سيستحسن محتوى هذا الفيلم . في الواقع ، حددت Netflix بشكل فعال ما يقارب من ٨٠ ألف “نوع صغير” (micro-genres) جديد من الأفلام بناءً على عادات المشاهدة لدينا!

في الآونة الأخيرة ، تحركت Netflix لتصبح منشئ محتوى ، وليس مجرد موزع لاستوديوهات الأفلام والشبكات الأخرى. كانت استراتيجيتهم هنا أيضا ً مدفوعة بقوة ببياناتهم – التي أظهرت أن مشتركيهم لديهم شهية نهمة للمحتوى الذي أخرجه ديفيد فينشر وبطولة كيفن سبيسي. بعد المزايدة على الشبكات بما في ذلك HBO و ABC للحصول على حقوق House of Cards ، كانوا واثقين جدا ً من أنها تناسب نموذجهم التنبؤي لـ “العرض التلفزيوني المثالي” لدرجة أنهم لم ينتجوا منتجا ً تجريبيا ًوقاموا على الفور بإنتاج موسمين يتألفان من 26 حلقة . كل جانب من جوانب الإنتاج الخاص ب Netflix كان مدعوما بالبيانات – حتى مجموعة الألوان المستخدمة في صورة الغلاف للمسلسل تم تحديدها لجذب المشاهدين إليها.

المقياس النهائي الذي تأمل Netflix في تحسينه هو عدد الساعات التي يقضيها المشتركين في استخدام خدمتهم. لا حاجة للإحصائيات لتعلم بأن المشاهدين الذين لا يقضون وقتا ً طويلاً في استخدام الخدمة من المحتمل أن يشعروا أنهم لا يحصلون على قيمة مقابل المال الذي يدفعونه مقابل اشتراكاتهم ، وبالتالي قد يلغوا تلك الاشتراكات. ولهذه الغاية ، تتم مراقبة الطريقة التي تؤثر بها العوامل المختلفة على “جودة التجربة” عن كثب ويتم تصميم النماذج لاستكشاف كيفية تأثير ذلك على سلوك المستخدم. من خلال جمع بيانات المستخدم النهائي حول كيفية تأثير الموقع الفعلي للمحتوى على تجربة المشاهد ، يمكن إجراء حسابات حول وضع البيانات لضمان وجود خدمة مثالية لأكبر عدد ممكن من المنازل.

ماذا كانت النتائج؟

تُظهر رسالة Netflix إلى المساهمين في أبريل 2015 أن استراتيجية البيانات الضخمة كانت تؤتي ثمارها. لقد أضافوا ٤.٩ مليون مشترك جديد في الربع الأول من عام 2015 ، مقارنة ٤ ملايين في نفس الفترة من عام 2014. وقد عزت Netflix الكثير من هذا النجاح إلى “المحتوى المتطور باستمرار” ، بما في ذلك House of Cards و Orange is the New Black. يؤدي هذا المحتوى الأصلي إلى اكتساب أعضاء جدد والاحتفاظ بالعملاء. في الواقع ، 90٪ من المشتركين تفاعلوا مع هذا المحتوى الأصلي. من الواضح أن قدرتهم على التنبؤ بما سيستمتع به المشاهدون هو جزء كبير من هذا النجاح.

وماذا عن مقياسهم النهائي: كم عدد الساعات التي يقضيها العملاء في استخدام الخدمة؟ حسنا ً ، في الربع الأول من عام 2015 وحده ، بث مشتركو Netflix  ١٠ مليارات ساعة من المحتوى. إذا استمرت استراتيجية البيانات الضخمة لشركة Netflix في التطور ، فمن المتوقع أن يرتفع هذا الرقم.

ما هي البيانات التي تم استخدامها؟

يتم تغذية خوارزميات التوصيات وقرارات المحتوى ببيانات حول العناوين التي يشاهدها المشركون ، ووقت مشاهدة الأفلام في اليوم ، والوقت المنقضي في اختيار الأفلام ، وعدد مرات إيقاف التشغيل (إما من قبل المستخدم أو بسبب الشبكة) والتقييمات المعطاة. من أجل تحليل جودة التجربة ، تجمع Netflix بيانات عن التأخيرات الناتجة عن التخزين المؤقت (معدل إعادة التخزين المؤقت) ومعدل البت (الذي يؤثر على جودة الصورة) ، بالإضافة إلى موقع العميل.

ما هي التفاصيل الفنية؟

على الرغم من استضافة الكتالوج الضخم للأفلام والبرامج التلفزيونية في السحابة على Amazon Web Services) AWS) ، إلا أنه ينعكس أيضا ً في جميع أنحاء العالم بواسطة مزودي خدمة الإنترنت والمضيفين الآخرين. بالإضافة إلى تحسين تجربة المستخدم عن طريق تقليل التأخير عند دفق المحتوى حول العالم ، فإن هذا يقلل من التكاليف لمزودي خدمة الإنترنت – مما يوفر عليهم تكلفة تنزيل البيانات من خادم Netflix قبل تمريرها إلى المشاهدين في المنزل.

في عام 2013 ، قيل أن حجم الكتالوج الخاص بهم يتجاوز ٣ بيتابايت. سبب كمية البيانات الهائلة هذه هو الحاجة إلى الاحتفاظ بالعديد من العناوين بعدة تنسيقات تصل إلى 120 تنسيقا ً مختلفا ً للفيديو ، نظرا ً لعدد الأجهزة المختلفة التي تشغل Netflix.

في الأصل ، استخدمت أنظمة Netflix قواعد بيانات Oracle ، لكنهم تحولوا إلى NoSQL و Cassandra للسماح بتحليل البيانات غير المهيكلة المعتمد على البيانات الضخمة.

في حديثه في مؤتمر Strata + Hadoop World ، أوضح كيرت براون ، الذي يقود فريق Data Platform في Netflix ، كيف تتطور منصة بيانات Netflix باستمرار. تتضمن البنية التحتية لبيانات Netflix تقنيات البيانات الضخمة مثل Hadoop و Hive و Pig بالإضافة إلى أدوات ذكاء الأعمال التقليدية مثل Teradata و MicroStrategy. ويتضمن أيضًا تطبيقات وخدمات المصدر المفتوح الخاصة بـ Netflix Lipstick  و Genie. ومثل كل البنية التحتية الأساسية لـ Netflix ، تعمل جميعها في سحابة AWS. مستقبلا، تستكشفNetflix  سبارك (Spark) للبث والتعلم الآلي (Machine Learning) وحالات لاستخدام التحليلات، وهم مستمرون في تطوير إضافات جديدة لمجموعة البرامج مفتوحة المصدر الخاصة بهم.

أبرز التحديات

على الرغم من أن الكثير من البيانات الوصفية التي جمعتها Netflix – التي تمثل الممثلين الذي يحب المشاهد مشاهدتهم وفي أي وقت من اليوم يشاهدون فيه الأفلام أو التلفاز – هي بيانات منظمة بسيطة وسهلة القياس ، أدركت Netflix في وقت مبكر أنه هناك الكثير من البيانات القيمة موجودة في المحتوى الفوضوي وغير المنظم للفيديو والصوت.

لجعل هذه البيانات متاحة للتحليل بالكمبيوتر وبالتالي الاستفادة منها، كان لا بد من قياسها بطريقة ما. قامت Netflix بذلك عن طريق الدفع لفرق من المشاهدين ، يبلغ عددهم الآلاف ، لمشاهدة ساعات عديدة من المحتوى ، ووضع علامات دقيقة على العناصر التي وجدوها فيها.

بعد قراءة كتيب مؤلف من 32 صفحة ، قام هؤلاء المشاهدين المدفوع لهم بترميز الموضوعات والقضايا والأفكار التي حدثت على الشاشة ، مثل البطل الذي يعاني من ظهور ديني أو شخصية أنثوية قوية تتخذ قرارا ً أخلاقيا ً صعبا ً. من خلال هذه البيانات ، حددت Netflix ما يقرب من 80000 “نوع صغير” مثل “الأفلام الكوميدية التي تعرض حيوانات متكلمة” يمكن لـ Netflix الآن تحديد الأفلام التي تحب مشاهدتها بدقة أكبر بكثير من مجرد رؤية أنك تحب أفلام الرعب أو أفلام التجسس ، ويمكنها استخدام هذا للتنبؤ بما تريد مشاهدته. وهذا يعطي البيانات الفوضوية غير المهيكلة مزايا هيكل معين يمكن تقييمه كميا ً – وهو أحد المبادئ الأساسية للبيانات الضخمة.

واليوم ، يُقال أن Netflix بدأ في أتمتة هذه العملية ، من خلال إنشاء إجراءات يمكنها التقاط لقطة للمحتوى بتنسيق Jpeg وتحليل ما يحدث على الشاشة باستخدام تقنيات متطورة مثل التعرف على الوجه وتحليل الألوان. يمكن التقاط هذه اللقطات إما على فترات زمنية مجدولة أو عندما يتخذ المستخدم إجراءً معينا ً مثل الإيقاف المؤقت أو إيقاف التشغيل. على سبيل المثال ، إذا كان يعرف أن المستخدم يميل إلى التوقف عن المشاهدة بعد مشاهدة المشاهد الدامية أو الجنسية ، فيمكنه اقتراح المزيد من البدائل الرزينة في المرة القادمة التي يجلس فيها لمشاهدة شيء ما.

الخلاصة ونقاط التعلم الرئيسية

إن توقع ما سيرغب المشاهدون في مشاهدته هو عمل كبير للشبكات والموزعين والمنتجين (جميع الأدوار التي تشغلها Netflix الآن في صناعة الإعلام). احتلت Netflix زمام المبادرة ، لكن الخدمات المنافسة مثل Hulu و Amazon Instant Box Office وقريبًا Apple ، يمكن الاعتماد عليها أيضا ً في تحسين وتنقيح تحليلاتها الخاصة. تعد برمجة المحتوى التنبئي مجالا ً يمكننا أن نتوقع فيه استمرار الابتكار ، مدفوعًا بمنافسة شرسة ، مع مرور الوقت.

بدأت Netflix في بناء أسس “التلفزيون المخصص” ، حيث سيكون لكل مشاهد جدوله الخاص للترفيه الذي يمكنه مشاهدته ، بناءً على تحليل تفضيلاته. تم الحديث عن هذه الفكرة لفترة طويلة من قبل شبكات التلفزيون ولكننا بدأنا الآن في رؤيتها أصبحت كحقيقة واقعة في عصر البيانات الضخمة.

تحسین المنتجات بناءً على التحلیل النصي لتقییمات المستخدمین: دراسة حول تطور سلسلة هواتف هواوي

ترجمة: أثیر الحارثي

تدقیق: شروق السنان

مع الانتشار الهائل لمواقع التجارة الالكترونية والتسوق عن بعد برزت أهمية مراجعة تقييمات المستخدمين قبل عملية الشراء وأصبحت عادة أساسية لكثير من المتسوقين مما يقلل من مخاطر الشراء و يساعد المستهلك على اتخاذ قرارات شراء أكثر موثوقية. لذلك أصبح خيار تقييم المنتج جزءا ً أساسيا ً في مواقع التجارة الالكترونية. 

تحتوي تقييمات المستهلكين على مجموعة كبيرة من المعلومات التي تلعب دورا ً هاما ً في اختيارات المستهلك كما تعتبر مرجعا ً أساسيا ً للشركات لبناء استراتيجيات تطوير المنتجات وتحسينها. يهدف هذا البحث إلى تحليل مراجعات المستخدمين على النحو التالي: ١- جمع آراء المستهلكين من موقع www.zol.com.cn الشهير كمصدر لبيانات تقييمات المستخدمين لسلسلة هواتف هواوي ميت. ٢- تحليل آراء المستخدمين حول ٣ أنواع من هواتف هواوي، ٣- قياس الارتباط بين تقييمات المستخدمين والتحسينات التي ظهرت في الإصدارات الحديثة من هذه الهواتف. 

إن عملية تحليل تقييمات المستخدمين عادة ما تمر بعدة مراحل: أولاً، الحصول على محتوى التقييمات ورأي المستخدم حول المنتج ومواصفاته. ثانيا ً، معالجة المعلومات المستخلصة من المحتوى و تصنيفها. وأخيرا ً، استخلاص النتائج. ويهدف هذا النوع من التحليلات إلى: ١- استنباط الميزات. ٢- تحليل المشاعر. 

يشير مصطلح “ميزة” إلى سمة المنتج ومواصفاته. ويعد استخراج الميزة جزءا ً مهما في عملية تحليل المراجعات. ويهتم هذا البحث باستخراج الميزات المذكورة بشكل صريح من قبل المستخدمين (الميزات التي ظهرت في تعليقات المستخدمين بشكل صريح). تم استخراج الميزات وفقا ً للنمط المتكرر أو الاستخراج المتكرر للكلمات (الميزة المتكررة). وعلى العكس، فالميزات الأقل ظهورا ً في التقييمات تعرف بالميزات غير المتكررة. يعتبر الباحثان Hu و  Liu أول من تعرف على الأسماء ومجموعات الأسماء باستخدام خوارزمية Apriori وأداة وسم النصوص POS labelling tool، من خلال حساب تكرار ظهورها ومن ثم الاحتفاظ بالكلمات التي يتجاوز تكرارها حدا ً معينا ً يضعه المحلل (Threshold). 

وللاستفادة من تقييمات العملاء في مواقع التجارة الالكترونية، برزت تقنية تحليل المشاعر لتعليقات العملاء وآرائهم حيث تهدف هذه التقنية إلى معرفة آراء العملاء تجاه منتج معين سواء ً كانت سلبية أو إيجابية. في هذا البحث، تم تحليل تقييم المستخدمين لسلسلة هواتف هواوي والتي تم بيعها عن طريق موقع www.zol.com.cn. يتم تصنيف تقييمات المستهلكين في هذا الموقع إلى ثلاثة أجزاء: المزايا (مراجعات ايجابية)، العيوب (مراجعات سلبية)، و الملخصات. وبالتالي، يصنف الموقع المراجعات بشكل مباشر وفقا ً لمشاعر المقيمين مما يجعل هذا الموقع  يتناسب مع الهدف الرئيسي للبحث والذي يتمحور حول دراسة تأثير مراجعة المستهلكين وتقييمهم على تطور وتحسين سلسلة هواتف هواوي ميت. 

خطوات تحليل تقييمات وآراء المستهلكين لسلسلة هواتف هواوي ميت:

أولا ً: تحديد الموقع المناسب لجمع البيانات. في هذه الدراسة تم اختيار موقع www.zol.com.cn  – ويعتبر من أشهر مواقع تقييمات الهواتف في الصين –  لجلب تقييمات هواتف هواوي ميت كمصدر للبيانات في هذا البحث. يتميز هذا الموقع باحتوائه على تقييمات قادة الرأي المؤثرين في تقييم المنتجات والتي غالبا ً ما تحتوي مراجعاتهم على تقييمات دقيقة للمنتج وذات قيمة عالية مما يزيد من حجم تأثيرها  سواء ً على قرارات المستهلكين أو حتى على مستوى الشركات المنتجة. 

ثانيا ً: استخراج تقييمات المنتج من الموقع باستخدام أداة Octopus Collector والتي تعتبر من الأدوات الاحترافية لجمع البيانات. حيث تم جمع ما يقارب ٢٠٥٨ تقييم لثلاثة اصدارات من هواتف هواوي منها ١٢٤١ تقييم حول هاتف هواوي ميت ٧، و ٦٠٤ تقييم حول هاتف هواوي ميت ٨، و ٢١٣ تقييم حول هاتف هواوي ميت ٩. 

ثالثا ً: تم استخدام نظام التحليل المعجمي الصيني ICTCLAS ونظام تحليل المحتوى لمعالجة النصوص والإحصاءات ROST CM. يعتبر ICTCLAS النظام الأكثر شيوعا ً لتجزئة الكلمات الصينية والذي تصل دقة تجزئة الكلمات فيه الى ٩٨.٤٥٪. كما تم استخدام نظام ROST CM لحساب إحصائيات تكرار الكلمات في النص المحدد ومن ثم تخزينها. تم اختيار مايزيد عن ٣٠٠ كلمة من الكلمات الأكثر تكراراً  ومن ثم القيام  بإجراء عملية تنظيف (تطهير) لهذه الكلمات بهدف استخلاص المؤشرات الأكثر أهمية بالنسبة لمستخدمي سلسلة هواتف هواوي ميت والتي بلغت أحد عشر  مؤشراً  على النحو التالي: [ السعر ، البطارية ، المظهر ، التصوير ، الشاشة ، الأداء ، الجودة ، النظام ، الصوت والفيديو ، خدمات ما بعد البيع ، تجربة المستخدم]

رابعا ً: إجراء التحليل التجريبي استنادا ً إلى الدراسات السابقة والتي تهتم بدراسة وتحليل تقييمات العملاء عبر الإنترنت، حددت هذه الدراسة مؤشرين رئيسيين لتقييمات العملاء عبر الإنترنت: ١- درجة اهتمام المستخدم بالميزة ٢- درجة رضا المستخدم عن الميزة، ومن ثم مناقشة مدى ارتباط هذين المؤشرين بالابتكار وتحسين المنتجات في الاصدارات الحديثة من هذه الهواتف. ومع هذين المؤشرين، فإنه من السهل للشركات معرفة مدى الحاجة إلى تحسين بعض الميزات وتطويرها. 

ولدراسة ما إذا كان تحسين هواتف هواوي ميت مرتبطا ً بدرجة اهتمام المستخدمين ببعض الميزات ودرجة رضاهم عنها حسب ما ورد في تقييمات المنتج، تم في البداية مقارنة ميزات الهواتف الثلاثة (هواوي ميت٩،٨،٧) ومن ثم مقارنة مستوى التحسين مع درجة تغير رأي المستهلكين تجاه المنتج ومن ثم حساب الارتباط بينهم. أظهرت النتائج أن  هناك ارتباطا ً قويا ً بين تحسين سلسلة هواتف هواوي والتغير في درجة رضا المستخدمين ، أي أنّ العلاقة بين تحسين سلسلة هواتف هواوي ومؤشر (رضا المستخدم) أقوى بكثير مقارنةً بعلاقة تحسين تلك الهواتف ومؤشر (اهتمام المستخدم) بالخصائص التي تم تقييمها، بمعنى أن التحسينات في الموديلات الحديثة (من ناحية: المؤشرات التي تم تحديها) من هواتف هواوي كانت أهم للمستهلك من اضافة مزايا إضافية للهاتف.

بالتالي، يمكن الاستنتاج أنه من الممكن أن تلعب تقييمات المستهلكين عبر الإنترنت دورا ً مهما ً في ابتكار وتحسين المنتجات، ويمكن أن تساعد مراجعات المستهلكين الشركات المصنعة على تحسين الابتكار حتى تصل إلى مستوى رضى المستهلكين. أيضا ً، وفقا ً لهذه النتائج، يمكننا تحديد اتجاهات التحسين والتطوير المستقبلي لسلسلة هواتف هواوي ميت حيث تميل الشركة إلى المحافظة على الخصائص التي تحقق درجة رضا أعلى والعمل على تحسين المميزات التي لم تحقق رضا العملاء. 

الخلاصة:

وجدت هذه الدراسة علاقة قوية بين التغير في درجة رضا الميزة وتحسين الهاتف. فعندما يشهد المنتج تحسينا ً كبيرا ً، تزداد درجة رضا المستهلك أكثر من رضاه عن إضافة ميزات جديدة وتميل تقييمات المستهلكين عبر الإنترنت إلى أن تكون إيجابية. ويؤدي عدم تحسين المنتج بشكل كافِ إلى انخفاض درجة رضا المستهلكين مما يؤدي إلى تقييم المنتج بشكل محايد او سلبي من قبل المستهلكين.

 توصلت هذه الدراسة إلى قدرة الشركات على تحسين المنتجات بناءً على المعلومات المرتبطة بتقييم طراز المنتج السابق، كما يعتبر استخدام المعلومات الواردة في مراجعات المستخدمين من أهم مصادر البيانات التي تستخدمها الشركات لتحسين المنتجات. إضافة إلى ذلك، يساهم هذا البحث في تمكين ومساعدة الشركات في فهم كيفية الاستفادة من هذه البيانات بما يتواءم مع متطلبات السوق، وفهم سلوك المستهلكين وتحسين جودة وكفاءة ابتكار المنتجات. كما يمكن للشركات المصنعة معرفة التفضيلات الحقيقية للمستخدمين من خلال مراجعاتهم عبر الإنترنت وتطوير منتجاتهم بشكل يتناسب مع تفضيلات المستخدم.

أخيراً، أدى التطور في تقنيات الويب وأدوات التحليل إلى انخفاض تكلفة الحصول على تقييمات المستهلكين بشكل كبير. إضافة إلى أن أدوات تحليل البيانات الضخمة واستخراج النصوص وتحليلها تشهد تطورا ً مستمرا ً مما يوفر فرصا كبيرة لتطوير المنتجات وتحسينها في المستقبل. 

***

H. Zhang, H. Rao and J. Feng, Product innovation based on online review data mining: A case study of Huawei phones, Electronic Commerce Research, vol.18, no.1, 

استخدام البيانات الضخمة في إدارة المواصلات العامة (تجربة مدينة لندن)

ترجمة: ريما

مراجعة: محمد كامل





تشرف هيئة النقل في لندن (TfL) على شبكة ضخمة من الحافلات والقطارات وسيارات الأجرة وتأجير الدراجات الهوائية والطرق ومسارات الدراجات وممرات المشاة بالإضافة الى العبَارات التي يتم استخدامها يوميا ًمن قبل الملايين. وتعتبر هذه الشبكة الواسعة جزء لا يتجزأ من حياة الكثير من البشر في واحدة من أزحم المدن في العالم مما يمكّن هيئة النقل من الوصول إلى كمية ضخمة من البيانات. ولذلك تعتمد الهيئة على تحليل البيانات الضخمة بشكل كبير لإدارة وتشغيل هذه الشبكة الضخمة.

المشكلة التي ساعدت البيانات الضخمة بحلها

كما أشارت رئيسة التحليل في هيئة النقل في لندن لورين ويسنتن: “مدينة لندن تنمو بشكل هائل. فعدد السكان الان 8.6 مليون نسمة ومن المتوقع ان تزيد الى 10 مليون نسمة بشكل سريع. يجب علينا فهم سلوك العملاء وكيفية تلبية احتياجاتهم.” وعلى هذا الأساس، لدى هيئة النقل في لندن هدفين لجمع وتحليل البيانات: تنظيم شبكة المواصلات وتقديم المعلومات اللازمة للعملاء. فكما أوضحت لورين وينستن: ” الركاب يرغبون منا بتوفير بخدمات ممتازة مقابل ما ينفقونه على شبكة المواصلات، كما يريدون رؤيتنا مبتكرين ومتقدمين من أجل تلبية احتياجاتهم.” 

كيف استخدمت البيانات الضخمة عمليا؟

تستخدم هيئة النقل في لندن تحليل البيانات الضخمة بثلاث طرق رئيسية: 

– تحديد وتخطيط رحلات العملاء 

– إدارة الحوادث الغير متوقعة. 

– توفير معلومات مخصصة عن الرحلات لكل شخص. 

دعونا نلقي نظرة على هذه الطرق.

في عام 2003 أطلق نظام التذاكر الذكي (Oyster) والذي مكّن الهيئة من جمع بيانات ضخمة عن الرحلات التي يتم حجزها. فعلى الركاب القيام بشحن البطاقات الذكية بالمال أو من خلال شراء بطاقات موسمية ومن ثم تمرير هذه البطاقات عبر الأجهزة المخصصة عند البوابات للتمكن من الوصول الى الباصات والقطارات. في عام 2014 كانت هيئة النقل في لندن أول من قدم وسائل نقل عامة تقبل الدفع عن بعد (تمرير البطاقة بدلا من إدخالها contactless) لحجز الرحلات كما لدى العملاء بديلا ًعن بطاقات (Oyster) لا يتطلب إجراء ً مسبقا ً كالشحن قبل الاستخدام. فبكل سهولة يمكنهم حجز الرحلات عن طريق تمرير بطاقاتهم البنكية عبر أجهزة الدفع. تنتج بطاقات (Oyster) ونظام حجز التذاكر عن بعد 19 مليون لمسة يوميا يمكن تحليلها. 

هذه البيانات مجهولة ويمكن استخدامها لمعرفة سلوك تنقلات الناس من خلال تحليل وجهاتهم وأوقات تنقلاتهم مما يعطي هيئة النقل صورة عامة عن أنماط التنقلات ويزيد من دقة التحليلات على مستوى الرحلات الفردية مقارنة بالسابق. فنسبة كبيرة من رحلات الركاب في لندن تشمل أكثر من وسيلة للتنقل (الرحلات البرية والرحلات التي تكون تحت الأرض an overland and Underground journey)، وهذا التحليل لم يكن ممكنا ً في زمن التذاكر التقليدية، وكان يتم استخدام التذاكر الورقية لكل جزء أو محطة خلال الرحلة.

أيضا ً، يساعد تحليل البيانات الضخمة هيئة النقل في لندن على التصرف بشكل أمثل عند حدوث اضطرابات أو مشاكل غير متوقعة. فعلى سبيل المثال عند حصول خلل فني في إحدى خدمات هيئة النقل فبإمكانهم حساب عدد الأشخصاص الذين ستتأثر رحلاتهم نتيجة هذا الخلل مما يتيح للعملاء من استرجاع نقودهم وإذا كان الخلل الفني كبير فإن هيئة النقل تقوم بشكل تلقائي بإرجاع النقود لكل العملاء الذين تأثروا بسبب هذا الخلل الفني. أما بالنسبة للعملاء الذين حجزوا رحلاتهم عن طريق الدفع عن بعد سيتم ارجاع نقودهم بشكل تلقائي لحساباتهم البنكية. وأما بالنسبة لمستخدمي بطاقات (Oyster) فبإمكان الهيئة التنبؤ إلى أين سيتجه العميل في المرة القادمة فعند تنقلهم في المرة القادمة فإن إرجاع النقود سيكون بانتظارهم في المحطة ويسترد المبلغ في بطاقات العملاء. 

وعند وجود خطة عمل مسبقة ستؤثر على بعض أجزاء وسائل النقل تقوم هيئة النقل في لندن باستخدام النمط التاريخي لتحديد المسارات المتوقعة لتنقلات الناس والتخطيط لخدمات بديلة لتلبية احتياجاتهم وتخفيف أثر هذا الانقطاع. كما يقومون بإشعار العملاء عن احتمالية تأثرهم بالخلل الفني مع تزويدهم بتحديثات شخصية باستمرار.

هذا النهج المخصص لمعلومات السفر هو إحدى الطرق التي تركز عليها الهيئة في تعاملهم مع البيانات لإدارة وسائل النقل. على سبيل المثال تستخدم الهيئة البيانات الخاصة بالتنقلات والسفر لتحديد العملاء الذين يستخدمون طرق أو مسارات محددة بانتظام وإرسال تحديثات مناسبة لهم. وكما ذكرت لورين وينستن” إذا كنا نعلم أن عميل ما يستعمل محطة معينة بشكل متكرر يمكننا ضم بعض المعلومات عن التغييرات التي ستحصل في الخدمات في هذه المحطة مع التحديثات الخاصة به. نحن نتفهم بأن الناس يستقبلون الكثير من الرسائل البريدية في هذه الأيام وقد تكون أمرا ً مزعجا بعض الشيء. نحن نركز على إرسال رسائل مخصصة ومعلومات ذات صلة لعملائنا” 

أبرز النتائج

أصبح لدى الهيئة صورة أوضح من السابق عن نمط تنقلات الناس عند استخدام وسائل النقل في لندن وصولا إلى نمط الرحلات الفردية. إن هذا الكم الهائل من المعلومات التي توفرها البيانات سيسمح لهم بفهم عدة حالات مهمة منها: مقدار الضغط على وسائل النقل load profiles (مدى ازدحام حافلة معينة أو مجموعة من الحافلات في وقت معين)، التخطيط الأمثل لمناطق تبديل الحافلات والقطارات interchanges، تقليل أوقات المشي، والتخطيط لخدمات أخرى مثل عروض منافذ البيع داخل المحطات.

باختصار تساعد البيانات هيئة النقل على تقديم خدمات أفضل للعملاء. تستشهد لورين وينستن بمثال عندما اجبر مجلس (Wandsworth) على اغلاق جسر (Putney) – حيث تقطع الحافلات 11000 رحلة خلال أسبوع – لتصليحات طارئة. ” استطعنا قطع نصف عدد الرحلات التي تبدأ أو تنتهي بالقرب من جسر (Putney)”. الجسر كان لا يزال مفتوح للمشاة وراكبي الدراجات. لذلك كنا نعلم أن الناس لا يزالون بإمكانهم العبور او الوصول لوجهاتهم أو إكمال رحلاتهم على الجهة الأخرى، سواءً كانوا سكان محليين او وجهتهم كانت محلية. النصف الاخر منهم كانوا يعبرون الجسر في الخط السريع من رحلتهم. ومن أجل تلبية احتياجاتهم، تمكنا من تطوير خدمات تبديل وسائل النقل وخدمات الحافلات بطرق بديلة، كما أرسلنا رسائل شخصية الى المسافرين في المنطقة حول مدى تأثر رحلاتهم.

أثبتت رسائل البريد الالكترونية الشخصية الخاصة بالسفر فائدتها بشكل خاص حيث أفاد 83% من الركاب أن الخدمة كانت مفيدة أو مفيدة جدا ً. وليس سيئا عندما تأخذ بالحسبان أن التذمر من حالة وسائل النقل العامة تعتبر هواية لدى العديد من البريطانيين.

البيانات التي تم استخدامها

تستخدم الهيئة مجموعة من البيانات التي تجمع من خلال نظام التذاكر، أجهزة الاستشعار الموصولة بالمركبات وإشارات المرور واستطلاعات الرأي ومجموعات المناقشة وبالطبع وسائل التواصل الاجتماعي. وكما ذكرت لورين وينستن ” نحن نستخدم المعلومات الواردة من نظام الدعم لمعالجة الدفع عن بعد بالإضافة الى بطاقات (Oyster) ومواقع القطارات وبيانات إشارات المرور وتأجير الدراجات الهوائية والمخالفات”. كما يؤخذ بالاعتبار معلومات المناسبات الاستثنائية مثل كأس العالم للرجبي (Rugby world cup) ومناسبات رياضة الدراجات مثل عبور سباق فرنسا للدراجات عبر لندن. حتى يتمكنوا من تحديد وتنبيه الناس المتوقع تأثرهم.

التفاصيل التقنية

تعمل أنظمة هيئة النقل في لندن على مجموعة متنوعة من الأنظمة التقليدية بالإضافة الى أحدث الأنظمة التقنية. كما أن دمج أحدث استراتيجيات جمع البيانات مع النظام القديم لم تكن مهمة سهلة في مدينة ضخمة مثل لندن حيث يعمل نظام النقل العام فيها منذ عام 1829. بالتالي تحرص الهيئة على التخطيط الأمثل وبعناية فائقة لأفضل الطرق التقنية لدمج مجموعات متنوعة من مصادر البيانات. دائما ما يكون هناك مخاطر في المشاريع التقنية تتمثل في تكامل الأنظمة مع بعضها مما يعرض تلك الأنظمة لأن تكون غير جاهزة لأداء المهام بشكل دقيق عن حدوث أدنى خلل في عملية التكامل. لذلك اتخذت هيئة النقل في لندن نهجا ًعمليا ً للغاية لبناء مستودعات لبيانات عملائهم. اختبرت الهيئة الفوائد التجارية من تطبيق منهجيات البيانات الضخمة قبل بناء نظم التشغيل والأدوات الجديدة. بدأوا باستخدام SQL (لغة الاستعلامات) التحليلية على مجموعة صغيرة من نظام المعاملات المستخدم لتحصيل الإيرادات. ومع الإمكانيات الهائلة والمفيدة للتحليل قامت بقية أقسام الهيئة باستخدام هذا النهج والمطالبة بالمزيد. ومن ثم قررت هيئة النقل بالاستثمار في أداة Parallel Datawarehouse والتي تقدم خدمات تحليلية حديثة ومفتوحة المصدر. تتيح المنصة التحليلية لهيئة النقل في لندن مساحة هائلة لتحليل البيانات تبلغ 150 تيرابايت جاهزة للاستخدام في تقارير تحليلات الاعمال، بالإضافة الى playpen area لاختبار أدوات البيانات الجديدة والخوارزميات باتباع منهجية إثبات المفهوم ((POCs والتي يتم تقديمها من خلال تطوير البرمجيات باستخدام منهجية agile. بمجرد تقييم (POCs) ومدى إمكانية توفر فوائد تجارية سيتم تطوير الأدوات الجديدة ودمجها في أنظمة مستودعات البيانات. تتضمن خطط التطوير المستقبلي زيادة القدرة على التحليلات الفورية والعمل على دمج نطاقات أوسع من مصادر البيانات لتخطيط الخدمات بشكل أفضل ورفع معدل رضا العملاء.

أبرز التحديات 

في مترو أنفاق لندن (المعروف أيضا باسم Tube) اعتاد الركاب على تمرير بطاقاتهم أو تذاكرهم عند الدخول والخروج ليتم التحقق من صحة التذاكر (بواسطة حواجز آلية) في بداية ونهاية الرحلة لأن أجرة الركوب تختلف حسب المنطقة (zonal basis). ولكن في الحافلات لا توجد آلية لتسجيل أين يغادر الركاب الحافلات بسبب أن أجرة استخدام الحافلات ليست بناء على المسافة التي قطعوها وإنما أجرة ثابتة. فكما ذكرت لورين وينستن ” تتبع رحلات العميل كان تحديا ً بالنسبة لنا “، لذلك عملت هيئة النقل في لندن مع معهد ماساتشوستس للتكنولوجيا MIT واحدا ً من المعاهد الاكاديمية المرموققة والتي لدى الهيئة شراكة بحثية معهم لابتكار حلول للبيانات الضخمة. تقول لورين وينستن ” أردنا معرفة ما إذا كان بإمكاننا استخدام البيانات الضخمة للإجابة على الأسئلة المجهولة السابقة. كان لدينا بعض البيانات للرحلات التي تظهر أين قام العملاء بتمرير تذاكرهم أو بطاقاتهم عند الركوب لذلك كان علينا البدء بتلك البيانات لسد النقص في المعلومات . قمنا بالتساؤل ‘هل بإمكاننا استخدام البيانات الضخمة لاستنتاج أين خرج راكب ما؟’ نحن نعلم اين هي الحافلة لأننا نملك بيانات الموقع ونملك أيضا بيانات ركوب عملائنا من خلال بطاقات (Oyster) “. ” ما نقوم به هو النظر لسجل سفر عميل ما لمعرفة مكان اللمسة (مكان تمرير البطاقة) التالية  فإذا رأينا اللمسة التالية بعد فترة وجيزة وهي عند مدخل مترو الانفاق، فسوف نعلم أننا نتعامل مع رحلة واحدة متعددة الوسائل باستخدام الباص ومترو الأنفاق”.

خاتمة

من الواضح أن البيانات الضخمة لعبت دورا ً كبيرا ً في إعادة تنشيط شبكة وسائل النقل في لندن ولكن الأهم من ذلك أنه تم تنفيذها بطريقة ذكية مع التركيز على الفائدة كما شرحت لورين وينستن ” لماذا نسأل هذه الأسئلة؟” من المهم أن ندرك الأفكار التي نحصل عليها من تحليل البيانات الضخمة في بعض الأحيان ” معرفتها مثيرة للاهتمام” فقط.” ” نحاول دائما ان نعود للأسئلة الكبرى – النمو في مدينة لندن وكيف يمكننا تلبية هذا الطلب المتزايد – من خلال إدارة الشبكة والبنية التحتية بأكبر قدر ممكن من الكفاءة”. 

فهم ما تريد تحقيقه هو المفتاح الأساسي لاستخدام البيانات بنجاح. من السهل جدا ً تشتيت انتباهك بالإمكانيات الهائلة للبيانات الضخمة، لذا فالحفاظ على تركيز قوي على أهدافك الرئيسية والتحديات سيساعدك كثيرا ً في التركيز على الوصول إلى البيانات التي تساعد على تحقيق الأهداف وتجاوز التحديات.

لمزيد من المعلومات والمراجع:

لمعرفة المزيد حول استخدام هيئة النقل في لندن لتحسين تجربة العملاء عن طريق

https://tfl.gov.uk/cdn/static/cms/documents/big-data-customer

experience.pdf