أحدث الأخبار​

تابع أخبار شريكك الرقمي وأحدث منتجاته وخدماته المقدمة لك.

استخدام البيانات الضخمة في قطاع التجزئة (تجربة أمازون)

ترجمة: ريما فواز

نبذة

منذ فترة طويلة، تجاوزت أمازون نموذجها التجاري الأصلي كمتجر لبيع الكتب عبر الإنترنت. وتعتبر الآن واحدة من أكبر متاجر التجزئة للسلع المادية والسلع الافتراضية مثل الكتب الإلكترونية والفيديوهات، ومؤخرا ً خدمات الويب.

حققت أمازون الكثير من نجاحاتها الجوهرية من خلال عدة استراتيجيات من أهمها استخدامهم الرائد لتقنية “محرك التوصيات” – أنظمة مصممة للتنبؤ برغبة العميل في بعض المنتجات، ومتى يرغب به وما إلى ذلك.

لم تكتف أمازون بالنجاحات التي حققتها من خلال تلك الاستراتيجيات بل انتقلت لتكون منتجا ً للسلع والخدمات، بدلاً من مجرد منفذ بيع. بالإضافة إلى إنتاج الأفلام والبرامج التلفزيونية، بناء وتسويق الأجهزة الإلكترونية، بما في ذلك الأجهزة اللوحية وصناديق التلفزيون وأجهزة البث.

ومؤخرا ً، اتجهوا لمنافسة سلاسل متاجر البقالات من خلال تقديم منتجات طازجة وتوصيل أسرع عبر خدمتهم Amazon Now.

ما المشكلة التي ساعدت البيانات الضخمة في حلها؟

بات الانفجار الهائل في توفر البيانات والمعلومات مشكلة حقيقية، ويواجه التجار خسائر كبيرة بسببها. تعتمد التجارة الإلكترونية على توفير أكبر عدد ممكن من المنتجات أو الخدمات، لزيادة فرص البيع. فازدهرت شركات مثل أمازون و ولمارت من خلال اعتماد نموذج “كل شيء تحت سقف واحد” للسوبرماركت.

المشكلة هنا أن العملاء غالبا ً ما يشعرون بالحيرة والتشتت عندما يتعرضون لمجموعة كبيرة من الخيارات الممكنة وهذا ما يعرف بمعضلة الخيارات. فعلى الصعيد النفسي، كثرة الخيارات قد تثير مخاوف “ندم الشراء” – إضاعة المال من خلال اتخاذ قرارات شراء بناء ً على معلومات غير دقيقة – أو تأجيل إنفاق المال حتى نتأكد من أننا قمنا بإجراء بحث كافٍ.

قد تتسبب كثرة الخيارات في تغيير رأينا تماما ً حول الحاجة إلى تلفزيون بدقة فائقة الوضوح بقيمة 2000 دولار ونقرر الذهاب لرحلة سياحية قصيرة بدلاً من ذلك.

إنها نفس المشكلة التي تعاني منها غالبية المشاريع التي تنطوي على كميات كبيرة من المعلومات. يمكن أن يواجه العملاء الكثير من البيانات (مع العديد من الخيارات) مع نقص في الإدراك – بدون فكرة واضحة حول ماهية أفضل قرار شراء لتلبية احتياجاتهم ورغباتهم.

كيف استخدمت البيانات الضخمة في عمل أمازون؟

استخدمت أمازون البيانات الضخمة التي تم جمعها من العملاء أثناء تصفحهم للموقع لبناء وضبط أنظمة التوصية الخاصة بها. ربما لم تكن أمازون هي المخترعة الأولى لأنظمة التوصية، ولكنها قدمت تلك الأنظمة للاستخدام العام الواسع. النظرية هنا هي أنهم كلما عرفوا المزيد عن العميل، زادت احتمالية قدرتهم على توقع ما يرغب بشرائه. بمجرد أن يتم ذلك، يمكنهم تبسيط عملية إقناعه بشرائها عن طريق التخلص من الحاجة إلى البحث في أقسام الموقع المتعددة.

يستند محرك التوصية في أمازون إلى ما يعرف ب “collaborative filtering “. وهذا يعني أنه يقرر ما يعتقد أنك ترغب فيه من خلال معرفة من تكون، ثم يقدم لك عناصر تم شرائها من قبل عملاء آخرين لديهم ملف شخصي مشابه لك.

على عكس تصفية القائمة على المحتوى، على سبيل المثال، في محرك التوصية في نيتفليكس – فإن ذلك يعني أن النظام لا يحتاج في الواقع إلى معرفة أي شيء عن البيانات غير المهيكلة داخل المنتجات التي يبيعها. كل ما يحتاجه هو البيانات الوصفية: اسم المنتج، وكم يكلف، ومن قام بشرائه، ومعلومات مماثلة.

أمازون تجمع البيانات عن كل واحد من أكثر من ربع مليار عميل أثناء استخدامهم لخدماتها. بالإضافة إلى ما تشتريه، فإنهم يراقبون ما تنظر إليه، وعنوان الشحن الخاص بك لتحديد البيانات الديموغرافية (يمكنهم تخمين مستوى دخلك بدقة من خلال معرفة حي السكن) وما إذا كنت تترك تعليقات وآراء العملاء.

كما ينظرون إلى وقت تصفحك لتحديد سلوكياتك العادية ومقارنة بياناتك مع أشخاص آخرين يتبعون أنماطا ً مشابهة.

إذا استخدمت خدمات أمازون للبث المباشر، مثل “أمازون برايم”  للبث المباشر للفيديو أو تأجير الكتب الإلكترونية، فيمكنهم أيضا ً معرفة مقدار الوقت الذي تكرسه لمشاهدة الأفلام أو قراءة الكتب.

تستخدم كل هذه البيانات لبناء “رؤية 360 درجة” عنك كعميل فردي. بناءً على ذلك، يمكن لأمازون أن تجد أشخاصًا آخرين يعتقدون أنهم ينتمون إلى نفس الفئة المستهدفة المحددة بدقة (مثال: رجال موظفين بين 18 و45 عاما ً، يعيشون في منزل مستأجر بدخل يتجاوز 30,000 دولار ويستمتعون بالأفلام الأجنبية، على سبيل المثال) وتقديم توصيات بناء ً على اهتماماتهم.

في عام 2013، بدأت أمازون ببيع هذه البيانات للمعلنين للسماح لهم بإطلاق حملات تسويقهم الخاصة المدعومة بتقنية البيانات الضخمة. وهذا وضعهم في منافسة مع جوجل وفيسبوك، التي تبيعان أيضًا وصولًا مجهولًا إلى بيانات المستخدمين للمعلنين.

ماذا كانت أبرز النتائج:

أصبحت أمازون أكبر متجر تجزئة عبر الإنترنت في الولايات المتحدة نتيجة نهجها المركز على العملاء في تكنولوجيا التوصية. في العام الماضي، حققت أمازون مبيعات تقارب 90 مليار دولار من المبيعات في جميع أنحاء العالم. وقد ارتفعت إيرادات أعمالها المستندة إلى الخدمات السحابية عبر الويب، مثل أمازون ويب سيرفيسز، بنسبة 81٪ في العام الماضي لتصل إلى 1.8 مليار دولار. بالإضافة إلى ذلك، جعل نهج أمازون في استخدام البيانات الضخمة في التسوق وخدمات العملاء منها علامة تجارية معترف بها عالميا ً.

ماهي البيانات المستخدمة:

أمازون تقوم بجمع البيانات من المستخدمين أثناء تصفحهم للموقع – مراقبة كل شيء بدءً من الوقت الذي يقضونه في تصفح كل صفحة إلى اللغة المستخدمة في التقييمات التي يتركونها. بالإضافة إلى ذلك، يستخدمون مجموعات بيانات خارجية مثل معلومات التعداد السكاني لتحديد بيانات العملاء الديموغرافية. إذا استخدمت تطبيقاتهم على هاتفك الذكي أو جهاز الكمبيوتر اللوحي الذي يدعم تحديد المواقع بنظام GPS ، فيمكنهم أيضا ً جمع بيانات موقعك ومعلومات عن التطبيقات والخدمات الأخرى التي تستخدمها على هاتفك. باستخدام خدمات المحتوى المتدفقة لأمازون مثل أمازون برايم وأوديبل، يمكنهم الحصول على معلومات مفصلة أكثر حول مكانك ووقت وكيفية مشاهدتك واستماعك للتلفزيون والأفلام والمحتوى الصوتي.

لمحة عن بعض التفاصيل التقنية:

تتعامل أمازون مع أعمالها الأساسية في مستودع البيانات المركزي الخاص بها، والذي يتألف من خوادم Hewlett-Packard تعمل بنظام التشغيل Linuxوتعتمد على قاعدة بيانات Oracle للتعامل مع 187 مليون زائر فريد شهريا ً على موقعها الإلكتروني وأكثر من مليوني بائع في سوق أمازون.

بعض التحديات في تلك التجربة:

في الأيام الأولى كان أكبر تحدي لأمازون وجميع متاجر التجزئة الإلكترونية هو جعل الجمهور يثق في المشاركة في الأنشطة التجارية عبر الإنترنت. في الوقت الحاضر، وبفضل التحسينات في الأمان والضغط التشريعي (وعلى الرغم من زيادة حالات سرقة البيانات)، لا يوجد لدينا قلق عالي في تقديم تفاصيل بطاقتنا الائتمانية لتجار التجزئة عبر الإنترنت أكثر مما نفعل مع المتاجر التقليدية. يستخدم أمازون أنظمة Netscape Secure Commerce Server و SSL لتخزين المعلومات الحساسة في قاعدة بيانات مشفرة.

ما هي نقاط التعلم الرئيسية والنتائج المستفادة؟

  • تنوع اختيارات المستهلك هو أمر رائع، ولكن الكثير من الاختيارات دون توجيه قد يربك العملاء ويثبطهم عن اتخاذ قرارات الشراء.
  • تسهّل محركات توصية البيانات الضخمة مهمة توقع ما يرغب فيه العميل، من خلال عمل تحليل للملف الشخصي له ومراجعة تاريخ الشراء للأشخاص الذين يندرجون ضمن نفس التخصصات.
  • كلما عرفت الشركة المزيد عن العميل، كلما استطاعت بيع منتجاتها بشكل أفضل لهم. تطوير رؤية شاملة لكل عميل كفرد هو أساس التسويق وخدمة العملاء التي تعتمد على البيانات الضخمة.
  • الخصوصية وأمان المعلومات هما أمران مطلوبان بشكل قطعي. يمكن أن يدمر اختراق البيانات الضخم أو سرقتها ثقة المستهلك في الشركة في ليلة وضحاها.
  • من خلال مراعاة هذه النقاط، يمكن للشركات تحسين تجربة العملاء، وتعزيز المبيعات، والحفاظ على الثقة في سوق يتسم بالاعتماد المتزايد على البيانات.

مصادر:

Statista(2015) Annual number of worldwide active Amazon customer

accounts from 1997 to 2014 (in millions), 

Annual Amazon accounts worldwide 2015 | Statista

لمعلومات اكثر حول استخدام امازون للبيانات الضخمة:

http://expandedramblings.com/index.php/amazon-statistics/

Scientific explanation of Amazon’s recommendation engine, and col-

laborative filtering in general, by Greg Linden, Brent Smith, and Jeremy

York of Amazon

http://www.scribd.com/doc/14771615/Amazon-

Recommendations

استخدام البيانات الضخمة في الرياضة (تجربة منتخب الولايات المتحدة الأولمبي للدراجات)

ترجمة: شدا المبرد

نبذة عن التجربة

سرعان ما تزداد العلاقة بين مجاليّ الرياضة وتحليلات البيانات، كما سيأتي في نقاط كثيرة من هذه التجربة. سوف نرى في هذه التجربة كيف انتقل فريق المنتخب الأمريكي للدراجات من مستوى الخسارة إلى الفوز بالميداليات الفضية في أولمبياد لندن 2012، وأحد أسباب ذلك يعود إلى قوة تحليلات البيانات.

كانت لاعبات الفريق يعانين عندما عدن إلى أصدقائهن وعائلاتهن وللمجتمع طلباً للمساعدة، شُكِّل فريق من المتطوعين في عدة مجتمعات رقمية للرياضة والصحة، وكانوا بقيادة سكاي كرستوفرسن. كان كرستوفرسن دراجاً أولمبيّاً ومحطماً للرقم القياسي على مستوى العالم في سباق الدراجات على المضمار ذو المئتين مترا للفئة العمرية 35 عاماً فأكثر، حقق ذلك باتخاذه نظام تدريب أعده لنفسه، بُني على تحليلات البيانات حذوَ ما عمله طبيب القلب د. إيريك توبال.

ما المشكلة التي ساعدت البيانات الضخمة في حلها؟

بدأ  كرستوفرسن بمشروعه “أوأثليت” اختصارا لـ”الرياضيّ المحسّن” بعد خيبة أمله من تعاطي العقاقير المنشطة في هذه الرياضة، إثر فضيحة لانس أرمسترونق بالعقاقير، والذي عرف بـ”أكبر محتال في الرياضات الأمريكية”. كانت فكرة أوأثليت هي مساعدة اللاعبات لتحسين أداءهن وصحتهن بصفة مستدامة، دون الرجوع للعقاقير المحسِّنة للأداء. ونتيجة لذلك، نشأت فلسفة “البيانات لا العقاقير”.

كيف استُخدمت البيانات الضخمة عمليًّا؟

بالعمل مع فريق الدراجات، وضع كريستوفرسون مجموعة من تقنيات جمع البيانات والمراقبة المعقدة لتسجيل كل الجوانب التي تؤثر على أداء اللاعبات، بما في ذلك النُّظم الغذائية وأنماط النوم والبيئات وكثافة التدريب. دُرست تلك البيانات لتحديد الأنماط المتعلقة بأداء اللاعبات لتُدلى التغييرات على برامجهن التدريبية.

ماذا كانت أبرز النتائج؟

كما يقول كرستوفرسن، بقياس الجوانب المختلفة (مثل النوم والنظام الغذائي) وفهم ترابطها، يمكن تحقيق “أعلى مستوى في الأداء”، ففي هذه الحالة، يدل عمق التحليلات على أن كرستوفرسن استطاع الوصول إلى ما يسميه بـ” نطاقات المثالية الفردية”. فبهذه المعلومات، استطاع تطوير برامج مصممة خصيصاً لكل لاعبة لتحقيق الحد الأعلى لمستوى كل لاعبة في الفريق، فمثلًا: كان أحد الاستنتاجات هو أن اللاعبة جيني ريد يتحسن أدائها بشكل لافت إذا كانت قد نامت بدرجة حرارة منخفضة في الليلة الماضية، لذا جُهَّزت لها مرتبة نوم مبردة بالماء لتبقي جسدها على نفس درجة الحرارة طيلة الليل، يقول كرستوفرسن: كان لذلك الأثر في جعل نومها عميقاً، ويكون كذلك عندما يفرز الجسم التستسترون وهو هرمون النمو في الإنسان. وأما في حالة ساره هامر، أظهرت بياناتها أن لديها نقص في فيتامين دال، فغُيّرَ نظامها الغذائي، وروتينها اليومي (بما في ذلك تعرضها لأشعة الشمس)، فنتج عن ذلك تحسن كبير في أدائها.

وعلى صعيد آخر، ساعدت تلك التحليلات اللاعبات في تجنب الإصابات. حسب رأي كرستوفرسن، أن أكثر ما يغوي الرياضيين لتعاطي العقاقير المحسنة للأداء والتي أفسدت رياضة ركوب الدراجات هو الحاجة للتدريب الصارم مع تجنب مخاطر الإصابة والمرض. تُمكّن البيانات الضخمة الفرق الرياضية ذات الأداء العالي من تحديد العوامل المتعددة التي تؤثر في الأداء، مثل حجم التدريب، والاستشفاء، وكيفية تجدد جسم الإنسان. مما يعني أن الفِرق يمكنها أخيرا قياس كل هذه العناصر وإنشاء إشارات تحذير مبكرة، تساعد الرياضيين مثلا من عدم الوقوع بفرط التدريب، مما قد يسبب الإصابة أو المرض. وفقاً لكرستوفرسون، فالسر يكمن في إيجاد التوازن أثناء التدريب، قال: “إنما هو التلاعب بالتدريب بناءً على البيانات التي سجلتها حيث لا تندفع إلى منطقة الخطر، ولا أن تتراجع أو تقلل من استخدام موهبتك، هناك خطٌّ رفيع فيما بينهما، وهذا ما فعلناه أخيرا باستخدام البيانات الضخمة”. يُرى أنه بإمكان البيانات الضخمة إذا استُخدمت بدقة وكفاءة أن توسع نطاق مهن الرياضيين المحترفين إلى ما بعد سن التقاعد (ثلاثون عاماً)، مع التوازن المحمود بين النظم الغذائية والتدريبات، وتجنب الإصابة من فرط الإجهاد.

لم تكن خطة كرستوفرسن مبنيّةً على تجارب علمية صارمة وإنما نفعت على مستوى نجاحه الشخصي ونجاح فريق اللاعبات، بدليل فوزهن المفاجئ بالميدالية الفضية.

ما هي البيانات التي تم استخدامها في التحليل؟

استخدم كرستوفرسن بيانات داخلية وخارجية وبيانات مهيكلة وغير مهيكلة؛ فعلى سبيل المثال: جُمعت بيانات ذات سلاسلَ زمنية – مثل قياسات سكر الدم والبشرة والنبض – باستخدام أجهزة استشعار متصلة بالجسم، وجُمعت بيانات الضجيج والتعرض لأشعة الشمس، وكذلك جمع بعض البيانات التي تخص البيئة، مثل درجة الحرارة والوقت والجو من خلال الاستفادة من البيانات المتوفرة والمنشورة. كما استُخدمت أيضا تحاليل الفيديو، وقياس أنماط نوم اللاعبات باستخدام التخطيطات الدماغية المباشرة.

ما هي أبرز التفاصيل التقنية المستخدمة في تلك التحليلات؟

لتنفيذ البرنامج، اشترك كرستوفرسن مع شركة داتامير (Datameer) من سان فرانسيسكو والمختصة بتحليلات البيانات وتمثيلها رسومياِ. خُزّنت البيانات في سحابة إلكترونية على منصة هدوب (Hadoop).

ماذا كانت أبرز التحديات؟

مشكلة استكشاف البيانات أنها غالبا تفتقر للفرضيّات الواضحة، ولكن بالنسبة لللّاعبات الأولمبيّات، كان بمقدرتهن الاستفادة من خبرتهنّ والتجارب الذاتية المستمرة لتوجيه الاستكشاف، إذ ساهمت هذه التجربة بالإضافة إلى نهج داتامير في جداول البيانات بمساعدة الفريق على التعامل مع الكمية الهائلة من البيانات المستخدمة، حيث وحّد نهج داتامير لجداول البيانات مُختَلف الأنواع والأحجام ومصادر البيانات بسهولة، وجعل منها طريقة أسهل للاستنتاج.

ما هي أبرز الفوائد والدروس من تلك التجربة؟

وضحّت هذه الدراسة أهمية إيجاد شريك يتفهم التحديات الخاصة بالمجال المعنيّ. في هذه الحالة، كان الرئيس التنفيذي لداتامير، وهو ستيفان جروشف، والذي كان سباحاً تنافسياً سابقاً على المستوى الوطني في ألمانيا.  مع خلفيته هذه وإلمامه بالأمر، رأى جروشف مباشرةً إمكانية نجاح هذا المشروع. فرح كرستوفرسن بمساهمتهم وقال: “عادوا بنتائج حماسية حقًّا، وروابطَ لم نرها من قبل، مثل كيفية تأثير التدريب والبيئة وعلاقتهما، وأن كل هذه الأشياء مترابطة، ويمكن رؤية ذلك فعلًا بالنظر إلى البيانات”.كما وضحت هذه الدراسة أيضاً أهمية ملاحظة الأنماط في البيانات، إذًا فهي ليست عن كم من البيانات جمعتَ أو كيف تم تحليلها؛ إنما هي بملاحظة الأنماط على مختلف مجموعات البيانات واستخدام تلك المعرفة لتحسين الأداء، وينطبق ذلك الأمر على مجالَيّ الرياضة والأعمال على حد سواء.

لقراءة المزيد:

اعرف أكثر عن أوأثليت من هنا:

http://www.oathlete.com/#intro and https://vimeo.com/48833290 And the amazing story of the US women’s cycling team’s transformation is covered in the documentary Personal Gold. There’s more information at: http://www.personal-gold.com/

استخدام البيانات الضخمة في الإعلام (تجربة قناة بي بي سي)

 

ترجمة: ريما فواز.

مقدمة

تعد هيئة الإذاعة البريطانية (BBC) واحدة من أكبر المؤسسات الإعلامية في العالم، وتتمتع بصفتها هيئة إذاعية عامة بصلاحيات فريدة نسبياً للعمل دون تمويل من المعلنين، مما يمكنها للعمل دون تدخل الشركات. كذلك، فإن برامجهم المدفوعة تمنحهم بعض الحرية في الابتكار، فعندما لا تضطر الهيئة للقلق بشأن جذب اموال اعلانية كبيرة، حينها يمكنهم المجازفة في نوعية البرامج والإنتاج. ونظرا ً لأن نسبة كبيرة من إنتاج بي بي سي أصبح رقميا الآن، من خلال خدماتهم على iPlayer وBBC Online، فإنهم ينتجون كميات متزايدة من البيانات ثم يحللونها لتطوير منتجات تناسب جمهورهم.

ما هي التحديات التي ساعدت البيانات الضخمة في حلها؟

ذكر جون ريث أن لدى بي بي سي أول مدير عام للشركة متخصص في انتاج محتوى ذو فائدة يتم تعريفه على أنه محتوى إما “تثقيفي، أو تعليمي أو ترفيهي “. وعلى الصعيد الدولي فهم يعملون بشكل مختلف قليلاً، فالإعلانات التجارية تعتبر مصدرا ً أساسيا ً من مصادر الإيرادات في بي بي سي العالمية حيث أنهم يتنافسون مع محطات البث في القطاع الخاص ووسائل الإعلام الإخبارية في هذا السوق.

وهذا يعني أن المشكلة التي تواجه بي بي سي في الأساس هي: كيفية إنتاج محتوى يجذب الجمهور من خلال محتوى الهادف.

فالمحتوى الرقمي لا يتم تقديمه بطريقة تسلسلية (كما هو الحال مع التلفزيون أو الراديو أو الصحف التقليدية المجدولة) فهو يمنح الجمهور القدرة على إنتاج جداولهم الخاصة من خلال اختيار ما يريدون قراءته أو مشاهدته أو الاستماع إليه بعد ذلك. مما يعني أنه يجب جذب انتباه الجمهور بكل طريقة ممكنة، على عكس الزمن الماضي حيث كان من المعروف أنه يتم جذب المشاهدون بعرض النجوم المشهورين في وقت الذروة على أمل أن يحظوا باهتمامهم لبقية المساء.

كيف تم استخدام البيانات الضخمة عمليا؟

تشتهر بي بي سي في جميع أنحاء العالم بتقاريرها الإخبارية، فكان استخدام تحليلات البيانات لتحسين عمق وشمولية التقارير ووقت إنتاجها ونشرها جزءًا رئيسيا ً من استراتيجية بي بي سي للبيانات الضخمة.

ففي عام 2013 أعلنت بي بي سي عن البحث عن شركاء لمشاريع البيانات الضخمة، وعرضت على الشركات 18 مليون جنيه إسترليني لمساعدتها على تطوير منصات واطارات للتحليلات وللنمذجات التنبؤية. فكانوا يبحثون تحديدا ً عن المساعدة في توصيات المحتوى باستخدام الخوارزميات أو ما يعرف بأنظمة التوصية (تحديد أي من البرامج التلفزيونية أو التقارير الإخبارية يفضلها المشاهد بعد برنامجه الحالي) بالإضافة إلى تحليلات وسائل التواصل الاجتماعي.

تهدف إحدى المبادرات، المعروفة باسم myBBC، إلى التحقيق في علاقة الشركة مع جمهورها، وتعميق هذه العلاقة من خلال تطوير محتوى أكثر صلة لمنصات BBC الالكترونية، وتشجيع المزيد من التواصل مع المشاهدين من خلال وسائل التواصل الاجتماعي وتوفير رؤى يمكن أن ترشد فرق التحرير والمحتوى الإبداعي حول تفضيلات المشاهدين.

كما فريق التحليل تقنيات التعرف على الوجه لقياس استجابة الجمهور لبرامج التلفزيون. فعلى سبيل المثال، أثناء التجارب قام ما يعرف بمختبر معاينة الشاشة التابع للشركة بمراقبة ردة فعل المشاهدين على 50 عرضا ً تلفزيونيا ً مختلفا ً في أربعة بلدان باستخدام الكاميرات المصممة لمراقبة وجوه المشاهدين وتحليل مشاعرهم أثناء مشاهدة تلك البرامج. ففي إحدى التجارب تمت مراقبة عدد من الأسر في أستراليا لالتقاط ردود أفعالهم أثناء مشاهدتهم لإعلان الحلقة الاولى لبرنامج شارلوك.

فماذا كانت النتائج؟

اكتشف الباحثون من نتائج التجربة في أستراليا أن المشاهدين الذين استمروا في تقييم العرض إلى حد كبير أظهروا ردود فعل أكبر للأحداث على الشاشة التي وصفت بأنها “مفاجئة” أو “حزينة”، بدلاً من “مضحكة “. وقد أدى ذلك إلى قيام منتجي البرنامج بإدراج عناصر أكثر سوداوية وإثارة في العرض والبرامج والتقليل من المشاهد الكوميدية.

ما هي البيانات التي تم استخدامها؟

تجمع  بي بي سي البيانات حول متى وكيف يتم مشاهدة برامجها من خلال خدمة iPlayer. كما تُجمع وتُرصد المعلومات المتعلقة باستخدام منصة هيئة الإذاعة البريطانية على الإنترنت. يتم تعزيز ذلك بالمعلومات الديموغرافية التي يتم جمعها إما من المستخدمين عند التسجيل في الخدمات أو من السجلات العامة. كما يستخدمون تحليل وسائل التواصل الاجتماعي لقياس ردود فعل الجمهور لبرامجهم التي يتابعونها. ويلتقط مشروع Preview Screen Lab تعابير ومشاعر الجماهير التي يراقبها.

ما هي التفاصيل التقنية؟

 جميع الصحفيين في قسم الأخبار عبر الإنترنت في بي بي سي مدربين على المهارات الأساسية لتحليل البيانات، بما في ذلك استخدام جداول إكسل وجوجل فيوجن “لاستجواب” البيانات وتحويلها إلى قصص.

بالنسبة لمجموعات البيانات الضخمة يعتمد المحللون على عدة تقنيات بما في ذلك MySQL وApache Solr. ويضم فريق الصحافة أشخاصا ً لديهم المهارات الأساسية في تطوير البرمجيات، ويميل هؤلاء إلى التخصص في لغات البرمجة المناسبة لعلوم البيانات مثل لغة R ولغة البايثون.

ماهي التحديات التي تم التغلب عليها؟

باعتبار أن هيئة الإذاعة البريطانية هيئة إذاعة عامة، فهي مسؤولة بشكل مباشر أمام كل من الحكومة ودافعي الضرائب، فقد أقرت الهيئة اتباعها نهجا ً أكثر تحفظا ً تجاه الخصوصية وحماية البيانات مقارنة بما تظهره المؤسسات الإعلامية في القطاع الخاص.

قال مايكل فليشمان، رئيس قسم التقنيات الرقمية الاستهلاكية في بي بي سي العالمية، لمجلة Web Computing: “تتخذ بي بي سي ككل نهجا ً محافظا ً للغاية، فهناك نقاط تفتيش مكثفة من الناحية التنظيمية والعملية للتأكد من التزامنا بهذا النهج المحافظ “.

ويقال أن المبدأ الشامل في بي بي سي فيما يتعلق بمشاريع البيانات الضخمة هو أنه إذا كانت هناك مخاوف تتعلق بالخصوصية أو قد تعرض حماية البيانات للخطر، فلن يتم وضع المشروع موضع التنفيذ.

والتحدي الآخر الذي تواجهه هيئة الإذاعة البريطانية هو قابلية التوسع. فنظرا ً للطريقة الفريدة التي يتم بها تمويل المؤسسة لا يُسمح لهم بالترويج لخدماتهم في المملكة المتحدة، حيث يتم استهلاك الجزء الأكبر من إنتاجهم. مما يعني أن الارتفاع الهائل في أعداد المشاهدين لجزء معين من المحتوى مثل تقرير إخباري شائع جدًا، لا يعني الارتفاع في معدل الإعلان الذي تتوقعه الخدمة التجارية. وكما قال كبير المهندسين التقنيين في بي بي سي، ديرك ويليم لماكوورلد في عام 2011: “دخلنا يبقى كما هو، ونحن لا نحصل على أي مبلغ أكثر من ذلك، لذلك عندما نحصل على عشرة أضعاف عدد المستخدمين، علينا أن نجد طريقة للقيام بالأشياء أقل سعرا ً بعشرة أضعاف.”

ولهذا السبب تم تطوير البنية التحتية التقنية المستخدمة لتشغيل عملية بيانات هيئة الإذاعة البريطانية على مبدأ أنها يجب أن تكون فعالة من حيث التكلفة قدر الإمكان. وشملت التدابير بناء حواسيب خدمة خاصة بها، للحد من الاعتماد على الحلول الجاهزة، واستخدام وسائط الأشرطة للتخزين بدلا من الأقراص الصلبة التي تعتبر أكثر تكلفة بسبب أعطالها المتكررة مما يؤدي إلى ارتفاع تكاليف الصيانة.

ما هي نقاط التعلم الرئيسية؟

البيئات الرقمية التي تعمل فيها الشركات الإعلامية الحديثة تعني أنها في موقع مثالي للاستفادة من الاستخدام المتزايد لتقنيات البيانات الضخمة. وينطبق هذا سواء كانت ممولة من القطاع العام أو الخاص – وفي كلتا الحالتين فإن الهدف هو زيادة حصة الجمهور من خلال توفير محتوى ذو قيمة أكبر مقارنة بالمنافسين.

تتمتع هيئة الإذاعة البريطانية ببعض المزايا (مثل عدم الحاجة إلى إبقاء المعلنين سعداء) مما يعني أن لديهم حرية أكثر في إنتاجهم دون الحاجة المستمرة لإثبات أن ابتكارهم سيؤثر على النتيجة النهائية للشركة.

ومع ذلك فإنها تواجه أيضا ً تحديات فريدة، بما في ذلك الحاجة الأكبر إلى أخذ خصوصية البيانات وأمنها على محمل الجد. وبما أنهم مسؤولون أمام الجمهور والبرلمان من خلال رسوم الترخيص التي يدفعونها، فإن الانتهاكات أو الانزلاق في هذا المجال يمكن أن يكون له تداعيات سياسية سلبية ومن غير المرجح أن يتم التسامح معها.

 

المصادر:

WSJ (2015) BBC facial recognition software analyzes audience response-

BBC Facial Recognition Software Analyzes Audience Response – WSJ

-Palmer, D. (2014) BBC’s conservative approach to data makes our jobs

a little harder, 

https://www.computing.co.uk/news/2379410/bbcs-conservative-approach-to-data-use-makes-our-jobs-a-little-harder

Essers, L. (2011) BBC-

 Tackles big data dilemma smart it structuring https://www.macworld.com/news/apple/bbc-tackles-big-data-dilemma-smart-it-structuring-3288278

لمزيد من المعلومات حول البيانات في المجال الإعلامي:

Data Journalism at the BBC | DataJournalism.com

استخدام البيانات الضخمة في الشبكات الاجتماعية (تجربة لينكدإن)

ترجمة: أثير الحارثي

مدخل

تعتبر لينكدإن أكبر شبكة مهنيّة عبر الإنترنت في العالم ، حيث تضم أكثر من 410 مليون عضو في أكثر من 200 دولة. بذلك يربط موقع لينكدإن المهنيين من خلال تمكينهم من بناء شبكة علاقات ضخمة من خلال الكثير من العوامل مثل الاهتمامات المشتركة وغير ذلك. 

في عام 2003 تم أطلق موقع لينكد إن بواسطة Reid Hoffman ، مما يجعله أحد أقدم شبكات التواصل الاجتماعي في العالم.

ما هي المشكلة التي تساعد البيانات الضخمة في حلها؟

أصبحت المنافسة بين الشبكات الاجتماعية أكثر شراسة من أي وقت مضى وما هو أكثر تفاعل وجاذبية في عام ما ، قد لا يكون في العام التالي. إذا ً، يتعين على لينكدإن التأكد من أن موقعهم يظل أداة أساسية للمهنيين المشغولين ، ومساعدتهم على أن يصبحوا أكثر إنتاجية ونجاحا ً ، سواء كانوا يستخدمون الخدمة المميزة (المدفوعة) أو الخدمة المجانية. 

على هذا النحو تعد البيانات الضخمة في صميم عمليات لينكدإن واتخاذ القرارات الاستراتيجية فيها ، مما يساعدهم على تقديم أفضل خدمة ممكنة لملايين أعضاء الموقع.

كيف استخدمت البيانات الضخمة؟

يتتبع لينكد إن كل حركة يقوم بها المستخدمون على الموقع: كل نقرة ، كل مشاهدة صفحة ، كل تفاعل مع 410 مليون عضو ، يعد هذا عددًا هائلاً من الأحداث التي يجب معالجتها كل يوم. بذلك يقوم علماء البيانات والباحثون في لينكدإن بتحليل هذا الكم الهائل من البيانات للمساعدة في اتخاذ القرار وتصميم المنتجات والميزات المدعومة بالبيانات. 

يمكننا تأليف كتاب كامل حول الطرق العديدة التي يستخدمها لينكدإن لإستخدام البيانات الضخمة ، ولكن الهدف من هذه المقالة هو إلقاء نظرة على بعض الأمثلة الرئيسية.

مثل الكثير من شبكات التواصل الاجتماعي الأخرى يستخدم لينكدإن البيانات لتقديم اقتراحات لمستخدميها، مثل “أشخاص قد تعرفهم”. فإن هذه الاقتراحات تستند إلى عدد من العوامل ، على سبيل المثال: إذا نقرت على الملف الشخصي لشخص ما (في هذه الحالة ، من المحتمل جدا ً أن نفترض أنك قد تعرفه ، أو تعرف شخصا ً آخر بهذا الاسم) ، أو إذا كنت تعمل في نفس الشركة خلال نفس الفترة.  أيضاً نظرا ً لأنه يمكن للمستخدمين تحميل جهات اتصال البريد الإلكتروني الخاصة بهم، يستخدم لينكدإن هذه المعلومات لتقديم اقتراحات – ليس فقط من أجل الأشخاص الذين قد تعرفهم على الموقع ولكن أيضاً للأشخاص الذين في جهات اتصالك قد تعرف عنهم عند انضمامهم إلى الموقع. كذلك، يمكن لـ لينكدإن أيضا ً سحب بيانات حول المستخدمين من مواقع أخرى ، مثل تويتر ، لتقديم المزيد من الإقتراحات.

بالإضافة إلى ذلك، يستخدم لينكدإن تقنيات التعلم الآلي لتحسين الخوارزميات وتقديم اقتراحات أفضل للمستخدمين. لنفترض ، على سبيل المثال ، أن لينكدإن قدم لك بشكل منتظم اقتراحات للأشخاص الذين قد تعرفهم و يعملون في الشركة “أ” (التي عملت بها قبل ثماني سنوات) والشركة “ب” (التي كنت تعمل فيها قبل عامين).

 إذا لم تنقر أبدا ً على الملفات الشخصية للأشخاص من الشركة “أ” ولكنك تتحقق بانتظام من الاقتراحات الواردة من الشركة “ب” ، فسيقوم لينكدإن بإعطاء الأولوية للشركة “ب” في اقتراحاتهم من الآن فصاعدا ً. يمكّن هذا النهج المخصص للمستخدمين من بناء الشبكات التي تعمل بشكل أفضل بالنسبة لهم.

إحدى الميزات التي تميز لينكدإن عن منصات وسائل التواصل الاجتماعي الأخرى مثل فيسبوك هي الطريقة التي تتيح لك معرفة من شاهد ملفك الشخصي. 

وقد حصلت هذه الميزة مؤخرا ً على تفاصيل أكثر بكثير: بينما اعتدت أن تكون قادرا ً على رؤية عدد الأشخاص الذين شاهدوا ملفك الشخصي ومن هم أحدث المشاهدين ، يمكنك الآن أيضا ً معرفة المناطق والصناعات التي ينتمي إليها هؤلاء المشاهدون ، والشركات التي يعملون فيها وما هي الكلمات الرئيسية (إن وجدت) التي جلبتهم إلى ملفك الشخصي. 

تساعد هذه الأفكار ، التي أتاحتها البيانات الضخمة ، المستخدمين على زيادة فعاليتهم على الموقع.

تستخدم  لينكدإن تقنية معالجة التدفق لضمان عرض أحدث المعلومات عندما يكون المستخدمون على الموقع – بدءا ً من المعلومات المتعلقة بمن انضم إلى الموقع ومن حصل على وظيفة جديدة وحتى المقالات المفيدة التي نالت إعجاب جهات الاتصال أو تمت مشاركتها من قبلهم. باختصار ، يقوم الموقع بجمع بيانات جديدة وعرضها باستمرار للمستخدمين. فهو لا يجعل هذا التدفق المستمر للبيانات الموقع أكثر تشويقا ً للمستخدمين فحسب ، بل إنه يسرع أيضا ً من عملية التحليل. 

تقليديا ، كانت الشركة تلتقط البيانات وتخزنها في قاعدة بيانات أو مستودع بيانات لتحليلها في وقت لاحق. ولكن باستخدام تقنية معالجة التدفق الفورية ، فإن  لينكدإن لديها القدرة على “دفق” البيانات مباشرة من المصدر (مثل نشاط المستخدم) وتحليلها أثناء التنقل.

أخيرا ً، دعونا لا ننسى أن لينكدإن بحاجة إلى زيادة الإيرادات، ويقومون بذلك من خلال خدمات التوظيف والعضوية المدفوعة والإعلانات. إذ تلعب البيانات الضخمة دورا ً في زيادة الإيرادات وكذلك في تحسين تجربة المستخدم. على سبيل المثال، في الإعلانات – التي تمثل 20-25٪ من الإيرادات السنوية لـ لينكدإن – يعمل المحللون مع فريق مبيعات لينكدإن لفهم سبب نقر الأعضاء على إعلانات معينة وليس على إعلانات أخرى. يتم إرسال هذه الأفكار بعد ذلك إلى المعلنين لجعل إعلاناتهم أكثر فعالية.

ماهي أبرز النتائج؟

تشمل مقاييس نجاح لينكدإن الإيرادات وعدد الأعضاء، وكلاهما يواصل في الارتفاع عاما ً بعد عام. و اكتسب موقع لينكدإن 40 مليون عضو جديد في النصف الأول من عام 2015 ، وفي وقت كتابة هذا التقرير ، بلغت الإيرادات الفصلية الأخيرة للشركة أكثر من 700 مليون دولار (ارتفاعا ً من بعد أن كان حوالي 640 دولارا ً في الربع السابق). 

ليس هناك شك في أن البيانات الضخمة تلعب دورا ً كبيرا ً في استمرار نجاح الشركة.

ما هي البيانات التي تم استخدامها؟ 

يتتبع لينكدإن كل حركة يقوم بها المستخدمون على الموقع ، بدءًا من كل شيء يتم الإعجاب به ومشاركته إلى كل وظيفة يتم النقر عليها وكل رسالة يتم إرسالها إلى جهة الاتصال.تخدم الشركة عشرات الآلاف من صفحات الويب في كل ثانية في اليوم.  تتضمن كل هذه الطلبات جلب البيانات من أنظمة الواجهة الخلفية في لينكدإن ، والتي بدورها تتعامل مع ملايين الاستفسارات في الثانية. بعد الحصول على الإذن، يجمع لينكدإن بيانات حول جهات اتصال البريد الإلكتروني للمستخدمين.

ما هي أبرز التقنيات المستخدمة؟

يشكل Hadoop جوهر البنية التحتية للبيانات الضخمة في لينكدإن ، ويتم استخدامه لكل من الاستعلامات المخصصة وتحليل تدفق البيانات. بذلك تمتلك الشركة استثمارا ً كبيرا ً في Hadoop ،بالإضافة إلى بعض التقنيات الأخرى في بانوراما البيانات الضخمة على لينكدإن مثل:

Oracle , Pig , Hive , Kafka , Java , MySQL. 

تعد مراكز البيانات المتعددة مهمة بشكل لا يصدق لـ لينكدإن ، من أجل ضمان الإتاحة العالية وتجنب نقطة واحدة من الفشل. اليوم يعمل لينكدإن من ثلاثة مراكز بيانات رئيسية. كما طورت لينكد إن أيضا ً أدوات مفتوحة المصدر خاصة بها للوصول إلى البيانات الضخمة وتحليلاتها. 

بدأ Kafka حياته بهذه الطريقة ، وتشمل التطورات الأخرى Voldemort و Espresso (لتخزين البيانات) و Pinot  (للتحليلات).

 بالإضافة إلى ذلك ، تمتلك الشركة فريقا ً رائعا ً من علماء البيانات الداخليين – حوالي 150 في التقديرات الحالية. لا يعمل الفريق فقط على تحسين منتجات لينكدإن وحل المشكلات للأعضاء ، بل يقومون أيضا ً بالنشر في المؤتمرات الكبرى والمساهمة في مجتمع المصادر المفتوحة. و في الواقع ، يتم تشجيع الفريق على متابعة البحث في العديد من المجالات، بما في ذلك الإعلانات الحاسوبية والتعلم الآلي والبنية التحتية والتنقيب عن النصوص وتحليل المشاعر والأمن والبريد المزعج.

ما هي أبرز التحديات التي تم التغلب عليها؟

يمثل النمو الهائل للبيانات الضخمة أحد التحديات الواضحة التي يتعين على لينكدإن التغلب عليها باستمرار – مما يجب أن تكون الشركة الآن قادرة على التعامل مع كميات هائلة من البيانات وتحليلها وفهمها كل يوم. يتمثل الحل في الاستثمار في أنظمة قابلة للتطوير بدرجة كبيرة ، والتأكد من أن البيانات لا تزال دقيقة بما يكفي لتوفير رؤى مفيدة. يوفر Hadoop القوة الخلفية وقابلية التوسع اللازمة للتعامل مع أحجام البيانات ، وتسمح واجهة مستخدم لينكدإن لموظفيهم بتقسيم البيانات وفهمها بعدة طرق مختلفة.

من شركة كانت توظف أقل من 1000 موظف منذ خمس سنوات ، نمت لينكدإن لتوظف ما يقرب من 9000 شخص. هذا يفرض طلبا ً هائلاً على فريق التحليلات. ربما استجابةً لذلك ، أعادت لينكدإن مؤخرا ً تنظيم فريق علم البيانات الخاص به بحيث يكون جزء علم القرار (الذي يحلل استخدام البيانات ومقاييس المنتج الرئيسية) الآن تحت رئاسة المكتب المالي للشركة ، بينما جزء علم بيانات المنتج (الذي يطور ميزات لينكدإن التي تولد كميات كبيرة من البيانات للتحليل) الآن جزء من الهندسة . على هذا النحو ، أصبح علم البيانات الآن أكثر تكاملاً من أي وقت مضى في لينكدإن ، حيث أصبح المحللون أكثر توافقا ً مع وظائف الشركة.

قد يكون من المفاجئ معرفة أن توظيف الموظفين يمثل أيضا ً تحديا ً ، حتى بالنسبة لشركة عملاقة مثل لينكدإن.  أكدت Sherry Shah ، رئيسة قسم توظيف البيانات في لينكدإن ، في حديثها إلى CNBC.com أنها تبحث لتوظيف أكثر من 100 عالم بيانات في عام 2015 (زيادة بنسبة 50٪ من 2014).

ولكن المنافسة على أفضل علماء البيانات صعبة بشكل خاص في كاليفورنيا ، واعترف Shah بأن “هناك دائما ً حرب مزايدات”.  على الرغم من دخول الكثير من الأشخاص إلى هذا المجال ، فمن المحتمل أن تكون هذه الفجوة في المهارات – حيث الطلب على علماء البيانات يفوق العرض – سيستمر بضع سنوات بعد.

بالإضافة إلى ذلك ، لم يلفت لينكدإن من رد الفعل العنيف بشأن الخصوصية. في يونيو 2015 ، وافقت الشركة على دفع 13 مليون دولار لتسوية دعوى جماعية ناتجة عن إرسال دعوات متعددة عبر البريد الإلكتروني إلى قوائم الاتصال الخاصة بالمستخدمين. 

نتيجة لتلك التسوية ، ستصرح لينكدإن الآن صراحةً أن أداة “إضافة اتصالات” الخاصة بهم تستورد قوائم العناوين ، وسيسمح الموقع لأولئك الذين يستخدمون الأداة بتحديد جهات الاتصال التي ستتلقى دعوات آلية ورسائل متابعة عبر البريد الإلكتروني.

الخاتمة:

تقدم لينكدإن درسا ً لجميع الشركات حول كيف يمكن أن تؤدي البيانات الضخمة إلى نمو كبير. حول باعتبارها واحدة من أقدم شبكات التواصل الاجتماعي ولا تزال قوية حتى الآن،  في إن قدرتهم على تقديم الاقتراحات والتوصيات للمستخدمين أمر يُحسدون عليه بشكل خاص (ويتم استخدامه أيضا ً بنجاح من قبل الشركات الأخرى الواردة في هذا القطاع ، مثل شركة إتسي وشركة إير بي إن بي). 

لكن لينكد إن تقدم أيضا ً مثالاً على الحاجة إلى الشفافية عند استخدام بيانات الأفراد – وردود الفعل العكسية التي يمكن أن تحدث عندما يشعر الناس أن الشركة لا تتمتع بالشفافية بشكل كاف. 

أعتقد أنه يمكننا توقع رؤية المزيد من الدعاوى القضائية المشابهة ضد الشركات في المستقبل ، لذلك من المهم أن تكون واضحا ً تماما ً مع عملائك بشأن البيانات التي تجمعها وكيف تنوي استخدامها.

المصدر:

https://engineering.linkedin.com/big-data

https://engineering.linkedin.com/architecture/brief-history-scaling

http://www.cnbc.com/2015/06/04/big-data-is-creating-big-career-

opportunites.html

LinkedIn had one of the first data science teams. Now it’s breaking up the band

http://www.mediapost.com/publications/article/251911/linkedin-to-

pay-13-million-to-settle-battle-over.html

استخدام البيانات الضخمة في التسويق (تجربة شركة اكسيوم)

ترجمة: ريما فواز

مراجعة: أثير الحارثي

مدخل

يُشار إلى شركة اكسيوم أحيانًا باسم ” أكبر شركة لم تسمع بها من قبل “. لقد كانوا مسؤولين عن إحداث ثورة في الولايات المتحدة الأمريكية في قطاع صناعة التسويق المباشر خلال الثمانينيات في عام 1980م من خلال تطبيق التحليلات المتقدمة المحوسبة عبر مجموعات البيانات الضخمة – مما جعلهم روادًا حقيقيين في البيانات الضخمة قبل أن يصبح مصطلح “البيانات الضخمة” شائعًا بوقت طويل.

من خلال موقع الشركة على الإنترنت إنهم يحتفظون ببيانات عن “جميع الأسر الأمريكية باستثناء نسبة صغيرة”. للبحث في هذا المقال ، تحدثت إلى تشارلز مورغان ، الذي كان مسؤولاً عن تحويل شركة صغيرة من المحللين الذين يقدمون الخدمات للشركات المحلية إلى مركز قوة متعدد الجنسيات يحركه البيانات الضخمة ويبلغ حجم مبيعاته مليار دولار.

أُطلق على الشركة في البداية باسم ديموغرافيكس ، وقد تم تأسيسها في عام 1969م كعمل إضافي من قبل  تشارلز د. وارد ، رئيس شركة الحافلات المدرسية المحلية. كانت فكرة (وارد) الأولية هي جمع البيانات وإعداد قائمة بريدية للحزب الديمقراطي المحلي. عندما واجهت شركة الحافلات المدرسية صعوبات مالية وتعرض وارد للتهديد بالإفلاس ، باع أسهمه إلى تشارلز مورغان ، خريج جامعة أركنساس بعد أن عمل سابقًا كمتخصص مهندس أنظمة في شركة IBM .

ما هي المشكلة التي تساعد البيانات الضخمة في حلها؟

خلال الثمانينيات في عام 1980م ، نقلت البنوك أعمالها بشكل كبير إلى تجارة التجزئة. بدأوا في محاولة بيع أكبر عدد ممكن من بطاقات الائتمان وصفقات التأمين والحسابات المصرفية والخدمات المالية لأكبر عدد ممكن من الناس.

لطالما كانت الشركات تتواصل مع العملاء مباشرة من أجل تقديم المنتجات التي اعتقدوا أنها ستنال إعجابهم ، وقد تمت صياغة مصطلح “التسويق المباشر” في عام 1967م. لكن ما تحتاجه البنوك الأمريكية ، مثل سيتي بنك ، التي أصبحت أكبر عملاء أكسيوم ، كان المطلوبًا أكثر تعقيدًا من أي شيء تم القيام به من قبل. نظرًا لأن جميع البنوك الكبرى قررت في وقت واحد تقريبًا متابعة نفس السوق ، حتى مع وجود ميزانيات تسويق مباشرة بمئات الملايين من الدولارات ، لم يكن هناك هامش للخطأ ويجب إنفاق كل cent بكفاءة.

يخبرني مورغان: “كان هناك الكثير من المشكلات المتعلقة بإدارة البيانات على نطاق واسع. تمكنا من مراقبة القوائم التي يمتلكها الأشخاص في أعمال البيانات وكان كل ذلك يدويًا للغاية.

” لم يكن هناك تحليل حقيقي على أي مستوى معقد. نظرت إلى مشكلة وفكرت ، هذه فرصة عظيمة لنشر علوم الكمبيوتر الحديثة في مشكلة ستزداد حجمًا وأكثر حيث يكتشف الأشخاص كيفية القيام بعمل أكثر كفاءة في التسويق المباشر “.

من أجل التعامل مع الكم الهائل من البيانات ، والتي تضمنت معلومات عن كل مواطن أمريكي تقريبًا تم جمعها من وكالات الائتمان الرئيسية الثلاث ، قامت شركة أكسيوم بتحديث قدراتها التحليلية وإدارة البيانات بشكل كبير وركزت على تطوير خوارزميات أكثر كفاءة لتقسيم السكان بشكل فعال. يقول مورغان: “نمت العلاقة مع سيتي بنك وكنا نتعامل مع التسويق المباشر لجميع منتجات بطاقات الائتمان الخاصة بهم. لقد أجرينا جميع أنواع التحليلات ، لمشاريعهم الحالية وتلك التي كانوا يعملون عليها من أجل المستقبل ، وهذه هي الطريقة التي دخلنا بها حقًا في مجال البيانات الضخمة: لقد ظلوا يريدون المزيد والمزيد من البيانات والمزيد والمزيد من التحليلات ، ونحن كان علينا أن نعمل على كيفية تلبية احتياجاتهم “.

كيف استخدمت البيانات الضخمة؟

أنشأت شركة أكسيوم نظام تنفيذ قائمة الملكية الخاص بها ، والذي أخذ البيانات من وكالات الائتمان ودمجها في أول منشئ قائمة بريدية عبر الإنترنت. قدم هذا للشركات الملايين من العملاء المتوقعين الفريدين المحددون ، مقسمين حسب العمر أو الموقع أو المهنة أو الصناعة أو أي معلومات أخرى معروفة.

يقول مورغان: “كان علينا بناء مستودعات بيانات ضخمة جدًا. كنا نحصل على بيانات شهرية عن جميع السكان من مكاتب الائتمان ودمجنا ذلك مع البيانات التاريخية والبيانات الحالية حول المكان الذي يعيشون فيه ، وعدد الأطفال في الأسرة – إذا كانوا عملاء لمدة 10 سنوات ولكنهم حصلوا عليها مؤخرًا توقفنا عن كوننا عميلاً ، عرفنا ذلك.

“غالبًا ما كنا نعرف المجلات التي اشتركوا فيها. كانت كمية البيانات التي جمعناها لا يمكن تصورها تقريبًا. سيكون هناك أكثر من 100 مليون شخص في واحدة فقط من قواعد البيانات هذه سيتعين علينا إنشاء إصدارات جديدة تمامًا ثلاث مرات في السنة. مع وجود بيانات عن الكثير من الأشخاص من مصادر عديدة ، سيكون هناك الكثير من البيانات المتضاربة و سيتعين علينا تحديد ما هو دقيق. بالإضافة إلى ذلك ، لم يكن من القانوني حقًا إنشاء قاعدة بيانات ائتمانية: كان علينا إنشاؤها لغرض معين [مثل التسويق] ، لذا فقد كانت مدفوعة أيضًا بالمتطلبات القانونية. نحن

لم يكن لدينا مصطلح “البيانات الضخمة” في ذلك الوقت ؛ لقد أطلقنا عليها اسم “قواعد البيانات الكبيرة جدًا”. “

منذ أن كانت شركة أكسيوم رائدة في مجال التسويق القائم على البيانات الضخمة ، فقد تحركت مع الزمن. في عام 2010م ، كشفوا السّتار عن نظام PersonicX الخاص بهم ، والذي يحلل نشاط وسائل التواصل الاجتماعي العامة لشخص ما لمطابقتها مع ملفات تعريف معينة للمستهلكين ، ودمج هذا مع بياناتهم الأخرى لمطابقتها بشكل أكثر دقة مع المنتجات والخدمات التي قد يحتاجون إليها. تستعين شركة أكسيوم بمصادر خارجية لهذه الخدمات للأعمال التجارية في جميع أنحاء العالم من عمالقة المال العالميين إلى الشركات الصغيرة.

ماهي أبرز النتائج؟

أنشأ تشارلز مورغان شركة أكسيوم من 27 موظفًا إلى شركة توظف أكثر من 7000 شخص من خلال ريادة البيانات والتسويق المباشر القائم على التحليلات.

 اليوم ، يقال إنهم يدرون 12٪ من إيرادات صناعة التسويق المباشرالأمريكية بأكملها ، والتي تصل إلى حوالي 1.15 مليار دولار سنويًا.

ما هي البيانات التي تم استخدامها؟

تأخذ شركة أكسيوم بياناتها عن المواطنين في الولايات المتحدة وحول العالم من وكالات الائتمان وكذلك السجلات العامة مثل القوائم الانتخابية ، وسجلات الزواج و المواليد ، واستبيانات المستهلكين ، ومن آلاف الشركات والمنظمات الأخرى التي تجمع البيانات عن عملائها و مستخدمي الخدمة ، وتمريرها (عندما يفشل هؤلاء العملاء في “إلغاء الاشتراك” في الوقت المناسب!).

على الرغم من أنهم لا يجمعون المعلومات بأنفسهم حول سلوك تصفح الويب للأفراد ، إلا أنهم يشترون المعلومات من المنظمات الأخرى التي تقوم بذلك – طالما أن لوائح الخصوصية والأمن ذات الصلة سارية. هذا يعني أن لديهم بلا شك الكثير من المعلومات حول نشاطنا عبر الإنترنت أيضًا.

ومع ذلك ، فإن أحد مجالات النشاط عبر الإنترنت التي يراقبونها هو وسائل التواصل الاجتماعي ، والتي أصبحت بشكل متزايد مصدرًا خصبًا جدًا للرؤى حول مشاعر المستهلك وسلوكه.

ما هي أبرز التقنيات المستخدمة؟

كان من أول الأشياء التي فعلتها شركة أكسيوم عندما أدركوا حجم مشكلة البيانات التي يواجهونها هو تطوير لغة تشبه لغة SQL الخاصة بهم للسماح لهم بالاستعلام عن مجموعات البيانات التي كانوا يجمعونها ، والتي أطلقوا عليها اسم تحديد اللغة.

تم تنفيذ معظم أعمال البيانات الرائدة المبكرة باستخدام أنظمة قائمة على الأشرطة ، ولكن عندما قام سيتي بنك بتوسيع نطاق متطلبات طاقة التحليلات والتخزين بشكل كبير ، استثمرت أكسيوم بكثافة في أجهزة الكمبيوتر العملاقة 

DEC Alpha التي تعمل بنظام التشغيل أوراكل لتنفيذ أول أنظمة موجهة بالفعل للبيانات الضخمة. 

يقول مورغان: “كان هذا مكسبًا تحويليًا لنا. كان هذا يعني أنه يمكننا حقًا البدء في إجراء نوع التحليل الذي أردنا القيام به ولكننا تأخرنا بسبب سرعة الأجهزة الموجودة “.

في مرحلة ما ، كانت الشركة تدير مزارع خوادم التي تشغل ما مجموعه ستة أفدنة من الأراضي ، منتشرة في جميع أنحاء الولايات المتحدة وحول العالم. اليوم ، يقال إن مقرهم الرئيسي في أركنساس يحتوي على 23,000 خادمًا للتخزين حوالي 1500 نقطة بيانات عن نصف مليار شخص.

ما هي أبرز التحديات التي تم التغلب عليها؟

يقول مورغان إن التحدي الأكبر خلال الثمانينيات في عام 1980م كان مواكبة النمو الهائل للشركة بعد مشاركتهم مع سيتي بنك في عام 1983م ، والشراكات الرئيسية الأخرى التي تلت ذلك بسرعة.

و يقول: “كانت أكبر مشكلتنا في معظم تاريخنا هي إدارة نمونا. عندما تزداد الحجم بأوامر من حيث الحجم في ثماني أو تسع سنوات وليس لدينا نموذج نتبعه – يكون الأمر تقريبًا مثل ،” يا إلهي ، لدينا عميل آخر ، ليس لدينا سعة كمبيوتر كافية ، ماذا سنفعل؟ خلال الثمانينيات والتسعينيات ، جاءت معظم مشاكلنا من خلال إدارة نمونا “.

بالطبع ، مع وجود نموذج أعمال قائم على طرق جديدة رائدة في جمع البيانات الشخصية وبيعها على المواطنين القطاع الخاص ، كان الجدل دائمًا لا بد أن يرفع رأسه في بعض الأحيان.

اتُهمت الشركة بمشاركة البيانات دون موافقة لجنة التجارة الفيدرالية الأمريكية ، وتم استجوابها بشأن تسهيلات “إلغاء الاشتراك” الملزمة قانونًا بتقديمها ، وتم ترشيحها لجائزة Big Brother على أنها “أسوأ شركة محتلة لتقليد وسيط البيانات “.

لقد استجابوا لهذا من خلال تكثيف سياسات السرية وحماية البيانات الخاصة بهم في السنوات الأخيرة وإنشاء الموقع الإلكتروني aboutthedata.com ، والذي يشرح كيف ومتى وأين يجمعون البيانات الشخصية ويستخدمونها.

الخاتمة:

إن الأساليب المتطورة بشكل متزايد لتطبيق التحليلات المتقدمة على البيانات الديموغرافية تمنح البائعين المزيد والمزيد من القوة لوضع علامتهم التجارية أمام أفضل العملاء المحتملين ، في الوقت المناسب. لقد قادت التكنولوجيا هذه الزيادة في القوة التحليلية – والتي كانت مدفوعة بدورها بحاجة الشركات الكبيرة لاستهداف العملاء بدقة أكبر. حققت التقنيات التحليلية للبيانات الضخمة مثل تلك التي طورتها شركة أكسيوم نموًا هائلاً للشركات التي تبنتها في العقود الأخيرة. كما أنها تثير مخاوف الخصوصية الحيوية. على الرغم من أن صناعة التسويق المباشر قد بذلت الكثير وتلك التي تقوم بجمع وتفسير البيانات نيابة عنها لكسب ثقة الجمهور ، إلا أنه يجب القيام بالكثير في المستقبل من أجل الحفاظ عليها.

المصادر:

To find out more about Acxiom’s founder see:

http://www.amazon.com/Matters-Life-Data-Remarkable-Visionary/dp/

1630474657/

For more on the way Acxiom use customer data visit:

http://www.nytimes.com/2012/06/17/technology/acxiom-the-quiet-

giant-of-consumer-database-marketing.html

استخدام البيانات الضخمة في مجال اللياقة البدنية (تجربة شركة Fitbit)

ترجمة: ريما فواز

مراجعة: محمد كامل

تعتبر شركة Fitbit والتي يقع مقرها الرئيس في مدينة سان فرانسيسكو شركة رائدة في السوق في مجال اللياقة البدنية. تعمل اجهزتهم كمتتبعات للياقة البدنية مما يسمح للمستخدمين بتتبع المقاييس المختلفة التي بذلك تساعدهم على عيش حياة صحية أكثر استنارة\وعيا. كما باعت الشركة ما يقارب 11 مليون جهاز في 2014.

ما هي المشكلة التي تساعد البيانات الضخمة على حلها؟

شركة Fitbit تعتمد ان نجاحها يقوم على فكرة أن الأشخاص الواعين يتخذون خيارات أكثر ذكاءً بشأن نمط\اسلوب الحياة. وبهذا الاساس\النحو تشجع أجهزة Fitbit الناس على تناول الطعام بشكل جيد وممارسة المزيد من الرياضة من خلال مساعدتهم على مراقبة وتحسين عاداتهم. كما ان الثروة من البيانات التي يتم جمعها من خلال أجهزة Fitbit لا تساعد الأفراد على أن يصبحوا أكثر صحة فحسب، بل لها أيضًا تأثيرات على أصحاب العمل ومهنيي الرعاية الصحية وحتى على شركات التأمين.

كيف يتم استخدام البيانات الضخمة عمليا؟

تتبع ساعة Fitbit الذكية نشاط المستخدم وممارسته للرياضة وتناوله للسعرات الحرارية والنوم، فيمكن للمستخدمين الوصول فوريا إلى المعلومات حول عاداتهم وتتم مزامنة الإحصائيات (لاسلكيًا وتلقائيًا) من الجهاز إلى الهاتف الذكي أو الكمبيوتر الخاص بالمستخدم. تسمح لوحة المعلومات للمستخدمين بتتبع تقدمهم (بالإضافة الى المخططات والرسوم البيانية المفيدة) وابقائهم متحفزين.

ميزان آريا، ميزان Fitbit الذكي المتصل بشبكة الواي فاي، يتتبع وزن المستخدم ومؤشر كتلة الجسم (BMI) وكتلة الجسم الخالية من الدهون\بدون الدهون ونسبة الدهون في الجسم. كما يمكن للميزان أن يتعرف الى ما يصل إلى ثمانية مستخدمين منفصلين (حتى تتمكن العائلة بأكملها من استخدامه) والحفاظ على نتائجهم منفصلة وسرية، وتتم مزامنة الإحصائيات مع شبكة الواي فاي المنزلية للمستخدم ويمكن مزامنتها أيضًا مع أجهزة Fitbit القابلة للارتداء. فكما نرى تساعد لوحة المعلومات عبر الإنترنت المستخدم على تحديد الأهداف وتتبع التقدم لمرة أخرى .

ومن الواضح  أيضا أن البيانات الصحية مثل هذه غنية بالمعلومات وقيمة بشكل لا يصدق، ليس فقط للمستخدم الفردي بل لأكثر من ذلك. فلذلك تجمع fitbit بيانات حول عادات اللياقة البدنية والإحصائيات الصحية لمشاركتها مع الشركاء الاستراتيجيين،ويمكن أيضًا مشاركة البيانات الشخصية والفردية بإذن من المستخدم، فعلى سبيل المثال تسمح خدمة HealthVault من Microsoft للمستخدمين بتحميل البيانات ومشاركتها من جهاز تتبع اللياقة البدنية مع المهنيين الصحيين، مما قد يعطي الأطباء صورة أكثر اكتمالًا عن الصحة العامة للمريض وعاداته أكثر مما قد يمكن معرفته من خلال الاستشارات والفحوصات فقط. وستكون التأثيرات أكثر مما هو عليه الان مع الإعلان الأخير بأن شركة التأمين John Hancock تقدم خصمًا لحاملي بوليصات التأمين الذين يرتدون جهاز Fitbit، يمكن لحاملي البوليصة مشاركة بيانات Fitbit الخاصة بهم في مقابل المكافآت المرتبطة بنشاطهم البدني ونظامهم الغذائي. فهذا يشير إلى ان رغبة الأفراد تتزايد ل “تداول” بياناتهم الخاصة مقابل تحسين المنتج/الخدمة أو المكافأة المالية وهو امر جيد، لطالما أن المعاملة شفافة\واضحة أي أن الفرد يدرك بالضبط ماهي البيانات التي يتنازل عنها\ يقدمها ولماذا.

تبيع Fitbit أيضًا الآن أجهزة التتبع وبرامج التتبع الخاصة بها لأصحاب العمل مثل BP America حتى يتمكنوا من تتبع مستويات صحة وأنشطة موظفيهم (بإذنهم). قال جيمس بارك، الرئيس التنفيذي لشركة Fitbit، متحدثًا إلى مجلة فوربس: إن بيع أجهزة Fitbitلأصحاب العمل أصبح واحدًا من أسرع الجوانب نموًا في أعمالهم، لذلك يمكننا التوقع أن نرى المزيد والمزيد من الشركات تتبع اللياقة اليومية لموظفيها.

فماذا كانت النتائج؟

منذ تشكيلها في عام 2007 أصبحت Fitbit تهيمن على سوق اللياقة البدنية القابلة للارتداء\للإلكترونيات الملبوسة بعد أن باعت ما يقارب 21 مليون جهاز بحلول مارس 2015. وبلا شك أن نمو الشركة مثير للإعجاب\مبهر؛ فلقد باعوا 11 مليون جهاز في عام 2014 وحده، مقارنة بـ 4.5 مليون جهاز في عام 2014. كما انه من الواضح أيضا أن خدمات المراقبة التحليلية الخاصة بهم يتم استخدامها بشكل جيد من قبل مرتدي Fitbit فيبلغ عدد المستخدمين المسجلين على منصة 19Fitbit  مليون مستخدم (من أصل 21 مليون جهاز مباع)، مما يشير إلى أن Fitbit أكثر من مجرد صيحة للياقة البدنية الحديثة: فإنها أداة مفيدة حقًا تساعد الملايين من الناس على أن يصبحوا على وعي أفضل ويبقوا أصحاء. كما يُظهر انتقال الشركة إلى سوق أصحاب العمل أن Fitbit لديها دهاء لفهم قوة البيانات المتعلقة بالصحة خارج نطاق المستخدم الفردي ومن المحتمل أن يستمر سوق أصحاب العمل في النمو بمعدل هائلللشركة.

ما هي البيانات التي تم استخدامها؟

تجمع أجهزة Fitbit مجموعة من البيانات المنظمة من المستخدمين بما في ذلك عدد الخطوات، وصعود السلالم، والسير/الجري لمسافة، وتناول السعرات الحرارية، والسعرات الحرارية المحروقة، دقائق النشاط في اليوم، وأنماط النوم، والوزن ومؤشر كتلة الجسم.

ما هي التفاصيل التقنية؟

لا تشارك Fitbit علنًا تفاصيل بنية البيانات الضخمة الخاصة بها، ولكن عندما تلقي نظرة على صفحة وظائفها المطروحة فإنها تشير إلى أنها قد تكون تستخدم تقنية قاعدة بيانات SQL، وHadoop، وPython، وJava.

ماهي التحديات التي تم التغلب عليها؟

يتمثل أحد التحديات في مجال البيانات الصحية هي في تشجيع المهنيين الصحيين على العمل مع البيانات التي يجمعها المرضى بأنفسهم. هناك قدر لا بأس به من الشك\الارتياب حول البيانات التي لم يتم جمعها أو التحقق منها مباشرة من قبل المهنيين الصحيينولكن مع الاهتمام الحالي إلى ان الوقاية من الأمراض والاوبئة خيرا من علاجها عند الإصابة بها فمن المرجح أن يتغير هذا التفكير.

فبالطبع لا توجد بيانات شخصية أكثر من بياناتنا الطبية والصحية، لذلك يجب وضع ضمانات آمنة للغاية للتأكد من وصول المعلومات فقط إلى أولئك الذين من المفترض أن يروها. وعلى الرغم من ذلك، يستهدف لصوص\قراصنة الإنترنت بصورة روتينية\منتظمة السجلات الطبية ويقال إنهم يكسبون أموالًا من البيانات الصحية المسروقة أكثر من سرقة تفاصيل بطاقاتالائتمان. ففي فبراير عام 2015 حدثت أكبر سرقة للبيانات المتعلقة بالرعاية الصحية على الإطلاق، عندما سرق قراصنة الانترنت سجلات تتعلق بـ 80 مليون مريض من Anthem، ثاني أكبر شركة تأمين صحي أمريكية. لحسن الحظ لم يأخذوا سوى معلومات الهوية مثل الأسماء والعناوين ولم يتم الكشف عن تفاصيل الأمراض والعلاجات. ومع ذلك هناك خوف من أن تكون المسألة مسألة وقت فقط حتى يحدث خرق أمني على نطاق تُفقد فيه سجلات المرضى.

وأخيرًا تواجه Fitbit تحديًا آخر للمستقبل: الا وهو المنافسة الشديدة من ساعة آبل الجديدة وغيرها من الساعات التي تدخل السوق. Fitbit في وضع قوي ولكنهم سيحتاجون إلى الاستمرار في التطور والبحث عن أسواق جديدة إذا أرادوا البقاء في المقدمة.

ما هي نقاط التعلم الرئيسية؟

تسلط هذه التجربة الضوء على قدرة ثورة إنترنت الأشياء على لمس كل مجال من مجالات حياتنا بما في ذلك صحتنا. وبينما قد يذعر بعض الأشخاص من قبل شركات التأمين أو أصحاب العمل الذين يراقبون انشطتهم، فمن المشجع رؤية الشركات تقدم مميزات واضحة مقابل تلك البيانات. وغالبًا ما نعطي بياناتنا دون وعي مننا (عن طريق الاشتراك في خدمة بريد إلكتروني مجانية على الويب على سبيل المثال أو تنزيل تطبيق). يجب على أي شركة تأخذ بيانات الأفراد أو تصل إليها ان تكون شديدة الوضوح فيما يتعلق بالبيانات التي يصلون إليها، وكيف يعتزمون استخدامها.  وبالتأكيد من العدل أن نقدم شيئًا مقابل تلك البيانات، سواء كان ذلك قسط تأمين مخفض أو القدرة على تتبع برنامج فقدان الوزن الخاص بك بسهولة أو التدرب على الماراثون باستخدام خدمة مثل Fitbit. بعد كل قصص الرعب من نوع Big Brother حول البيانات الضخمة فإن هذا النوع من الشفافية هو الذي سيساعد على تعزيز رضا العملاء وولائهم.

المراجع والمصادر الإضافية:

تعرف على المزيد حول Fitbit والبيانات الضخمة على:

Fitbit files for IPO, sold nearly 11 million fitness devices in 2014 | MobiHealthNews

The Quantified Other: Nest And Fitbit Chase A Lucrative Side Business (forbes.com)

http://www.cio.com/article/2911604/health/insurance-company-now-offers-discounts-if-you-let-it-track-your-fitbit.html[RF3] 

http://techcrunch.com/2015/06/29/the-latest-big-data-innovation-is-consumer-empowerment/