معلومات شاملة عن البيانات الكبيرة: ثقيلة ومثيرة للفوضى ومضلّلة

رجوع
Piet Hein van Dam
فبراير 06 2015
وسائل الإعلام الرقمية
معلومات شاملة عن البيانات الكبيرة: ثقيلة ومثيرة للفوضى ومضلّلة
شارك هذا المقال

الإعلانات التلفازية

في العام 1942 تم نشر الإعلان التلفازي الأول على الإطلاق. شاهده على YouTube. إعلان مدته 9 ثوان لساعة Bulova يرافقه صوت تعليقي مدهش قائلاً: "تستند أميركا إلى توقيت Bulova". إنه مثال جيد عن واقع توفر وسيلة واحدة-المجلات المطبوعة-ومن ثم توفر وسيلة أخرى-التلفاز. الإعلانات التلفازية البدائية الأولى مجرد إعادة إنتاج للإعلان المطبوع. بالإضافة إلى ميزة جديدة أضافها التلفاز: الصوت. الصوت+الإعلان المطبوع=إعلان تلفازي جديد. كانت كلفة ال9 ثوان تسعة دولارات.

الإعلانات على الانترنت

عرضت مؤخراً إعلانات 2015 Super Bowl مقابل 4.5 مليون دولار أميركي لمدة 30 ثانية. إذا ما قمنا بعملية الحساب بسرعة نتوصل إلى أن قيمة الإعلانات التلفازية قد ارتفعت من العام 1941 إلى 2015 من دولار واحد في الثانية إلى 150 ألف دولار في الثانية. عجباً!

ارتفعت هذه القيمة 74 ضعف في خلال فترة زمنية من 74 سنة. ومن الواضح أن هذا النمو ليس وليد الصدفة. بل هو ثمرة جهود هذا القطاع التي يبذلها المعلنون والوكالات والشبكات والباحثون حرصاً على وصول كل إعلان إلى المجموعة المستهدفة المناسبة وعلى استغلال كل لحظة من الدعاية وحرصاً على تأديتها التأثير المطلوب.

في أكتوبر/ تشرين الأول 1994، أطلق الإعلان الأول على الانترنت لقراء hotwired.com. وقد نقر 44% من أولئك الذين رأوا الإعلان عليه. كان الإعلان برعاية AT&T و44% ممن رأوا الإعلان نقروا عليه فعلياً.

وها نحن اليوم بعد مرور 20 سنة. سؤال يطرح نفسه: هل نحن على الدرب الصحيح؟ هل نحن على درب مضاعفة إعلان على الانترنت 150.000 مرة في خلال 74 سنة؟ ما رأيكم؟....كلا، لم نصل بعد. ولكن ينبؤني حدسي بأننا بعيدون عن الدرب الصحيح. إذا لم تقتنع بما أقول، اقرأ Adcontrarian.com أو مجلة هارفرد لإدارة الأعمال.

التنقيب عن النفط

تحدثت إلى محلل إحصائي في مؤتمر عرب النت السنة الماضية. كلانا حائز على شهادة دكتوراه في الفيزياء الإحصائية وبالتالي وصلنا في نهاية المطاف إلى نقطة حيث بدأنا نتكلم عن المسائل ذات الصلة. طرح سؤالاً مثيراً للاهتمام جداً ولا أزال حتى اليوم غير قادر على الإجابة عليه. التنقيب عن النفط عملية مهمة جداً في الشرق الأوسط وقام بحسابات في الزمن الحقيقي حول إمكانية الوصول إلى بئر نفط جديد أثناء التنقيب عنه.

افتراضياً، عندما تكون فرص النجاح أدنى من 85%، يوفقون عملية البحث عن بئر جديدة المكلفة. فسألني: لماذا لا يطبقون ذلك على قطاع الإعلانات على الانترنت؟ "ألا يتمحور الأمر حول الأموال الطائلة"؟ "حسناً، بلى حوالي 140 مليار دولار في العالم 2014". "هل ذلك قابل للقياس؟ هل لديك بيانات في الزمن الحقيقي؟" "في الواقع، لدينا هذه البيانات." "ماذا تنتظر إذاً؟" "حسناً...لا شيء على ما أظن".

البيانات الكبيرة

الحل موجود: البيانات الكبيرة. بإمكاننا قياس كل شيء، أليس كذلك؟ إمكانية رؤية إعلان على الانترنت ومدى الدعاية الفعالة والوصول إلى الجمهور المستهدف واستجابات الناس المباشرة وغير المباشرة، بإمكاننا تتبع مشترياتهم وتتبع موقعهم على نظام تحديد المواقع العالمي.

لديك كل ما تحتاجه لقياس فعالية إعلان ما. ومعظم البيانات في الزمن الحقيقي أو في الزمن شبه الحقيقي، وبالتالي بإمكاننا تعديل حملتنا فيما نتقدم. نظرياً.

تطبيقياً، ليس لدينا كل ذلك. لماذا؟ نتيجة لمقاومة القطاع لبعض الابتكارات (الوفيات الناتجة عن جرح الورق، لنتجنب بعضهاً منها). ولكن يكمن السبب أيضاً في ضرورة تعلّم بعض الدروس أولاً. فالبيانات الكبيرة ليست الحل المطلق. فهي ثقيلة ومثيرة للفوضى ومضللة. إن العمل عليها بمثابة مشكلة بشرية وليست مشكلة تقنية. إليكم بعض الدروس التي تعلمتها بعد تمضية السنوات الخمس الأخيرة في هذا المجال.

كيفية التنظيم

عليك قبل كل شيء تنظيم نفسك. احصل على مصادر البيانات المناسبة واحصل على الأنظمة المناسبة والخبرة المناسبة. إذا ما كنت تبحث عن مصادر البيانات المتوفرة، فكّر بالبيانات النشطة أو غير النشطة (نتيجة مسح آراء أو قياس، أو مزيج من الاثنين) وفكر بجانب الخادم (على مستوى المعلن) أو على مستوى المستخدم (مستوى المتلقي). النوع الأول متوفّر بكميات أكبر ولكنه أقل تعمقاً. فيما أن النوع الثاني أكثر تعمقاً ولكنه يستند إلى اللوحات/اللجان عادة. فكّر بالخصوصية-هل جميع البيانات عبارة عن بيانات قابلة للتعريف شخصياً يتم الحصول عليها بالاستناد إلى موافقة واعية ومشاركة ثنائية؟ خذ بعين الاعتبار أيضاً الانحيازات المحتملة في البيانات (هل خضعت للقياس؟ ما العناصر التي لم تخضع للقياس؟) ومدى تمثيلها (هل تغطي السكان جميعاً؟).

إذا ما كنت تفكر بالأنظمة، عليك التفكير بالتخزين والتحليلات. البيانات الكبيرة هائلة الحجم، وتتم في الزمن الحقيقي، وبالتالي لا بد من تحليلها بسرعة؛ كما أن مقتضياتها من حيث التخزين والتحليلات متقلبة وبالتالي لا بد من التكيّف معها بسرعة.

لا بد من أن يتحلى الأشخاص الذين يعملون على البيانات- هم غالباً علماء بيانات-بمزيج مناسب يجمع مهارات الدخول غير القانوني والمهارات في مجال الرياضيات والإحصائيات والخبرة الجوهرية (الإلمام بالقطاع).

قواعد أساسية

وبالتالي أثناء العمل على البيانات، يجب تطبيق 5 قواعد (مستخلصة من التطبيق).

مزج الطرق: لا تثق بمصدر واحد لجمع البيانات دون غيره وحاول دائماً استخدام مصدرين أو أكثر. ومن ثم يصبح بإمكانك تثليث نتائجك والحصول على الإجابة الأكثر احتمالاً.

ابدأ خطوة بخطوة: أمر نموذجي في حال كانت البيانات الكبيرة تعني الحصول على أكثر مما تطلب. عندما تعمل على هذه البيانات، ابدأ بعينة صغيرة أو شخص واحد لفهم محتوى البيانات. إذا كنت تنوي تناول فيل، احرص على تناوله شيئاً فشيء.

اختبر واحذف: بعد أن تجري التحليلات الأولى، استخلص أكبر قدر ممكن من الفرضيات ومن ثم ابدأ باختبارها. واحذفها بمجرد أن تدرك أنك غير قادر على دحضها ومن ثم اعمل على الأخرى.

الفريق أهم من الأدوات: أسلوب تعاون فريقك أهم بكثير من الأدوات التي تستخدمها. عندما ترى عالم بيانات يعمل على مشروع من دون مناقشة أفكاره وفرضياته مع العميل وأخصائي، احرص على التزامه بهذا النقاش.

أنت مصدر الدقة: قد تحوي البيانات الكبيرة أخطاءً كبيرة. البيانات الكبيرة غير تمثيلية. وهي تتمحور حول الارتباطات (وليس العلاقات بين السبب والمسبب). وبالتالي عندما تكون مصادر البيانات عديدة، أنت مصدر الدقّة!

كلمة أخيرة

آمل أن تكون هذه الدروس قد ساهمت في منحنى التعليم الخاص بالإعلانات على الانترنت. لنرى إذا ما كان بإمكاننا التفوق على منحنى الإعلانات التلفازية (150000 مرة في 74 سنة، هل تتذكر؟)

نبذة عن الكاتب

بيت هين فان دام هو المدير التنفيذي في شركة الانترنت الناشئة في أمستردام Wakoopa. أصبح بيت هين إلى مدير تنفيذي ومطوّر أعمال في الوقت نفسه بفضل شهادة الدكتوراه في الديناميكيات اللاخطية. أمضى أكثر من 10 سنوات في Unilever وKPMG Consulting في مناصب ذات صلة بتطوير الأعمال الدولية. في العام 2005، أصبح عضو مجلس الإدارة المنتدب في Motivaction International وهي شركة هولندية لأبحاث السوق. في العام 2011 انضم إلى شركة الانترنت الناشئة Wakoopa. تقدّم الشركة للوكالات العالمية في مجال أبحاث السوق والمعلنين والناشرين ووكالات الإعلام تتمحور تكنولوجيا حول المستخدم لقياس الجمهور على الانترنت. بيت هين متحدث دائم في المؤتمرات وكاتب عدد من المقالات حول عمليات جمع البيانات السلوكية.