خوارزميات غوغل خارج السيطرة وكيف تصلح نظاماً لا يمكن إصلاحه

اكتشف وتسوق أفضل مجموعة من المنتجات التقنية وأسلوب الحياةواحصل على خصم 10% على طلبك الأول من متجر سماعة باستخدام الكوبون

TECH1

غوغل، أحد أكبر الشركات التقنية حجماً في العالم، تسيطر على جزء ضخم من الانترنت ويعتبر محرك البحث خاصتها مفتاح الدخول لكافة المواقع الموجودة على الشبكة، خدماتها المختلفة تغطي العديد من الجبهات التقنية الأخرى دون منافس تقريباً؛ إعلانات أدسنس التي يمكن رؤيتها في كل مكان على الانترنت، منصة الفيديو الأكبر دون منازع على الشبكة، نظام التشغيل الأكثر استخداماً على الهواتف المحمولة، خدمة البريد الإلكتروني الأشهر ونواة متصفح الانترنت الأكثر شيوعاً اليوم، كل هذه الأدوات تبسط سيطرة غوغل على أغلب أجزاء دورة الحياة الانترنتية.

قد يتسائل الناظر من الخارج، كيف يمكن لشركة مشابهة أن تعمل، بالأخص تحت القوانين والنيران الحكومية المستمرة التي تهدف لتطبيق قوانين حقوق النشر وقوانين المحتوى المسموح بنشره والتي تتغير من دولة لأخرى، كيف يمكن لها أن توازن بين النتائج في البحث وأن تختار الإجابة الأفضل على سؤالك المحدد جداً، وكيف يمكن لها أن تدير منصات هائلة بعدد محدود من الموظفين؟ والجواب واحد: الخوارزميات.

الطريق الوحيد للتعامل مع كمية البيانات الهائلة التي تمتلك غوغل وصولاً لها هو الخوارزميات أصلاً، فالتعامل البشري خارج إطار الصورة تماماً – الإدارة البشرية والإشراف على عمل الخوارزميات موجودان بالطبع، ولكن الجزء الأكبر من العمل يقع على عاتق “الآلات” التي تحدد على سبيل المثال إن كانت أغنية ما في مقطع الفيديو خاصتك على يوتيوب تقع تحت حماية الملكية الفكرية أو تحت المشاع الإبداعي.

ما يجب معرفته عن الآلات هو أنها لا تستطيع اتخاذ القرارات بنفسها، فهي بحاجة لبشريّ خلف لوحة المفاتيح ليأخذ القرار أولاً ويعلّمها ما يجب أن تفعله، والمشكلة في هذه المقاربة أنك أولاً تعتمد على القدرات المحدودة والبطيئة للدماغ البشري لتحدد طريقة عمل الآلة.

في بداية أيام الإنترنت ومحركات البحث الأولى، كان من الناجع الاعتماد على خوارزميات محددة في أرشفة مواقع الويب – النسخ الاولية من محرك غوغل اعتمدت خوارزميات وأساليب أرشفة “مكشوفة” لمطوري الويب، على سبيل المثال، كان من السهل عليك أن تقنع غوغل بوضع أي صفحة في موقعك ضمن نتائج البحث عن كلمة ما، فقط عن طريق تصريحك في وصف هذه الصفحة أنها تتحدث عن هذه الكلمة.

أمر معتمد على الثقة تماماً، وفي الحالات المتطرفة التي تخرق فيها هذه الثقة يمكن حل المشكلة بسهولة من طرف الفريق البشري كون حجم البيانات المتدفقة يمكن السيطرة عليه بشرياً.

مع زيادة كمية البيانات المتدفقة بدأت غوغل تتوجه لاستخدام خوارزميات أكثر تعقيداً، لم تعد كلمة مالك موقع الويب هي الأقوى في تحديد توجه المحتوى ولم يعد أمر الوصول لنتائج البحث الأولى أمراً بسيطاً. الخوارزميات تقرأ النص وتقرر معناه، وتراقب المستخدم بعد دخوله للموقع وعند خروجه، وتقرر بناء على كل نقاط البيانات الأخرى قيمة الصفحة، وتدفعها للأعلى أو تدفنها في الأسفل.

بالطبع – أبالغ في تبسيط الخطوات هنا، الانتقال بين المرحلة الأولى والثانية لم يكن مفاجئاً وإنما بالتدريج، كما كان الانتقال إلى تقنيات تعلم الآلة في السنوات الأخيرة.

الفرق بين تعلم الآلة والخوارزميات التقليدية

تعلم الآلة

كل من الطريقتين المذكورتان في الأعلى تستخدمان لتعليم الحاسوب القيام بخدعة ما، ولكن كل منهما يعتمد على مبدأ مختلف؛ الخوارزميات التقليدية تعتمد على المبرمج وخبرته لبناء البرنامج وتحديد مهامه، على سبيل المثال، برنامج يقوم بحذف كل موقع يتضمن كلمة معينة من نتائج البحث، وهذا يعني أن للمبرمج القدرة الكاملة للسيطرة على نتائج البرنامج.

بينما البرامج المبنية بواسطة تقنيات تعلم الآلة تصنع بطريقة مختلفة تماماً، حيث يقدّم كم هائل من البيانات للبرنامج ويعرّف له بضع القواعد العامة، ومن ثم يترك ليقرر بنفسه الخوارزمية التي يجب اتباعها للحصول على النتائج الأفضل. على سبيل المثال لبناء برنامج يقوم بحذف مواقع تتضمن كلمة معينة من نتائج البحث، يتم توفير كمية هائلة من نتائج البحث لهذا البرنامج، ومن ثم تقديم مجموعة من نتائج البحث المقبولة، واخرى مرفوضة، ويترك البرنامج ليقدم “تخمينه الأفضل” لأي مجموعة يجب أن تنتمي النتيجة.

يقوم المبرمج هنا فقط بضبط شروط التجربة، وتصحيح الأخطاء وتقويمها لتحسين “التخمين” الذي يقوم به البرنامج – وبالطبع صناعة هذا البرنامج الذي سيأخذ القرار وضبطه، هذا الضبط يدفع البرنامج لبناء خوارزمية أفضل للعثور على الحل – هذه الخوارزمية تتطور باستمرار طالما يتم تقديم المزيد من البيانات والمزيد من الحالات التعريفية.

المشكلة هنا أن ما يجري ضمن الخوارزمية في نموذج تعلم الآلة لن يكون مفهوماً دائماً للمبرمج البشري الذي يلقّمها البيانات، أجل هو يحدد ما يرغب الحصول عليه من نتائج، ولكنه لا يتحكم تماماً بالطريق الذي يسلكه البرنامج للوصول لهذه النتيجة. والسؤال المحوريّ بهذا الخصوص هو مدى خطورة هذه المشكلة.

هذه في الحقيقة ميزة، وليست عيباً

ذكرت سابقاً أن غوغل كانت تعتمد في البداية على “أمانة” أصحاب المواقع وتثق بهم لتعريف محتواهم بالشكل الأفضل، وذكرت أيضاً أن أي نظام يتضمن ثغرات معروفة سيتم استغلالها فيه ما لم يتم إصلاحها.

التلاعب بنتائج البحث على سبيل المثال قديم بقدم محركات البحث ذات نفسها، المواقع المخادعة والمزورة والمواقع التي تحاول خداع المستخدم للدخول وغيرها من المواقع التي ترغب بالوصول للصفحة الأولى من نتائج البحث كانت موجودة ولا تزال موجودة حتى الآن، حتى مع التقدم المهول بفعالية أنظمة محركات البحث في كشف وحذف هذه المواقع من نتائجها.

الطريقة الوحيدة لمنع هذا التلاعب أو الحدّ منه على أقل تقدير، هو التوقف عن مشاركة المعلومات مع مالكي مواقع الويب. لن يستطيع أحد خداع الخوارزمية، إن لم يعلم أحد ما هي الخوارزمية أصلاً.

وهنا يأتي دور تعلم الآلة، إن كان المبرمج ذاته غير قادر على فهم آلية عمل الخوارزمية تماماً -ولو أنه يعرف الهدف منها والنتيجة المرجوة- فيمكن التخمين أن شخصاً من خارج الشركة لن يكون قادراً على فهم هذه الخوارزمية بسهولة أيضاً، وما يجعل الأمر أكثر صعوبة هو أن هذه الخوارزمية متغيرة باستمرار، مما يجعل مهمة البحث عن ثغرات فيها أمراً لا طائل منه.

وعلى الرغم من أن الكلام السابق قد يشعرك أن غوغل قد عثرت على وحيد القرن الأسطوري لحل كافة مشاكلها، إلا أن هذا بعيد جداً عن الواقع، فأفضل أدواتها هو أكبر العقبات التي تقف في طريقها اليوم وتجعلها محشورة في الزاوية.

“أي زاوية؟” قد تتسائل

زاوية القانون إن أردنا اختزالها في كلمة واحدة، عدو غوغل الأول والأخير هي الدول والقوانين التي تسنّها لوضع حدود على خدمات هذه الشركة، على سبيل المثال قوانين حقوق النشر التي لطالما سببت المشاكل للشركة منذ أيامها الاولى وحتى الآن.

لنأخذ خدمتين من أكبر خدمات غوغل وأكثرهما حساسية للمستخدمين: يوتيوب وخدمة البحث، ولنتحدث قليلاً عن المعارك القانونية التي تخوضها وخاضتها غوغل لتبقي على هاتين الخدمتين على قيد الحياة. لتفعل هذا يجب أن تحافظ غوغل على التوازن بين ثلاث عناصر، الأول هو الربح الماديّ وهو هدف الشركة الأساسي، الثاني هو تجربة المستخدم وجذبه لاستخدام الخدمة، والثالث هو الجانب القانوني الذي عليها الالتزام به لتبقى في سوق العمل.

أي هذه العناصر أكثر أهمية من الآخر؟ كلها ذات نفس الأهمية. ولكن العنصر الذي “يقاوم” تقدم غوغل هو العنصر القانوني فحسب بشكل فعال، بينما يمكن القول ان الأداء الماديّ للشركة يمكن تحمّله، وتجربة المستخدم يمكن أن تنتظر في كثير من الأحيان.

القضية الأولى: قضية حقوق النشر الأزلية.

مفهوم الملكية الفكرية وحقوق النشر من أصعب المفاهيم التي يمكن تطبيقها على الانترنت والبضائع الإلكترونية بشكل ناجع، لا يمكن للقانون فعلياً مطاردة كل شخص يحمّل أغنية مقرصنة على هاتفه المحمول – على الأقل ليس ضمن النظام الإجتماعيّ الذي نعيش فيه اليوم. ولكن ما يمكن للقانون أن يفعله هو أن يجبر شركات ضخمة مثل غوغل أن تمنع وصول هذا المحتوى لشبكتها وبالتالي تحول هذه الشبكة إلى منصة توزيع أعمال مقرصنة.

وهذا ليس سيئاً نظرياً، لا يجب على غوغل أن تتحول إلى منصة قرصنة، أو منصة لمشاركة الأعمال المقرصنة كالأغاني والأفلام والألعاب… ولكن كيف يمكن تطبيق هذا؟ مع كمية البيانات الهائلة الموجودة لا حل سوى استخدام الآلات.

تبرمج الآلات على كشف الأغاني المقرصنة على سبيل المثال في منصة يوتيوب وتزيلها تلقائياً، هذا النظام سهل التلاعب وربما يخطئ في تعليم أحد الفيديوهات على أنه أغنية بسبب خطأ برمجي، أو يعجز عن كشف اغنية مقرصنة مرفوعة كما هي على الموقع لخطأ برمجي آخر. هنا يجب على الشركة أن تضع نظاماً آخر، يسمح لصاحب الفيديو أن يدافع عن نفسه لإعادة المحتوى، ونظام مختلف لصاحب حقوق النشر كي يعترض على وجود عمله مقرصناً على المنصة.

مجدداً، هذين النظامين يتلقيان كمية هائلة من البيانات كل يوم، ولا يمكن التعامل معهما بشرياً، لذا يجب تركهما للآلات أيضاً، نظام لقراءة وتقييم طلبات ازالة المحتوى بسبب مخالفة حقوق النشر، ونظام للنظر في المحتوى المرفوع الذي يدعي أصحابه أنه لا يخرق حقوق النشر. ومن ثم نظام آخر لدعم هذا النظام، وآخر لدعم ذاك النظام، وهكذا ليكون قدر البيانات قابلاً للمعالجة بشرياً.

ولكن هذا ليس ما يجري في الحقيقة.

غوغل توقفت عن الاهتمام في الطبقة الأولى، بعد أن يرسل صاحب الأغنية طلب إزالة، غوغل لا تقوم بدراسة هذا الطلب أبداً ولا تعرضه على الآلات ولا البشر، بل تزيل المحتوى تلقائياً. وهذا بسبب القانون الذي يجبرها على هذا. بالنسبة لاعتراضات اصحاب المحتوى الذين تم إزالة محتواهم ظلما، لم ترغب غوغل أيضاً بالتعامل مع مشكلتهم بل حوّلتها لتكون مشكلة الطرف الذي قام بالمطالبة بحقوق النشر.

وضعت غوغل مصير أصحاب المحتوى على منصتها في أيدي أصحاب حقوق النشر، وتم استغلال هذا النظام بشكل سيء لسنوات طويلة – في النهاية، لا يوجد ما يمنع أصحاب حقوق النشر من استغلال نظام يعطيهم الأفضلية.

لا يمكن لغوغل اليوم أن تضع آلات أخرىة قادرة على التعامل مع الحالات الخاصة بطريقة أفضل – لأن القانون لا يسمح لها بهذا. وهذا يؤثر سلباً على تجربة أصحاب المحتوى، والذي بدوره يؤثر على أرباح المنصة.

يضغط هنا القانون على المنصة مؤثراً بشكل مباشر على تجربة مستخدميها، الأمر الذي يؤثر بدوره بشكل غير مباشر على دخلها.

القضية الثانية: معالجة البيانات

كتبت مطولاً في مقال سابق عن حرب البيانات الضخمة التي تجري اليوم، وكيف تحاول اغلب دول العالم حماية بيانات مواطنيها من الشركات الكبرى مثل غوغل وفيسبوك. وفقط للحديث عن مثال سريع هنا سنذكر القضية الأخيرة التي واجهت فيها لجنة التجارة الفدرالية الامريكية غوغل بخصوص منصة يوتيوب والمحتوى المستهدف للأطفال فيها.

بالمختصر، المصدر الأساسي لدخل غوغل هو بيانات مستخدميها، تستخدم هذه الشركة البيانات التي تجمعها من عشرات آلاف النقاط المختلفة حول الانترنت لتقدم لمتصفحي مواقعها إعلانات مناسبة لما يبحثون عنه. المشكلة هنا أن القانون الأمريكي يمنع جمع البيانات الشخصية من الأطفال لأي أغراض تجارية، ويمكن توقع المسار الذي يمكن أن تأخذه قضية مشابهة.

على غوغل الآن العثور على طريقة لمنع جمع بيانات الأطفال، ولكنها تقوم بهذا سلفاً من خلال توفير تطبيق YouTube Kids الذي يمنع جمع أي بيانات – بديهياً، لم يكن هذا كافياً للجنة التجارة الفدرالية، بل طلبت انشاء نظام جديد يعمل على منصتها الرئيسية.

كيف يمكن أن تمنع جمع البيانات حول الأطفال، إن لم يكن بإمكانك جمع بيانات كافية لمعرفة أنهم أطفال؟ حسناً لا يمكنك فعل هذا، ولكن ما يمكنك فعله هو التخمين، خمّن أي محتوى يمكن أن يجذب الأطفال على المنصة وطبق عليه القواعد التي تشترطها لجنة التجارة الفدرالية.

وهو ما فعلته غوغل هنا، إذ وضعت نظاماً “يخمّن” إن كان المحتوى موجهاً للأطفال، ومن ثم سمحت لأصحاب المحتوى بتحديد الجمهور المستهدف بأنفسهم، وبهذا أزالت عن نفسها المسؤولية القانونية بالكامل. ولكن يمكن توقع الطريقة التي يمكن لنظام مشابه أن يفشل فيها، نظام معتمد على ثقة المنصة بمستخدميها يمكن استغلاله بسهولة. وعلى الرغم من أن تبعات هذه المشكلة لم تظهر بعد إلا أنها قد تظهر في وقت قريب جداً.

الضغط القانوني هنا جاء مباشرة على دخل الشركة، وأثر هذا بشكل غير مباشر على تجربة مستخدميها.

المغزى

يمكنك أن ترى نمطاً متكرراً في هذه القضايا، غوغل تستخدم الكثير من الأنظمة التلقائية التي تسهل تعاملها مع المحتوى، ولكن الضغط القانوني في كثير من الأحيان يجعل هذه الأنظمة ذات فائدة محدودة او معدومة، وفي أسوأ الأحوال ضارّة لمستخدميها ودخلها الماديّ.

الضغط القانوني بذاته ليس أمراً سيئاً على الإطلاق، يجب ان يضع أحد رقابة على الشركات الضخمة ليضمن أنها لن تتحول إلى “شركة شريرة” تسيطر على أجزاء غير معقولة من حياة مستخدميها، على الرغم من أنها كذلك سلفاً، وأنا شخصياً أؤيد وضع الأنظمة التي تحد من حركة هذه الشركات لتضمن مصلحة المستخدمين. ولكن…

هذه الدائرة المستمرة من الشد والضغط قد تعني أن ما تحاول غوغل فعله هو إصلاح نظام غير قابل للإصلاح، وأن الأمر قد يحتاج من الشركة التخلي عن جزء من الكعكة الضخمة التي تحاول التهامها لتكون قادرة على الاستمرار.

اترك ردّاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *