معهد ليفانت للدراسات

تطبيق نظرية الألعاب على الأزمة السورية

تطبيق نظرية الألعاب على الأزمة السورية
يونيو 16
00:31 2016

"التفكير الاستراتيجي هو فن التفوق على الخصم، و معرفة أن الخصم يحاول أن يفعل الشيء ذاته لك"

 

لم يعد خافياً على أحد أن الأزمة التي تعيشها سورية مننذ ما يقارب الخمس سنوات، ليست مجرد أزمة سياسية داخلية عابرة منفصلة عن سياقها التاريخي. إنما هي أزمة مركبة سياسية، اقتصادي، و اجتماعية مرتبطة إلى حد كبير بصراع اقليمي و دولي يهدف إلى تغيير موازين القوى و إعادة تشكيل نظام عالمي جديد.

لن نخوض في الأسباب الداخلية و الخارجية التي شكلت الأرض الخصبة للأزمة، و لا في نتائجها الكارثية على المستويين الاقتصادي و الاجتماعي. بل سوف نبحث في أحد تجليات هذه الأزمة، و هو النزاع المسلح الذي امتد ليصبح حرباً تخوضها الدولة بمساندة حلفائها ضد مجموعات إرهابية مسلحة محلية و أجنية مدعومةً من قبل بعض الدول الاقليمية. سنحاول في هذه الورقة تطبيق نظرية الألعاب على هذه الحرب.   
 

مفهوم نظري

إن نظرية الألعاب (Game Theory) هي تحليل رياضي لحالات تضارب المصالح بغرض الإشارة إلى أفضل الخيارات الممكنة لاتخاذ قرارات في ظل الظروف المعطاة تؤدي إلى الحصول على النتيجة المرغوبة. عرفت نظرية الألعاب لأول مرة عندما نشر أوسكار مورجنسترن و جون نيومان (Oskar Morgenstern and John Von Neumann) كتابهما المعروف" نظرية األعاب و السلوك الاقتصادي"، ثم وجدت هذه النظرية تطبيقاً واسعاً لها في مختلف المجالات مثل الاقتصاد، السياسة، الاجتماع، إضافة إلى العلوم العسكرية.

في نظرية الألعاب هناك نوعان:

  • الألعاب الغير التعاونية (Non-Co-operative games): في هذه الحالة يتصرف اللاعبون بشكل مستقل دون أي تقدير عن ما يفعله اللاعبون الأخرون.
  • الألعاب التعاونية (Co-operative games): في هذه الحالة يمكن أن يتعاون اللاعبون مع ببعضهم البعض.

في كل لعبة يوجد ما يلي:

  • مجموعة من اللاعبين (Set of players) Pi : 1 <= i  <= n  
  • مجموعة من القواعد (Set of rules) R
  • مجموعة من الاستراتيجيات (Set of strategies) Si لكل لاعب Pi
  • مجموعة من النتائج (Set of outcomes) O
  • المدفوعات (Payoff) Ui(O) لكل لاعب Pi و لكل نتيجة O

ربما أشهر مثال طرح عن نظرية الألعاب هو معضلة السجين (Prisoner’s dilemma):

ارتكب شخصان جريمة و لكن لا دليل إثبات، أمسكت الشركة بهم و وضعت كل شخص في زنزانة بعيداً عن الأخر. و بما أنه لا يوجد أي دليل إثبات لا يمكن إتهامهم بالجريمة. لذلك حاولت الشرطة استخدام أحداهما ضد الأخر. فأعطي كل سجين خياريين إما الإعتراف أو الانكار. إذا اعترف السجين الأول و نكر السجين الثاني، يعفى السجين الاول من أي عقوبة لمساعدته الشرطة و يسجن السجين الثاني كامل العقوبة 10 سنوات. و بالعكس إذا اعترف الثاني و نكر الاول. أما إذا عترف السجينان يعاقب كل منهم 5 سنوات. و في حال نكر السجينان و بما الشرطة لا تملك أي دليل فأقصى عقوبة ممكن ان يحصل عليها السجينان هي سنة واحدة لكل منهما.

إذا هنا مجموعة اللاعبين: }السجين الثاني، السجين الأول P={

القواعد كما في النص، و مجموعة الاستراتيجيات لكل لاعب:  }الانكار،الاعتراف{ S1= و  }الانكار،الاعتراف{ S2=

و مجموعة النتائج }الثاني يعترف و الاول ينكر، الاثنان ينكران، الاول يعترف و الثاني ينكر، الأول و الثاني يعترفان O={

و بالتالي تكون المدفوعات:

=5(الاول و الثاني يعترفان)2u                  =5(الاول و الثاني يعترفان)u1

=10(الاول يعترف و الثاني ينكر)2u           =0(الاول يعترف و الثاني ينكر)u1

=1(الاول و الثاني ينكران)2u                    =1(الاول و الثاني ينكران)u1

=0(الاول ينكر و الثاني يعترف)2u        =10(الاول ينكر و الثاني يعترف)u1

 

 

و يمكن تمثيل ذلك وفق الجدول التالي:

 

 

السجين الثاني

 السجين الأول

 

اعتراف

انكار

اعتراف

5/5

0/10

انكار

10/0

1/1

 

    

إذا ما أردنا تحليل اللعبة من وجهة نظر السجين الأول، مع العلم أنه لا يعلم قرار السجين الثاني، و يريد تخفيض مدة العقوبة قدر الإمكان. فهو يفترض ما يلي:

  • أن السجين الثاني اعترف: و في هذه الحالة الاعتراف يعطيه 5 سنوات سجن، و النكران 10 سنوات، فمن الأفضل الإعتراف.
  • أن السجين الثاني نكر: و في هذه الحالة الاعتراف يمنحه إعفاء 0 سنة، و النكران يمنحه 1 سنة سجن، فمن الأفضل الإعتراف.

و بالتالي يكون له من الأفضل ان يعترف، و كذلك يقوم السجين الثاني بنفس التحليل و سيفضل الاعتراف على النكران. إذاً نصل إلى حالة (اعتراف، اعتراف) و التي تمثل بنظر السجينين أقل مدة عقوبة (أقل الخسائر) و التي يطلق عليها توازن ناش (Nash Equilibrium). إلا أن التوازن الذي حصلنا عليه في هذه العبة ليس التوازن الامثل (Optimal Equilibrium) أو ما يعرف أمثلية باريتو(Pareto Optimality)، و هي حالة (اعتراف، انكار) بالنسبة للسجين الأول، و حالة (انكار، اعتراف) بالنسبة للسجين الثاني. لذلك فإن كل سجين عندما يتبع استراتيجية الاعتراف فهو يأمل أن ينكر السجين الأخر و بالتالي تتحقق الحالة المثلى له. أما الحالة المثلى للنموذج فهي حالة (انكار، انكار) و فيها يعاقب السجينان بسنة واحدة سجن لكل منهما بدل خمس سنوات كما في حالة توازن ناش. و لكن الحالة المسيطرة هي توازن ناش طالما أن كل من اللاعبين لا يعرف ما القرار الذي سوف يتخذه الأخر، و بمعنى أخر طالما أن اللعبة غير تعاونية. إلا أنه عندما يمكن لأحد اللاعبين التعاون مع الاخر بشكل من الاشكال عندها سوف ننتقل إلى أمثلية باريتو و هي الحالة المثلى لكلا اللاعبن معاً.

 

 

التطبيق العملي

بالنسبة للحالة السورية، اللاعبون هم:

  • الدولة و حلفائها
  • المجموعات المسلحة و داعميها

و سنفترض أن هدف المجموعات المسلحة هو السيطرة على الأرض بهدف تحقيق مكاسب سياسية، أما الدولة فهو إعادة السيطرة على المناطق التي كانت قد سيطرت عليها المجموعات المسلحة. و بعد أن بدأت الحرب و سيطرت المجموعات المسلحة على مساحات من الأرض السورية، لم يعد أمام الدولة سوى محاربة هذه المجموعات. و لكن استمرار الحرب لسنوات طويلة و تضاعف آثارها الكارثية، جعل الاستراتيجيات المطروحة هي إما الاستمرار في القتال او التوقف عن القتال و بدء الحوار. و سنفترض أنه في حال الاستمرار في القتال لللاعبين، سيحصل كل من اللاعبين،في أحسن الاحوال، على 50% من الأرض (تزداد و أو تتناقص مع اكتساب أو خسارة أجزاء من الارض خلال الحرب). أما استمرار لاحد اللاعبين و توقف الاخر سيحصل الأول على كامل الارض و يخسرها الأخر. و في حالة توقف كل منهما و بدء الحوار فسنفترض أن كامل الارض ستعود لجميع المواطنين و تتم تسوية الأوضاع مع المجموعات المحلية و تتوحد الجهود للقضاء على الارهاب الذي انتشر في المنطقة و الذي تتعارض مصالحه مع مصالح كل من الدولة و المعارضة.
 

سنمثل النتائج كما يلي:

 

 

المجموعات المسلحة

 الدولة و حلفائها

 

استمرار القتال

توقف عن القتال

استمرار القتال

50/50

100/0

توقف عن القتال

0/100

100/100

 

 

وفق التحليل المتبع في نظرية الألعاب الغير تعاونية، سنكون الحالة الأولى (استمرار، استمرا) هي الحالة المسيطرة طالما انه لا يوجد تعاون بين اللاعبين. فتوقف أي لا عب سيجعل اللاعب الاخر مسيطر على كافة الارض في حال استمر في القتال.

أما الحالة المثالية بالنسبة للدولة فهي (استمرار، توقف) و التي تجعل الدولة تعيد السيطرة على كافة الأرض، لذلك عليها أن تخلق الظروف التي تجعل المجموعات المسلحة تتوقف عن القتال. و بالعكس بالنسبة للمجموعات المسلحة.

إن أهم العوامل التي تجعل لاعب من اللاعبين يتوقف عن الاستمرار هي:

  • محدودية الموارد: مثل انتهاء الموارد المالية (توقف التمويل)، أو عدم كفاية الموارد البشرية، أو العتاد..
  • التعب: أو الارهاق الجسدي و النفسي و عدم القدرة على الاستمرار

و لكن عندما تبدأ توقعات اللاعبين بالوصول إلى حالتهم المثلى مع مرور الوقت (و خصوصاً بعد فترات طويلة)، يبدأ كل لاعب يفكر كيف يمكنة عبر المفاوضات مع الاخر توقيف اللعبة دون خسائر إضافية. و يطلق على هذه النقطة التي تتحول فيها اللعبة من غير تعاونية إلى تعاونية بتطور باريتو (Pareto Improvement). و هي تبدأ عندما يدرك كلا اللاعبين أنه كلما طال الوقت لتحقيق السيطرة الكاملة كلما استنفذا الموارد و الجهد  و بالتالي كلما قلت فرصتهما في الربح.

و مع انتقال اللاعبين إلى التفاوض،المباشر أو غير المباشر، تنتقل اللعبة من الوضعية التنافسية إلى الوضعية التعاونية، و يمكن القول أنه عند هذه النقطة تصبح اللعبة فاسدة حسابياً (Mathematical Point of Corruption)، حيث أن اللاعبين لا يتبعا قواعد اللعبة. و لكي تتحقق هذه الوضعية و يتم الانتقال إلى حالة توازن (توقف، توقف) لا بد من تهيأة الظروف المناسب لذك، إضافة إلى ضرورة توافر الإرداة الدولية، حيث أن القوى الدولية و الإقليمية هي داعم لكل من اللاعبين. و بالتالي فإن إدراك هذه القوى الخارجية (صاحبة المصالح) أن الوقت قد حان للانتقال إلى التعاون ستسعى إلى خلق الظروف المناسبة لذلك (مثال: الاتفاق الامريكي-الروسي لوقف الأعمال القتالية).

—————————————————————————————————-

1 ديكسيت، افيناس، و نالبوف، باري، "التفكير استراتيجياً" ،(1991)، نقلاً عن سامويلسون، بول و أخرون "الاقتصاد"، ترجمة الطبعة الخامسة عشر، ص 220

2  نسبةً إلى الاقتصادي و عالم الرياضيات جون ناش، و الحائز على جائزة نوبل للاقتصاد عام 1994 عن عمله Analysis of equilibrium in the theory of non-cooperative games

3 نسبةً للاقتصادي الايطالي Vilfredo Pareto، تعتبر نتيجة اللعبة فعالة بمقياس باريتو عندما يصل لاعب لأعلى عائد، و لايمكن أن يحصل أحد اللاعبين على اعلى عائد دون تقليل عائد منافسه.

تقارير ذات صلة