مهارت در برابر شانس در تعیین برندگان تخته نرد – Skill vs luck in determining backgammon winners

مهارت در برابر شانس در تعیین برندگان تخته نرد

 

در یک نگاه:

من رابطه بین کیفیت تصمیم گیری و برنده شدن در تخته نرد را با داده های آنالیزXG-Gammon  حاصل از بازی­های FIBS و grid.gammon را سنجیدم.

 

گرفتن داده های تخته نرد از XG-Gammon

 

تخته نرد یک بازی تلفیقی بین شانس و مهارت است و هرکسی با آن روبرو میشود این سؤال را میپرسد که «چقدر شانس و چقدر مهارت لازم است؟» که البته پاسخ آن بستگی دارد. دو بازیکنی را که دقیقاً به یک میزان مهارت دارند در نظر بگیرید، به این نتیجه میرسیم که ۱۰۰ درصد شانس تعیین کننده برنده است و بهترین پیش بینی را میتوان با شیر یا خط[۱] تعیین کرد. در مثالی دیگر، یک بازیکن ماهر[۲] برابر یک تازه ­کار[۳] را فرض کنید که فرد ماهر ۷۵ درصد بازی های تک امتیازی را برنده خواهدشد و نزدیک به ۱۰۰ درصد بازی ها تا یازده یا بیشتر را خواهد برد (هرچه بازی طولانی تر، احتمال استفاده از مهارت بیشتر خواهدشد).

از آنجاییکه هوش روبات (کامپیوتری) که از شبکه­ های عصبی[۴] بمنظور تعیین استراتژی های پیروزی استفاده میکند پیشرفت کرده است، ما راهی جدید را برای تعیین دقیق میزان شانس و مهارت برآورده کردیم. هر تصمیم توسط هربازیکن را میتوان با بهترین تصمیمی که توسط کامپیوتر گرفته میشود مقایسه نمود و کامپیوتر میتواند دقیقاً بگوید که نتیجه نهایی که شما با بازی متفاوت خود گرفته­ اید چقدر با آنچه باید صورت میگرفت تطابق دارد. اگر شما ۱ نتیجه بگیرید، شما از برد قطعی به باخت قطعی رسیده­اید. در عمل از دست دادن ۰٫۰۸۰ از احتمال پیروزی[۵] در یک حرکت را معمولاً بعنوان اشتباه فاحش[۶] تفسیر میکنند و ۰٫۰۲۰ را یک خطا به حساب می آورند. در حالیکه افزایش ۰٫۳۰۰ به تطبیق کامل توسط تاس خوب آوردن یک امتیاز رایج برای یک جوکر محسوب میشود.

البته وقتی که شما با فرد دیگری تحت قوانین قراردادی بین یکدیگر بازی میکنید، اطلاعی ندارید که مثلاً ۰٫۰۹۶ از احتمال پیروزی (تطابق کامل با حرکات صحیح) خود را تسلیم داشته­ اید، گرچه گاهی اوقات با خود میگویید که «نباید این حرکت را می آمدم…». ما خطاهای خود را در آنالیز پس از بازی بررسی کردیم.

بخوبی بهترین تخته نرد بازان دنیا، XG-Gammon و دیگر نرم افزارها همچون GNU Backgammon  و  Snowie توسط بسیاری از تخته نرد بازان به منظور آنالیز بازی های خود از آنها استفاده کرده اند تا جاهایی را که امکان بهبود دارد تعیین کرده و بداند که حریف او شانس داشته یا خیر. سایت های آنلاین مثل FIBS و grid.gammon امکان ذخیره بازی های شما را فراهم کرده تا بتوان توسط نرم افزارهای مربوطه میزان شانس و اشتباهات را آنالیز نمود. اگر کاربر نتایج آنالیزی را در بخش پروفایل بازیکن ذخیره کند، شما یک دیتابیس از بازی ها و مسابقات در دست خواهید داشت. برخلاف دیگران، من غالباً مسابقات (مچ) را انجام داده و در این پست من داده های سطح مسابقه ها را آنالیز میکنم که نهایتاً از یک صفحه گسترده که توسط XG-Gammon تهیه شده و یک ردیف برای هر مسابقه که من اجرا کرده ام و ۵۴ ستون از داده های مربوط به مسابقه دارد استفاده میکنم.

برای بیرون کشیدن این داده ها از XG-Gammon باید:

  • بازیکن ها را انتخاب کرده
  • نتایج پروفایل را مشاهده نموده
  • از منوی نتایج گزینه کپی را انتخاب کرده
  • لیست جلسات
  • بازکردن اکسل یا نرم افزاری مشابه آن و ارسال موارد کپی شده در آن
  • ذخیره آن بعنوان فایل CSV و بستن اکسل و استخراج داده به محیط آنالیزی واقعی مثل R.

البته من کمی مغرور هستم. چراکه هر بازیکن تخته نردی که این مطلب را میخواند و نمیخواهد از نرم افزاری مثل R استفاده کند میتواند کارهای زیادی با اکسل انجام داده و من نیز شما را به این کار تشویق میکنم.

من پروفایل آنلاین خود را که در آن با بازیکنان واقعی مسابقه داده ام از تمرین های خود در برابر XG-Gammon در حالت آموزشی جدا کرده و نگه داری میکنم پس هر وقت مراحل فوق الذکر را انجام میدهم، رکورد اصلی کیفیت بازی خودم را بدست می آورم. در این پست من حدود ۶۵۰ مسابقه را که تعداد بازی هایی است که از ابتدا با XG-Gammon انجام داده ام آنالیز میکنم.

 

اشتباهات فاحش و جوکرها

بسیار خوب، بهتر است نگاهی به داده ها بندازیم. یکی از ستون ها تعداد اشتباهات فاحشی که من در هر مسابقه انجام داده ام است و در شکل زیر تاریخچه ی مسابقاتی که من تعدادی اشتباه فاحش داشته ام آورده شده است.

تمام کدهایی که شکل فوق بر مبنای آن رسم شده در آخر آورده شده است.

رایج ترین تعداد اشتباهات من در یک مسابقه، ۴ و سپس ۲ و ۵ است. در یک کابوس من بیش از چهل اشتباه -که یک دستاورد است!- داشته ام.

مورد دیگری که حائز اهمیت است تعداد جوکرهاست (تاس هایی که جریان بازی را عوض میکند MGJoft6.com). تصور کنید که جفت شش آورده و این تنها شانس شما بوده است:

بنظر می آید که من ۴ یا ۵ شانس در هر مسابقه بدست آورده ام.

مسابقات تخته نرد شامل تعداد حرکات مختلف بوده که هرچه این تعداد بیشتر شود قاعدتاً فرصت اشتباهات و جوکرها نیز بیشتر خواهد شد. جدای اینکه این دیتاست شامل مسابقات از اول تا ۱۱ الی اول تا ۱ است، گاهی اوقات شرایط خیلی سریع پیش میرود و گاهی عقب و جلو رفتن تا ابد میتواند ادامه داشته باشد. مهمتر از تعداد اشتباهات و جوکرها، تعداد این اتفاقات در هر حرکت است. با نگاه به نسبت اشتباهات و جوکرها به هر حرکت، من از این نکته خوشنود هستم که بطور متوسط شانس جوکرهای من بیشتر از اشتباهاتم است.

 

ریتینگ ELO – الو [۷]

چیزی که بعضی وقت ها مردم از آن تعجب میکنند رابطه بین اتلاف احتمال پیروزی با هر تصمیم و ریتینگ الو است. هیچ رابطه ثابت اساسی نمیتواند وجود داشته باشد. ریتینگ الو بطور اساسی یک وضعیت نسبیتی از میزان خوب بودن شما (یا میزان عملکرد خوب شما) در مقایسه با افرادی که شما با آنها مسابقه داده اید است. اتلاف احتمال پیروزی در هر تصمیم، یک مقایسه مطلق از تصمیم شما است که به رباتی که به شبکه عصبی مجهز شده، میباشد.

یک رقابت تخته نرد را درنظر بگیرید با قوانین مشابه با FIBS که تنها از بات ها تشکیل شده است. در شرایط جاری FIBS این بات ها دارای ریتینگی در حدود ۲۱۰۰ در قیاس با امتیاز آغازین که بازیکنان جدید ریتینگ ۱۵۰۰ دارند، هستند. اما در جهان نوین ما، پس از آنکه FIBS را برای بات های حرفه­ای مجدداً راه اندازی میکنیم، این بات ها تنها میتوانند با هم بازی بکنند و ریتینگ های الوی آنها همگی حول امتیاز اولیه آنها یعنی ۱۵۰۰ خواهد بود. نه دقیقاً ۱۵۰۰ اما حدودی از آن خواهد بود که این یک خطایی ساخته شده از شانس رندم (اتفاقی) است. پس ریتینگ های ۲۱۰۰ که در جهان کنونی ما وجود دارد بطور دلبخواه به خطاهای افرادی که در بازی انجام میدهند ربط دارد.

پایداری مطلوبی در استانداردهای بازیکن وجود دارد که ما میتوانیم بفهمیم یک بازیکن چقدر با ریتینگ FIBS معادل ۱۸۰۰ توانایی دارد و XG-Gammon نیز در بعضی مواقع بعنوان قانونی سرانگشتی (مدل آماریMGJoft6.com) که از احتمال پیروزی در هر تصمیم برابر ریتینگ الویی که شما بطور مثال از بازیکنی انتظار دارید که بطور مداوم در آن سطح تا سطح نهایی بازی کرده و تشکیل شده است. از داده هایی که از XG-Gammon گرفته ایم امکان مهندسی معکوس نیز وجود دارد. داده هایی که از پروفایل بازیکنمان گرفته ایم شامل ستونی برای احتمال پیروزی در هر تصمیم و ستونی هم برای سطح الو است. اولین پله، تخمین میزان متوسط احتمال پیروزی که من شانس آن را داشته ام و هدر داده ام بوده و دومین آن تخمین سطح الوی من که باید در هر مسابقه به تصمیم گیری من نسبت داده شود است. رابطه آن بصورت زیر میباشد:

غیر از نشان دادن اتلاف اکویتی در هر تصمیم، من آن را با XG “Player Rating” که رایج ترین نوع ارزشیابی از کیفیت واقعی تصمیمات بازیکن است (بر خلاف ریتینگ الو که به شانس و رقابت بستگی دارد) تفسیر کرده ام. هرچه میزان PR کمتر باشد بهتر است. بازیکنان کلاس جهانی نیز همواره PR کمتر از پنج را دارند.

پس میتوانیم ببینیم که اگر همواره با PR زیر ده بازی کنید (که این عدد شما را بعنوان یک فرد پیشرفته در اکثر کتاب ها به حساب می آورد) باید در انتظار ریتینگ الویی کمی بیش از ۱۷۰۰ باشید. این میزان از نظر من کمی پایین تر از چیزی است که نسبت به استانداردهای FIBS می پندارم (میانگین من نزدیک به ۱۱ بوده و ریتینگ الوی من در FIBS 1800 است جاییکه XG فکر میکند که من باید تنها ۱۶۶۳ امتیاز داشته باشم) اما این مطلب در هر جامعه ای بزرگتر شامل بازیکنان، متفاوت بوده و بدون داده ای بیشتر نمیتوان موارد را تحلیل کرد. احتمالاً ایده XGی ریتینگ الو به جامعه grid.gammon مرتبط بوده که بنظر من از استانداردهای بالاتری نسبت به FIBS برخوردار است.MGJoft6.com

نکته: من در راهنمای XG نتوانستم تعریف PR را پیدا کنم اما طبق پست موثق فروم، ریتینگ XG بازیکن تنها خطای اکویتی در هر تصمیم بوده که در ۵۰۰ ضرب شده است. پس اگر بطور متوسط ۱ درصد از اکویتی خود را در هر تصمیم هدر دهید، با ریتینگ PR حدود ۵ روبرو خواهید شد که عالی بوده و شما را بعنوان فردی ماهر در نظر میگیرد. طبق تعریف، PR برای XG صفر میباشد.

 

مهارت در برابر شانس

 

ستون دیگر مورد بحث از این داده ها که از XG حاصل شده، ستون هزینه شانس است. این ستون شامل تخمین XG از میزان کلی بهایی که برای تاس انداختن از شما گرفته شده است، میباشد. این خیلی خوب است اگر شما ماهر باشید تا نرخ خطای خود را تنها به ۰٫۰۱ اکویتی در هر نوبت حفظ کنید اما در مورد جوکر یا ضد جوکرهایی که این میزان را در یک بار تاس اندازی به ۰٫۳ یا بیشتر زیاد کرده چی؟ آنچه واضح است این است که ستون هزینه شانس را با اکویتی در هر نوبت یا داده PR مقایسه کرده و هر امتیاز موجود در نمودار پراکندگی نتیجه را بسته به برد یا باخت رنگ آمیزی کنیم.

تعداد کمی از مثلث های قرمز نشاندهنده بردهای من وقتی که تاس علیه من بوده (شانس<0) بدون در نظر گرفتن اینکه خوب بازی کرده ام یا بد میباشد و تنها یک مثلث آبی (نشانه باخت) وقتی که شانس خوبی داشتم رخ داده است. بله شانس به تنهایی آن چیزی است که تو برای جداکردن مسابقات به وقت هایی که شانس داشتی و وقت هایی که نداشتی نیاز داری. این یک بازی بی رحم است و هم یک بازی سحرآمیز. این شانس نشاندهنده این است که تو باید قبل از اینکه سطح مهارتت شروع به تعیین نرخ پیروزی تو بکند، به میزان زیادی بازی کرده باشی و در پایان بازی ندانی (بدون آگاهی از طریق بات) که اشتباه تو بوده یا نه…

در تخته نرد میتوان به جای نگاه کردن ریتینگ مهارت خودم، نرخ خطاهای خودم را با حریفانم مقایسه کنم. تصویر زیر نمایانگر این مطلب است:

در واقع با مدلسازی آماری به برخی نتایج که مصداق تصویر فوق است پی بردیم:

  • پیشبینی نتیجه یک مسابقه تنها با فاکتور شانس بعنوان متغیری توضیحی، ۹۷٫۹ درصد مواقع صحیح است.
  • پیشبینی نتیجه تنها با خطای خالص بعنوان متغیری توضیحی، ۶۵ درصد مواقع صحیح است (به یاد داشته باشید با حدس دلخواه حدود ۵۰ درصد نشان داده میشود).
  • پیشبینی نتیجه هم با شانس و هم با نرخ خطا بعنوان متغیرهای توضیحی، ۹۹٫۷ درصد مواقع صحیح است.

نتیجه گیری

 

مهارت در تخته نرد اهمیت دارد اما وقتی با افرادی که از نظر مهارت همسطح شما هستند بازی میکنید بیشتر و بیشتر شبیه شیر یا خط میشود. خوب بازی کردن در یک مسابقه میتواند بمرور باعث بد شانسی شود اما غالباً این اتفاق نمی افتد. شما باید بازی های زیادی را برای کسب مهارت انجام دهید تا این فاکتور اهمیت پیدا کند.

 

[۱] Coin flip

[۲] master

[۳] beginner

[۴] Neural networks

[۵] equity

[۶] blunder

[۷] Elo rating

 

ترجمه : توسط MGJoft6.com

منبع : Skill v luck in determining backgammon winners – لینک مقاله 

پاسخی بگذارید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *