KNToosi.in - همکلاســــی

وبلاگ گروهی دانشجویان ِ دانشگاه صنعتی خواجه نصیرالدین طوسی

KNToosi.in - همکلاســــی

وبلاگ گروهی دانشجویان ِ دانشگاه صنعتی خواجه نصیرالدین طوسی

گــیــرنــده : میر(!)حسین(!) موسوی(!) ؟ ؟ ؟

۰۱ تیر ۱۳۸۸

چرا بدون ارایه دلیل منطقی و مستند درباره "تقلب گسترده"، یک هفته این بندگان خدا را فقط با توسل به احساسات به خیابان‌ها کشیده‌اید. آیا بهتر نبود برای اعتراض به نتیجه انتخابات، اول از . . .
اینجانب فعلا در حال کسب تجربه در حوزه سلامت روان هستم . . .
شما را به عقلانیت و منطق دعوت میکنم

سایت الف- علی نقیه دبیر سابق انجمن های اسلامی دانشجویان انگلستان

+
یک بحث آماری درباره فراگیری موج شکست خورده سبز
از سوی دانشجویان دانشگاه شریف


برای بزرگ شدن عکس روی آن کلیک کنید




یک بحث آماری درباره فراگیری موج سبز




    جمعی از دانشجویان دانشگاه شریف*   
۳۰ خرداد ۱۳۸۸
این نوشته برای دفاع یا رد مواضع سیاسی هیچ گروهی نیست. این نوشته به اتفاقات رخ‌داده تا پیش از زمان انتخابات نمی‌پردازد. این نوشته در مورد عمل‌کرد صدا و سیما و ارگان‌های دولتی دیگر نیست. این نوشته ارتباطی با عمل‌کرد شورای نگه‌بان و قوة قضاییه ندارد. موضوع این نوشته نقد و بررسی یک استدلال حسی است که به نظر می‌رسد این روزها در بین افراد جامعه از عامی گرفته تا تحصیل‌کرده مورد استفاده قرار می‌گیرد.

مهندس موسوی در اواخر روز رأی‌گیری در کنفرانس خبری با حضور خبرنگاران داخلی و خارجی با بیان این‌که دولت قدر حضور گسترده مردم در انتخابات را ندانسته است اظهار داشت: «با توجه به اطلاعات بنده در سطح کشور برندة قطعی این انتخابات بنده هستم.» ایشان در همان شب بیانیة زیر را نیز صادر کردند:

«ضمن تشکر از حضور پر شور و استقبال گسترده شما از انتخابات ریاست جمهوری، به اطلاع می‌رساند طبق گزارش‌ها و مستندات واصله علی‌رغم تخلفات و کارشکنی‌های متعدد و نارسایی‌های گسترده، مستندات واصله حاکی از آن است که رأی اکثریت قاطع مردم متوجه این خدمت‌گزارشان بوده است. از مسؤولان امر می‌خواهم در شمارش آراء نهایت دقت را بنمایند و اعلام می‌کنم در غیر این صورت از همة امکانات قانونی برای احقاق حقوق حقة ملت ایران اقدام خواهم کرد. همین‌جا فرصت را مغتنم می‌شمارم و از ملت شریف ایران می‌خواهم آمادة برگزاری جشن پیروزی در شام‌گاه میلاد بانوی دو عالم حضرت فاطمه زهرا (س) باشند.»

روز بعد پس از اعلام نتایج توسط وزارت کشور مهندس موسوی در اولین بیانیة خود ادعا کردند که در انتخابات تقلب شده است. طبیعی است که ایشان در این بیانیه به مهم‌ترین دلایل خود برای اثبات این ادعا اشاره کرده باشند. تنها عبارتی که حاکی از دلیل وجود تقلب است این است:

«مردمی که در صف‌های طولانی اخذ رأی شاهد ترکیب آرا بودند و خود می‌دانند که به چه کسی رأی داده‌اند، با حیرت تمام به شعبده‌بازی دست‌اندرکاران انتخابات و صدا و سیما نگاه می‌کنند.»

البته ایشان و یا افراد دیگر ممکن است شواهد دیگری نیز برای اثبات تقلب داشته باشند که در این نوشته به آن‌ها پرداخته نمی‌شود. مطالبی نظیر اتهام وارد کردن به شخصیت‌های حقیقی، بیان مطالب خلاف امنیت ملی، کارشکنی برخی مسئولان، کم‌بود تعرفه، استفاده از اموال دولتی، دروغ‌گویی و... که در نوشته‌های بعدی مهندس موسوی به آن‌ها اعتراض شده است ارتباطی با بحث ما ندارند.

سبزها چه چیزهایی را مشاهده کرده اند؟

به‌طور خلاصه مردم در این روزها شاهد افرادی بودند که با لباس یا پارچة سبز طرف‌داری خود را از مهندس موسوی نشان می‌دادند. خودروهایی را دیدند که مزین به روبان سبز و تبلیغات بودند. در گفت‌وگوها و تماس‌های تلفنی رأی دیگران را جویا می‌شدند و در نهایت در هنگام رأی دادن نظر اطرافیان خود را می‌پرسیدند یا می‌شنیدند. آیا استفاده از چنین مشاهداتی برای اثبات بالا بودن رأی یک نامزد درست است؟ در ادامه به بررسی مورد به مورد این مشاهدات می‌پردازیم.

همه اطرافیان من مانند من سبزند!

این مشاهده که می‌توان آن را «مشاهدة منطقه‌ای» نامید یکی از اشتباهات معروف در آمارگیری است. واقعیت این است که در بسیاری از مسایل از جمله عقاید دینی و آرای سیاسی بین افراد «نزدیک به هم» شباهت آماری قابل توجه وجود دارد. در مورد موضوع مورد بحث کم و بیش بر همه‌گان روشن است که وضعیت فرهنگی، اقتصادی و اجتماعی یک نفر ارتباطی جدی با نظر سیاسی او دارد؛ فردی که در شمال تهران، مثلاً در قیطریه، زندگی می‌کند به احتمال زیاد از نظر رأی سیاسی به یک هم‌محله‌ای خود شبیه‌تر است تا به کسی که در جنوب تهران، مثلاً در میدان خراسان، زندگی می‌کند. دو نفر که با هم دوست هستند به احتمال زیاد در عقاید سیاسی نیز به هم شبیه‌تر هستند تا دو نفر که با هم ارتباطی ندارند. مثال روبه‌رو نشان می‌دهد که مشاهدة منطقه‌ای تا چه حد گم‌راه کننده است. شکل زیر جامعه‌ای صد و ده نفره را نشان می‌دهد که دقیقاً نیمی از آن‌ها سبز هستند.


اکنون فرض کنید هر فرد سبز بگوید که از بین خود و اطرافیانش (که معمولاً روی هم 9 نفرند) چند درصد سبز هستند و میانگین اعداد را به عنوان درصد سبزها محاسبه کنیم:
 
 

پس 72 درصد افراد سبز هستند و این یعنی خطایی 22 درصدی! البته افراد در جامعه آمارگیری نمی‌کنند ولی این محاسبه به‌طور ناخودآگاه انجام و به یک استدلال حسی تبدیل می‌شود.

ما با لباس ها و روبان های سبز، وجود خودمان را ثابت کردیم!

باید به این نکته توجه کرد که در این مورد علاوه بر ایراد مشاهدة منطقه‌ای، که در بالا ذکر شد، ایراد دیگری هم وجود دارد و آن پیش‌گامی سبزها و سازماندهی شدن آن‌ها است؛ سبزها به دلیل دستور گرفتن از لیدرهای خود در استفاده از این نماد بسیار مصرتر بودند در حالی که کسی که هفته‌ها سبز پوشیده و کسی که بدون هیچ تظاهری به دکتر احمدی‌نژاد رأی داده هر دو فقط یک رأی دارند. البته خیلی‌ها هم که سبز بودند هنوز به سن قانونی برای رأی دادن نرسیده بودند!

هر خودرو یک ستاد: من خودم دیدم که اکثر خودروها مثل من روبان سبز داشتند!

اولاً این هم باز یک مشاهدة منطقه‌ای است؛ آیا شهروندان شمال تهران بیش‌تر در شمال تهران تردد می‌کنند یا در محله‌های جنوبی؟ جواب روشن است. ثانیاً پیش‌گامی سبزها این مشاهده را هم به نفع افزایش ظاهری درصد سبزها مخدوش می‌کند. ثالثاً آیا به این فکر کرده‌اید که هر شهروند با توجه به وضعیت مالی خود به طور متوسط چند خودرو دارد؟ در خانواده‌های ثروت‌مند، غیر از کودکان، هر فرد یک خودروی شخصی دارد و برعکس یک خانوادة فقیر، با وجود جمعیت بیش‌تر، حداکثر یک خودرو دارد. با توجه به این که به طور آماری گرایش خانواده‌های ثروت‌مند به مهندس موسوی بیش‌تر از گرایش خانواده‌های فقیر به ایشان است مشاهدة ماشین‌ها ما را گم‌راه می‌کند. فرض کنید در جامعه 50 درصد سبز باشند. اگر به طور میانگین هر دو نفر سبز یک خودرو و هر چهار نفر غیرسبز یک خودرو داشته باشند چه چیزی در سطح خیابان خواهیم دید؟ هر 100 نفر سبز 50 خودرو و هر 100 نفر غیرسبز 25 خودرو دارند و در نتیجه 66 درصد خودروها سبز هستند. این یعنی خطایی 16 درصدی به نفع سبزها!

نکتة دیگر ساعاتی است که یک خودرو در خیابان حرکت می‌کند. بسیاری از خودروهای سبز برای این‌که تبلیغات کنند علاوه بر ساعاتی که به‌طور طبیعی در خیابان هستند ساعاتی را هم اضافه کاری می‌کردند! اگر فرض کنیم یک ماشین سبز تبلیغی به‌طور میانگین دو برابر حالت عادی خیابان‌گردی کند خطا شدید‌تر خواهد شد: 100 خودروی سبز در مقابل 25 خودروی غیرسبز و این یعنی سبزها در خیابان به نظر 80 درصد می‌رسند. یعنی 30 درصد خطا!

هر کس به پنج نفر تلفن بزند: من به خیلی ها زنگ زدم، همه مثل من سبز بودند

این عمل‌کرد تبلیغاتی که با ایده گرفتن از شرکت‌‌های هرمی طراحی شده بود از دو جهت موجب تصور نادرست از درصد طرف‌داران مهندس موسوی شد. اولاً تبلیغ‌کننده‌ها به دوستان خود زنگ می‌زنند و این بسیار طبیعی است که رأی دو دوست شبیه هم باشد. ثانیاً کسانی که با تلفن توجیه می‌شدند بارها و بارها به آن‌ها تلفن می‌شد و به آن‌ها این‌طور القاء می‌شد که اکثریت جامعه طرف‌دار مهندس موسوی هستند.

اعتراض و فشار روانی به اقلیت موضعی: ما که ندیدیم کسی بخواهد به احمدی نژاد رأی بدهد

طرف‌داران مهندس موسوی معترضان به وضع موجود هستند و طرف‌دارن دکتر احمدی‌نژاد مدافع نسبی ادامة وضع موجود. از نظر جامعه‌شناسان و کسانی که تجربه‌های اجتماعی دارند روشن است که بیان نارضایتی یک فرد معترض چندین برابر بیان رضایت یک فرد راضی است. به عنوان مثال کسی که در اداره‌ای با برخوردی ناشایست مواجه شده است به احتمال زیاد این موضوع را به دیگران منعکس می‌کند ولی کسی که کارش به‌طور عادی انجام شده است عموماً در این مورد با کسی صحبت نمی‌کند. همین وضعیت باعث شد که طرف‌دارن مهندس موسوی در استفاده از نمادهای رنگی و تبلیغات کلامی چندین برابر طرف‌دارن دکتر احمدی‌نژاد ابراز وجود کنند.
از طرف دیگر در بین گروه‌هایی که اکثریت طرف‌دار یک نامزد خاص هستند فشار روانی موجب می‌شود فرد مخالف از بیان عقیدة خود صرف‌نظر کند.


پرسیدن نظرات افراد در حوزه اخذ رأی: من با هر کسی در صف صحبت کردم مثل من فکر می کرد

واضح است که افراد معمولاً در حوزه‌ای که به محل زندگی‌شان نزدیک است رأی می‌دهند. اگر شهروند ساکن نیاوران سری به حوزه‌ای در میدان شوش بزند خواهد دید که اکثر رأی‌دهندگان خلاف او فکر می‌کنند. مثال سادة روبه‌رو نشان می‌دهد که مشاهدات سبزها در حوزه‌ها تا چه حد موجب تصور اشتباه و اغراق‌آمیز از درصد طرف‌دارن مهندس موسوی شده است. هر کدام از یازده ستون زیر یک حوزة اخذ رأی است. در حوزة سمت راست هر 10 نفر سبز هستند، در حوزة بعدی 9 نفر سبز هستند و به همین ترتیب در آخرین حوزه کسی سبز نیست. پس در کل 50 درصد سبز هستند.
 

اکنون فرض کنید مبنای ما برای محاسبة درصد سبزها گزارش دقیق سبزها باشد. در حوزة اول 10 نفر گزارش می‌دهند 100 درصد، در حوزة دوم 9 نفر گزارش می‌دهند 90 درصد و الی آخر. نتیجه با محاسبة ساده زیر به دست می‌آید.
 
جواب ۲۰ درصد بیش تر از مقدار واقعی است. آیا مهندس موسوی و مشاورانش از این موضوع غافل بوده اند؟!

به هر حل وزارت کشور هم معترف است که در تهران اکثریت با ما سبزهاست!

بله، این درست است البته نه یک اکثریت نزدیک به مطلق بلکه اکثریتی نزدیک به 52 درصد و به دکتر احمدی‌نژاد هم حدود 43 درصد از مردم شهر تهران رأی داده‌اند. جدا از این حتی اگر فرض کنیم تمام مردم تهران طرف‌دار مهندس موسوی باشند، این انتخابات ریاست‌جمهوری بود نه انتخابات شهرداری تهران! طرف‌داران مردم‌سالاری می‌بایست رأی اکثریت مردم ایران را بر رأی شخصی خود و یا رأی هم‌شهریان خود مقدم بدارند.

یعنی واقعاً انتخابات هیچ ایرادی نداشته است؟!

بعید است که انتخابات بدون هیچ اشکالی برگزار شده باشد و واضح است که مطالب بیان‌شده ثابت نمی‌کند که روند انتخابات سالم بوده است. ولی آیا نباید در فضایی آرام و منطقی دلایل و شواهد موجود را بررسی کنیم؟ آیا به‌تر نیست قبل از انتشار یک خبر یا مطلب ظاهراً علمی از درستی آن اطمینان حاصل کنیم؟ در چنین شرایطی وظیفة اهالی دانش‌گاه بسیار سنگین‌تر است. چشم و نگاه اکثر مردم به جامعة دانش‌گاهی است.

*ارسال شده توسط ا. محمودی، دانشجوی رشته ی ریاضی و علوم کامپیوتر، دانشگاه صنعتی شریف

فایل PDF برای دانلود
فایل DOC برای دانلود














سیدمهدی سیدنصرالله*   
۰۱ تیر ۱۳۸۸
  سازگاری نتایج انتخابات با آزمون‌های بنفورد؛
تحلیل علمی انتخابات ریاست جمهوری 1388

 
مقدمه: با توجه با داغ بودن موضوع صحت انتخابات در روزهای اخیر، مقاله ای با عنوان "مستندات علمی دستکاری در آراء انتخابات دهمین دوره انتخابات" در پایگاههای متعدد اینترنتی مرا بر آن داشت تا محاسبات ادعایی در آن مقاله را بررسی کنم که نتیجه این امر چیزی جز رد آن مقاله و اطمینان از نتایج انتخابات نبود. در مقاله ادعایی هیچ نموداری رسم نشده بود تا اصل ماجرا مشخص گردد و البته قسمتهای اصلی مقاله یعنی محاسبه میزان خطا و انحراف، کاملا اشتباه بود و تعمداً از مقادیر نرمال نشده استفاده شده بود و نتیجه دیگری را به خواننده القا می‌کرد. اما در مقاله پیش رو سه آزمون متعارف آماری برای بررسی علمی نتایج انجام شده است تا به طور کامل صحت داده ها تحلیل گردد. امید است تا خوانندگان گرامی، نگارنده را از نظرات خود بهره‌مند سازند.
 
×××

طی چند روز گذشته بحثهای فراوانی در خصوص امکان و احتمال تقلب در انتخابات ایران بعمل آمده است. با توجه به اینکه بازشماری آراء کاری پرزحمت برای دستگاه اجرایی و نظارتی انتخابات خواهد بود باید، کاندیداهای معترض شواهد و مستندات قابل قبولی را به این مراجعه اعلام نمایند تا دستکاری در نتایج انتخابات را آشکارا نشان دهد. راههای علمی زیادی وجود دارد که با استفاده از آمارهای اعلام شده توسط وزارت کشور این دستکاری ها در صورت وجود به نمایش گذاشته شود و یا صحت انتخابات از لحاظ شاخصهای علمی آمار بررسی شود.

صحبت از تقلب در انتخابات تنها یک موضوع مختص به ایران و حتی کشورهای در حال توسعه نظیر ونزوئلا، مکزیک، و زیمباوه نیست و در سال 2000 شاهد بودیم که بحث تقلب در انتخابات ریاست جمهوری در ایالت فلوریدا به موضوع داغ آنروزها بدل شده بود. به هر حال آنچه مسلم است آنکه اهمیت سیاست و موضوع تقلب در انتخابات سبب شده که دانشمندان علم آمار با استفاده از کمترین داده های موجود از انتخابات روشهای آماری را طراحی کنند که با کمک آن بتوان با صراحت در مورد سلامت انتخابات اظهار نظر نمایند. یکی از معمول ترین این روشها روشی است که از قانون بن فورد (Benford’s Law) پیروی می‌کند. بطور خیلی مختصر و قابل درک برای خوانندگان این قانون به آن اشاره دارد که رقمهای مربوط به یک عدد (خواه یک رقمی یا بیش از یک رقمی) حاصل از شمارش یک پدیده در جهان خارج (جهان واقعی) از توزیع نرمال (Normal distribution) یا توزیع یک فرم (Uniform distribution) پیروی نمی‌کند بلکه از توزیعی شبیه توزیع Chi Square پیروی می‌کند. آقای بن‌فورد احتمال این اعداد را برای حوادثی چون انتخابات محاسبه کرده است. قابل ذکر است که اعداد ذکر شده در قانون بن‌فورد همانند قوانین نیوتن یک واقعیت علمی است و در حال حاضر علاوه بر مسئله انتخابات، برای رسیدگی به احتمال تقلب در سود سهام شرکتها و مسائل مالیاتی نیز از همین روش استفاده می‌شود.

اجازه بدهید چند خط از این مقاله را به توضیح ساده این قانون بپردازیم. در این قانون احتمال اینکه آخرین عدد سمت چپ یک عدد (فرض کنید تعداد آراء اخذ شده به نفع یک کاندیدا) که می‌تواند یکی از اعداد 1 تا 9 باشد با هم برابر نیست. بلکه احتمال آنکه رقم سمت چپ یک عدد، 1 باشد حدود 30% است در حالی که این احتمال برای عدد 9 در حدود 4.5%. همچنین است احتمال وجود عدد 0 تا 9 برای دومین رقم سمت چپ تعداد آراء اخذ شده به نفع یک کاندیدا که آن نیز از قانون دیگری پیروی می‌کند.
طبق این قانون احتمال ظهور اعداد در رقم اول از رابطه 1 تبعیت می‌کند:

(1)
 
     
شکل 1- توزیع ستونی احتمال توزیع اعداد در رقم اول، دوم و سوم طبق قانون بن فورد
   
جدول 1- توزیع اعداد در رقم اول طبق قانون بن فورد

برای توضیح بیشتر به توزیع رقمهای اول، دوم و سوم یک دسته تصادفی می‌پردازیم، برای نمونه یک دسته 20000تایی اعداد تصادفی که به پیوست خواهد آمد را در نظر می‌گیریم و توزیع اعداد 1 تا 9 را در ارقام اول تا سوم آن در جدول 2 بررسی می‌کنیم.
 
جدول 2 - توزیع یکنواخت اعداد در رقم اول،دوم و سوم در یک دسته تصادفی

همان گونه که در جدول 2 دیده می‌شود، توزیع اعداد در رقمهای اول، دوم و سوم یک دسته تصادفی کاملا یکنواخت بوده و این تفاوت، اصلی ترین تفاوت بین داده‌های به دست آمده از طبیعت و داده های دستکاری شده می باشد. چرا که همان گونه که ذکر شد، طبق قانون بن‌فورد برای داده‌های طبیعی این نسبتها یکسان نیستند و مطابق جدول 1 می‌باشند.

برای اینکه اهمیت قانون بن‌فورد بهتر دیده شود، جدول 3 که شامل مثالهایی از طبیعت و تطابق آن با قانون بن فورد است، نشان داده شده است.
 
جدول 3- توزیع اعداد در رقم اول در کمیتهای طبیعی و مقایسه با قانون بن‌فورد

همان گونه که در جدول 3 دیده می‌شود اعداد به دست آمده از طبیعت به طرز شگفت انگیزی در انواع کمیتها از توزیع پیش‌بینی شده بن‌فورد تبعیت می‌کند و البته جمعیت افراد و نتایج به دست آمده بر مبنای جمعیت نیز جزء این کمیت هاست.
 
آزمون رقم اول
جدول 4- تعداد تکرار اعداد  1،2،3...،9 در اولین رقم سمت چپ تعداد آرای هر نامزد در 366 شهرستان

نمودار 1 گویای نتایج جدول 4 است که مقایسه این اعداد با حالت ایده آل که در واقع معیار بن‌فورد می‌باشد، نشان دهنده تطابق این اعداد با مدل بن‌فورد است.
 
 
نمودار 1- مقایسه توزیع رقم اول نتایج آرای نامزدها با توزیع پیش بینی شده بن فورد

اگر بخواهیم این اعداد را به صورت درصد نسبی نشان دهیم جدول 5 ارائه دهنده این اعداد است.
 
جدول 5- نسبت تکرار اعداد 1،2،3...،9 در اولین رقم سمت چپ تعداد آرای هر نامزد در 366 شهرستان

اگر بخواهیم میزان این اختلاف را به صورت علمی حساب کنیم، باید از روشهای معتبر محاسبه خطا مانند Chi-Squared استفاده کنیم، بر مبنای این رابطه داریم :
(2)     


در این رابطه m نشان دهنده میزان واقعی کمیت و p احتمال وقوع آن است که با ضرب تعداد کمیتها(N) در آن به تعداد پیش‌بینی شده در توزیع ایده آل می‌رسیم. جدول 6 بر مبنای این محاسبات تنظیم شده است:
جدول 6- محاسبه میزان خطای Chi-Squared برای رقم اول داده‌ها

همان گونه که دیده می‌شود، بیشترین خطای نسبی 0.07 می باشد، که با توجه به تعداد نه چندان زیاد داده‌ها (366 شهرستان) نتیجه بسیار خوبی برای اعتبار نتایج است.

آزمون رقم دوم

برای بررسی دقیق تر صحت اعداد اعلام شده، گاهی اوقات رقم دوم اعداد را نیز بررسی می‌کنند و برای صحت نتایج آن را با پیش‌بینی بنفورد می‌سنجند. اگر آمار ارائه شده وزارت کشور را برای نتایج آرای نامزدها در شهرستانها بررسی کنیم برای توزیع اعداد در رقم دوم، نتایج زیر به دست می‌آید.
 
 
جدول 7- تعداد تکرار اعداد 0،1،2،3،...،9در دومین رقم سمت چپ تعداد آرای هر نامزد در 366 شهرستان

همان گونه که در جدول 7 و نمودار 2 نشان داده شده است نتایج آرای تمامی نامزدها با مدل پیش‌بینی بن‌فورد تطابق بسیار خوبی دارد.
 
 
نمودار 2- مقایسه توزیع رقم دوم نتایج آرای نامزدها با توزیع پیش بینی شده بن فورد

اگر نتایج جدول 7 را به صورت نسبی نشان دهیم به جدول 8 می‌رسیم.
جدول 8 - نسبت تکرار اعداد0،1،2،3،...،9 در دومین رقم سمت چپ تعداد آرای هر نامزد در 366 شهرستان

برای محاسبه خطا، این بار نیز با استفاده از محاسبه Chi-Squared به تحلیل نتایج می‌پردازیم، که جدول 9 به همین منظور تهیه شده است.
 
جدول 9 - محاسبه میزان خطای Chi-Squared برای رقم دوم داده‌ها

همانگونه که دیده می‌شود، بیشترین خطای نسبی برای این آزمون 04/0 می باشد، که این میزان نیز با توجه به تعداد نه چندان زیاد داده‌ها (366 شهرستان) نتیجه بسیار خوبی برای اعتبار نتایج است.

آزمون رقم سوم

اگر بخواهیم حد  اطمینان را افزایش دهیم، می‌توان تمامی این محاسبات را برای رقم سوم نیز تکرار کرد، البته برای این منظور باید از معیار رقم سوم بن‌فورد استفاده کرد. با ادامه محاسبات برای بررسی نهایی، جداول و نمودارهای ذیل خواهند آمد. شایان ذکر است در این آزمون از اطلاعات مربوط به یکی از نامزدها به علت اینکه بسیاری از آرا ایشان در شهرستانها دو رقمی و فاقد رقم سوم بود، حذف گردیده است.
جدول 10 - تعداد تکرار اعداد 0،1،2،3...،9 در سومین رقم سمت چپ تعداد آرای هر نامزد در 366 شهرستان
نمودار 3 گویای نتایج آزمون رقم سوم است:
نمودار 3- مقایسه توزیع رقم سوم نتایج آرای نامزدها با توزیع پیش بینی شده بن فورد

بر همین اساس جدول 11 نسبت تکرار اعداد 0،1،2،3...،9 در سومین رقم سمت چپ تعداد آرای هر نامزد را نشان می دهد.

جدول 11- نسبت تکرار اعداد 0،1،2،3...،9 در سومین رقم سمت چپ تعداد آرای هر نامزد در 366 شهرستان
جدول 12 - محاسبه میزان خطای Chi-Squared برای رقم سوم داده‌ها

همانگونه که دیده می‌شود، بیشترین خطای نسبی برای این آزمون 0.03 می باشد، که این میزان نیز با توجه به تعداد نه چندان زیاد داده‌ها (366 شهرستان) نتیجه بسیار خوبی برای اعتبار نتایج است.

نتیجه گیری نهایی

همان گونه که بیان شد، امروزه برای اعتبار سنجی علمی نتایج انتخاباتها در سراسر دنیا روشهای خوبی وجود دارد، که یکی از اصلی ترین این روشها روش توزیع Benford بر مبنای تعداد ظاهر شدن اعداد 1 تا 9 در رقمهای اول تا سوم نتایج تفکیکی است. در این مقاله سه روش قدرتمند بر داده های استخراج شده مربوط به آرای تفکیکی شهرستانها از پایگاه اینترنتی وزارت کشور www.moi.ir اعمال گردید که همگی حاکی از صحت علمی نتایج انتخابات است و بنابراین فرض دستکاری گسترده در آرا و عددسازی مردود است.


منابع و مراجع

1.    پایگاه اینترنتی وزارت کشور www.moi.ir
2.    “Detecting Problems in Survey Data using Benford’s Law”, George Judge, University of California at Berkeley, Laura Schechter, University of Wisconsin at Madison, November 1, 2007
3.    “The Effective Use of Benford’s Law to Assist in Detecting Fraud in Accounting Data”, Cindy Durtschi,William Hillison, Carl Pacini, Journal of Forensic Accounting, Vol. V 2004, pp 17-34
4.    “Election Forensics: Vote Counts and Benford's Law”, Walter R. Mebane, Jr., July 17, 2006
5.    http://mathworld.wolfram.com/Chi-SquaredTest.html
6.    http://mathworld.wolfram.com/BenfordsLaw.html
7.    http://en.wikipedia.org/wiki/Benford's_law
8.    http://en.wikipedia.org/wiki/Chi-square_distribution
9.    http://en.wikipedia.org/wiki/P-value

*پژوهشگر – کارشناس ارشد دانشگاه شریف

  دانلود فایل PDF





سایت الف آماده نظرات شما !