دانش‌ها ریاضیات

ده راه برای استفاده‌ی موثر از آمار

محققان همیشه تحت فشار هستند تا حاصل تحلیل حجم بالای داده های یافته های خود را دقیق گزارش نمایند و به همین دلیل به دنبال شیوه های اماری منطقی هستند.

به همین خاطر گروهی از متخصصان آمار از جمله رابرت کَس از دانشگاه کارنگی ملون مقاله ای تحت عنوان «ده قانون ساده برای استفاده موثر از آمار» نوشتند. این قوانین به صورتی طراحی شده اند که به جامعه محققان- به خصوص محققانی که در آمار تخصص ندارند یا فاقد متخصص آمار در تیمشان هستند- کمک کند از استدلالهای آماری اشتباه اجتناب نمایند.

کَس استاد آمار و آموزش ماشینی می گوید «وظیفۀ اصلی و همیشگی ما به عنوان محقق آنست که کشف کنیم داده ها درمورد مشکلی که ما سعی در حل آن داریم چه چیزی می گویند. آمار زبانیست که برای کمک به این روند ساخته شده و احتمال دستور زبان آن است.»

در حالیکه مکالمات ابتدایی بدون تسلط بر زبان امکانپذیر می باشد، تحلیل اصولی آمار در بررسی بسیاری از پدیده های ظریف اهمیت دارد تا اطمینان حاصل شود هیچ امر مهمی در برگردان از قلم نیفتد و یافته های تحقیق با گذشت زمان همچنان معتبر باقی بماند.

این قوانین که از ۹ جون به صورت آنلاین قابل دسترس می باشد تا به حال ۳۷٫۰۰۰ بازدید کننده داشته که آنرا در فهرست ۲۰ مقاله پر بیننده این مجموعۀ ۶۰ مقاله ای قرار می دهد. مورد توجه قرار گرفتن این مقاله برای مایکل تار، رییس بخش روانشناسی دانشگاه کارنگی شگفت آور نیست.

۲۰۰۰px-Fisher_iris_versicolor_sepalwidth.svgوی می گوید «علوم مختلف به خصوص روانشناسی و عصب شناسی در سالهای اخیر به خاطر شیوه های آماری ضعیف مورد سوال قرار گرفته اند. دستورالعمل روشن و صریح مانند آنچه کَس و همکارانش در این مقاله بکار برده اند به دانشجویان و اعضای هیئت علمی اهمیت تحقیقی که از نظر آماری قوی باشد را خاطرنشان می کند. خواندن این مقاله برای هر کس که به علم قابل استناد اهمیت می دهد، ضروریست.»

خلاصۀ ۱۰ قانون:

  1. شیوه های آماری به نحوی استفاده شوند که داده ها به پرسشهای علمی پاسخ دهند

همکاری با متخصص آمار از ابتدای تحقیق بسیار مفید است چرا که افراد ناوارد به آمار معمولا بر انتخاب تکنیکی که برای تحیل داده ها تمرکز می کنند به جای آنکه تمام روشهایی که داده ممکن است به پرسش علمی پاسخ دهد توجه کنند.

  1. سیگنال همیشه با صدا همراه است. متغیر به شکلهای مختلف ظاهر می شود اما مهم آن است که بدانیم چه موقع مناسب و چه موقع هیاهواست تا عدم اطمینان را نشان دهیم. همچنین برای تشخیص منبع اشتباه سیستماتیک مفید است.
  2.  از قبل برنامه ریزی کنید . طرح سوال در مرحله طراحی می تواند از مشکلات مرحلۀ تحلیل بکاهد. جمع اوری دقیق داده ها نیز می تواند تحلیل را دقیق و آسان نماید.
  3. به کیفیت داده ها اهمیت دهید. در تحلیل داده ها «ورودی خراب، خروجی خراب تولید می کند». پیچدگی جمع اوری داده های امروزی به فرضیات بسیاری در زمینۀ عملکرد فن آوری نیاز دارد که معمولا شامل فن اوری پیش پردازش می شود که می تواند تاثیر شگرفی داشته باشد که معمولا نادیده گرفته می شود.
  4. تحلیل آماری بیشتر از مجموعه ای محاسباتی است. نرم افزارهای اماری وسیله ای برای کمک به تحلیل هستند نه تعریف تحلیلها. زمینۀ علمی اهمیت دارد و و کلید تحلیل آماری اصولی، استفاده از شیوه های آماری در ارتباط پرسش علمی است.
  5. سادگی. سادگی بر پیچیدی چیره است. اندازه گیری های بسیار، تعامل متغیرهای تبیینی بر هم، مکانیزمهای غیرخطی کنشها، دادۀ بدون متغیر، نمونه های اریب، اختلاط اریب و عوامل دیگر می توانند موجب افزایش پیچیدگی مدل شوند.

اما به خاطر داشته باشید طرح مناسب که به خوبی اجرا شود روشهای سادۀ تحلیلی با نتایج قوی تولید می کند.

  1. ارزیابی متغیرها را نشان دهید. هدف اصلی تحلیل آماری کمک به ارزیابی عدم قطعیت است که معمولا در فرم خطای استاندارد یا بازۀ اطمینان می باشد و یکی از موفقیتهای بزرگ استنباط و نمونۀ آماری توانایی آن در ارائۀ تخمین خطای استاندارد از همان آماریست که کمیت بهره را تخمین می زند. ارائۀ آمار عدم قطعیت در زمان گزارش نتایج امری ضروریست.
  2. فرضیات خود را بررسی نمایید. فراوانی نرم افزارهای آماری انجام تحلیل بدون توجه دقیق به فرضیات را آسان می کند که می تواند به نتایج نادرست و حتی گمراه کننده بینجامد.
  3. در صورت امکان تکرار کنید! در شرایط ایده آل محققی مستقل تکرار را انجام می دهد. نتایج علمی که در طول زمان معتبر باقی می مانند آنهایی هستند که در موقعیتهای متفاوت اما مرتبط تایید می شوند. در بسیاری زمینه ها از جمله آزمایشات گسترده کلینیکی چند مرکزی، تکرار کامل دشوار یا غیرممکن است. در چنین شرایطی استاندارد کمینه دنبال کردن قانون شماره ۱۰ خواهد بود.
  4. تحلیل خود را تکرارپذیر کنید. با استفاده از مجموعه داده ها و توضیح کامل تحلیل، تولید مجدد جدولها، ارقام و استنباط آماری باید امکانپذیر باشد. با سیستماتیک عمل کردن در مراحل تحلیل، به اشتراک گذاشتن داده ها و کدی که برای تولید نتایج استفاده کرده اید و با دنبال کردن بهترین روشهای آماری توانایی تولید مجدد نتایج را به طور قابل توجهی ارتقا دهید.

دیگر نویسندگان این مقاله علاوه بر کَس، برایان کافو از دانشگاه جان هاپکینز، مری دیویدیان از دانشگاه ایالتی کارولین شمالی، زیا لی منگ از هاروارد و نانسی رید از دانشگاه برکلی کالیفرنیا و تورنتو می باشند.

کَس می گوید: «من معتقد هستم تشخیص ایده های اصلی آمار و بیان خلاصه و واضح آنها ارزشمند است. این ده قانون برای تحلیل تحقیقات علمی ارزشمند هستند. نوشتن چنین مقاله ای آسان نبود اما تیم عالی داشتیم و از نتیجه بسیار خشنودم.»

منبع: فیز.اورگ

نظری بدهید