مروری بر آزمون‌های فرض در R، بخش اول

در این پست قرار است نگاهی داشته باشیم بر انواع مختلف آزمونهای فرض که می‌توانید در R از آنها استفاده کنید. آزمون‌های فرض می‌توانند کمی مشکل‌آفرین باشند، بعضی از آنها نیازمند نمونه‌هایی هستند که از توزیع نرمال پیروی می‌کنند، برخی دیگر نیاز به دو نمونه با وارایانسهای برابر دارند و خیلی از آزمونهای فرض هم وجود دارند که چنین پیشنیازهایی ندارند.

این پست را با تست نرمال بودن که در یکی از پست‌های قبلی وبلاگ درباره‌ی آن نوشته بودم آغاز می‌کنیم، سپس به سراغ آزمون فرض برای برابری واریانس (با فرض نرمال بودن و نبودن) خواهیم رفت و در نهایت نگاهی بر آزمون‌های فرض برابری میانگین خواهیم انداخت.

ادامه مطلب →

چگونه در R آنالیز واریانس (آنووا) یک‌طرفه انجام دهیم

گاهی اوقات پیش می‌آید که بخواهیم میانگین چند جامعه یا گروه را با هم مقایسه کنیم، مثلا فرض کنید شرکتی با سه پیمانکار A ، B و C قرارداد دارد و می‌خواهد بداند که آیا میانگین یکی از مشخصات محصولات این سه پیمانکار با هم تفاوتی دارند یا نه. برای این کار روشی آماری به نام آنالیز واریانس یا  Anova وجود دارد. در این پست قرار است ببینیم که چطور می‌شود از آنالیز واریانس یک‌طرفه(یا یک‌راهه) استفاده کرد. ادامه مطلب →

توزیع نرمال چیست، چرا مهم است و چطور با استفاده از R نرمال بودن داده را مشخص کنیم؟

برای آشنایی با توزیع نرمال پیشنهاد می‌کنم مدخل ویکی‌پدیای آن را بخوانید و یا به یکی از کتاب‌های آمار و احتمال( احتمال شلدون راس، آمار فروند، آمار مهندسی مونتگومری یا هر کتابی که پیدا کردید) مراجعه کنید. اما به طور خلاصه:

  • توزیع نرمال یک توزیع پیوسته است(یعنی گسسته نیست و می‌تواند هر مقداری به خود بگیرد)
  • بسیاری از پدیده‌های طبیعی از آن پیروی می‌کنند.
  • شکل آن همانند زنگوله (اصطلاحا Bell shape) و حول میانگین خود متقارن است.
  • با تقریب خوبی مهم‌ترین توزیع آماری است.

normal-distribution-2

(منبع عکس + )

ادامه مطلب →