یادگیری ماشینی در R — بخش اول، مقدمه

یادگیری ماشینی شاخه‌ای از علوم کامپیوتر است که به گفته آرتور ساموئل در ۱۹۵۹، به کامپیوترها توانایی یاد گرفتن می‌دهد، بدون آن که صراحتا برای آن برنامه‌ریزی شده باشند. یادگیری ماشینی از مطالعه شناسایی الگوها و نظریه یادگیری محاسباتی تکامل یافته و به طور کلی به مطالعه و ساخت الگوریتم‌هایی می‌پردازد که می‌توانند از داده‌های موجود یاد بگیرند و بر روی داده‌ها پیش‌بینی انجام دهند. در این مجموعه پست‌ها که هنوز معلوم نیست تا کی ادامه داشته باشید، قصد دارم درباره‌ی الگوریتم‌های رایج یادگیری ماشینی که پیاده‌سازی آنها در R آسان است و یا پکیج‌های خوبی در R دارند بنویسم. ایده‌ی کلی این مجموعه آشنایی با آن بخش از یادگیری ماشینی است که در مبحث تحلیل داده کاربرد دارند و قرار نیست به کاربردهای پیچیده‌تر آن برسد. این پست‌ها را با الگوریتم‌های کلسیفایر مانند K-NN در پست بعدی شروع می‌کنیم، در ادامه به الگوریتم‌های پیشبینی مانند مدل‌های رگرسیونی خواهیم رسید و در نهایت به انواع دیگر الگوریتم‌های یادگیری ماشینی می‌رسیم. هدف این پستها ارایه‌ی یک توضیح فارسی برای الگوریتم، کد R آن و یک دیتاست به عنوان مثال است. اگر پیشنهادی برای این مجموعه دارید، یا دیتاستی مناسب برای این مجموعه سراغ دارید خوشحال می‌شود در نظرات همین مطلب آن را به اشتراک بگذارید.

مروری بر آزمون‌های فرض در R، بخش اول

در این پست قرار است نگاهی داشته باشیم بر انواع مختلف آزمونهای فرض که می‌توانید در R از آنها استفاده کنید. آزمون‌های فرض می‌توانند کمی مشکل‌آفرین باشند، بعضی از آنها نیازمند نمونه‌هایی هستند که از توزیع نرمال پیروی می‌کنند، برخی دیگر نیاز به دو نمونه با وارایانسهای برابر دارند و خیلی از آزمونهای فرض هم وجود دارند که چنین پیشنیازهایی ندارند.

این پست را با تست نرمال بودن که در یکی از پست‌های قبلی وبلاگ درباره‌ی آن نوشته بودم آغاز می‌کنیم، سپس به سراغ آزمون فرض برای برابری واریانس (با فرض نرمال بودن و نبودن) خواهیم رفت و در نهایت نگاهی بر آزمون‌های فرض برابری میانگین خواهیم انداخت.

ادامه مطلب →