چگونه در R آنالیز واریانس (آنووا) یک‌طرفه انجام دهیم

گاهی اوقات پیش می‌آید که بخواهیم میانگین چند جامعه یا گروه را با هم مقایسه کنیم، مثلا فرض کنید شرکتی با سه پیمانکار A ، B و C قرارداد دارد و می‌خواهد بداند که آیا میانگین یکی از مشخصات محصولات این سه پیمانکار با هم تفاوتی دارند یا نه. برای این کار روشی آماری به نام آنالیز واریانس یا  Anova وجود دارد. در این پست قرار است ببینیم که چطور می‌شود از آنالیز واریانس یک‌طرفه(یا یک‌راهه) استفاده کرد. ادامه مطلب →

انواع ساختار‌‌های داده در R، بخش پایانی

در پست قبلی، با ماتریس و data frame (معادل‌های چارچوب‌داده یا داده چارچوب‌دار برای آن پیشنهاد شده است) آشنا شدیم. این ساختارهای داده، دو بعدی بودند و معمولا هر ردیف آن، نماینده یک مشاهده و هر ستون آن نماینده یک مشخصه بود. فرض کنید داده‌ای داریم که نیازمند بعد زمان نیز هست. مثلا چهار دانش‌آموز، سه امتحان را در دو هفته پشت سر گذاشته‌اند و می‌خواهیم به جای این که یک ماتریس جداگانه برای هر هفته داشته باشیم، در یک ساختار داده همه چیز را خلاصه کنیم، در اینجا ساختار داده‌ای به نام Array کار ما را راه می‌اندازد. داده‌های اولیه را در R به وجود می‌آوریم: ادامه مطلب →

انواع ساختار‌‌های داده در R، بخش دوم ماتریس و Data.frame

ماتریس، یک ساختار دو بعدی برای داده است. تمام عناصر یک ماتریس باید از یک نوع باشند.(numeric, log­i­cal, char­ac­ter, com­ple). درست همانند بردارها، اگر عناصری که به یک ماتریس می‌دهید چند نوع باشند R در ماتریس نهایی همه‌ی آنها را به یک نوع تبدیل خواهد کرد. (به این عمل اگر اشنباه نکنم Coerc­ing می‌گویند.) چندین راه برای به وجود آوردن یک ماتریس در R وجود دارد. به عنوان مثال می‌توانیم دو یا چند بردار را با دستورهای cbind و rbind به صورت ستونی یا ردیفی به هم بچسبانیم:

ادامه مطلب →

انواع ساختارهای داده‌ در R، بخش اول، بردارها

بردارها

بردار تقریبا پایه‌ای‌ترین ساختار داده در R  است. بردار ساختاری است که مجموعه‌ای از مقادیر مرتب‌شده به نام عنصر را در خود ذخیره می‌کند. یردار را می‌‌توان معادل یک ستون در نرم‌افزارهایی چون اکسل و spss دانست. یک بردار می‌تواند هر تعداد عنصر داشته باشد با این شرط که نوع تمام عناصر یکسان باشد، به عنوان مثال، یک بردار نمی‌تواند هم شامل عدد و هم شامل متن باشد. برای تشخیص نوع عناصر یک بردار می‌توانید از دستور زیر استفاده کنید:

ادامه مطلب →

آموزش نوشتن تابع در R، بخش دوم

در یکی از پست‌های قبلی وبلاگ، با استفاده از الگوریتم Top­sis یک موبایل انتخاب کردیم و در پست قبلی یاد گرفتیم که چطور می‌توان در R یک تابع نوشت. همچنین در پست قبلی قرار شد با یک مثال روند نوشتن تابع در R را بررسی کنیم و به نظر می‌رسد همان الگوریتم Top­sis مثال خوبی برای این کار باشد. ادامه مطلب →

آموزش نوشتن تابع در R، بخش اول

با این که خیلی‌ها R را به عنوان یک نرم‌افزار آماری می‌شناسند(که به نظر من شناخت اشتباهی است)، R در ذات خود یک زبان برنامه‌نویسی کامل است و خیلی از چیزهایی که در زبان‌های دیگر رایج هستند مانند توابع، حلقه‌ها، آرایه‌ها و … در R نیز وجود دارند. در این پست قرار است با نحوه‌ی نوشتن یک تابع در R آشنا شویم. ادامه مطلب →

چطور R یاد بگیریم؟

اگر عبارت "why you should learn R" را در اینترنت جستجو کنید به مطالب ده‌‌ها نفر در اینترنت بر می‌‌خورید که دلایل فراوانی برای یادگرفتن این زبان(یا برنامه) آماری نوشته‌اند. اگر به هر دلیلی بخواهید این زبان را یاد بگیرید اولین چیزی که احتمالا متوجه خواهید شد و اکثر کاربران این زبان بر سر آن توافق دارند این است:

یاد گرفتن R {در هنگام شروع} سخت است.

خوشبختانه کاربرد R در ایران رو به افزایش است و دوره‌ها و کلاس‌های آموزشی آن حداقل در شهرهای بزرگ یافت می‌شود و پیشنهاد می‌کنم اگر فرصتی دست داد حتما در یکی از این دوره‌ها ثبت‌نام کنید. برای یادگرفتن R حتما لازم نیست در کلاس آن شرکت کنید و منابع خوبی برای خودآموزی آن وجود دارد.  ادامه مطلب →