آموزش نوشتن تابع در R، بخش اول

با این که خیلی‌ها R را به عنوان یک نرم‌افزار آماری می‌شناسند(که به نظر من شناخت اشتباهی است)، R در ذات خود یک زبان برنامه‌نویسی کامل است و خیلی از چیزهایی که در زبان‌های دیگر رایج هستند مانند توابع، حلقه‌ها، آرایه‌ها و … در R نیز وجود دارند. در این پست قرار است با نحوه‌ی نوشتن یک تابع در R آشنا شویم. ادامه مطلب →

نگاهی به Microsoft R Open

ژانویه امسال خبری منتشر شد مبنی بر این که مایکروسافت، شرکت Rev­o­lu­tion Ana­lyt­ics را خریده است. Rev­o­lu­tion Ana­lyt­ics محصولاتی تجاری برمبنای R ارایه می‌کرد و هدف مایکروسافت از این خرید تمایل این شرکت به استفاده از R در سرویسهایش عنوان شد.  Rev­o­lu­tion R Open یک پیاده‌سازی محبوب و متن‌باز از زبان R محسوب می‌شد که توسط Rev­o­lu­tion Ana­lyt­ics توسعه داده شده بود و اکنون که این شرکت تحت تملک مایکروسافت است، نام این پیاده‌سازی به Microsoft R Open یا به اختصار MRO تغییر کرده است. ادامه مطلب →

با R و یک الگوریتم نسبتا ساده موبایل انتخاب کنید

تصمیم‌گیری به طور کلی چیزی است که هر انسانی با آن سر و کار دارد، از وقتی که مثلا می‌خواهیم از بقالی چیپس بخریم گرفته تا انتخاب زمینی که قرار است یک طرح عمرانی بزرگ در آن اجرا شود. در این پست می‌خواهیم به سراغ علمی به نام تصمیم‌گیری و به طور مشخص، یکی از زیرشاخه‌های آن به نام تصمیم‌گیری چندمعیاره(mcdm) برویم.

mcdm همان‌طور که احتمالا از اسمش مشخص است هنگامی به کار می‌رود که تصمیم‌گیرنده می‌‌خواهد چندین معیار را با هم در تصمیم‌گیری خود لحاظ کند. چندین روش و الگوریتم برای mcdm پیشنهاد شده و در این پست قرار است با یکی از الگوریتم‌های نسبتا ساده‌ی mcdm به نام TOPSIS آشنا شویم. ادامه مطلب →

توزیع نرمال چیست، چرا مهم است و چطور با استفاده از R نرمال بودن داده را مشخص کنیم؟

برای آشنایی با توزیع نرمال پیشنهاد می‌کنم مدخل ویکی‌پدیای آن را بخوانید و یا به یکی از کتاب‌های آمار و احتمال( احتمال شلدون راس، آمار فروند، آمار مهندسی مونتگومری یا هر کتابی که پیدا کردید) مراجعه کنید. اما به طور خلاصه:

  • توزیع نرمال یک توزیع پیوسته است(یعنی گسسته نیست و می‌تواند هر مقداری به خود بگیرد)
  • بسیاری از پدیده‌های طبیعی از آن پیروی می‌کنند.
  • شکل آن همانند زنگوله (اصطلاحا Bell shape) و حول میانگین خود متقارن است.
  • با تقریب خوبی مهم‌ترین توزیع آماری است.

normal-distribution-2

(منبع عکس + )

ادامه مطلب →

چطور R یاد بگیریم؟

اگر عبارت "why you should learn R" را در اینترنت جستجو کنید به مطالب ده‌‌ها نفر در اینترنت بر می‌‌خورید که دلایل فراوانی برای یادگرفتن این زبان(یا برنامه) آماری نوشته‌اند. اگر به هر دلیلی بخواهید این زبان را یاد بگیرید اولین چیزی که احتمالا متوجه خواهید شد و اکثر کاربران این زبان بر سر آن توافق دارند این است:

یاد گرفتن R {در هنگام شروع} سخت است.

خوشبختانه کاربرد R در ایران رو به افزایش است و دوره‌ها و کلاس‌های آموزشی آن حداقل در شهرهای بزرگ یافت می‌شود و پیشنهاد می‌کنم اگر فرصتی دست داد حتما در یکی از این دوره‌ها ثبت‌نام کنید. برای یادگرفتن R حتما لازم نیست در کلاس آن شرکت کنید و منابع خوبی برای خودآموزی آن وجود دارد.  ادامه مطلب →

مروری بر نرم‌افزار Rstudio

اگر از خوره‌های R بپرسید که اولین کاری که باید بعد از نصب R روی یک سیستم انجام دهیم چیست قطعا پاسخ اکثر آنها نصب RStu­dio خواهد بود. RStu­dio در حال حاضر معروف‌ترین و بهترین IDE است که برای R ساخته شده و در این پست قرار است با آن بیشتر آشنا شویم. نحوه‌ نصب این نرم‌افزار را در پست قبلی توضیح دادم.  بعد اجرای RStu­dio با صفحه زیر مواجه می‌شوید. همان‌طور که می‌بینید این نرم‌افزار سه بخش اصلی دارد که به ترتیب آنها را بررسی می‌کنیم.

rstudio

ادامه مطلب →

شروع کار با R

برای شروع کار با R بدیهی است که نخست باید آن را روی کامپیوتر یا لپتاپ خود نصب کنید. R از ویندوز، لینوکس و مک پشتیبانی می‌کند (البته با استفاده از ترفندهایی روی گجت‌های اندرویدی هم بالا می‌آید.). برای نصب R باید آن را از وبسایت cran (مخفف شبکه جامعه آرشیو R) دانلود کنید. اگر از ویندوز استفاده می‌کنید از این صفحه روی base کلیک کنید و سپس Rرا دانلود کنید. بعد از نصب و باز کردن با این صفحه مواجه می‌شوید: ادامه مطلب →

پست اول، R چیست؟

R یک برنامه آماری است، دانشمندان داده(Data sci­en­tist)، تحلیلگران مالی، آماردانان و کلا هر کسی که نیاز دارد تا از داده‌ها سر درآورد، از R برای تحلیل آماری، مصورسازی داده‌ها و مدل‌سازی پیشگویانه استفاده می‌کند.

R یک زبان برنامه‌نویسی است، شما با نوشتن اسکریپت‌ها و توابع در زبان برنامه‌نویسی R، داده‌ها رو تحلیل می‌کنید. R یک زبان برنامه‌نویسی کامل، تعاملی و شئ‌گرا است که توسط آماردانها برای آماردانها طراحی شده است. این زبان شئ‌ها، عملگرها و توابعی را در خود دارد که روند کاوش، مدل‌سازی و مصورسازی داده‌ها را راحت می‌کنند. تحلیل‌های آماری کامل گاها با چند خط کد در R انجام می‌شوند.

R یک محیط برای تحلیل آماری است. تقریبا برای تمامی روشهای دست‌کاری داده، مدل‌سازی آماری و یا نمودارسازی که یک تحلیلگر آماری ممکن است به آن احتیاج پیدا کند تابعی در R وجود دارد. علاوه بر روش‌های استاندارد، به دلیل این که بیشتر تحقیق‌های آماری نوین در R انجام می‌شوند جدیدترین روشهای آماری معمولا اول در R عرضه می‌شوند. ادامه مطلب →