یادگیری ماشین در R — بخش دوم، الگوریتم k-NN

اولین الگوریتمی که در این سری از پست‌ها به آن می‌پردازیم، الگوریتم K- near­est neigh­bours یا به اختصار k-NN نام دارد. این الگوریتم  یکی از ساده‌ترین الگوریتم‌های یادگیری ماشینی است و به دسته‌ای از این الگوریتم‌ها به نام الگوریتم‌های clas­si­fi­ca­tion (طبقه‌بندی) تعلق دارد. الگوریتم‌های clas­si­fi­ca­tion در یادگیری ماشینی و آمار، الگوریتم‌هایی هستند که مشخص می‌کنند با توجه به یک مجموعه‌ی داده موجود و مورد استفاده به منظور آموزش که شامل مشاهداتی است که عضویتشان در یک دسته موجود است، یک مشاهده جدید به کدام یک از مجموعه دسته‌ها( زیرجمعیت‌ها) تعلق دارد. این الگوریتم در دسته‌ای از الگوریتم‌های یادگیری ماشین به نام یادگیری با نظارت قرار می‌گیرد.

بیشتر بخوانید

مقدمه‌ای بر شبیه‌سازی در R، روش مونت‌کارلو

یکی از کاربرد‌های کمتر شناخته‌شده‌ی R، استفاده از آن برای شبیه‌سازی است. شبیه‌سازی سیستم‌های گسسته‌ پیش‌آمد(DES) ، سیستم‌های صف و روش‌های مانند مونت‌کارلو رایج‌ترین شبیه‌سازی‌هایی هستند که در R انجام می‌شوند. البته این را هم در نظر داشته باشید که R کمی تا قسمتی کند است و چیزی که آن را برای شبیه‌سازی مطلوب کرده این است که بسیاری از محققینی که زمینه‌ی آماری دارند R را به زبان‌ها و ابزارهای دیگر ترجیح می‌دهند، از طرف دیگر، متن‌باز بودن R  مزیت آن در این زمینه در مقابل Mat­lab است. از آنجایی که این وب‌سایت درباره‌ی R و مخلفاتش است، پرداختن به مبحث شبیه‌سازی در آن خالی از لطف نیست. تقریبا هر جایی که مبحث شبیه‌سازی مطرح می‌شود، روش مونت‌کارلو اولین روشی است که مورد بحث قرار می‌گیرد.

بیشتر بخوانید

انواع ساختار‌‌های داده در R، بخش دوم ماتریس و Data.frame

ماتریس، یک ساختار دو بعدی برای داده است. تمام عناصر یک ماتریس باید از یک نوع باشند.(numeric, log­i­cal, char­ac­ter, com­ple). درست همانند بردارها، اگر عناصری که به یک ماتریس می‌دهید چند نوع باشند R در ماتریس نهایی همه‌ی آنها را به یک نوع تبدیل خواهد کرد. (به این عمل اگر اشنباه نکنم Coerc­ing می‌گویند.) چندین راه برای به وجود آوردن یک ماتریس در R وجود دارد. به عنوان مثال می‌توانیم دو یا چند بردار را با دستورهای cbind و rbind به صورت ستونی یا ردیفی به هم بچسبانیم:

بیشتر بخوانید

با R و یک الگوریتم نسبتا ساده موبایل انتخاب کنید

تصمیم‌گیری به طور کلی چیزی است که هر انسانی با آن سر و کار دارد، از وقتی که مثلا می‌خواهیم از بقالی چیپس بخریم گرفته تا انتخاب زمینی که قرار است یک طرح عمرانی بزرگ در آن اجرا شود. در این پست می‌خواهیم به سراغ علمی به نام تصمیم‌گیری و به طور مشخص، یکی از زیرشاخه‌های آن به نام تصمیم‌گیری چندمعیاره(mcdm) برویم.

mcdm همان‌طور که احتمالا از اسمش مشخص است هنگامی به کار می‌رود که تصمیم‌گیرنده می‌‌خواهد چندین معیار را با هم در تصمیم‌گیری خود لحاظ کند. چندین روش و الگوریتم برای mcdm پیشنهاد شده و در این پست قرار است با یکی از الگوریتم‌های نسبتا ساده‌ی mcdm به نام TOPSIS آشنا شویم.

بیشتر بخوانید