اولین الگوریتمی که در این سری از پستها به آن میپردازیم، الگوریتم K- nearest neighbours یا به اختصار k-NN نام دارد. این الگوریتم یکی از سادهترین الگوریتمهای یادگیری ماشینی است و به دستهای از این الگوریتمها به نام الگوریتمهای classification (طبقهبندی) تعلق دارد. الگوریتمهای classification در یادگیری ماشینی و آمار، الگوریتمهایی هستند که مشخص میکنند با توجه به یک مجموعهی داده موجود و مورد استفاده به منظور آموزش که شامل مشاهداتی است که عضویتشان در یک دسته موجود است، یک مشاهده جدید به کدام یک از مجموعه دستهها( زیرجمعیتها) تعلق دارد. این الگوریتم در دستهای از الگوریتمهای یادگیری ماشین به نام یادگیری با نظارت قرار میگیرد.
یادگیری ماشین
یادگیری ماشین در R — بخش یک و نیم، طبقهبندی الگوریتمهای یادگیری ماشینی
قرار بود این پست دربارهی اولین الگوریتم این سری به نام k-NN باشد اما متاسفانه من به این نکته توجه نکرده بودم که بدون ارایهی یک طبقهبندی مناسب برای این الگوریتمها، کار نوشتن دربارهی آنها سخت خواهد شد. برای طبقهبندی این الگوریتمها به دو روش عمل میشود:
- طبقهبندی بر اساس نحوه یادگیری
- طبقهبندی بر اساس کاربرد و شباهت بین الگوریتمها