تحلیل ۲ میلیون گذرواژه در R، بخش دوم

در قسمت اول این پست، یک فایل متنی حاوی دو میلیون پسورد را در R وارد کردیم و نشان دادیک که داخل آن چه خبر است، پسوردها عموما از چه چیزهایی تشکیل شده‌اند و یکی دو تا نمودار درباره‌ی ترکیب پسوردها رسم کردیم، حالا نوبت این رسیده که قدرت این پسوردها را بسنجیم. تحلیل اصلی که روی گیت‌هاب و به زبان پایتون انجام شده بود، روش سنجش قدرت پسورد را از اینجا  گرفته و کمی تغییر داده بود تا به قوانین زیر برسد:

اضافات:

  • تعداد کاراکترها: طول * ۴
  • تعداد حروف بزرگ: طول * ۳
  • تعداد حروف کوچک: طول * ۳
  • تعداد ارقام: طول * ۲.۵
  • کاراکترهای ویژه: طول * ۴
  • ترکیبی از دو مورد بالا: طول
  • ترکیبی از سه مورد بالا: طول * ۱.۵
  • ترکیبی از هر چهار مورد: طول * ۲

کسورات:

  • فقط حروف: –طول
  • فقط اعداد: –طول
  • فقط کاراکترهای ویژه: –طول
  • کاراکتر تکراری: –طول

ما هم همین داستان را در قالب یک تابع در R پیاده می‌کنیم:

بیشتر بخوانید

چطور R یاد بگیریم؟

اگر عبارت "why you should learn R" را در اینترنت جستجو کنید به مطالب ده‌‌ها نفر در اینترنت بر می‌‌خورید که دلایل فراوانی برای یادگرفتن این زبان(یا برنامه) آماری نوشته‌اند. اگر به هر دلیلی بخواهید این زبان را یاد بگیرید اولین چیزی که احتمالا متوجه خواهید شد و اکثر کاربران این زبان بر سر آن توافق دارند این است:

یاد گرفتن R {در هنگام شروع} سخت است.

خوشبختانه کاربرد R در ایران رو به افزایش است و دوره‌ها و کلاس‌های آموزشی آن حداقل در شهرهای بزرگ یافت می‌شود و پیشنهاد می‌کنم اگر فرصتی دست داد حتما در یکی از این دوره‌ها ثبت‌نام کنید. برای یادگرفتن R حتما لازم نیست در کلاس آن شرکت کنید و منابع خوبی برای خودآموزی آن وجود دارد. 

بیشتر بخوانید