Abstract:
Elektron rabitənin mühüm xidmətlərindən biri də elektron poçtdan istifadədir.
İnternetin yaranması və geniş yayılması ilə ən çox istifadə edilən ünsiyyət
vasitələrindən birinə çevrilən e-poçt xidmətində baş verən inkişaflar bəzi problemləri
də ortaya çıxarmışdır. Bu problemlərdən biri də elektron məktublar vasitəsilə “spam”
mesajların yayılmasıdır. Gündən-günə kritik problemə çevrilən spam mesajlar e-poçt
xidmətlərinin təhlükəsizliyini və etibarlılığını təhdid edərək istifadəçilərin narahat
olmasına səbəb olur. Ortaya çıxan bu təhlükə qarşısında bütün dünyada texniki və
hüquqi tədbirlər görülür və problemlə mübarizə üçün səylər göstərilir. Bunun aradan
qaldırılması üçün spam filtrasiyası və spam aşkarlama metodunun inkişafı kimi
proseslər həyata keçirilir. E-poçtlarında spam e-poçtları aşkar etmək və onların
aradan qaldırılması maşın öyrənmə alqoritmlərindən istifadə edilir. Maşın öyrənmə
alqoritmlərindən istifadə edərək, e-poçtlarda arzuolunmaz e-poçtların süzgəcdən
keçirilməsi məqsədəuyğundur. İndiki vaxtda elektron məktubların göndərilməsi asan
olduğundan, onlar təkcə dostlarla ünsiyyət vasitəsi kimi deyil, həm də tez-tez reklam
məqsədləri üçün spam e-poçt qutularını məhv etmək üçün bir vasitə kimi böyük
populyarlıq qazanmışdır. Bunun üçün Random Forest, Logistic Regression, Naive
Bayes, Artificial Neural Networks maşın öyrənmə üsulları təhlil edilmişdir. E-
poçtların spam və ya normal kimi təsnif etmək üçün əvvəlcə mətn əsaslı spam və
normal e-poçt nümunələrindən ibarət məlumat dəsti istifadə edilmişdir. Sonra hər bir
e-poçtun məzmunu təhlil edildi və hər bir e-poçtda görünən müxtəlif sözlər və ya
terminlər tapıldı. Bu araşdırmada iki fərqli e-poçt verilənlər bazasında fərqli maşın
öyrənmə alqoritmindən istifadə edilərək təhlükəli e-poçtlar aşkar edilməyə çalışıldı.
Bu alqoritmlərdən istifadə etməzdən əvvəl verilənlər bazasında əvvəlcədən emal
addımları yerinə yetirildi. Daha sonra xüsusiyyət çıxarılması və xüsusiyyət seçimi
həyata keçirildi. Xüsusiyyət seçildikdən sonra xüsusiyyət vektoru yaradıldı və maşın
başa düşə biləcəyi formatda dəyərlər əldə edildi. Xüsusiyyət vektoru maşın öyrənmə
alqoritmləri ilə sınaqdan keçirildi və yaramaz e-poçt filtrləmə prosesi ilə əldə edilən
performans nəticələri qiymətləndirildi.