«Ансамблевый метод»: учёные создали систему киберзащиты почты от спама и фишинга
В Московском политехническом университете учёные из Узбекистана представили свою новую разработку — программу для комплексной защиты электронной почты от спама и злоумышленников. Программа применяет ансамблевый метод — то есть проверяет письма не только по кодовым словам, но также анализирует множество косвенных данных и признаков, таких как время отправления и наличие в тексте слов-штампов. Как пояснил автор разработки, программа может найти практическое применение у российских почтовых сервисов, поскольку именно в России очень развита сфера IT и кибербезопасности.
Учёные Ташкентского университета информационных технологий имени Мухаммада ал-Хоразмий создали инновационную программу для повышения эффективности защиты почты от спама. По словам специалистов, алгоритм на основе нейросети также убережёт пользователей от фишинговых атак, кражи личных данных и финансовых потерь. Об этом RT сообщили в Московском политехе, на семинаре которого была представлена разработка.
Как отметили авторы работы, в мире повсеместно наблюдается рост киберпреступности. В частности, кибератаки всё чаще совершаются на электронную почту: преступники рассылают нежелательные и вредоносные письма, а также занимаются фишингом — крадут конфиденциальную информацию, чтобы получить доступ к учётным записям пользователей. Традиционно для защиты почты от вредоносных писем используется фильтрация сообщений по ключевым словам или составляются чёрные списки отправителей. Однако с развитием технологий, которые применяют кибермошенники, такие способы защиты теряют эффективность.
Чтобы решить эту проблему, учёные разработали систему на основе нескольких алгоритмов, использующих технологию нейронных сетей. Такой подход позволяет объединить сразу несколько методик в единый ансамбль, чтобы выявлять спам по ряду критериев, а не только по ключевым словам.
Разработанная программа сортирует электронные письма по структуре текста, его содержанию, учитывает поведенческие особенности отправителей и метаданные — то есть дату и время отправки письма, тип вложения, объём и т. д.
Перед тем как отнести письмо к той или иной категории, программа обрабатывает текст сообщения. Обработка включает разбитие текста на отдельные слова — токенизацию, удаление речевых штампов — часто встречающихся, но бессмысленных оборотов, отсечение у слов суффиксов и приставок для выявления их основы — стемминг и т. д.