000 01458nab a2200193 a 4500
001 144309
003 237141
005 20201118122731.0
008 ||||||n9999 ||| || ||
100 _aRojas-Galeano, Sergio A.
245 0 _aRevealing non-alphabetical guises of spam-trigger vocables
300 _app.50-57
520 _aResumen: El 75% del correo electrónico que se transmite hoy en día, corresponde a mensajes masivos no solicitados (comúnmente denominados spam), lo que evidencia la necesidad de continuar fortaleciendo los mecanismos de protección contra su propagación. Uno de los tretas más ingeniosas utilizadas últimamente por los spammers para sobrepasar los filtros basados en comparación de texto, es el enmascaramiento de las palabras vedadas mediante substituciones con símbolos no alfabéticos, de manera que aun visualmente logren transmitir la semántica del término original (por ejemplo, enmascarando viagra como v1@gr@ o como v-i-a-g-r-a). En este artículo se discute una técnica simple pero efectiva para contrarrestar esta sutil trampa, que consiste en la adaptación de un algoritmo reconocido de apareamiento de textos para revelar efectivamente la similitud existente entre vocablos desencadenadores de filtros spam y variantes alfanuméricas enmascaradas.
650 _aALGORITMOS
650 _aCOMUNICACIONES
650 _aCORREO ELECTRONICO
773 _0142252
_aDyna - No.182
942 _cSART
999 _c144309
_d144309