|
ru.unix.bsd- RU.UNIX.BSD ------------------------------------------------------------------ From : Auster 2:5020/400 12 Aug 2006 19:22:43 To : Sergey Skvortsov Subject : Re: bsdtar & symlinks -------------------------------------------------------------------------------- Sergey Skvortsov <skv@protey.ru> wrote: >>>> смотрим теперь нп в статистику идущую с SA для URIBL_SBL рулесета >>>> - 98.6% правильных срабатываний, 1.4% - ложных. >>>> (можно конечно поперепроверять все рулесеты на обьеме своей почты, >>>> но я почемуто склонен верить той что уже есть). >>> Порочная логика, пример неверной экстраполяции. Такие "рулесеты" - >>> типичная апофения. >>> Все эвристические фильтры спама следует запретить. >>> >> здесь было дано только статистическое описание, а не эвристика. > > Это эвристика, поскольку к чистым входным данным (тело письма), > добавляются косвенные данные (типа NS'ов). И это добавление "отравляет" > данные, делая их попросту нерепрезентативными. > ага, вот что здесь подразумевалось под эвристикой. помоему говорить о эвристике стоилобы если бы был нечеткий алгоритм вывода, а здесь упоминался довольно четкий алгоритм по определению спам/неспам - поэтому о эвристике, помоему, здесь говорить трудно. Относительно исходных данных (!не алгоритма) - заключение спам/неспам только, и исключительно только, на основании лишь того что имеется в сообщении - это можно отнести к герменевтическим схемам. Заключение же спам/неспам с привлечением еще доп.информации связанной с контекстом - это насколько я помню называлось эксегетическая схема заключения (или както похоже, могу ошибаться - давно уже должна была забыться подобная информация). > Может, если вычислять по geoip место отправления письма, брать текущий > прогноз погоды и скармливать SA среднюю температуру за неделю - > результаты могут быть просто потрясяющими, возволяя вывести правило типа > "его в регионе отправителя температура 18+-2 градуса (с учетом > сезонности) - то это спамер". > интересная аналогия :), но - если это даст постоянный исчезающе малый процент ложных срабатываний, почемубы тогда данный критерий и не использовать, какбы его там при этом и не обозвали. > Причем на любой выборке таких правил можно вывести хоть десяток. > > Только вот эволюционный анализ позволяет выдвинуть гипотезу "почему так > было", но не даёт, в данном случае, оснований делать вывод "и в будущем > тоже так будет". Это попросту принципиальная разница между интерполяцей > и экстраполяцией - т.е. между статистическими характеристиками (типа > корреляции) или функциональными (f(х) -> y). > Потому-то смешивание статического анализа с эвристикой весьма порочно. > дальнейшее обсуждение, сорри, без меня (считаю себя недостаточно в этом разбирающимся). - сперва в этом треде был переход от ответа (предполагаю верного) на вопрос "почему это спам" -> к обсуждению логики как получен ответ (правильная она, или всетаки порочна:), а сейчас похоже наметился еще один переход. - я пас. -- Auster Vl. --- ifmail v.2.15dev5.3 * Origin: Demos online service (2:5020/400) Вернуться к списку тем, сортированных по: возрастание даты уменьшение даты тема автор
Архивное /ru.unix.bsd/3293eade7717.html, оценка из 5, голосов 10
|