Facebook Linkedin
Git Instagram

I write mostly about security, mail, web and linux. My contacts are: me@andreybondarenko.com, Telegram, FB chat, WhatsApp. My CV. This site can use cookies.

Buy me a beer / Автору на пиво:

shaman007@andreybondarenko.com (paypal)
17QxrNyk9BCrP6LGUbqCNnXCzu4oeoYKaH (btc) 0x57500960FBC986225209E597D5B97065A9A10043 (eth)

Links turned out to be useful / не потерявшие актуальности ссылки:

Растаможка автомобиля из России в Чехии
Поиск работы за границей РФ: доступ из вашей страны запрещен и другие важные вещи
Как правильно искать работу
Почему закон о блокировке сайтов в рунете – это очень плохо

Later Ctrl + ↑

Interesing “feature” of the Mediawiki

Just have a bit digged in the Mediawiki, that is quite popular Wiki engine :-) Found out that the  articles are located in the “prefix_text” table, with all the changes, obviously. So changes are being stored as a new copy of the article: if you have 100kb article and you need to save a change in 1 symbol, there would be 100kb growth (plus additional data) of the table. No wonder that the Wikipedia need new servers all the time! Cannot imagine size of their DBs.

 No comments    33   2016   internet   IT   php   wiki

E-mail notification on every login

It’s useful sometimes to get notifications on every ssh login that is happen on the server (though, could be used to monitor logins made by other means). First method is based on the /etc/profile, but it should not be used because user can override it with setting own variables if home directory is writable for him. Most convenient is to use PAM, putting in the /etc/pam.d/sshd execution of the script that whould send the mail in the session section:

session optional pam_exec.so seteuid  /usr/local/bin/send_mail.sh

I would not recommend to set “required” here because the fail of the scrip should not be critical. The script just sends notification mail:

#!/bin/sh
if [ "$PAM_TYPE" != "open_session" ]
then 
	exit 0

else
  {
    echo "User: $PAM_USER"
    echo "User: $PAM_TYPE"
    echo "Remote Host: $PAM_RHOST"
    echo "Service: $PAM_SERVICE"
    echo "TTY: $PAM_TTY"
    echo "Date: `date`"
    echo "Server: `uname -a`"
 } | mail -s "$PAM_SERVICE login on `hostname -s` for account $PAM_USER" admin@example.com
fi

exit 0

Don’t forget to put +x permissions on it with:

chmod +x  /usr/local/bin/send_mail.sh
 No comments    6   2016   IT   linux

DNSBL checkers list

Since I am now running my own smtp-server, I have to deal with different black list servers myself and check my IP from time to time if it’s there or not.To cover pretty much everything valuable:

https://www.whatismyip.com/blacklist-check/
http://whatismyipaddress.com/blacklist-check
http://mxtoolbox.com/SuperTool.aspx?action=blacklist%3a85.17.249.170&run=toolpage

My IP was in 2 lists, DAN ME, APEWS and Barracuda.

DAN ME is a list maintained by some loser, who lists there all TOR-related IP addresses he can find. Unfortunately he lists not only the exit-points, but relays as well. Fortunately, his list is automated, but I had to shut down the TOR node.

Barraccuda removes by request, however, sells “subscription” for $20, so you will not be in the list again. That’s low!

At the moment it’s in the APEWS for 3(!) years and the owner has a long faq where he is explaining why he would not remove you ever.

Thinking of extra VPS for the additional MX.

 No comments    7   2016   dns   IT   linux   networking

Leaseweb IPv6 PTR

Just for the record: Leaseweb does not support PTR record setting for the IPv6 address from the web panel, but you can ask the support team to set it with ticket. Google rejects my mail that comes from the IPv6 network with “PTR not found” message.

 No comments    3   2016   dns   linux

SUDO !-rules

Checked one insecure approach to use sudo not to allow commands, but to prohibit commands for user with the NOT-operator “!”. Why it’s a bad idea we can see in the sudoers man page:

” Limitations of the ‘!’ operator
It is generally not effective to “subtract” commands from ALL using the ‘!’ operator. A user can trivially circumvent this by copying the  desired command to a different name and then executing that. For example:

bill ALL = ALL, !SU, !SHELLS

Doesn’t really prevent bill from running the commands listed in SU or SHELLS since he can simply copy those commands to a different name, or use a shell escape from an editor or other program. Therefore, these kind of restrictions should be considered advisory at best (and reinforced by policy).”

RHEL 5,6 – works
RHEL 7 – does not work, which is good. Still, wanted by some customers.

 No comments    14   2016   IT   linux   sudo

Переезды сервисов из страны в страну

Смена страны проживания в разных сервисах:

  • Google: просто нельзя переехать из РФ в Чехию. Поддержка говорит, что можно воспользоваться услугами партнера и перенести, но в реальности ни один партнер на захотел со мной возиться. Сценарий “удалить все и зарегистрировать новый” меня не устраивает, проще переехать на собственный сервер (что я и сделал).
  • Steam: просто прописать новую страну, адрес и карточку. Можно делать не чаще чем раз в пол года.
  • Apple: можно поменять страну проживания, когда у тебя нет платных подписок. Но от платной подписки до конца периода оплаты отказаться нельзя. Ждем декабря.
  • Blizzard: по запросу в поддержку. Там надо показать локальный документ.
  • Adobe: смена платежных реквизитов меняет страну. Есть тонкость с использованием уникального адреса, но про нее говорят в саппорте
  • Различные мессенджеры: просто поменять телефон и адрес. По подтверждению кода с телефона меняется и страна.
 No comments    6   2016   IT   жизнь   интернет

Из наблюдений за интернетом

Примерно полтора года, пока была жива подписка на Google я почти не пользовался этим сервером. Он существовал как-то сам по себе своей жизнью, спамеры нагадили в комментариях ссылками на дорвеи, иногда пропадал файл rome-club.pdf, на который в сети очень много ссылок (лол, никогда бы не подумал, что им кто-то будет интересоваться). При этом Yandex считал ТИЦ сайта равным 10 (нет, я знаю, что это стэнд-элон никто не читает и скорее всего читать не будет) и у Гугла тоже что-то водилось >0.

Однако теперь я обновил движок, потер спамеров, скопировал сюда более-менее длинные тексты, чтобы были все в одном месте, в этом вашем Fecebook’е хрен чего найдешь, например. Все, Гугл и Яндекс обнулили его “ценность” и “авторитетность”. Интересно, почему так и правильно ли это?

 No comments    25   2016   google   yandex   интернет

Растаможка автомобиля из России в Чехии

Наверное стоит рассказать (да чтоб и самому не забыть) про то, как растаможить машину из РФ в Чехии. tl&dr: приходишь к брокеру (спасибо Pavel Zhukov), платишь денежку (мне вышло около 14 000 крон), получаешь номера. Длинно:

(-1) Зачем это надо, ведь в Чехии полно дешевых машин? Да, конечно! Тут есть совсем бесплатные машины, прямо в салонах! То есть стоимость сравнима со стоимостью расходников за год или вообще со стоимостью полного бака + техосмотра. Я знаю место, где стоит Кайен 2007 года, не бит не крашен, с 2мя комплектами колес и всеми документами за десятку тысяч евро. Пятерка е39 может стоить 2000 евро и еще за 2000 ее можно покрасить-поправить и заменить ей фары-резинки, но это не на каждый день машины. Внятные-понятные-свежие все-таки чего-то стоят, из-за курсовой разницы конкретно мой случай был примерно на 3-5000 евро не выгоден по цене + я использовал свою машину как транспорт для переезда + я сразу мог ездить в Икею, в тот же день как приехал, а не решать вопрос с колесами сначала. Машину старше 7 лет везти смысла нет, до 2012 везти машину тоже не было смысла.
UPD: старше 6 лет ее растоможат, но не поставят на учет! То есть старше 6 лет НЕЛЬЗЯ СОВСЕМ НИКАК, ЗАБУДЬ И ОТПУСТИ.

(0) Есть ли специфика от страны к стране? Да, есть, но не много. Я читал как народ это делал в Германии – там орднунг, по этому (наверное) все принесенные документы надо было перевести на немецкий язык нотариально заверенным переводом (ДКП, например, страниц 15, можете посчитать расходы, по 20 евро за лист). Плюс ребят из Германии просили бумажку о пересечении границы, которую никому не дают, а мой брокер на нее просто забил.

(1) Сколько можно ездить на номерах из РФ? 185 дней. Это никак не проверить, погранцы в Польше никак не отмечают машину кроме значка “пересекал на машине” на печати в паспорте. За все время меня ни разу не остановили и не спросили что и как, говорят, можно ездить дольше, убалтывать полицейских, которым все равно кроме гринкарты (это эквивалент ОСАГО) ничего не интересно, и т.п. Но зачем, если можно все сделать как надо. Если поймают, то штраф 50 000 крон. Въехать-выехать бесполезно, так как 185 дней из года, а не 185 дней подряд.

(2) Какой налог, какой таможенный сбор и т.п.? Налога на личные машины в Чехии нет вообще, точнее, он заложен в бензин. Таможенный сбор составляет 10% от заявленной стоимости + надо заплатить НДС 19% от нее же. На мою машину получается примерно 3000 евро (оценили в 10). Однако, если ты жил в РФ до переезда более 6 месяцев и владел авто более 6 месяцев там, то платить ничего не надо. С момента растаможки первой машины начинается год, в течение которого можно без сборов ввезти все что угодно (яхту, самолет, еще машину) без налога по таким же принципам.

(3) Сколько стоит брокер и что он делает? Мне брокер стоил 100 евро, делает он все. Надо приехать на машине на таможню, поговорить с брокером, дать ее на осмотр и фотографирование.

(4) Какие документы нужны? ПТС, ДКП (который сейчас отбирают гайцы и который мне очень оперативно выслал копию по электронной почте Авилон), акт приема-передачи, договор аренды жилья в Чехии, договор с работодателем. Счета за электричество, интеренет, старые страховки, унитаз, жо^W в общем, надо показать что ты жил в РФ за пол года до переезда, годится все, я просто положил в багажник вообще все документы которые у меня есть. Переводить ничего не потребовалось, многие документы сошли в виде копии без оригинала.

(5) ОК, растаможили. А продать ее теперь можно? Нет, продавать можно только через год, иначе надо будет уплатить НДС. Потом можно.

Дальше можно действовать самому, можно последовать совету брокера и обратиться к специальному человеку, который все сделает за тебя. Я пошел по второму пути, скорее всего я за это переплатил, но не думаю, что много. Потому что чтобы получить номера нужны еще бумаги:

(1) STK – это техосмотр + экологический контроль. “Начальный” стоит 3 500 крон, дается на 2 года, потом продлевать можно вроде как крон за 700. ТО делают разные фирмы, цена сильно зависит от того как его сделают, за 30 минут или за пару недель. Выбрал дороже, но сегодня.

(2) Российский ПТС заберут и выдадут новый. В него вносится не только цвет, вес и мощность, но и какие фары стоят, какие колеса допустимы и еще много чего, вплоть до недостатков, например, что кузов ржавый. Этого всего в ПТСе РФ нет, тут требуется самая дорогая бумага, которая стоит 4500 крон: справка от производителя о том, что вот этот VIN имеет вот такую-то комплектацию и для эксплуатации в ЕС допущен. Можно заказывать самому, но что-то по отзывам не дешевле.

(3) Поход в Магистрат, где дают номера и ставят машину на учет. Вот тут мог потратить меньше, но за выпуск номеров и постановку на учет берут какие-то сборы.

(4) Все! Можно покупать страховку, перекручивать номера и ездить.

Следующий интересный вопрос – снять ее с учета в РФ.

Sieve: фильтрация почты на стороне сервера

осле того, как Google закрыл Reader, я утратил веру в большую компанию, которая делает для меня инструмент, решающий важные мне задачи. Я решился строить свой собственный Луна-парк с читалками, агрегаторами, болжеком и т.п. Почта на своем домене — первое, что приходит в голову. Не вопрос прописать MX запись, поставить Postfix на локальную доставку, установить IMAP-сервер Dovecot и почтовый веб-клиент Roundcube, вопрос повторить функциональность «большой» системы, в первую очередь, сортировку. Я не буду дублировать существующие инструкции, опишу только неочевидные моменты.

Что меня не устраивает в Gmail? Это идеология меток (labels), которых можно прицепить к одному и тому же письму несколько, а в IMAP отобразить их в виде папок. В результате корневая папка всегда полна писем, а я такой человек (возможно, мой случай уникален), что всю «лишнюю» почту я удаляю, а всю «нужную» раскладываю по папкам. Я стираю все уведомления от веб-магазинов, форумов, сервисов и т.п., что не укладывается в идеологию Гугла «зачем удалять, если место бесконечно?». Гугл хочет видеть у меня как можно больше, а я не хочу видеть мусор. Далее, я пользовался iCloud/me.com, там все просто: правила сортировки входящей почты просто не работают и все.

Итак, задача: чтобы Dovecot сам раскладывал почту по папкам IMAP’а. Честно говоря, я провел минут 20 в поиске «а где же у Roundcube’а настройки фильтрации?», а потом начал читать инструкции. К сожалению, все, что можно найти в вебе, не содержит полного списка граблей, на которые можно наступить, постараюсь по горячим следам описать их тут.

Сперва, надо выучить слово sieve, это целый язык описания правил фильтрации, созданный Cyrusoft’ом во время работы над почтовым сервером Cyrus (не к ночи помянут). Он позволяет писать такие вот самоочевидные правила
в ~/.dovecot.sieve:

require ["fileinto"];
# rule:[LinkedIn]
if header :contains "From" "linkedin.com"
{
	fileinto "INBOX/LinkedIn";
	stop;
}
# rule:[Drupal Alerts]
if header :contains "Subject" "yet another home page"
{
	fileinto "INBOX/Drupal Alerts";
	stop;
}
if header :contains "From" [ "user@example.com" ] {      
  addflag "\\flagged";
  fileinto "Trash";
  stop;
}
# rule:[Paypal]
if allof (header :contains "From" "paypal")
{
	fileinto "INBOX/Ebay, Paypal";
	stop;
}

Конечно, не очень хочется лезть в консоль, чтобы прописать новое правило фильтрации, к счастью, есть протокол managesieve, который позволяет почтовому клиенту рулить правилами на сервере. Удачно, что и Dovecot, и Roundcubе поддерживают обе функциональности. А дальше, начинаются грабли.

Во-первых, самое простое и естественное, что делается для включения seive, это установка mail_plugins = sieve где-то глобально для всего Dovecot’а. Это неправильно! Будет так:

Error: dlopen(/usr/lib64/dovecot/lib90_sieve_plugin.so) failed: /usr/lib64/dovecot/libdovecot-sieve.so.0: undefined symbol: mail_deliver_get_log_var_expand_table

Переменную следует выставить в /etc/dovecot/conf.d/15-lda.conf, для lda, локальной доставки. Включение managesieve и в Dovecot’е и в Roundcube проблем не вызывает (плагины есть в стандартной поставке), надо только не забыть прописать порт. Можно начинать писать правила, только работать они не будут, так как хотя почта раскладыватеся по папкой из клиента, «локальный доставщик» по-прежнему Postfix и INBOX не в /home/username, а в /var/mail/username. Надо прописать в main.cf mailbox_command = /usr/lib/dovecot/deliver -d «$USER». Теперь кажется, что все нормально: почти все письма раскладываются по почти всем правилам. Я потратил день на то, чтобы выяснить почему почта не попадает в папку и вывел коллег-из себя своими экспериментами. Я думал, что неправильно описываю свойства заголовка, так как там данные конверта и доставки отличаются (потому что общение происходит на сервере рассылки в рассылке, а выглядеть все должно как от собеседника собеседнику). Потом я увидел ошибку:

Mar 16 17:53:01 DJBZ002 dovecot: lda(shaman007): Error: write() failed with mbox file /home/shaman007/mail/INBOX/LOR: File too large (process was started with ulimit -f limit)
Mar 16 17:53:01 DJBZ002 dovecot: lda(shaman007): Error: sieve: msgid=<d068a42487535146ce3e7ec8b6557b27@andreybondarenko.com>: failed to store into mailbox 'INBOX/LOR': Internal error occurred. Refer to server log for more information. [2013-03-16 17:52:57]
Mar 16 17:53:01 DJBZ002 dovecot: lda(shaman007): sieve: msgid=<d068a42487535146ce3e7ec8b6557b27@andreybondarenko.com>: stored mail into mailbox 'INBOX'
Mar 16 17:53:01 DJBZ002 dovecot: lda(shaman007): Error: sieve: execution of script /home/shaman007/.dovecot.sieve failed, but implicit keep was successful (user logfile /home/shaman007/.dovecot.sieve.log may reveal additional details)
Mar 16 17:53:01 DJBZ002 postfix/local[13359]: 4575811F76E: to=<shaman007@andreybondarenko.com>, orig_to=<me@andreybondarenko.com>, relay=local, delay=3.9, delays=0.21/0.02/0/3.7, dsn=2.0.0, status=sent (delivered to command: /usr/libexec/dovecot/dovecot-lda -f "$SENDER" -a "$RECIPIENT")
Mar 16 17:53:01 DJBZ002 postfix/qmgr[29435]: 4575811F76E: removed

File too large! Целых 100 мегабайт! Оказалось, что хотя инициирует ошибку Dovecot, дело в параметре mailbox_size_limit Postfix’а. По умолчанию там 5 что-ли мегабайт, надо выставить в 0. Кажется, это все грабли.

 No comments    7   2016   IT   linux

Доклад по вопросам сравнения антиспамов и построения спам-фильтров

Ссылка на конференицию UNИX;

Презентации: ODPPDF;

Спам

Сколько вам приходит спама в день? Мне около 1000-1500 сообщений на abondarenko@gmail.comи корпоративный ящик. Это много, друзья, моя жена, спам-аналитик, не даст мне соврать, но эти адреса принадлежат живому человеку и им больше 5 лет.

Нормальные люди решают задачи минимизации потока мусора в свои ящики, а мне как-то довелось решать обратную задачу, мне нужно было сделать спам-ловушки, то есть адреса, на которые будет приходить 100% спам дабы можно было обучать фильтры и смотреть статистику их работы. Казалось бы, чего проще! Ну зарегистрируем мы немного ящиков на разных сервисах платных и не очень, заведем какой-нибудь неприметный домен с ничего не говорящим именем digitalhardcore.us, будем эти адреса оставлять в регистрационных карточках заказа рекламы Pfizer’a и еще какой-нибудь дряни (естественно, отписавшись сразу же от легитимной рекламы) и дело в шляпе. И так, что было сделано:

  • Несколько адресов на mail.com, yahoo.com и еще где-то с форвардом на приемник потока у нас.
  • digitalhardcore.us, вся почта с которого форвардится на тот же приемник.
  • Регистрируемся на множестве сайтов разной направленности от торрент-трекеров и обзоров железа до секс-шопов оставляя там эти адреса.
  • Постим на форумах разные нейтральные комментарии указывая в подписях адреса.

Результат выполнения пунктов 3 и 4 ночными дежурными за 1 год – около 100 писем в день на адрес (плюс-минус), хотя ожидался на порядок больше.

Второй интересный момент: на 1 адрес мы собирали “не спам”, то есть рекламу уважаемых контор вроде cocacola или hp чтобы тестировать себя на ложные срабатывания. Результат через год – 10-20 спамовых писем в день в потоке честной рекламы, хотя адрес живым людям кроме меня был не известен.

Третий интересный момент относится уже к наблюдению за личным потоком: стоит написать какому-нибудь недалекому человеку и характер спама меняется. Появляется реклама продуктов, которых раньше не было, его становится заметно больше. Происходит это потому, что у недалеких людей есть трояны, которые извлекают полезные сведения из их переписки.

Отсюда лично я делаю выводы:

  • крупные неуважаемые места торгуют базами пользователей (удав, фишки).
  • крупные уважаемые места ими не торгуют (LOR, Lepra), но некоторые все-таки торгуют. основной метод сбора адресов для набития баз – это не прочесывание стайтов и перебор имен, а потрошение записных книжек почтовиков троянами.

По этому можете смело писать свои адреса без дурацких _at_ или _здесь_была_собака_, форумы – капля в море.

Антиспам – отстой

Антиспамами принято меряться, давать им разные крутые награды и хвалить на форумах. Я хочу рассказать о том, как ими меряться правильно и что следует из измерений.

Сначала надо определиться, что есть спам. Вопрос не так прост, как кажется. Вот так определяет спам Лаборатория Касперского: “Массовая не запрошенная анонимная рассылка”. Массовая – потому, что единичный blackmail не есть результат работы спамера, а есть просто частный конфликт двух-трех людей. Незапрошенная – потому, что запрошенная реклама – не спам, ведь пользователь сам хотел ее у себя видеть и спамфильтр ее резать не должен. Анонимная (технически), потому, что с непрошенными письмами людей, которые себя никак не скрывают вопрос решают административно. Яркий пример таких писем – разные повестки или оповещения. Важность этого определения в том, что например, Яндекс спам определяет иначе, у него это “вся нежелательная почта и все рассылки”. Можно дискутировать на тему правы они или нет, но это однозначно надо учитывать при сравнении результатов их работы. Вообще на сколько мне известно, на сегодняшний момент консорциум по борьбе со спамом определение термина так и не утвердил, но рабочий вариант максимально приближен к определению ЛК.

Второе – в каких условиях сравнивать? Сравнивать надо только на живом потоке почты, а не на старой коллекции спама, потому, что то, что попало в “коллекцию” уже никогда не встретится в реальной жизни и ее фильтрация нам ни о чем реальном не скажет. Все тестируемые антиспамы должны быть поставлены в равные условия, то есть не последовательно, а параллельно. И тестировать надо неделю или две на хорошем потоке, а не на десятке сообщений и не один день.

Третье – что сравнивать кроме скорости. Сравнивать надо 2 величины – уровень детектирования (Detection Rate) и уровень ложных срабатываний (False Positive Rate). Первое число – это число верно распознанных как спам писем поделенное на общее число спама. Это число НИКАК нельзя посчитать при помощи робота потому, что робот не видит собственных ошибок. Уровень ложных срабатываний – это число распознанных как спам нормальных писем поделенное на общее число нормальных писем. Если первый параметр указывают, то второй либо замалчивают либо пишут откровенные небылицы. Нужно помнить, что FPR резко растет с увеличением агрессивности фильтра и, например, при замене антиспама на тупой скрипт “помечать как спам вообще все” и DR и FPR будут равны 100%: 100% спама мы распознаем уверенно, но и все чистые письма тоже зарубим.. Пример реальных цифр – Spam SLA Message Labs гарантирует деньгами 95%DR, 0.0004%FPR.

А теперь, почему антиспам – отстой. Потому, что хороший антиспам при низком FPR (одно на 10000) имеет в реальности DR около 93-96%. То есть например я при хорошем эгрегоре и чистой карме получу 40-70 спамовых писем в день (что собственно и происходит). По опыту, спам начинает бесить пользователя где-то на 14-16 письмах в день, так что меня ярость должна разорвать на куски :-).

Персональный спам

Для того, чтобы понять как нам сделать жизнь удобнее, надо разобраться, как вообще работают антиспамы. Есть 3 больших класса методов борьбы со спамом (классификация моя, можете поправить):
Разграничение прав доступа. То есть блокировка письма по признаку отправителя, не важно как мы его ограничиваем: авторизацией или урезанием пулов IP по DNSBL, greylist’у или как-то еще.

Анализ контента. Когда какой-то нормализованый кусочек письма рассматривается как образец спама, характеристический термин, URI из блек-листа чего угодно (IP, телефоны, URL, whatever).
Статистика. Ведение персональной базы по отдельно взятому потоку спама-неспама любым удобным алгоритмом, например байесом.

Недостаток первого метода в том, что слишком грубая резка порождает ложные срабатывания и RBLы часто обслуживаются полностью невменяемыми людьми. Второго в том, что база сигнатур-признаков-терминов всегда в большей или меньшей степени не поспевает за спамерами и отражают некий усредненный поток, а рассылки нынче уникальные с очень коротким временем жизни. Третьего (кроме традиционной убогости реализации) в вечном мусоре в базе, опасностью перекормить спамом и необходимостью вести статистическую базу для каждого пользователя (если мы хотим хорошего результата), а по сему по моему глубокому убеждению подкрепленному опытом Байесу на серверах делать совершенно нечего. Первый метод используют все, второй – практически все коммерческие вендоры (Message Labs, Yandex, Kasperksy, Symantec), третий – spamassasin и производные, а так же все персональные.

Так как спамассасин все-таки ставят на сервера, а ведением персональных баз никто себя не утруждает, то можно смело заявлять, что ваш серверный антиспам использует анализ некоего усредненного потока, и то, что все-таки проходит к вам в ящик – это либо очень хороший спам, либо “выбросы” из этого среднего потока. Так как хороший спам – это наверняка инновации и его поимку через некоторое время лечит вендор серверного антиспама, то нам следует сосредоточится на “выбросах” – вот тут-то нам и поможет Байес. Он встроен во все персональные антиспамы в том или ином виде с разной степенью убогости (самая убогая реализация – у Microsoft при совершенном отсутствии причин делать плохо очевидные вещи по известным алгоритмам имея в общем полноценный почтовый клиент и не полхой сервер) и так как он наш, то настроить и обучить его мы вполне способны так, чтобы снизить вредное влияние его традиционно большого false positive rate. Мой рецепт счастья: скидывать спам, отфильтрованный им в отдельный ящичек не смешивая со спамом отфильтрованным сервером, чтобы просматривать его перед удалением. Первое время там окажется довольно много нужной почты и потребуется явные корректировки настройки, но месяца через 3 он перестанет фалсить.

 No comments    5   2016   IT   linux   spam
Earlier Ctrl + ↓