Backup (опять)

Если не нужен NAS/SAN, то WD MyBook решает. Ну и пусть он дороже просто харда + просто коробка процентов на 15-20. За то он dramatically тише, у него не греется блок питания и он не страшный. Даже на шкаф его теперь жалко отправлять.

Купил, потому, что сисадмины получили от моего отдела целых 2 мертвых харда, а виновный блок питания при смерти еще и фейрверк исполнил. Вот и решил, что дома тоже надо себя обезопасить – теперь backup покрывает 100% моего двоичного мусора.

Антиспам – отстой

Любой антиспам – отстой с точки зрения конечного пользователя, если конечный пользователь пользуется своим почтовым адресом достаточно активно и долго.

Антиспамами принято меряться, давать им разные крутые награды и хвалить на форумах. Я хочу рассказать о том, как ими меряться правильно и что следует из измерений.

Сначала надо определиться, что есть спам. Вопрос не так прост, как кажется. Вот так определяет спам Лаборатория Касперского: “Массовая не запрошенная анонимная рассылка”. Массовая – потому, что единичный blackmail не есть результат работы спамера, а есть просто частный конфликт двух-трех людей. Незапрошенная – потому, что запрошенная реклама – не спам, ведь пользователь сам хотел ее у себя видеть и спамфильтр ее резать не должен. Анонимная (технически), потому, что с непрошенными письмами людей, которые себя никак не скрывают вопрос решают административно. Яркий пример таких писем – разные повестки или оповещения. Важность этого определения в том, что например, Яндекс спам определяет иначе, у него это “вся нежелательная почта и все рассылки”. Можно дискутировать на тему правы они или нет, но это однозначно надо учитывать при сравнении результатов их работы. Вообще на сколько мне известно, на сегодняшний момент консорциум по борьбе со спамом определение термина так и не утвердил, но рабочий вариант максимально приближен к определению ЛК.

Второе – в каких условиях сравнивать? Сравнивать надо только на живом потоке почты, а не на старой коллекции спама, потому, что то, что попало в “коллекцию” уже никогда не встретится в реальной жизни и ее фильтрация нам ни о чем реальном не скажет. Все тестируемые антиспамы должны быть поставлены в равные условия, то есть не последовательно, а параллельно. И тестировать надо неделю или две на хорошем потоке, а не на десятке сообщений и не один день.

Третье – что сравнивать кроме скорости. Сравнивать надо 2 величины – уровень детектирования (Detection Rate) и уровень ложных срабатываний (False Positive Rate). Первое число – это число верно распознанных как спам писем поделенное на общее число спама. Это число НИКАК нельзя посчитать при помощи робота потому, что робот не видит собственных ошибок. Уровень ложных срабатываний – это число распознанных как спам нормальных писем поделенное на общее число нормальных писем. Если первый параметр указывают, то второй либо замалчивают либо пишут откровенные небылицы. Нужно помнить, что FPR резко растет с увеличением агрессивности фильтра и, например, при замене антиспама на тупой скрипт “помечать как спам вообще все” и DR и FPR будут равны 100%: 100% спама мы распознаем уверенно, но и все чистые письма тоже зарубим.. Пример реальных цифр – Spam SLA Message Labs гарантирует деньгами 95%DR, 0.0004%FPR.

А теперь, почему антиспам – отстой. Потому, что хороший антиспам при низком FPR (одно на 10000) имеет в реальности DR около 93-96%. То есть например я при хорошем эгрегоре и чистой карме получу 40-70 спамовых писем в день (что собственно и происходит). По опыту, спам начинает бесить пользователя где-то на 14-16 письмах в день, так что меня ярость должна разорвать на куски :-).

В следующий раз расскажу о методах повышения уровня до 99% в личном ящике.

Шнурки USB 2.0

Как оказалось, вполне себе реально пойти в магазин и купить шнур USB 2.0 A-B длиной 5 метров. Как раз столько, сколько нужно для успешной отправки обоих хардов прямиком на шкаф, где их не видно и не слышно.

ГОСТ

Сегодня читал технические требования на ПО, которые ваяли по ЕСКД. Мама дорогая! Рамочки на каждом листе, “проверил”, “разработал”, таинственная “литера”. Нет, я понимаю, почему ГОСТы требуют использование определенной марки клея ПВА и чернил для маркировки коробок. Я даже могу осознать зачем в требованиях температура, давление и влажность. Но вот почему при проведении испытаний эти температуры-давления надо мерить около CD, на который продукт записан? Такое впечатление, что ГОСТ больше заботится о том, что CD будет читаться, чем о том, что программа заработает.

Нашел еще тупак – компьютер должен быть совместим с IBM PC AT. Это между прочим довольно жестко ограниченное семейство продукции IBM, оснащенное процессором Intel 80286, мегабайтом оперативки и 24х битной шиной. Его прекратили производить в 1987 году и как туда ставить Win2003 Server?

Потому, что когда процесс и стандарт становятся формальностью и просто “рыбой”, в которую пихают тексты, его надо менять.

Support&HelpDesk

Ну почему мир столь не совершенен!

Microsoft CRM – отличный модуль продажи и маркетинга, поддержки почти нет. Разграничения прав доступа нет. Ролей нет. Распределенной работы нет. Поддержки SLA/OLA нет.UNICODE есть, но локализация может быть только 1.Интерфейс модифицировать можно только через задницу. Тормозит.

FrontRange Heat – формально есть отсутствующее у MS CRM, но реально все присыпано толстым слоем ошибок ПО и дурацких ограничений вроде “журнальные записи не подпадают под разделения прав доступа”. Нет юникода. За то шустрая.

SugarSRM – вроде все хорошо, но опять же, все для sales/marketing, а поддержка базовая.

OTRS – хорошо заточено под простой incedent tracking, но эскалаций инцидентов на разработчиков нет, SLA нет.

SalesForce – опять продажи + все данные на сервере 3й стороны (нельзя).

Нет, конечно же все хорошо и замечательно в HP/OpenView, BMC Remedy или SAP/R3, но они дорого стоят. Я не понимаю, почему в MS CRM или Heat так сложно сделать правило “информировать вот этот контакт, когда вот этот инцидент никем не трогался более N часов”?

Спам

Сколько вам приходит спама в день? Мне около 1000-1500 сообщений на abondarenko@gmail.com и корпоративный ящик. Это много, друзья, не даст мне соврать, но эти адреса принадлежат живому человеку и им больше 5 лет.

Нормальные люди решают задачи минимизации потока мусора в свои ящики, а мне как-то довелось решать обратную задачу, мне нужно было сделать спам-ловушки, то есть адреса, на которые будет приходить 100% спам дабы можно было обучать фильтры и смотреть статистику их работы. Казалось бы, чего проще! Ну зарегистрируем мы немного ящиков на разных сервисах платных и не очень, заведем какой-нибудь неприметный домен с ничего не говорящим именем digitalhardcore.us, будем эти адреса оставлять в регистрационных карточках заказа рекламы Pfizer’a и еще какой-нибудь дряни (естественно, отписавшись сразу же от легитимной рекламы) и дело в шляпе. И так, что было сделано:

1 – Несколько адресов на mail.com, yahoo.com и еще где-то с форвардом на приемник потока у нас.
2 – digitalhardcore.us, вся почта с которого форвардится на тот же приемник.
3 – Регистрируемся на множестве сайтов разной направленности от торрент-трекеров и обзоров железа до секс-шопов оставляя там эти адреса
4 – Постим на форумах разные нейтральные комментарии указывая в подписях адреса

Результат выполнения пунктов 3 и 4 ночными дежурными за 1 год – около 100 писем в день на адрес (плюс-минус), хотя ожидался на порядок больше.

Второй интересный момент: на 1 адрес мы собирали “не спам”, то есть рекламу уважаемых контор вроде cocacola или hp чтобы тестировать себя на ложные срабатывания. Результат через год – 10-20 спамовых писем в день в потоке честной рекламы, хотя адрес живым людям кроме меня был не известен.

Третий интересный момент относится уже к наблюдению за личным потоком: стоит написать какому-нибудь недалекому человеку и характер спама меняется. Появляется реклама продуктов, которых раньше не было, его становится заметно больше. Происходит это потому, что у недалеких людей есть трояны, которые извлекают полезные сведения из их переписки.

Отсюда лично я делаю выводы:

1 – крупные неуважаемые места торгуют базами пользователей (удав, фишки)
2 – крупные уважаемые места ими не торгуют (LOR, Lepra), но некоторые все-таки торгуют
3 – основной метод сбора адресов для набития баз – это не прочесывание стайтов и перебор имен, а потрошение записных книжек почтовиков троянами.

По этому можете смело писать свои адреса без дурацких _at_ или _здесь_была_собака_, форумы – капля в море.

PS

В следующий раз расскажу про хорошие потоки и как меряться антиспамами.

Киборги вокруг

Если верить киношникам, мы загружены в Матрицу. Я отказываюсь верить в существования некоторых людей, серьезно. Вот например, у дома на перекрестке Дорогомиловской и Можайского вала в метель и слякоть регулярно встречаю девушек в замшевой белой обуви и таких меховых топиках с голой спиной-животом. Им не холодно в -10 и к ним не липнет грязь не потому, что они такие идеальные, а потому, что это просто декорации, которые забывают менять когда меняют погоду.

С легкой руки ivlad’a обнаружил, что Арви-хакир вроде как жив, но почитав его ЖЖ тоже отказываюсь в него верить.

Отпуск

Какое-то дурацкое ощущение перманентного Воскресенья – я не на работе и не уехал куда подальше. А жизнь вокруг бурлит, новости есть, народ что-то делает…

Мышки

Пришлось поменять модные Mightymouse на работе и Mightymouse wireless дома, так как у них окончательно отказали волшебные шарики, а пользоваться мышью без скролла как-то странно. На работе взял какой-то Logitech, а домой купил Logitech MX-400. Выяснил, что для MacOs но подходит отлично, так как есть конфигуратор кнопок, на дополнительные легко легли Dashboard и Expose. В качестве побочного эффекта отвязал Expose от 3й кнопки, теперь ссылки открываются в новом табе так же как в других ОС.

А еще я узнал от ixbt, что мыши за 50$ – бюджетные.

Неисправности

Суммируя свой опыт поддержки пользователей в не самых простых случаях (а так же найдя место, где пропадал аудиосингал в машине) попробую составить топ-лист мест, где ломается самым неочевидным образом:

1 – Интерфейсы. В сегда что-то недодокументировано, недоделано, сломана обратная совместимость или просто есть что-то не продумано. При этом чем более закрытый и чем менее популярный интерфейс, тем больше проблем. А физические интерфейсы еще подвержены выламыванию и разбалтыванию.

2 – Конфигурационные файлы, управление и настройки, которые тоже на самом деле интерфейсы, только для работы с пользователем.

3 – Пользователь, который не прав, потому, что не читал документацию или не знает чем заняться. Очень плохо то, что в голову пользователю залезть нельзя и знание передается с проблемами из пункта 1.

А вот брак, ошибки и разного рода повреждения идут в конце. Потому что когда ломается деталь или когда в программе ошибка, то все упирается в воспроизведение-исправление-замену сразу же после решения пункта 3. В конце концов, детали и программы делают профессионалы и тестируют QA, а вот что придумывает пользователь и как он может переделать продукт угадать очень сложно.