Na navigaci | Klávesové zkratky

50MB spamu a jedny Rolexky

E-mailovou složku se spamem a viry mažu až po delší době. Abych náhodou nenávratně neodstranil něco důležitého. Spamový filtr SpamBayes sice funguje spolehlivě, ale je to také díky tomu, že většina „dobré“ pošty mi chodí v češtině, zatímco nabídky na delší sex se zvětšeným údem za poslechu tikotu hodinek Rolex bývají v jazyce anglickém. Takže filtr se někdy chybně snaží uchránit před mým zrakem i e-maily od Google či amerického kamaráda.

Antispamový vs. spamový filtr

Trošku odbočím, ale právě mě trklo, jak spousta lidí používá termín Antispamový filtr. Vlastně většina (1270 : 1199)! Nejsem sice študovanej, ale selský rozum mi říká, že antispamový filtr je zařízení, které odfiltruje opak spamu a samotný spam propustí. K čemu je to dobré, vskutku nevím, ale rozhodně spíš doporučuji používat „spamové filtry“ :-)

Statistika nuda je

Statistika nuda je, má však cenné údaje. Než jsem smazal měsíc starou složku se spamy a viry (nepoužívám e-mailový antivir, spolehlivě jej nahradí spamfiltr), změřil jsem pár hodnot:

Spamů a virů za měsíc listopad 1135ks (32ks / den)
Objem 47MB (1,6MB / den)
Průměrná velikost 1 spamu 41kB

Podívejme se ještě na statistiky, které prezentuje filtr SpamBayes. Údaje jsou za 7 měsíců provozu, nicméně o prázdninách je e-mailů vždy méně, tedy můžeme je považovat za půlroční.

Přijato 11559 e-mailů
Označeno jako spam 66%
Označeno jako dobré 31%
Nebyl si jist 3%
Chybně považováno za spam 0,2%
Chybně označeno jako dobré 0,5% (odhadem)
Poměr spam:dobré 2:1

Nemít občasnou anglickou konverzaci, těch omylů by bylo mnohem méně. Na druhou stranu, zajímala by mě účinnost filtrů u Angličanů a Američanů.

Závěry

A v záveru našej relácie si urobíme volaké závery, hej? Spam

  • Bayesovský filtr je v českém prostředí vynikající
  • Spam tvoří zanedbatelný objem přenesených dat (u mě cca 5%)
  • Poměr spam/antispam není zas tak drtivý, jak jsem se domníval
  • SMS notifikace provedená před filtrováním je dobrá jen pro masochisty

Ale jde o výzkum provedený na jednom jediném vzorku, závěry jsou tedy neobjektivní. Proto bych vyzval čtenáře, zda by se mohli o podělit o své zkušenosti!

Komentáře

  1. kakoo #1

    sms notifikaci mám před spam filtrem – ovšem jen maily, který jsou z .cz … málokdy přijde zahraniční spam s podvrhnutou adresou z .cz… a pokud si budu psát s někým z jiné domény, notifikaci oželím nebo udělám samotný filtr pro něj – mluvím ovšem o t-zones, nevím, jak moc jde nastavovat u ost. operátorů

    před 13 lety
  2. Jiří Bureš http://blog.converter.cz/ #2

    Tak to se máš dobře. Já mám „užitečné“ pošty tak kolem 5 % – viz http://blog.converter.cz/index…

    před 13 lety
  3. Hollyfood #3

    Dejve, docela bych s tebou polemizoval, páč podle tvé definice by antivirové programy propouštěly viry a nezávadné zprávy naopak potíraly. Takže buď je tvá teorie mylná nebo jsou v omyl antivirové firmy (AVG jako takové je omyl v obou případech).

    před 13 lety | reagoval [4] David Grudl
  4. David Grudl http://davidgrudl.com #4

    avatar

    #3 Hollyfoode, jde o kombinaci předpony anti- a slova filtr. Prostě kávový filtr v překapávači zachytává kávu, prachový filtr zachytává prach, spamový filtr zachytává spam a co dělá antispamový filtr? Zachytává anti-spam. A spam propouští dál ;-)

    před 13 lety
  5. MaD #5

    Čistě anglická pošta by měla být ve skutečnosti pro Bayesovské filtry stravitelnější, než takovýto mix, protože ho nebudou mást běžná anglická slova, která ve vaší poště znamenají vysokou pravděpodobnost spamu, zatímco u anglického uživatele budou nezajímavá.

    před 13 lety
  6. Jan Vaněk jr. http://malyctenar.bloguje.cz #6

    Sice taky nejsem studovaný, ale produktivní přípona -ový má rozhodně víc významů než „na X“. Rozhodně dám přednost protitetanové injekci před tetanovou.

    před 13 lety | reagoval [7] David Grudl
  7. David Grudl http://davidgrudl.com #7

    avatar

    #6 Jane Vaňku jr., jsem si to ale zavařil, ač byla poznámka o antiXXX filtru myšlena jako vtípek, teď abych ji obhajoval v každém druhém komentáři ;-)

    před 13 lety
  8. Jakub #8

    avatar

    Dobrý den.
    Nejsem žádný IT profesionál.
    Mám jen jednoduchou otázku:
    mb znamená megabit, megabyte nebo MalýBordel?

    Ve školce nám vychovatelky říkaly, že:
    MB je megabajt
    Mb je megabit
    ale s mb je pro mne absolutní novinka.

    Předem děkuji za odtajnění záhadné zkratky

    před 13 lety | reagoval [9] David Grudl
  9. David Grudl http://davidgrudl.com #9

    avatar

    #8 Jakube, mb? to bude nejspíš Mladá Boleslav, ale ještě to ověřím :-)

    před 13 lety | reagoval [10] Jakub
  10. Jakub #10

    avatar

    #9 Davide Grudle, už vím !!

    mb=malý bobeš :-)

    nebo něco více počítačového?

    před 13 lety
  11. frantisek #11

    avatar

    chodi mi 18 spamu denne (prumer), nejvice 30.11. (34ks)
    i u me jde o zanedbatelne procento prenesenych dat, hlavni cast objemu tvori :-) pps a ppt
    antispamovy filtr jsem pochopil – chyta nespamy, pousti spamy. je to tak?
    a jako pocitacovy neodbornik chapu, ze mluvi li nekdo o objemu prenesenych dat, je velmi nepravdepodobne, ze by ho uvadel v megabitech , ze

    před 13 lety | reagoval [12] David Grudl
  12. David Grudl http://davidgrudl.com #12

    avatar

    #11 frantisku, Jakub má pravdu v tom, že jsem použil špatnou jednotku. A donutil mě tím si konečně zjistit, jak se to správně píše. Teď už jsou jednotky ve článku a nadpisu opravené.

    Jinak zjišťuji, že dlouhodobé statistiky SpamBayes jsou mnohem pozitivnější, než co ukazuje denní praxe. Toho spamu je mnohem větší procento…

    před 13 lety
  13. Mark #13

    avatar

    Myslim ze zrovna na TE strance to maji popsane docela blbe. … mrkni radsi na wikipedii :-) … spravne bys mel mit v clanku jednodku MiB (megabinarybyte – zkracene mebibyte) :-)

    před 11 lety

Tento článek byl uzavřen. Už není možné k němu přidávat komentáře.