Klávesové zkratky na tomto webu - rozšířené Na obsah stránky

1
prsinec
2004

50MB spamu a jedny Rolexky

Spam E-mailovou složku se spamem a viry mažu až po delší době. Abych náhodou nenávratně neodstranil něco důležitého. Spamový filtr SpamBayes sice funguje spolehlivě, ale je to také díky tomu, že většina „dobré“ pošty mi chodí v češtině, zatímco nabídky na delší sex se zvětšeným údem za poslechu tikotu hodinek Rolex bývají v jazyce anglickém. Takže filtr se někdy chybně snaží uchránit před mým zrakem i e-maily od Google či amerického kamaráda.

Antispamový vs. spamový filtr

Spam Trošku odbočím, ale právě mě trklo, jak spousta lidí používá termín Antispamový filtr. Vlastně většina (1270 : 1199)! Nejsem sice študovanej, ale selský rozum mi říká, že antispamový filtr je zařízení, které odfiltruje opak spamu a samotný spam propustí. K čemu je to dobré, vskutku nevím, ale rozhodně spíš doporučuji používat „spamové filtry“ :-)

Statistika nuda je

Statistika nuda je, má však cenné údaje. Než jsem smazal měsíc starou složku se spamy a viry (nepoužívám e-mailový antivir, spolehlivě jej nahradí spamfiltr), změřil jsem pár hodnot:

Spamů a virů za měsíc listopad 1135ks (32ks / den)
Objem 47MB (1,6MB / den)
Průměrná velikost 1 spamu 41kB

Podívejme se ještě na statistiky, které prezentuje filtr SpamBayes. Údaje jsou za 7 měsíců provozu, nicméně o prázdninách je e-mailů vždy méně, tedy můžeme je považovat za půlroční.

Přijato 11559 e-mailů
Označeno jako spam 66%
Označeno jako dobré 31%
Nebyl si jist 3%
Chybně považováno za spam 0,2%
Chybně označeno jako dobré 0,5% (odhadem)
Poměr spam:dobré 2:1

Nemít občasnou anglickou konverzaci, těch omylů by bylo mnohem méně. Na druhou stranu, zajímala by mě účinnost filtrů u Angličanů a Američanů.

Závěry

A v záveru našej relácie si urobíme volaké závery, hej? Spam

  • Bayesovský filtr je v českém prostředí vynikající
  • Spam tvoří zanedbatelný objem přenesených dat (u mě cca 5%)
  • Poměr spam/antispam není zas tak drtivý, jak jsem se domníval
  • SMS notifikace provedená před filtrováním je dobrá jen pro masochisty

Ale jde o výzkum provedený na jednom jediném vzorku, závěry jsou tedy neobjektivní. Proto bych vyzval čtenáře, zda by se mohli o podělit o své zkušenosti!

napsáno 1. 12. 2004 | shlédnuto 5756x | nahoru

Komentáře RSS 2.0 komentářů » přidat

#1 kakoo nový

sms notifikaci mám před spam filtrem – ovšem jen maily, který jsou z .cz … málokdy přijde zahraniční spam s podvrhnutou adresou z .cz… a pokud si budu psát s někým z jiné domény, notifikaci oželím nebo udělám samotný filtr pro něj – mluvím ovšem o t-zones, nevím, jak moc jde nastavovat u ost. operátorů

Posláno 1. 12. 2004 v 18.19 | Odpovědět

#2 Jiří Bureš http://blog.converter.cz/ nový

Tak to se máš dobře. Já mám „užitečné“ pošty tak kolem 5 % – viz http://blog.converter.cz/index…

Posláno 2. 12. 2004 ve 14.52 | Odpovědět

#3 Hollyfood nový

Dejve, docela bych s tebou polemizoval, páč podle tvé definice by antivirové programy propouštěly viry a nezávadné zprávy naopak potíraly. Takže buď je tvá teorie mylná nebo jsou v omyl antivirové firmy (AVG jako takové je omyl v obou případech).

Posláno 2. 12. 2004 v 15.47 | Odpovědět
Na komentář reagoval [4] David Grudl
avatar

#4 David Grudl http://davidgrudl.com nový

#3 Hollyfood: jde o kombinaci předpony anti- a slova filtr. Prostě kávový filtr v překapávači zachytává kávu, prachový filtr zachytává prach, spamový filtr zachytává spam a co dělá antispamový filtr? Zachytává anti-spam. A spam propouští dál ;-)

Posláno 2. 12. 2004 v 18.06 | Odpovědět

#5 MaD nový

Čistě anglická pošta by měla být ve skutečnosti pro Bayesovské filtry stravitelnější, než takovýto mix, protože ho nebudou mást běžná anglická slova, která ve vaší poště znamenají vysokou pravděpodobnost spamu, zatímco u anglického uživatele budou nezajímavá.

Posláno 4. 12. 2004 v 16.04 | Odpovědět

#6 Jan Vaněk jr. http://malyctenar.bloguje.cz nový

Sice taky nejsem studovaný, ale produktivní přípona -ový má rozhodně víc významů než „na X“. Rozhodně dám přednost protitetanové injekci před tetanovou.

Posláno 7. 12. 2004 ve 13.20 | Odpovědět
Na komentář reagoval [7] David Grudl
avatar

#7 David Grudl http://davidgrudl.com nový

#6 Jan Vaněk jr.: jsem si to ale zavařil, ač byla poznámka o antiXXX filtru myšlena jako vtípek, teď abych ji obhajoval v každém druhém komentáři ;-)

Posláno 7. 12. 2004 ve 20.32 | Odpovědět
avatar

#8 Jakub nový

Dobrý den.
Nejsem žádný IT profesionál.
Mám jen jednoduchou otázku:
mb znamená megabit, megabyte nebo MalýBordel?

Ve školce nám vychovatelky říkaly, že:
MB je megabajt
Mb je megabit
ale s mb je pro mne absolutní novinka.

Předem děkuji za odtajnění záhadné zkratky

Posláno 12. 12. 2004 v 1.09 | Odpovědět
Na komentář reagoval [9] David Grudl
avatar

#9 David Grudl http://davidgrudl.com nový

#8 Jakub: mb? to bude nejspíš Mladá Boleslav, ale ještě to ověřím :-)

Posláno 12. 12. 2004 ve 13.13 | Odpovědět
Na komentář reagoval [10] Jakub
avatar

#10 Jakub nový

#9 David Grudl: už vím !!

mb=malý bobeš :-)

nebo něco více počítačového?

Posláno 13. 12. 2004 v 19.15 | Odpovědět
avatar

#11 frantisek nový

chodi mi 18 spamu denne (prumer), nejvice 30.11. (34ks)
i u me jde o zanedbatelne procento prenesenych dat, hlavni cast objemu tvori :-) pps a ppt
antispamovy filtr jsem pochopil – chyta nespamy, pousti spamy. je to tak?
a jako pocitacovy neodbornik chapu, ze mluvi li nekdo o objemu prenesenych dat, je velmi nepravdepodobne, ze by ho uvadel v megabitech , ze

Posláno 14. 12. 2004 ve 23.32 | Odpovědět
Na komentář reagoval [12] David Grudl
avatar

#12 David Grudl http://davidgrudl.com nový

#11 frantisek: Jakub má pravdu v tom, že jsem použil špatnou jednotku. A donutil mě tím si konečně zjistit, jak se to správně píše. Teď už jsou jednotky ve článku a nadpisu opravené.

Jinak zjišťuji, že dlouhodobé statistiky SpamBayes jsou mnohem pozitivnější, než co ukazuje denní praxe. Toho spamu je mnohem větší procento…

Posláno 15. 12. 2004 v 8.40 | Odpovědět
avatar

#13 Mark nový

Myslim ze zrovna na TE strance to maji popsane docela blbe. … mrkni radsi na wikipedii :-) … spravne bys mel mit v clanku jednodku MiB (megabinarybyte – zkracene mebibyte) :-)

Posláno 14. 7. 2006 ve 21.26 | Odpovědět

Tento článek byl uzavřen. Už není možné k němu přidávat komentáře.

Výtah na začátek článku na první komentář

Názory čtenářů v diskusích nejsou názory provozovatele webu, a ten za jejich obsah neodpovídá.

Poslední články

Projekty

Statistiky

Odběr zpráv