Ze všech vašich osobních údajů je e-mail pravděpodobně ten nejčastější, který zadáváte na internetu. Ne náhodou nám při testování objednávek na e-shopech vyšlo, že e-mail je jeden z kamenů úrazu při nákupech. Při procházení databází odběratelů v newsletterech nejsou zkomolené e-maily ničím vyjímečným. Ukážu vám pár zlepšováků, kterými se nám podařilo snížit poměr špatných e-mailů.

Překlepy, zapomenuté domény a čárky

Při pohledu na spoustu běžných uživatelů u počítače získáte pocit, že při kontaktu s klávesnicí najednou zpomalí, znervózní a v neposlední řadě – začnou dělat chyby. Ať už z nervozity nebo z nepozornosti, veliká spousta špatných záznamů byla způsobena banálními překlepy, mezi nimi např.:

  • čárky místo teček
  • dva zavináče
  • mezery uprostřed slov či za interpunkcí
  • chybějící TLD (seznam místo seznam.cz)
  • diakritika
  • do pole pro e-mail předvyplňujeme zavináč (je dost zákazníků, kteří jej neumí s jistotou napsat) – stane se pak ale, že jej někdo zapomene na začátku či konci adresy

U podobných chyb je skoro jisté, že jde pouze o překlep, a tak jsme je začali automaticky opravovat.

Česká vs. anglická klávesnice je nejen častým namětem na flame u nás v kanceláři, ale i další z příčin špatně zadaných adres. seynam.cy či ayet.sk jsou poměrně časté případy. Určitě sami naleznete další podobné případy.

Zapeklitá validace

Většina kódu, se kterým jsem se setkal, validovala e-maily regulárními výrazy. Většinou nejsou 100% spolehlivé, pro představu korektního výrazu splňujícího požadavky RFC822 pro adresy se podívejete na tento regex z Perlu (pozor, je to bestie). Pokud byste chtěli použít e-mail s méně častým znakem (třeba pluskem), počítejte s tím, že na mnoha službách nepochodíte.

Existují pěkné přehledy shrnující různé přístupy a jejich výsledky nad poměrně různorodou sadou platných i neplatných adres. Regex s nejlepšími výsledky v právě odkázaném přehledu se používá v PHP funkci filter_var, nevidím tedy důvod nepoužít právě ji.

V dalším díle rád ukážu některé další metody, pokud to opravdu myslíme vážně. Např. při čištění databáze newsletteru pro získání přesnějších statistik. Řeč bude mj. o MX záznamech, spam blacklistech či SMTP serverech.

Tagged with:
 

Napsat komentář

Vaše emailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *