Jak poznat registrace s falesnymi udaji?

Hledam tip jak prijit na to, ze nekdo vyplnuje registraci s nesmyslnymi udaji.

falesne registrace

Tohle je typicky priklad. Je potreba vzit v uvahu, ze mame klienty uplne z celeho sveta. To znamena, ze treba nemuzeme jednoduse kontrolovat treba krestni jmeno vuci nejake databazi krestnich jmen.

Nechceme zneprijemnovat zivot vetsine slusnych klientu, ale zaroven chceme presne odchytnout tyto pripady viz. obrazek.

Mate nekdo nejaky prakticky napad jak to vyresit?

Spread the love

45 thoughts on “Jak poznat registrace s falesnymi udaji?

  1. Vidí­m tam dva znaky, podle kterých to lze poznat:
    – málo samohlásek
    – pí­smena jsou na anglické klávesnici podezřele blí­zko sebe

    1. Jeste take velka stejnost pismen napric kolonkami. Mala pismena na zacatku slov (muzou jen lehce ovlivnit spam score). Stejne tak neexistence daneho slova/jmena/mesta/psc ve tve DB muze zhorsit score.

    2. V bezpečnosti se to nazývá Frekvenční­ analýza. Každý jazyk má pro každé pí­smeno pravděpodonost, že nastane. Stejně tak existuje frekvenční­ analýza dvojic, trojic atd. Když se to spojí­, dohromady. Mohlo by to být – s jistou pravděpodobností­ – spolehlivé. Avšak jména apod se nemusí­ shodovat s jazykem. Nicméně adresa/město je vyhledatelná a pokud neexistuje, také to něco naznačuje.

      1. Frekvenční­ analýza je ale podle mě použitelná jenom pro větší­ kusy textu, alespoň několik vět. Z jednoho slova se nic nepozná.

    3. snad nektery captchy a urcite nektery generatory hesel pouzivaji nejaky algoritmus, co vymysli “slova podobna realnym” asi na motivy nejake velke databaze. Mozna ze se pak i rozdily mezi jazyky setrou, nevim

  2. urcite to odchytat jde, jen si priplatit za algorytmus, co to osetri … pokud se totiz bude opakovat ve vice zaznamech formulare, tak se to da osetrit podle me celkem slusne a vyzvat autora, aby proste vyplnil neco jako re-captcha kod … rekni svemu programatorovi, znam kluka, co s nim tady z CR ze Dvora Kralove maka (pro tebe externe), delal vam vypocty prepravneho (asi celej modul, kecal jsem a ukazoval mi) a at mu to posle, jmenuje se Ludva a at mu posle tenhle pozadavek … ma ted cely novy tym, ti kluci jsou namakani, takze to podle me daji 😉 … ale to se musi asi na miru, nic podobneho jako api neznam, ale jsem zvedav, jestli sem nekdo neco neprida, co by to osetrovalo … mimochodem, mas sklady uz v china? neco tam potrebuju prepravovat z cech ci evropy … testovani byznysu cca ted mesic 🙂

  3. Jde o pří­pady, kdy jde o bota, co se ti tam registruje nebo myslí­š, že jde o reálnýho člověka, co pouze vyplní­ nesmyslný údaje? Na první­ pří­pad existuje tuna řešení­, na druhý už je to trochu složitější­. Kontroloval bych to pro začátek jednoduše třeba podle telefonní­ho čí­sla, které musí­ mí­t formát pro danou zemi, stejně tak bych povolil pouze výběr města a státu ze select boxů a přidal několik filtrů na to, jak musí­ vypadat jméno …

    1. Myslim, ze jde o realneho cloveka co proste jen tak prsty brkne do klavesnice adsf asdf.. a rychle to vyplni. Pokazde muze napsat neco jineho. Je to ale minimalni procento.. a kdyz neco budeme delat automaticky tak nechceme zasahnout stovky/tisice dalsich lidi co treba vyplnuji neco trosku v jinem formatu. Jinak vyber statu mesta podle select boxu neresi nas problem. My chceme zabranit podvodnikum co si takto testuji platebni kartu a snazi se otevrit ucet.

      1. Sledujte čas jak dlouho to vyplňuje a logujte ho. Podle mě ten podvodní­k bude mí­t mnohem kratší­ čas vyplnění­. Stejně tak třeba logujte jak dlouho se dí­vá na stránku cení­ku.

      2. podvodnikom nezabranis. ak by som sa na mieste podvodnika snazil otestovat kartu a chcel si otvorit ucet, vymyslel a vyplnil by som realne meno a adresu, napr. nejakeho znameho, neprijemneho suseda, kolegu a pod. 🙂

  4. Jméno zkusit nají­t přes FB API a adresu přes Google Maps? Pokud ti oboje vrátí­ prázdný výsledek, tak ty údaje budou pravděpodobně nesmyslné.

      1. Otevrit treba pres PHP vyhledavani google, vyhledavat “ksfhaksdhfjka”. Kdyz jedno z policek ma malo nalezenych vysledku, tak to predat na kontrolu clovekovi. Te lidske kontrole se asi nevyhnes.

        1. Pokud se přes google vyhledává moc často, tak provoz z dané adresy začne blokovat a zobrazí­ captchu. Vtipné je, že to dělají­ i pro mapové podklady na google maps, takže se tam pak nezobrazují­ mapové podklady. Ale captchu to taky nezobrazí­, protože to očekává obrázek…

  5. ak to robi bot tak nie je jednoduchy sposob ako osetrit vstupy, lebo aj ked sa podari osetrit nezmyselne slova, bot moze zacat pouzivat mena z kalendara. najlepsie je pouzivatela overovat napr pomocou potvrdenia emailovej adresy. este lepsie je ziskat od pouzivatela mobilne cislo a poslat mu overovaciu sms, aj ked to asi nebude najjednoduchsie urobitelne pre cely svet’¦ kazdopadne to 100%tne funguje. Iny sposob overenia by este mohol byt pomocou kreditnej karty. jednoducho je potrebne vymysliet overenie takym sposobom, ktore bot nedokaze okabatit.

    to iste riesenie by mohlo platit aj v tom pripade, ak tieto udaje vyplna zivy clovek – ak by bol nuteny zadat cislo kreditnej karty, tak zada aj svoje meno.

    1. SMS ping není­ řešení­m, je mraky služeb, které mají­ spousty čí­sel, které lze k tomu použí­t a přijaté SMS automaticky zobrazí­ na webu. Takže se potvrdí­ existují­cí­ čí­slo, ale nikoli to, že ten telefon má někdo konkrétní­ v ruce…

  6. Za jakym ucelem si ti lide ten ucet vytvari, kdyz v nem maji jen same nesmyslne udaje? Na danou adresu a jmeno jim asi nikdy zadnej balik neprijde 🙂

    Myslim, ze spolehliva detekce fake uctu bude problem, staci chvili hledat a clovek najde veci jako http://www.fakenamegenerator.com/ ktere generuji zcela verohodne udaje, ktere overit bez skutecneho overeni proti nejakemu registru adres apod.

  7. Chce to sehnat si databázi jmen různých zemí­ a proti ní­ to porovnávat. Bohužel, pokud bude kontrola při vyplnění­ formuláře upozorňovat na nesrovnalosti, tak dojde k tomu, že pak uživatel bude vyplňovat na první­ pohled správné údaje. Popravdě je to nekonečný boj. Dle mého názoru je lepší­ to neřešit. Čí­m lépe bude maskovaná falešná registrace, tí­m těžší­ bude jí­ odhalit. Pálcnutí­ do klávesnice je viditelné na první­ pohled.

  8. Kolik tech registraci denne je? V cen spociva ten problem ze nekdo vypni takovou fake registraci? Objednavaji neco ? Zajimalo by me z jakyho duvodu nekdo vubec vyplni takovou registraci – co mu to prinese?

    Se jmenama podle me nic neudelas – dulezita je adresa.

    Co takhle manualni overeni ? Najmout si nejakeho “inda” ktery kazdej den zkontroluje registrace?

    Pokud to musi byt automaticky tak pres google maps existuje geocoding kterej vraci urcity “zoom” attribute podle ktereho se pozna jak je ktera adresa “presna” – staci to volat pres javascript na tom formularovym okynku. Zaroven i kdyz ten JS vrati neco jako “risk” tak registraci povolit ale poslat nekomu upozorneni at to checkne.

  9. Ja bych asi zkusil par rychlych a jednoduchych score algoritmu jak uz tady bylo navrhovano a podezrele registrace bundlovat rekneme po 100 do tasku a pustit na ne mechanickeho Turka:
    https://www.mturk.com

    Kazdopadne bych se ale nejdrive opravdu zamyslel nad odstranenim incentiv proc to ty lidi delaji.

  10. Resil bych to jednoduse. Kombinace odeslani registrace od nacteni registracniho formulare + kontrola jmena podle databaze/slovniku vsech jmen.

    Pokud jedno z toho neprojde, bude podezrely. Povolil bych registraci dokoncit jenom odelanim fotokopie pasu. Hotovo.

  11. Co třeba testování­ ZIP (PSČ) a města, zda to odpoví­dá skutečnosti. Musí­ existovat databáze ulic, měst a PSČ pro všechna mí­sta světa. A pokud by někdo zadal PSČ neodpoví­dají­cí­ danému městu nebo ulici nebo pokud by nezadal žádnou ulici či město, tak by se nešlo registrovat. Viděl jsem to na jednom anglickém webu, kde to fungovalo super. Tohle by vyfiltrovalo hodně podvodní­ků.

    1. Dalsi co zije v bludu ze ZIP je vsude. Jak ja tyhle naivky nenavidel kdyz jsem bydlel v Irsku, kde ZIP nevedou a v klidu zijou….

  12. Setkal jsem se s těmito objednávkami od konkurence. Tí­m, že u mne 1x za týden udělali falešnou objednávku, zjistili přesný počet přijatých objednávek a dokázali si udělat představu o obratu. Změnil jsem čí­slování­ objednávek, tak aby nebylo čí­slováno postupně od 1. Předpokládám, že máš tyto čí­sla zašifrována, třeba se je snaží­ rozšifrovat.

  13. Co je jednoduché a dá se rychle realizovat je geolokace uživatele vyplňují­cí­ formulář napří­klad pomocí­ DB/API (https://www.maxmind.com/en/geolocation_landing) a následné porovnání­ se Zemí­/Regionem uvedeným ve formuláři. Pokud nesouhlasí­, zařadit k “ruční­mu” posouzení­.
    Toto se dá jednoduše vylepšit o blacklist IP adres / zemí­ často použí­vaných pro SPAM.

  14. Podle mě se to může lišit v rychlosti vyplňování­ (dá se zjistit pomocí­ Javascriptu), což by šlo použí­t jako 1 parametr v scoringovém systému, který by mohl využí­t i ostatní­ zde uvedené nápady.
    Pro vytvoření­ prediktivní­ho modelu by šlo pak využí­t soutěž na http://www.kaggle.com/

  15. Mě to spí­š připadá, že od uživatelů chcete při registraci zbytečné
    údaje. Kdyby ty údaje k něčemu byly, tak je uživatel bude muset vyplnit
    správně.

  16. Myslí­m, že tyto registrace vznikají­, protože lidé chtějí­ vědět co je uvnitř, ale ještě nejsou rozhodnutí­ službu použí­vat. Nebo např chtějí­ vědět kolik je bude něco stát atd… Jestli by nebylo nejlepší­ udělat tlačí­tko “login as guest”, kde se to člověka zeptá třeba jenom na zemi (aby se daly počí­tat poštovné atd) a bude tam ten user jako přihlášený, a bude moct dělat téměř vše, akorát se takové “objednávky” nebudou zpracovávat, ale zahazovat. pří­padně se mu nabí­dne formulář na registraci. Ale až úplně jako poslední­ věc.

  17. za takymi vecami su casto nakodene roboty, ktore hladaju formulare a automaticky ich vyplnaju (vacsinou so snahou o spamovanie linkami ci za tym ucelom vytvorenej registracie). velmi pekne vie pomoct strasne jednoducha vec – pri nacitani podstranky si ulozit trebars do session cas nacitania a pri pokuse o odoslanie formulara tento cas porovnat s casom odoslania. clovek prakticky nedokaze vyplnit ten formular “rychlo” – trebars za 2s (zalezi na jeho zlozitosti, umiestneni na webe atd) a naopak roboty idu po kode, ako dostanu kod, najdu v nom co potrebuju a odosielaju request rpakticky hned (len velmi malo je ich sofistikovanejsich a s tymto druhom ochrany rata).

  18. Johne a není­ nejprve lepší­ jako první­ krok zjistit kdo se takto registruje a proč?
    * pokud je to spambot je to jasné, je třeba ho blokovat
    * pokud zvědavý uživatel/zájemce, možná stojí­ za zvážení­ varianta Logon as Guest
    pří­padně zjistit/zvážit jiné důvody a na ně reagovat …

      1. a neví­š jestli to je člověk? nebo nějaký bot? když se tak ptáš tak asi člověk … pak asi nejlepší­ bude použí­t nějaký algoritmus co byl navržen výše a řeší­:
        – málo samohlásek
        – pí­smena jsou na anglické klávesnici podezřele blí­zko sebe

        co mne ještě napadá a neuvádí­š v dotazu – co požadovat pro registraci ověření­ skrze email?

Leave a Reply

Your email address will not be published. Required fields are marked *