Jak poznat registrace s falesnymi udaji?

July 8, 2014Poradna & dotazyJohn

Hledam tip jak prijit na to, ze nekdo vyplnuje registraci s nesmyslnymi udaji.

Tohle je typicky priklad. Je potreba vzit v uvahu, ze mame klienty uplne z celeho sveta. To znamena, ze treba nemuzeme jednoduse kontrolovat treba krestni jmeno vuci nejake databazi krestnich jmen.

Nechceme zneprijemnovat zivot vetsine slusnych klientu, ale zaroven chceme presne odchytnout tyto pripady viz. obrazek.

Mate nekdo nejaky prakticky napad jak to vyresit?

Spread the love

45 thoughts on “Jak poznat registrace s falesnymi udaji?”

janmarek says:

July 8, 2014 at 12:37 pm

Vidím tam dva znaky, podle kterých to lze poznat:
– málo samohlásek
– písmena jsou na anglické klávesnici podezřele blízko sebe

Reply
1. Michal Špaček says:
  
  July 8, 2014 at 12:53 pm
  
  To “podezřele blízko” je dobrý nápad. Existuje Ruby program, který určuje skí³re hesel podle toho, jestli představují nějaký pattern na klávesnici. Možná by se dalo z toho inspirovat: http://digi.ninja/projects/passpat.php
  
  Reply
  1. John says:
    
    July 8, 2014 at 12:53 pm
    
    zajimavy
    
    Reply
2. Vitezslav Valka says:
  
  July 8, 2014 at 1:06 pm
  
  Jeste take velka stejnost pismen napric kolonkami. Mala pismena na zacatku slov (muzou jen lehce ovlivnit spam score). Stejne tak neexistence daneho slova/jmena/mesta/psc ve tve DB muze zhorsit score.
  
  Reply
3. Stanislav Špek says:
  
  July 8, 2014 at 2:28 pm
  
  V bezpečnosti se to nazývá Frekvenční analýza. Každý jazyk má pro každé písmeno pravděpodonost, že nastane. Stejně tak existuje frekvenční analýza dvojic, trojic atd. Když se to spojí, dohromady. Mohlo by to být – s jistou pravděpodobností – spolehlivé. Avšak jména apod se nemusí shodovat s jazykem. Nicméně adresa/město je vyhledatelná a pokud neexistuje, také to něco naznačuje.
  
  Reply
  1. Mi. Chal. says:
    
    July 8, 2014 at 2:49 pm
    
    Frekvenční analýza je ale podle mě použitelná jenom pro větší kusy textu, alespoň několik vět. Z jednoho slova se nic nepozná.
    
    Reply
    1. Stanislav Špek says:
      
      July 8, 2014 at 2:53 pm
      
      To ano, ale hlouposti typu klklklk by to odhalit mělo.
      
      Reply
4. J. says:
  
  July 8, 2014 at 2:36 pm
  
  snad nektery captchy a urcite nektery generatory hesel pouzivaji nejaky algoritmus, co vymysli “slova podobna realnym” asi na motivy nejake velke databaze. Mozna ze se pak i rozdily mezi jazyky setrou, nevim
  
  Reply
David Dobrovolný says:

July 8, 2014 at 12:46 pm

urcite to odchytat jde, jen si priplatit za algorytmus, co to osetri … pokud se totiz bude opakovat ve vice zaznamech formulare, tak se to da osetrit podle me celkem slusne a vyzvat autora, aby proste vyplnil neco jako re-captcha kod … rekni svemu programatorovi, znam kluka, co s nim tady z CR ze Dvora Kralove maka (pro tebe externe), delal vam vypocty prepravneho (asi celej modul, kecal jsem a ukazoval mi) a at mu to posle, jmenuje se Ludva a at mu posle tenhle pozadavek … ma ted cely novy tym, ti kluci jsou namakani, takze to podle me daji 😉 … ale to se musi asi na miru, nic podobneho jako api neznam, ale jsem zvedav, jestli sem nekdo neco neprida, co by to osetrovalo … mimochodem, mas sklady uz v china? neco tam potrebuju prepravovat z cech ci evropy … testovani byznysu cca ted mesic 🙂

Reply
Vaclav Bedrich says:

July 8, 2014 at 12:47 pm

Jde o případy, kdy jde o bota, co se ti tam registruje nebo myslíš, že jde o reálnýho člověka, co pouze vyplní nesmyslný údaje? Na první případ existuje tuna řešení, na druhý už je to trochu složitější. Kontroloval bych to pro začátek jednoduše třeba podle telefonního čísla, které musí mít formát pro danou zemi, stejně tak bych povolil pouze výběr města a státu ze select boxů a přidal několik filtrů na to, jak musí vypadat jméno …

Reply
1. John says:
  
  July 8, 2014 at 12:52 pm
  
  Myslim, ze jde o realneho cloveka co proste jen tak prsty brkne do klavesnice adsf asdf.. a rychle to vyplni. Pokazde muze napsat neco jineho. Je to ale minimalni procento.. a kdyz neco budeme delat automaticky tak nechceme zasahnout stovky/tisice dalsich lidi co treba vyplnuji neco trosku v jinem formatu. Jinak vyber statu mesta podle select boxu neresi nas problem. My chceme zabranit podvodnikum co si takto testuji platebni kartu a snazi se otevrit ucet.
  
  Reply
  1. Pavel Beran says:
    
    July 8, 2014 at 1:01 pm
    
    Sledujte čas jak dlouho to vyplňuje a logujte ho. Podle mě ten podvodník bude mít mnohem kratší čas vyplnění. Stejně tak třeba logujte jak dlouho se dívá na stránku ceníku.
    
    Reply
  2. Palo says:
    
    July 9, 2014 at 12:48 am
    
    podvodnikom nezabranis. ak by som sa na mieste podvodnika snazil otestovat kartu a chcel si otvorit ucet, vymyslel a vyplnil by som realne meno a adresu, napr. nejakeho znameho, neprijemneho suseda, kolegu a pod. 🙂
    
    Reply
Tom Bartoň says:

July 8, 2014 at 12:51 pm

Jméno zkusit najít přes FB API a adresu přes Google Maps? Pokud ti oboje vrátí prázdný výsledek, tak ty údaje budou pravděpodobně nesmyslné.

Reply
1. John says:
  
  July 8, 2014 at 12:52 pm
  
  No ale to je mysleni treba pro US trh nebo EU trh.. ale co treba Cina, Rusko.. kde ten FB zas tak nefrci
  
  Reply
  1. Pét'a Sla'mů says:
    
    July 8, 2014 at 1:09 pm
    
    Otevrit treba pres PHP vyhledavani google, vyhledavat “ksfhaksdhfjka”. Kdyz jedno z policek ma malo nalezenych vysledku, tak to predat na kontrolu clovekovi. Te lidske kontrole se asi nevyhnes.
    
    Reply
    1. Mi. Chal. says:
      
      July 8, 2014 at 2:52 pm
      
      Pokud se přes google vyhledává moc často, tak provoz z dané adresy začne blokovat a zobrazí captchu. Vtipné je, že to dělají i pro mapové podklady na google maps, takže se tam pak nezobrazují mapové podklady. Ale captchu to taky nezobrazí, protože to očekává obrázek…
      
      Reply
    2. Tomáš Fejfar says:
      
      July 8, 2014 at 4:00 pm
      
      https://www.google.com/webhp?sourceid=chrome-instant&ion=1&espv=2&ie=UTF-8#q=lklklklklk&qscrl=1 (4000 results)
      
      Reply
Rasta says:

July 8, 2014 at 12:52 pm

ak to robi bot tak nie je jednoduchy sposob ako osetrit vstupy, lebo aj ked sa podari osetrit nezmyselne slova, bot moze zacat pouzivat mena z kalendara. najlepsie je pouzivatela overovat napr pomocou potvrdenia emailovej adresy. este lepsie je ziskat od pouzivatela mobilne cislo a poslat mu overovaciu sms, aj ked to asi nebude najjednoduchsie urobitelne pre cely svet’¦ kazdopadne to 100%tne funguje. Iny sposob overenia by este mohol byt pomocou kreditnej karty. jednoducho je potrebne vymysliet overenie takym sposobom, ktore bot nedokaze okabatit.

to iste riesenie by mohlo platit aj v tom pripade, ak tieto udaje vyplna zivy clovek – ak by bol nuteny zadat cislo kreditnej karty, tak zada aj svoje meno.

Reply
1. Michal Vrábel says:
  
  July 16, 2014 at 2:02 pm
  
  SMS ping není řešením, je mraky služeb, které mají spousty čísel, které lze k tomu použít a přijaté SMS automaticky zobrazí na webu. Takže se potvrdí existující číslo, ale nikoli to, že ten telefon má někdo konkrétní v ruce…
  
  Reply
Vojtěch Mikšů says:

July 8, 2014 at 12:59 pm

Blokovat prispevky, ktere jsou odeslane moc rychle od nacteni stranky.

Reply
Josef Sustacek says:

July 8, 2014 at 1:07 pm

Za jakym ucelem si ti lide ten ucet vytvari, kdyz v nem maji jen same nesmyslne udaje? Na danou adresu a jmeno jim asi nikdy zadnej balik neprijde 🙂

Myslim, ze spolehliva detekce fake uctu bude problem, staci chvili hledat a clovek najde veci jako http://www.fakenamegenerator.com/ ktere generuji zcela verohodne udaje, ktere overit bez skutecneho overeni proti nejakemu registru adres apod.

Reply
Birkof says:

July 8, 2014 at 1:18 pm

Chce to sehnat si databázi jmen různých zemí a proti ní to porovnávat. Bohužel, pokud bude kontrola při vyplnění formuláře upozorňovat na nesrovnalosti, tak dojde k tomu, že pak uživatel bude vyplňovat na první pohled správné údaje. Popravdě je to nekonečný boj. Dle mého názoru je lepší to neřešit. Čím lépe bude maskovaná falešná registrace, tím těžší bude jí odhalit. Pálcnutí do klávesnice je viditelné na první pohled.

Reply
Filip says:

July 8, 2014 at 1:49 pm

Skús tam umiestniť link, kde budú zobrazené všetky kroky pri registrácii. Ä½udia aj zo zvedavosti skúšajú aké údaje im treba vyplniť v ďalšom kroku. Takto eliminuješ aspoň časť nezmyselných registrácii. 🙂 Napríklad: http://www.nakupyvusa.com/shipito-registracia/

Reply
Miroslav Sekera says:

July 8, 2014 at 1:51 pm

Shodou okolností jsem minulý týden četl o tomhle startupu který něco takového řeší: https://blockscore.com/

Reply
Tomas Adamek says:

July 8, 2014 at 2:03 pm

Kolik tech registraci denne je? V cen spociva ten problem ze nekdo vypni takovou fake registraci? Objednavaji neco ? Zajimalo by me z jakyho duvodu nekdo vubec vyplni takovou registraci – co mu to prinese?

Se jmenama podle me nic neudelas – dulezita je adresa.

Co takhle manualni overeni ? Najmout si nejakeho “inda” ktery kazdej den zkontroluje registrace?

Pokud to musi byt automaticky tak pres google maps existuje geocoding kterej vraci urcity “zoom” attribute podle ktereho se pozna jak je ktera adresa “presna” – staci to volat pres javascript na tom formularovym okynku. Zaroven i kdyz ten JS vrati neco jako “risk” tak registraci povolit ale poslat nekomu upozorneni at to checkne.

Reply
Antonin Hildebrand says:

July 8, 2014 at 2:30 pm

Ja bych asi zkusil par rychlych a jednoduchych score algoritmu jak uz tady bylo navrhovano a podezrele registrace bundlovat rekneme po 100 do tasku a pustit na ne mechanickeho Turka:
https://www.mturk.com

Kazdopadne bych se ale nejdrive opravdu zamyslel nad odstranenim incentiv proc to ty lidi delaji.

Reply
Mirka says:

July 8, 2014 at 2:35 pm

Většinou si tyhle lidi nedají práci začínat velkým písmenem..

Reply
Bystroushaak says:

July 8, 2014 at 3:43 pm

Použij markovovy řetězce, které natrénuješ na nějaké netriviální množině
jmen. V tomhle konkrétním případě jsou imho využívány poměrně často.

http://cs.wikipedia.org/wiki/Markov%C5%AFv_%C5%99et%C4%9Bzec

Reply
TwisterNo8 says:

July 8, 2014 at 7:07 pm

Resil bych to jednoduse. Kombinace odeslani registrace od nacteni registracniho formulare + kontrola jmena podle databaze/slovniku vsech jmen.

Pokud jedno z toho neprojde, bude podezrely. Povolil bych registraci dokoncit jenom odelanim fotokopie pasu. Hotovo.

Reply
Michal Vilimovsky says:

July 8, 2014 at 9:08 pm

Co třeba testování ZIP (PSČ) a města, zda to odpovídá skutečnosti. Musí existovat databáze ulic, měst a PSČ pro všechna místa světa. A pokud by někdo zadal PSČ neodpovídající danému městu nebo ulici nebo pokud by nezadal žádnou ulici či město, tak by se nešlo registrovat. Viděl jsem to na jednom anglickém webu, kde to fungovalo super. Tohle by vyfiltrovalo hodně podvodníků.

Reply
1. Jindrich Vimr says:
  
  July 8, 2014 at 11:48 pm
  
  Dalsi co zije v bludu ze ZIP je vsude. Jak ja tyhle naivky nenavidel kdyz jsem bydlel v Irsku, kde ZIP nevedou a v klidu zijou….
  
  Reply
Petr says:

July 8, 2014 at 9:26 pm

Setkal jsem se s těmito objednávkami od konkurence. Tím, že u mne 1x za týden udělali falešnou objednávku, zjistili přesný počet přijatých objednávek a dokázali si udělat představu o obratu. Změnil jsem číslování objednávek, tak aby nebylo číslováno postupně od 1. Předpokládám, že máš tyto čísla zašifrována, třeba se je snaží rozšifrovat.

Reply
MichalR says:

July 9, 2014 at 12:50 am

Co je jednoduché a dá se rychle realizovat je geolokace uživatele vyplňující formulář například pomocí DB/API (https://www.maxmind.com/en/geolocation_landing) a následné porovnání se Zemí/Regionem uvedeným ve formuláři. Pokud nesouhlasí, zařadit k “ručnímu” posouzení.
Toto se dá jednoduše vylepšit o blacklist IP adres / zemí často používaných pro SPAM.

Reply
aichi says:

July 9, 2014 at 10:05 am

Ja bych zkusil pouzit Bayesovsky SPAM filtr. Kazda emailova sluzba ho pouziva a ac neni dokonaly, dokaze docela dobre odhalit podivne veci a veci v pohode nechat projit. Jedna z ukazek je popsana zde: http://theory.stanford.edu/~dfreeman/papers/namespam.pdf

Reply
Ondrej Galbavý says:

July 9, 2014 at 1:15 pm

Generator identity (http://sk.fakenamegenerator.com/) bude asi tazke rozpoznat aj rucne.

Reply
weblog.9c.cz says:

July 12, 2014 at 2:35 pm

Podle mě se to může lišit v rychlosti vyplňování (dá se zjistit pomocí Javascriptu), což by šlo použít jako 1 parametr v scoringovém systému, který by mohl využít i ostatní zde uvedené nápady.
Pro vytvoření prediktivního modelu by šlo pak využít soutěž na http://www.kaggle.com/

Reply
Martin says:

July 14, 2014 at 8:04 am

Mě to spíš připadá, že od uživatelů chcete při registraci zbytečné
údaje. Kdyby ty údaje k něčemu byly, tak je uživatel bude muset vyplnit
správně.

Reply
Rammi says:

July 16, 2014 at 12:54 am

Myslím, že tyto registrace vznikají, protože lidé chtějí vědět co je uvnitř, ale ještě nejsou rozhodnutí službu používat. Nebo např chtějí vědět kolik je bude něco stát atd… Jestli by nebylo nejlepší udělat tlačítko “login as guest”, kde se to člověka zeptá třeba jenom na zemi (aby se daly počítat poštovné atd) a bude tam ten user jako přihlášený, a bude moct dělat téměř vše, akorát se takové “objednávky” nebudou zpracovávat, ale zahazovat. případně se mu nabídne formulář na registraci. Ale až úplně jako poslední věc.

Reply
Miroslav Suchý says:

July 16, 2014 at 3:34 am

Pro doplneni par singularit:
http://wookware.org/name.html
http://web.archive.org/web/20130131045037/http://www.codingthewheel.com/archives/radioactive-search-hardened-user-name-for-online-poker

Reply
rrr says:

July 20, 2014 at 1:49 pm

za takymi vecami su casto nakodene roboty, ktore hladaju formulare a automaticky ich vyplnaju (vacsinou so snahou o spamovanie linkami ci za tym ucelom vytvorenej registracie). velmi pekne vie pomoct strasne jednoducha vec – pri nacitani podstranky si ulozit trebars do session cas nacitania a pri pokuse o odoslanie formulara tento cas porovnat s casom odoslania. clovek prakticky nedokaze vyplnit ten formular “rychlo” – trebars za 2s (zalezi na jeho zlozitosti, umiestneni na webe atd) a naopak roboty idu po kode, ako dostanu kod, najdu v nom co potrebuju a odosielaju request rpakticky hned (len velmi malo je ich sofistikovanejsich a s tymto druhom ochrany rata).

Reply
Michal Zobec says:

July 20, 2014 at 4:30 pm

Johne a není nejprve lepší jako první krok zjistit kdo se takto registruje a proč?
* pokud je to spambot je to jasné, je třeba ho blokovat
* pokud zvědavý uživatel/zájemce, možná stojí za zvážení varianta Logon as Guest
případně zjistit/zvážit jiné důvody a na ně reagovat …

Reply
1. John says:
  
  July 20, 2014 at 4:55 pm
  
  Podvody s kreditkou.. zaregistruji se takto jen z duvodu aby zjistil, jestli nejaka kradena kreditka funguje.
  
  Reply
  1. Michal Zobec says:
    
    July 20, 2014 at 5:27 pm
    
    a nevíš jestli to je člověk? nebo nějaký bot? když se tak ptáš tak asi člověk … pak asi nejlepší bude použít nějaký algoritmus co byl navržen výše a řeší:
    – málo samohlásek
    – písmena jsou na anglické klávesnici podezřele blízko sebe
    
    co mne ještě napadá a neuvádíš v dotazu – co požadovat pro registraci ověření skrze email?
    
    Reply
Marcel Krčah says:

July 22, 2014 at 3:20 pm

Skusil som vytvorit nastroj pre automaticku detekciu slov, ktore vyzeraju nahodne. Aj napriek svojej jednoduchosti funguje algoritmus celkom dobre.
Blog post: http://marcelkrcah.net/blog/random-word-detector/
Interaktivna verzia: http://random-text-detector.herokuapp.com
Zdrojaky: https://github.com/mkrcah/random-text-detector.

Reply

Podnikani a zivot v USA

Skoro 25 let zkusenosti z podnikani a zivota v USA.

Jak poznat registrace s falesnymi udaji?

45 thoughts on “Jak poznat registrace s falesnymi udaji?”

Leave a Reply Cancel reply