Avaleht
uus teema   vasta Uudised »  Turvalisus ja privaatsus »  Nõrga CAPTCHA saab murda vaid 26 koodireaga märgi kõik teemad loetuks
märgi mitteloetuks
vaata eelmist teemat :: vaata järgmist teemat
Hinnavaatlus :: Foorum :: Uudised :: Ärifoorumid :: HV F1 ennustusvõistlus :: Pangalink :: Telekavad :: HV toote otsing
autor
sõnum Saada viide sõbrale. Teata moderaatorile
otsing:  
Tanel
HV Guru
Tanel

liitunud: 01.10.2001



Autoriseeritud ID-kaardiga

sõnum 26.02.2010 00:43:13 Nõrga CAPTCHA saab murda vaid 26 koodireaga vasta tsitaadiga

link :: minut.ee


Veebilehtedel tihti kasutatav tähtede ja numbrite äraarvamine pildilt ning nende sisestusaknasse toksimine võib olla päris tüütu. Paraku on nende "äraarvamine" hoopis lihtsam kui enamik ette kujutab - selleks piisab vaid 26-st koodireast.

Seega tasuks oma valdustes laiutavad süsteemid üle vaadata ja vajadusel samm karmim inimolendi kontrollmehhanism käima ajada.

Kood ise selline:

from PIL import Image

img = Image.open('input.gif')
img = img.convert("RGBA")

pixdata = img.load()

# Clean the background noise, if color != black, then set to white.
for y in xrange(img.size[1]):
    for x in xrange(img.size[0]):
        if pixdata[x, y] != (0, 0, 0, 255):
            pixdata[x, y] = (255, 255, 255, 255)

img.save("input-black.gif", "GIF")

#   Make the image bigger (needed for OCR)
im_orig = Image.open('input-black.gif')
big = im_orig.resize((116, 56), Image.NEAREST)

ext = ".tif"
big.save("input-NEAREST" + ext)

#   Perform OCR using pytesser library
from pytesser import *
image = Image.open('input-NEAREST.tif')
print image_to_string(image)

_________________
HV valuutakalkulaator
Kommentaarid: 461 loe/lisa Kasutajad arvavad:  :: 12 :: 7 :: 356
tagasi üles
vaata kasutaja infot saada privaatsõnum mine selle kasutaja kodulehele
Noname
HV Guru
Noname

liitunud: 26.10.2002



Autoriseeritud ID-kaardiga

sõnum 26.02.2010 02:02:17 vasta tsitaadiga

valus. on teada, et lihtsalt murtavad juba ammu, aga nii lihstalt thumbs_down.gif
_________________
"Olukord on sitt, aga see on meie tuleviku väetis." - Lennart Meri
"Edu on kehv õpetaja. See ahvatleb tarku inimesi mõtlema, et nad ei saagi kaotada" - B. Gates
Kommentaarid: 370 loe/lisa Kasutajad arvavad:  :: 3 :: 0 :: 320
tagasi üles
vaata kasutaja infot saada privaatsõnum
Ra*
HV Guru
Ra*

liitunud: 19.04.2003




sõnum 26.02.2010 02:22:47 vasta tsitaadiga

Nojah. Viites ka näiteks rohkem midagi sellist ikka:


HVs illustratiivse pildina pandud Google captchad on nii räiged,et isegi tahaks tihti abi,et neist läbi närida.
Spoiler Spoiler Spoiler
Kommentaarid: 135 loe/lisa Kasutajad arvavad:  :: 1 :: 2 :: 123
tagasi üles
vaata kasutaja infot saada privaatsõnum
maakas1
HV kasutaja
maakas1

liitunud: 18.03.2004




sõnum 26.02.2010 10:59:23 vasta tsitaadiga

Mõned pakuvad ikka väga üle oma captchadega.. nuputa nigu iina keelt. Eriti vahva on peale umbes 26 sisestust leida alt "code is case sensitive".
Kommentaarid: 32 loe/lisa Kasutajad arvavad:  :: 0 :: 1 :: 27
tagasi üles
vaata kasutaja infot saada privaatsõnum
alec
HV kasutaja
alec

liitunud: 26.02.2003




sõnum 26.02.2010 11:19:29 vasta tsitaadiga

Pythoni reklaam thumbs_up.gif

OCR ja pildi manipulatsioonide libraryd.
Kui selle "26 koodirida programmi teha funktsiooniks siis saab ühe reaga hakkama
>>> breakcaptcha(pilt)
kas pole võimas? icon_lol.gif

_________________
You win again, gravity!
C-4 can make a dull day fun
there are very few problems that can't be remedied with the proper application of explosives
Kommentaarid: 23 loe/lisa Kasutajad arvavad:  :: 0 :: 1 :: 22
tagasi üles
vaata kasutaja infot saada privaatsõnum
xecroy
HV kasutaja
xecroy

liitunud: 23.05.2008




sõnum 26.02.2010 11:37:02 vasta tsitaadiga

Minu arust on need captchad sama efektiivsed nii arvutite kui inimeste vastu.

http://www.docshare.com/doc/195323/The-Worst-CAPTCHAs-of-All-Time

Neid küll ülevaloleva koodiga ei murra thumbs_up.gif

_________________
Kõige suurem pidur on alati ketas. Naudi inimväärset elu, osta SSD!
Kommentaarid: 20 loe/lisa Kasutajad arvavad:  :: 0 :: 0 :: 19
tagasi üles
vaata kasutaja infot saada privaatsõnum
Freeman
HV kasutaja
Freeman

liitunud: 23.09.2003




sõnum 26.02.2010 13:11:43 vasta tsitaadiga

puhas kuld link
Kommentaarid: 8 loe/lisa Kasutajad arvavad:  :: 0 :: 0 :: 7
tagasi üles
vaata kasutaja infot saada privaatsõnum
veiks
HV kasutaja

liitunud: 28.01.2003




sõnum 26.02.2010 14:00:15 vasta tsitaadiga

uudis on veidi eksitav,
kui nüüd süveneda koodi, siis see ei tee väga midagi muud, kui konverteerib pildi mustvalgeks ning seejärel edastav OCR programmile.

Tulemuse kvaliteet sõltub siiski konkreetsest OCR tarkvarast ning enamus koodi on seal. Kui too tarkvara tunneb ära hoopis mingid muud siis tuleb vale vastus.

Seega kui hea on tänapäeval OCR tarkvara? Nende tasulised ja tasuta versioonid?
Kommentaarid: 9 loe/lisa Kasutajad arvavad:  :: 0 :: 0 :: 6
tagasi üles
vaata kasutaja infot saada privaatsõnum mine selle kasutaja kodulehele
xerom
HV kasutaja

liitunud: 03.07.2002



Autoriseeritud ID-kaardiga

sõnum 26.02.2010 15:53:54 vasta tsitaadiga

Ei saa ikka 26 koodireaga.. Sama hästi võiks need 26 rida koodi ühte pythoni moodulisse kompileerida ning öelda, et kahe koodireaga (mooduli import + funktsiooni väljakutse) saab ka hakkama.

Või noh, 26 reaga võib ideepoolest ka 3d mängu kirjutada, kui valmis librareid kasutada.
Kommentaarid: 9 loe/lisa Kasutajad arvavad:  :: 0 :: 0 :: 9
tagasi üles
vaata kasutaja infot saada privaatsõnum
Chaza!
Kreisi kasutaja
Chaza!

liitunud: 18.07.2006



Autoriseeritud ID-kaardiga

sõnum 01.03.2010 18:44:22 vasta tsitaadiga

xerom kirjutas:
Ei saa ikka 26 koodireaga.. Sama hästi võiks need 26 rida koodi ühte pythoni moodulisse kompileerida ning öelda, et kahe koodireaga (mooduli import + funktsiooni väljakutse) saab ka hakkama.

Või noh, 26 reaga võib ideepoolest ka 3d mängu kirjutada, kui valmis librareid kasutada.

pmst-lt võib ju nii ka mingi 3-5 reaga programmi teha, mis on nagu shortcuti eest. icon_lol.gif

_________________
Linux - Future
"Those Who Sacrifice Liberty For Security Deserve Neither." - Benjamin Franklin
1984 was not supposed to be instruction manual
Kommentaarid: 58 loe/lisa Kasutajad arvavad:  :: 0 :: 0 :: 53
tagasi üles
vaata kasutaja infot saada privaatsõnum
matik
HV kasutaja

liitunud: 28.05.2008




sõnum 02.03.2010 13:48:34 vasta tsitaadiga

xerom kirjutas:
Ei saa ikka 26 koodireaga.. Sama hästi võiks need 26 rida koodi ühte pythoni moodulisse kompileerida ning öelda, et kahe koodireaga (mooduli import + funktsiooni väljakutse) saab ka hakkama.

Või noh, 26 reaga võib ideepoolest ka 3d mängu kirjutada, kui valmis librareid kasutada.


no aga kes see keelab?
ega tänapäeval pole programmeerimine enamjaolt ammu enam assembleris baidikeste ja bitikeste nihutamine.
kui keegi hakkab 3d mängu kirjutama, siis ta ei hakka OpenGL-i ega DirectX-i uuesti leiutama, eksole?
ikka kasutatakse maksimaalselt seda, mis on olemas, et vähendada töö mahtu.
ja see programm on 26 rida. kui see "breakCaptcha" funktsioon lisatakse kuskile standard lib-i siis saab ka 1 reaga icon_smile.gif
tagasi üles
vaata kasutaja infot saada privaatsõnum
Chaza!
Kreisi kasutaja
Chaza!

liitunud: 18.07.2006



Autoriseeritud ID-kaardiga

sõnum 02.03.2010 19:37:23 vasta tsitaadiga

matik kirjutas:
ega tänapäeval pole programmeerimine enamjaolt ammu enam assembleris baidikeste ja bitikeste nihutamine.

Lihtsalt tuli see pilt kohe silme ette:
Spoiler Spoiler Spoiler

_________________
Linux - Future
"Those Who Sacrifice Liberty For Security Deserve Neither." - Benjamin Franklin
1984 was not supposed to be instruction manual
Kommentaarid: 58 loe/lisa Kasutajad arvavad:  :: 0 :: 0 :: 53
tagasi üles
vaata kasutaja infot saada privaatsõnum
HacaX
HV Guru
HacaX

liitunud: 22.01.2004




sõnum 02.03.2010 20:38:42 vasta tsitaadiga

Eks see üks "näpuga järge ajades" teema ole. Kui too kood vaid progemiskeelega vaikimisi kaasas olevaid teeke kasutab siis on pealkiri täies mahus õigustatud. Kui tegu ei ole standardteekidega (mis, ma pakuks, hetkel paika peab) siis mitte päriselt.
Aga uudise eesmärk ongi vast täpse numbri asemel illustreerida tegevuse (suhtelist) lihtsust: ei ole mingit maagiat, vaid paar elementaarset operatsiooni ning sidumist vabalt kättesaadavate lahendustega, ning ongi kaitsest läbi murtud. Midagi mille valmiskribamisega enam-vähem igaüks kes progemisest midagigi mõistab hakkama saab.

_________________
IMO & GPLed
Kommentaarid: 24 loe/lisa Kasutajad arvavad:  :: 1 :: 0 :: 22
tagasi üles
vaata kasutaja infot saada privaatsõnum mine selle kasutaja kodulehele
LauriKaks
HV kasutaja

liitunud: 09.04.2003




sõnum 03.03.2010 12:01:41 vasta tsitaadiga

veiks kirjutas:
uudis on veidi eksitav,
kui nüüd süveneda koodi, siis see ei tee väga midagi muud, kui konverteerib pildi mustvalgeks ning seejärel edastav OCR programmile.

Tulemuse kvaliteet sõltub siiski konkreetsest OCR tarkvarast ning enamus koodi on seal. Kui too tarkvara tunneb ära hoopis mingid muud siis tuleb vale vastus.

Seega kui hea on tänapäeval OCR tarkvara? Nende tasulised ja tasuta versioonid?


Uudises näidatud kood kasutab Tesseract nimelist programmi. Kunagi HP poolt pakutav tõsine tegija, praeguseks on Google arendamise üle võtnud.
Tesseracti väljundi täpsust saab kordades parandada õpetamisega. Õpetamine=antakse ette näiteid sisendiks olevatest tähtedest ja kirjeldatakse, milliste koordinaatidega piiratud alal on milline märk.
Esimeses postis toodud CAPTCHAde lugemiseks on vaja need enne 'sirgeks venitada', seejärel saab õpetatud Tesseract ilmselt suhteliselt hästi nondest aru.
Kommentaarid: 16 loe/lisa Kasutajad arvavad:  :: 0 :: 0 :: 16
tagasi üles
vaata kasutaja infot saada privaatsõnum
xerom
HV kasutaja

liitunud: 03.07.2002



Autoriseeritud ID-kaardiga

sõnum 06.03.2010 12:12:26 vasta tsitaadiga

matik kirjutas:

no aga kes see keelab?
ega tänapäeval pole programmeerimine enamjaolt ammu enam assembleris baidikeste ja bitikeste nihutamine.
kui keegi hakkab 3d mängu kirjutama, siis ta ei hakka OpenGL-i ega DirectX-i uuesti leiutama, eksole?
ikka kasutatakse maksimaalselt seda, mis on olemas, et vähendada töö mahtu.
ja see programm on 26 rida. kui see "breakCaptcha" funktsioon lisatakse kuskile standard lib-i siis saab ka 1 reaga icon_smile.gif


Keegi pole rääkinud baidikeste ja bitikeste nihutamisest, vaid kolmandate teekide kasutamisest. Jutt ei ole programeerimiskeele standardteekidest, vaid third-party teekidest, mida võib igaüks teha ja kasutada vastavalt vajadusele. Loomulikult pole nende kasutamises midagi halba, vaid ilma nende teekide sisemist maagiat teadmata ei saa hinnata koodi keerukust. Paraku OCR vahendeid sinu nimetatud "standard libides" olemas ei ole, ega tule. Seega see 26 rida ei väljenda asja keerulisust. Mõte on selles, et sama loogika järgi võiks olla uudise pealkiri, et igasuguse captcha saab murda ühe koodireaga, küsimus on vaid custom teegis, mida kasutada.
Kommentaarid: 9 loe/lisa Kasutajad arvavad:  :: 0 :: 0 :: 9
tagasi üles
vaata kasutaja infot saada privaatsõnum
electron
HV kasutaja

liitunud: 06.10.2004




sõnum 09.03.2010 15:25:08 vasta tsitaadiga

maakas1 kirjutas:
Mõned pakuvad ikka väga üle oma captchadega.. nuputa nigu iina keelt. Eriti vahva on peale umbes 26 sisestust leida alt "code is case sensitive".


thumbs_up.gif thumbs_up.gif Krt kui närvi olen päris mitu korda läinud sellepärast!

_________________
Tuleb lihtsalt täiega panna!!!
tagasi üles
vaata kasutaja infot saada privaatsõnum
näita postitusi alates eelmisest:   
uus teema   vasta Uudised »  Turvalisus ja privaatsus »  Nõrga CAPTCHA saab murda vaid 26 koodireaga
[vaata eelmist teemat] [vaata järgmist teemat]
 lisa lemmikuks
näita foorumit:  
 ignoreeri teemat 
sa ei või postitada uusi teemasid siia foorumisse
sa ei või vastata selle foorumi teemadele
sa ei või muuta oma postitusi selles foorumis
sa ei või kustutada oma postitusi selles foorumis
sa ei või vastata küsitlustele selles foorumis
sa ei saa lisada manuseid selles foorumis
sa võid manuseid alla laadida selles foorumis



Hinnavaatlus ei vastuta foorumis tehtud postituste eest.