Hinnavaatlus
:: Foorum
:: Uudised
:: Ärifoorumid
:: HV F1 ennustusvõistlus
:: Pangalink
:: Telekavad
:: HV toote otsing
|
|
autor |
sõnum |
|
Tanel
HV Guru
liitunud: 01.10.2001
|
26.02.2010 00:43:13
Nõrga CAPTCHA saab murda vaid 26 koodireaga |
|
|
link :: minut.ee
Veebilehtedel tihti kasutatav tähtede ja numbrite äraarvamine pildilt ning nende sisestusaknasse toksimine võib olla päris tüütu. Paraku on nende "äraarvamine" hoopis lihtsam kui enamik ette kujutab - selleks piisab vaid 26-st koodireast.
Seega tasuks oma valdustes laiutavad süsteemid üle vaadata ja vajadusel samm karmim inimolendi kontrollmehhanism käima ajada.
Kood ise selline:
from PIL import Image
img = Image.open('input.gif')
img = img.convert("RGBA")
pixdata = img.load()
# Clean the background noise, if color != black, then set to white.
for y in xrange(img.size[1]):
for x in xrange(img.size[0]):
if pixdata[x, y] != (0, 0, 0, 255):
pixdata[x, y] = (255, 255, 255, 255)
img.save("input-black.gif", "GIF")
# Make the image bigger (needed for OCR)
im_orig = Image.open('input-black.gif')
big = im_orig.resize((116, 56), Image.NEAREST)
ext = ".tif"
big.save("input-NEAREST" + ext)
# Perform OCR using pytesser library
from pytesser import *
image = Image.open('input-NEAREST.tif')
print image_to_string(image) |
_________________ HV valuutakalkulaator |
|
Kommentaarid: 461 loe/lisa |
Kasutajad arvavad: |
|
:: |
12 :: |
7 :: |
356 |
|
tagasi üles |
|
|
Noname
HV Guru
liitunud: 26.10.2002
|
26.02.2010 02:02:17
|
|
|
valus. on teada, et lihtsalt murtavad juba ammu, aga nii lihstalt
_________________ "Olukord on sitt, aga see on meie tuleviku väetis." - Lennart Meri
"Edu on kehv õpetaja. See ahvatleb tarku inimesi mõtlema, et nad ei saagi kaotada" - B. Gates |
|
Kommentaarid: 370 loe/lisa |
Kasutajad arvavad: |
|
:: |
3 :: |
0 :: |
320 |
|
tagasi üles |
|
|
Ra*
HV Guru
liitunud: 19.04.2003
|
26.02.2010 02:22:47
|
|
|
Nojah. Viites ka näiteks rohkem midagi sellist ikka:
HVs illustratiivse pildina pandud Google captchad on nii räiged,et isegi tahaks tihti abi,et neist läbi närida.
Spoiler
|
|
Kommentaarid: 135 loe/lisa |
Kasutajad arvavad: |
|
:: |
1 :: |
2 :: |
123 |
|
tagasi üles |
|
|
maakas1
HV kasutaja
liitunud: 18.03.2004
|
26.02.2010 10:59:23
|
|
|
Mõned pakuvad ikka väga üle oma captchadega.. nuputa nigu iina keelt. Eriti vahva on peale umbes 26 sisestust leida alt "code is case sensitive".
|
|
Kommentaarid: 32 loe/lisa |
Kasutajad arvavad: |
|
:: |
0 :: |
1 :: |
27 |
|
tagasi üles |
|
|
alec
HV kasutaja
liitunud: 26.02.2003
|
26.02.2010 11:19:29
|
|
|
Pythoni reklaam
OCR ja pildi manipulatsioonide libraryd.
Kui selle "26 koodirida programmi teha funktsiooniks siis saab ühe reaga hakkama
>>> breakcaptcha(pilt)
kas pole võimas?
_________________ You win again, gravity!
C-4 can make a dull day fun
there are very few problems that can't be remedied with the proper application of explosives |
|
Kommentaarid: 23 loe/lisa |
Kasutajad arvavad: |
|
:: |
0 :: |
1 :: |
22 |
|
tagasi üles |
|
|
xecroy
HV kasutaja
liitunud: 23.05.2008
|
|
Kommentaarid: 20 loe/lisa |
Kasutajad arvavad: |
|
:: |
0 :: |
0 :: |
19 |
|
tagasi üles |
|
|
Freeman
HV kasutaja
liitunud: 23.09.2003
|
26.02.2010 13:11:43
|
|
|
puhas kuld link
|
|
Kommentaarid: 8 loe/lisa |
Kasutajad arvavad: |
|
:: |
0 :: |
0 :: |
7 |
|
tagasi üles |
|
|
veiks
HV kasutaja
liitunud: 28.01.2003
|
26.02.2010 14:00:15
|
|
|
uudis on veidi eksitav,
kui nüüd süveneda koodi, siis see ei tee väga midagi muud, kui konverteerib pildi mustvalgeks ning seejärel edastav OCR programmile.
Tulemuse kvaliteet sõltub siiski konkreetsest OCR tarkvarast ning enamus koodi on seal. Kui too tarkvara tunneb ära hoopis mingid muud siis tuleb vale vastus.
Seega kui hea on tänapäeval OCR tarkvara? Nende tasulised ja tasuta versioonid?
|
|
Kommentaarid: 9 loe/lisa |
Kasutajad arvavad: |
|
:: |
0 :: |
0 :: |
6 |
|
tagasi üles |
|
|
xerom
HV kasutaja
liitunud: 03.07.2002
|
26.02.2010 15:53:54
|
|
|
Ei saa ikka 26 koodireaga.. Sama hästi võiks need 26 rida koodi ühte pythoni moodulisse kompileerida ning öelda, et kahe koodireaga (mooduli import + funktsiooni väljakutse) saab ka hakkama.
Või noh, 26 reaga võib ideepoolest ka 3d mängu kirjutada, kui valmis librareid kasutada.
|
|
Kommentaarid: 9 loe/lisa |
Kasutajad arvavad: |
|
:: |
0 :: |
0 :: |
9 |
|
tagasi üles |
|
|
Chaza!
Kreisi kasutaja
liitunud: 18.07.2006
|
01.03.2010 18:44:22
|
|
|
xerom kirjutas: |
Ei saa ikka 26 koodireaga.. Sama hästi võiks need 26 rida koodi ühte pythoni moodulisse kompileerida ning öelda, et kahe koodireaga (mooduli import + funktsiooni väljakutse) saab ka hakkama.
Või noh, 26 reaga võib ideepoolest ka 3d mängu kirjutada, kui valmis librareid kasutada. |
pmst-lt võib ju nii ka mingi 3-5 reaga programmi teha, mis on nagu shortcuti eest.
_________________ Linux - Future
"Those Who Sacrifice Liberty For Security Deserve Neither." - Benjamin Franklin
1984 was not supposed to be instruction manual |
|
Kommentaarid: 58 loe/lisa |
Kasutajad arvavad: |
|
:: |
0 :: |
0 :: |
53 |
|
tagasi üles |
|
|
matik
HV kasutaja
liitunud: 28.05.2008
|
02.03.2010 13:48:34
|
|
|
xerom kirjutas: |
Ei saa ikka 26 koodireaga.. Sama hästi võiks need 26 rida koodi ühte pythoni moodulisse kompileerida ning öelda, et kahe koodireaga (mooduli import + funktsiooni väljakutse) saab ka hakkama.
Või noh, 26 reaga võib ideepoolest ka 3d mängu kirjutada, kui valmis librareid kasutada. |
no aga kes see keelab?
ega tänapäeval pole programmeerimine enamjaolt ammu enam assembleris baidikeste ja bitikeste nihutamine.
kui keegi hakkab 3d mängu kirjutama, siis ta ei hakka OpenGL-i ega DirectX-i uuesti leiutama, eksole?
ikka kasutatakse maksimaalselt seda, mis on olemas, et vähendada töö mahtu.
ja see programm on 26 rida. kui see "breakCaptcha" funktsioon lisatakse kuskile standard lib-i siis saab ka 1 reaga
|
|
tagasi üles |
|
|
Chaza!
Kreisi kasutaja
liitunud: 18.07.2006
|
02.03.2010 19:37:23
|
|
|
matik kirjutas: |
ega tänapäeval pole programmeerimine enamjaolt ammu enam assembleris baidikeste ja bitikeste nihutamine. |
Lihtsalt tuli see pilt kohe silme ette:
Spoiler
_________________ Linux - Future
"Those Who Sacrifice Liberty For Security Deserve Neither." - Benjamin Franklin
1984 was not supposed to be instruction manual |
|
Kommentaarid: 58 loe/lisa |
Kasutajad arvavad: |
|
:: |
0 :: |
0 :: |
53 |
|
tagasi üles |
|
|
HacaX
HV Guru
liitunud: 22.01.2004
|
02.03.2010 20:38:42
|
|
|
Eks see üks "näpuga järge ajades" teema ole. Kui too kood vaid progemiskeelega vaikimisi kaasas olevaid teeke kasutab siis on pealkiri täies mahus õigustatud. Kui tegu ei ole standardteekidega (mis, ma pakuks, hetkel paika peab) siis mitte päriselt.
Aga uudise eesmärk ongi vast täpse numbri asemel illustreerida tegevuse (suhtelist) lihtsust: ei ole mingit maagiat, vaid paar elementaarset operatsiooni ning sidumist vabalt kättesaadavate lahendustega, ning ongi kaitsest läbi murtud. Midagi mille valmiskribamisega enam-vähem igaüks kes progemisest midagigi mõistab hakkama saab.
_________________ IMO & GPLed |
|
Kommentaarid: 24 loe/lisa |
Kasutajad arvavad: |
|
:: |
1 :: |
0 :: |
22 |
|
tagasi üles |
|
|
LauriKaks
HV kasutaja
liitunud: 09.04.2003
|
03.03.2010 12:01:41
|
|
|
veiks kirjutas: |
uudis on veidi eksitav,
kui nüüd süveneda koodi, siis see ei tee väga midagi muud, kui konverteerib pildi mustvalgeks ning seejärel edastav OCR programmile.
Tulemuse kvaliteet sõltub siiski konkreetsest OCR tarkvarast ning enamus koodi on seal. Kui too tarkvara tunneb ära hoopis mingid muud siis tuleb vale vastus.
Seega kui hea on tänapäeval OCR tarkvara? Nende tasulised ja tasuta versioonid? |
Uudises näidatud kood kasutab Tesseract nimelist programmi. Kunagi HP poolt pakutav tõsine tegija, praeguseks on Google arendamise üle võtnud.
Tesseracti väljundi täpsust saab kordades parandada õpetamisega. Õpetamine=antakse ette näiteid sisendiks olevatest tähtedest ja kirjeldatakse, milliste koordinaatidega piiratud alal on milline märk.
Esimeses postis toodud CAPTCHAde lugemiseks on vaja need enne 'sirgeks venitada', seejärel saab õpetatud Tesseract ilmselt suhteliselt hästi nondest aru.
|
|
Kommentaarid: 16 loe/lisa |
Kasutajad arvavad: |
|
:: |
0 :: |
0 :: |
16 |
|
tagasi üles |
|
|
xerom
HV kasutaja
liitunud: 03.07.2002
|
06.03.2010 12:12:26
|
|
|
matik kirjutas: |
no aga kes see keelab?
ega tänapäeval pole programmeerimine enamjaolt ammu enam assembleris baidikeste ja bitikeste nihutamine.
kui keegi hakkab 3d mängu kirjutama, siis ta ei hakka OpenGL-i ega DirectX-i uuesti leiutama, eksole?
ikka kasutatakse maksimaalselt seda, mis on olemas, et vähendada töö mahtu.
ja see programm on 26 rida. kui see "breakCaptcha" funktsioon lisatakse kuskile standard lib-i siis saab ka 1 reaga |
Keegi pole rääkinud baidikeste ja bitikeste nihutamisest, vaid kolmandate teekide kasutamisest. Jutt ei ole programeerimiskeele standardteekidest, vaid third-party teekidest, mida võib igaüks teha ja kasutada vastavalt vajadusele. Loomulikult pole nende kasutamises midagi halba, vaid ilma nende teekide sisemist maagiat teadmata ei saa hinnata koodi keerukust. Paraku OCR vahendeid sinu nimetatud "standard libides" olemas ei ole, ega tule. Seega see 26 rida ei väljenda asja keerulisust. Mõte on selles, et sama loogika järgi võiks olla uudise pealkiri, et igasuguse captcha saab murda ühe koodireaga, küsimus on vaid custom teegis, mida kasutada.
|
|
Kommentaarid: 9 loe/lisa |
Kasutajad arvavad: |
|
:: |
0 :: |
0 :: |
9 |
|
tagasi üles |
|
|
electron
HV kasutaja
liitunud: 06.10.2004
|
09.03.2010 15:25:08
|
|
|
maakas1 kirjutas: |
Mõned pakuvad ikka väga üle oma captchadega.. nuputa nigu iina keelt. Eriti vahva on peale umbes 26 sisestust leida alt "code is case sensitive". |
Krt kui närvi olen päris mitu korda läinud sellepärast!
_________________ Tuleb lihtsalt täiega panna!!! |
|
tagasi üles |
|
|
|