Hinnavaatlus
:: Foorum
:: Uudised
:: Ärifoorumid
:: HV F1 ennustusvõistlus
:: Pangalink
:: Telekavad
:: HV toote otsing
|
|
autor |
|
Raulj
Kreisi kasutaja

liitunud: 27.01.2002
|
|
Kommentaarid: 14 loe/lisa |
Kasutajad arvavad: |
   |
:: |
0 :: |
0 :: |
14 |
|
tagasi üles |
|
 |
Redikate
HV veteran

liitunud: 30.12.2005
|
09.05.2013 08:04:18
|
|
|
nodeJs
Ütle mis asju täpselt vaja on. Vaatan üle kui lihtne või raske mingi lahendus teha oleks.
E: Kõiki 17000 pilti on vaja?
E: Lahendus põhimõtteliselt olemas. Kirjutasin paarkümmend rida nodeJS'i. Võta palun PM'i või skype teel ühendust ja leiame kasutuse neile ridadele. (Olen Eestist -10h)
Muidu infoks ka, et:
PIlte on 17021
Iga lehekülje "vaatamine" (dns resolve, domi tirimine, ning sealt linkide otsimine) võtab aega ~3s.
Seega ainult selleks, et kätte saada kõik lingid nendele piltidele, kulub aega 14h ning see aeg ei sisalda nende piltide reaalselt downloadimist.
Lambi pilt mis ma sealt alla tirisin, kaalus 988kb, seega kui kõik need pildid oleks nii suured, on nende kogusuurus 134gb mida tirib tavalise kodu 12Mpbs netiga ~31h.
|
|
Kommentaarid: 34 loe/lisa |
Kasutajad arvavad: |
   |
:: |
0 :: |
0 :: |
33 |
|
tagasi üles |
|
 |
gynterk
HV kasutaja
liitunud: 17.01.2004
|
09.05.2013 09:01:37
|
|
|
Vähe küll OT, aga seal lehe all on kirjas "Copyright © 2013 Rahvusarhiiv" seepärast soovitan kindlasti antud tegevuseks hankida vastav luba, muidu võib nii suure koguse materjali allalaadimine lõppeda kurvalt (juhin tähelepanu sellele, et külastused on kindlasti logitud).
|
|
Kommentaarid: 5 loe/lisa |
Kasutajad arvavad: |
   |
:: |
0 :: |
0 :: |
5 |
|
tagasi üles |
|
 |
limp
HV Guru

liitunud: 11.08.2003
|
09.05.2013 09:45:37
|
|
|
gynterk kirjutas: |
Vähe küll OT, aga seal lehe all on kirjas "Copyright © 2013 Rahvusarhiiv" seepärast soovitan kindlasti antud tegevuseks hankida vastav luba, muidu võib nii suure koguse materjali allalaadimine lõppeda kurvalt (juhin tähelepanu sellele, et külastused on kindlasti logitud). |
juhin tähelepanu ka sellele, et lehe vaatamine = sisuliselt allalaadimisega.
Nende materjalide hilisem kasutamine kuskil mujal võib selle kopiraidiga vastuolusse sattuda.
_________________ Ärgake lapsed, maailm on hädaohus
Windows keskkond on nagu li*s - kõik teda ke*ivad aga keegi teda ei armasta! |
|
Kommentaarid: 56 loe/lisa |
Kasutajad arvavad: |
   |
:: |
0 :: |
0 :: |
52 |
|
tagasi üles |
|
 |
Fukiku
Kreisi kasutaja

liitunud: 06.11.2003
|
09.05.2013 13:36:50
|
|
|
Samas aegajalt saadakse ikka kurjaks, kui süstemaatiliselt tõmbama hakatakse... Ei pruugi alati õiguslikku alust selleks ollagi, aga IP bänn võib ikka tulla.
Ja noh, Aaron Swartz'i case oli vist ka üldjoontes sama, et kui andmeid automatiseeritult alla tõmmata isegi kui on legaalne ligipääs olemas, siis said mõned väga kurjaks selle pärast..
_________________ Foxic is just a simple fox
Enne kui sa küsid oma küsimuse - küsi seda vannipardilt! Rangelt soovitatav enne programmeerimise alafoorumisse uue teema tegemist. |
|
Kommentaarid: 2 loe/lisa |
Kasutajad arvavad: |
   |
:: |
0 :: |
0 :: |
2 |
|
tagasi üles |
|
 |
perenoel
Kreisi kasutaja

liitunud: 04.05.2004
|
09.05.2013 14:17:05
|
|
|
Copyrighti sübol lehel ei tähista sisuliselt mitte midagi, see on rohkem kombeasi. Autoriõigused lehel ilmunud originaalmatrjalile tekivad ka ilma selleta. Aga digitaliseerimise osas on rahvusvaheline (Ameerika) praktika selline, et kahemõõtmeline tõmmis vabakasutuses olevast trüki- pildi- vmt materjalist on samuti vabakasutuses. Seda eeldusel, et ei ole tehtud mitte mingeid muid muudatusi (näiteks tehtud iluravi vanale fotole).
Seevastu materjalide massilise allalaadimise blokeerib enamik servereid nii ehk naa. Kui soovid seda teha, pead kasutama tervet posu erinevaid proksisid.
_________________ The biggest delusion is that there are causes other than your own state of consciousness. - Neville Goddard |
|
tagasi üles |
|
 |
raitl
HV veteran

liitunud: 20.01.2002
|
09.05.2013 14:32:07
|
|
|
perenoel kirjutas: |
... Seevastu materjalide massilise allalaadimise blokeerib enamik servereid nii ehk naa. Kui soovid seda teha, pead kasutama tervet posu erinevaid proksisid. |
Või jätma oma crawleriga mulje, et oled tavaline tubli netikasutaja kes brausib neid materjale.
|
|
Kommentaarid: 166 loe/lisa |
Kasutajad arvavad: |
   |
:: |
1 :: |
0 :: |
147 |
|
tagasi üles |
|
 |
Fukiku
Kreisi kasutaja

liitunud: 06.11.2003
|
09.05.2013 15:13:12
|
|
|
raitl kirjutas: |
perenoel kirjutas: |
... Seevastu materjalide massilise allalaadimise blokeerib enamik servereid nii ehk naa. Kui soovid seda teha, pead kasutama tervet posu erinevaid proksisid. |
Või jätma oma crawleriga mulje, et oled tavaline tubli netikasutaja kes brausib neid materjale. |
Mis sisuliselt tähendab oma roboti päris tugevat piiramist kiiruse mõttes. Üks-kaks pilti minutis jne.. Aga jah, võimalik.
_________________ Foxic is just a simple fox
Enne kui sa küsid oma küsimuse - küsi seda vannipardilt! Rangelt soovitatav enne programmeerimise alafoorumisse uue teema tegemist. |
|
Kommentaarid: 2 loe/lisa |
Kasutajad arvavad: |
   |
:: |
0 :: |
0 :: |
2 |
|
tagasi üles |
|
 |
Raulj
Kreisi kasutaja

liitunud: 27.01.2002
|
09.05.2013 22:53:29
|
|
|
Hei! Tean neid arhiivi kohti sellepärast, et Rahvusarhiiv ise on mind suunanud antud materjalidele, kui nende juures on käidud sooviga saada koopiaid antud materjalidest. Seega copyrighti asja ei tasu selle case puhul karta. Olen pöördunud ka meilitsi nende poole, et saaks neilt neid andmeid kasvõi raha eest digitaalsena, kuid pole veel paari päeva jooksul vastust saanud.
Vaja oleks neid siis ikkagi ise alla laadida ja neid fonde on mitu, seega materjale ~25000 pildi jagu.
|
|
Kommentaarid: 14 loe/lisa |
Kasutajad arvavad: |
   |
:: |
0 :: |
0 :: |
14 |
|
tagasi üles |
|
 |
mahfiaz
HV kasutaja
liitunud: 03.11.2005
|
14.05.2013 22:35:27
|
|
|
See esimese postituse link nõuab sisselogimist.
Kas curl ei aita?
|
|
Kommentaarid: 32 loe/lisa |
Kasutajad arvavad: |
   |
:: |
0 :: |
0 :: |
32 |
|
tagasi üles |
|
 |
Raulj
Kreisi kasutaja

liitunud: 27.01.2002
|
14.05.2013 23:06:08
|
|
|
Tänu Redikate lahendusele saan enda materjalid kätte
|
|
Kommentaarid: 14 loe/lisa |
Kasutajad arvavad: |
   |
:: |
0 :: |
0 :: |
14 |
|
tagasi üles |
|
 |
Cemtey
HV kasutaja

liitunud: 04.03.2008
|
21.05.2013 01:34:52
|
|
|
.. kustutatud ..
viimati muutis Cemtey 23.04.2014 01:41:45, muudetud 1 kord |
|
Kommentaarid: 18 loe/lisa |
Kasutajad arvavad: |
   |
:: |
0 :: |
0 :: |
17 |
|
tagasi üles |
|
 |
napoleon
Unknown virus

liitunud: 08.12.2008
|
21.05.2013 10:26:58
|
|
|
Ei ole see päris nii. Kui lehele massiliselt roboteid kallale tuleb, siis on kulud serveritele ja ühendusele suuremad ja minu arvates ei olegi riigi asi spämmerite elu lihtsamaks muuta
|
|
Kommentaarid: 77 loe/lisa |
Kasutajad arvavad: |
   |
:: |
0 :: |
0 :: |
60 |
|
tagasi üles |
|
 |
Redikate
HV veteran

liitunud: 30.12.2005
|
21.05.2013 20:36:28
|
|
|
napoleon kirjutas: |
Ei ole see päris nii. Kui lehele massiliselt roboteid kallale tuleb, siis on kulud serveritele ja ühendusele suuremad ja minu arvates ei olegi riigi asi spämmerite elu lihtsamaks muuta |
Lehele ei saadeta massiliselt roboteid kallale kui leht pakub võimalust andmeid kätte saada mõistlikul viisil (näiteks täiesti tavaline REST API). Kui andmete kättesaamine tehakse raskeks ning idiootseks, tuleb kasutada muid võimalusi.
Teema algataja sai oma pildid jms kätte?
_________________ http://nodejs.org/
"I'm also a person. Programming is just one thing I do." |
|
Kommentaarid: 34 loe/lisa |
Kasutajad arvavad: |
   |
:: |
0 :: |
0 :: |
33 |
|
tagasi üles |
|
 |
|