praegune kellaaeg 16.06.2024 01:03:37
|
Hinnavaatlus
:: Foorum
:: Uudised
:: Ärifoorumid
:: HV F1 ennustusvõistlus
:: Pangalink
:: Telekavad
:: HV toote otsing
|
|
autor |
sõnum |
|
lauri
HV veteran
liitunud: 05.11.2001
|
09.01.2008 00:03:08
XML -> CSV parser |
|
|
kas keegi on kokku puutunud mõne hea XML->CSV parseriga (soovitavalt vabavara kommertskasutuseks, peab töötama Windowsi platvormil), mis ei oleks väga mäluõgard ning töötaks normaalse kiirusega?
hetkel katsetatud SAXON http://saxon.sourceforge.net/ ei ole kõige parem, kuna tarbib tohutul hulgal mälu (serveris 4GB jäi väheks).
XML fail on parajalt suur ca 366MB ning ilmselt on ka suuremaid faile oodata.
kui keegi teab kuidas sellel parseril mälu kasutust piirata, võib ka teada anda. väikene ajakulu suurenemine on lubatud.
edit: või kui keegi teab kuidas DTS laadimispaketi kaudu kuidagi otse XML -> Teradata andmebaasi kirjed saab võib ka teada anda.
edit2: pole siis kellelgi mingit ideed ega kogemust?
edit3: täpne veateade:
Unhandled Exception: OutOfMemoryException
_________________ Powered by MacBook Pro.
The sh*t has hit the fan. |
|
Kommentaarid: 89 loe/lisa |
Kasutajad arvavad: |
|
:: |
0 :: |
0 :: |
79 |
|
tagasi üles |
|
|
andre85
HV vaatleja
liitunud: 10.09.2006
|
09.01.2008 19:25:34
|
|
|
Kogemus on järgmine (küll mitte Saxoniga, vaid Xalaniga).
XSLT teisendid loevad kogu dokumendi DOM-puu mällu ja teevad siis teisenduse. Seepärast ei sobi mainitud vähendid väga suurte dokumentide teisendamiseks - mälu saab otsa.
Lahendusvariandid.
1) Vaata oma dokumenti. Oletan, et fail sisaldab suurt hulka dokumente, mida teisendatakse tegelikult ükshaaval. Üks väike Java-programmike tükeldaks failid dokumentideks, teisendaks ja sülitaks tulemuse välja. Olen ise selle tee läbi teinud.
2) Kasuta muud tehnoloogiat: http://joost.sourceforge.net/ , streaming transformations http://stx.sourceforge.net/ .
Andres
_________________ andres |
|
Kommentaarid: 8 loe/lisa |
Kasutajad arvavad: |
|
:: |
0 :: |
0 :: |
7 |
|
tagasi üles |
|
|
lauri
HV veteran
liitunud: 05.11.2001
|
09.01.2008 21:37:22
|
|
|
tänud soovituste eest.
hetkel on seis selline, et kolleegid teevad oma parseri, mis teeb täpselt seda mida vaja, kuna valmislahendusi pole aega otsida ja testida.
lihtsam oleks muidugi XML faili tekitajale öelda, et ole nüüd tubli ja anna asi meile kohe CSV's, kuid arhitektile see ei meeldi ning leedukad vaevalt viitsivad hakata midagi oma süsteemis muutma. ja see asjaajamine võtaks oluliselt rohkem aega. suurkorporatsioonide teema.
_________________ Powered by MacBook Pro.
The sh*t has hit the fan. |
|
Kommentaarid: 89 loe/lisa |
Kasutajad arvavad: |
|
:: |
0 :: |
0 :: |
79 |
|
tagasi üles |
|
|
|
lisa lemmikuks |
|
|
sa ei või postitada uusi teemasid siia foorumisse sa ei või vastata selle foorumi teemadele sa ei või muuta oma postitusi selles foorumis sa ei või kustutada oma postitusi selles foorumis sa ei või vastata küsitlustele selles foorumis sa ei saa lisada manuseid selles foorumis sa võid manuseid alla laadida selles foorumis
|
|
Hinnavaatlus ei vastuta foorumis tehtud postituste eest.
|