praegune kellaaeg 21.06.2025 22:23:57
|
Hinnavaatlus
:: Foorum
:: Uudised
:: Ärifoorumid
:: HV F1 ennustusvõistlus
:: Pangalink
:: Telekavad
:: HV toote otsing
|
|
autor |
|
Märt.
HV Guru

liitunud: 17.01.2004
|
10.01.2011 21:23:15
Charset, vene keel ja muudki. |
|
|
Millist charseti on mõistlik kasutada vene keele puhul? Hetkel kasutan ISO-8859-5, kuid neid on veel...
Ja kuidas lahendada venekeelse teksti kuvamine editoris? Lihtne kopipasteet Wordist annab tulemuseks:
???????? ???? ????? ????????? |
Salvestasin jutu veebilehena, siis sai selline märgisupp sortsust ümber kopeeritud:
Открылся фонд Ивана
Болдырева |
Ja see märgisupi kuvand on siis:
Открылся фонд Ивана Болдырева |
Editoriks on siis Evrsoft FirstPage 2006
Tahaks kuidagi lihtsamalt seda venekeelset teksti koodiaknasse saada, kui võimalik. Wordi genereeritud lehte küll otse välja panna ei soovi, mõttetut läbu on palju, sama tulemuse saab ka ju lihtsamalt HTML-is kribada.
Hüva nõu on tarviline vara...
_________________ Albert Einstein: "Vaid kaks asja on lõpmatud, universum ja inimlik rumalus, ja selles esimeses pole ma nii kindel." |
|
Kommentaarid: 29 loe/lisa |
Kasutajad arvavad: |
   |
:: |
0 :: |
0 :: |
23 |
|
tagasi üles |
|
 |
andrusny
Kreisi kasutaja

liitunud: 20.03.2006
|
10.01.2011 21:27:43
|
|
|
UTF-8
_________________
 |
|
Kommentaarid: 7 loe/lisa |
Kasutajad arvavad: |
   |
:: |
0 :: |
0 :: |
7 |
|
tagasi üles |
|
 |
Märt.
HV Guru

liitunud: 17.01.2004
|
11.01.2011 15:15:24
|
|
|
Olgu, aga kuidas saaks siiski normaalselt vene keelt Wordist või mujalt koodiaknasse kopeerida, ilma et jätaks mulle ülaltoodud küsimärkide rea? Millest see sõltub?
_________________ Albert Einstein: "Vaid kaks asja on lõpmatud, universum ja inimlik rumalus, ja selles esimeses pole ma nii kindel." |
|
Kommentaarid: 29 loe/lisa |
Kasutajad arvavad: |
   |
:: |
0 :: |
0 :: |
23 |
|
tagasi üles |
|
 |
Taavi_R
HV Guru

liitunud: 30.09.2002
|
11.01.2011 22:58:38
|
|
|
Kuhu editorisse sa seda kopeerida soovid?
Kui sul on mingi taoline editor nagu näiteks CKEditor, siis pead kleepima selle teksti "HTML" koodina, mitte tekstina.
Charset kirillitsal ISO 8859-5
_________________ raamatupidamine | laadakalender |
|
Kommentaarid: 183 loe/lisa |
Kasutajad arvavad: |
   |
:: |
2 :: |
3 :: |
163 |
|
tagasi üles |
|
 |
Fukiku
Kreisi kasutaja

liitunud: 06.11.2003
|
11.01.2011 23:13:45
|
|
|
Igasuguse UTF-8'st erinevate charsettide propageerimine tundub aastal 2010 saatanast olevat minuarust. Selles suhtes pole selle ISO'ga midagi peale hakata minu tagasihoidliku arvamuse järgi.
_________________ Foxic is just a simple fox
Enne kui sa küsid oma küsimuse - küsi seda vannipardilt! Rangelt soovitatav enne programmeerimise alafoorumisse uue teema tegemist. |
|
Kommentaarid: 2 loe/lisa |
Kasutajad arvavad: |
   |
:: |
0 :: |
0 :: |
2 |
|
tagasi üles |
|
 |
priitr
HV kasutaja
liitunud: 17.06.2004
|
12.01.2011 12:26:17
|
|
|
Vene kirillitsa erinevaid ühebaidiseid kodeeringuid on palju (IBM-855, KOI-8, CP-866, Windows-1251, ISO8859-5, ...), seega mõistlik inimene kasutab UTF-8.
_________________ Tšudes ne bõvajet. |
|
Kommentaarid: 27 loe/lisa |
Kasutajad arvavad: |
   |
:: |
0 :: |
0 :: |
27 |
|
tagasi üles |
|
 |
Märt.
HV Guru

liitunud: 17.01.2004
|
12.01.2011 13:07:11
|
|
|
Taavi_R kirjutas: |
Kuhu editorisse sa seda kopeerida soovid?
Kui sul on mingi taoline editor nagu näiteks CKEditor, siis pead kleepima selle teksti "HTML" koodina, mitte tekstina.
Charset kirillitsal ISO 8859-5 |
Editoriks on siis Evrsoft FirstPage 2006. Lihtne ja arusaadav. Kust leida kirillitsa HTML-koodi? Võimalik, et olen valesti otsinud.
Ja kuna enamik soovitab UTF-8-t, siis muudangi vast praegusest ISO-8859-5 UTF-8 peale ära.
EDIT: näpukas.
_________________ Albert Einstein: "Vaid kaks asja on lõpmatud, universum ja inimlik rumalus, ja selles esimeses pole ma nii kindel."
viimati muutis Märt. 12.01.2011 17:45:12, muudetud 1 kord |
|
Kommentaarid: 29 loe/lisa |
Kasutajad arvavad: |
   |
:: |
0 :: |
0 :: |
23 |
|
tagasi üles |
|
 |
Fukiku
Kreisi kasutaja

liitunud: 06.11.2003
|
12.01.2011 13:46:33
|
|
|
udusiil kirjutas: |
Taavi_R kirjutas: |
Kuhu editorisse sa seda kopeerida soovid?
Kui sul on mingi taoline editor nagu näiteks CKEditor, siis pead kleepima selle teksti "HTML" koodina, mitte tekstina.
Charset kirillitsal ISO 8859-5 |
Editoriks on siis Evrsoft FirstPage 2006. Lihtne ja arusaadav. Kust leida kirillitsa HTML-koodi? Võimalik, et olen valesti otsinud.
Ja kuna enamik soovitab UTF-8-t, siis muudangi vast praegusest ISO-8859-5 UTF-6 peale ära. |
See on igal juhul mõistlik, kuivõrd UTF-8 kodeering toetab põhimõtteliselt kõike, mida hing ihaldab. Võid samasse faili kirjutada segamini kirillitsat, jaapani ja/või hiina hieroglüüfe, Skandinaavia täpilisi ja kreeka tähestikku kasvõi. ISO vms. kodeeringutega majanadades vajaks iga selline keel erineva kodeeringuga salvestamist ning ühte faili kõike segamini suruda on oluliselt keerulisem. See siis natuke selgituseks, et miks UTF-8 on hea ja ISO, windows codepage'd ja muu eksootika saatanast.
Mulle isiklikult tundub, et kui kogu maailm UTF-8 kodeeringut kasutaks, oleks elu progejatele ja ka kasutajatele märkimisväärselt ilusam.
_________________ Foxic is just a simple fox
Enne kui sa küsid oma küsimuse - küsi seda vannipardilt! Rangelt soovitatav enne programmeerimise alafoorumisse uue teema tegemist. |
|
Kommentaarid: 2 loe/lisa |
Kasutajad arvavad: |
   |
:: |
0 :: |
0 :: |
2 |
|
tagasi üles |
|
 |
priitr
HV kasutaja
liitunud: 17.06.2004
|
12.01.2011 15:36:04
|
|
|
Fukiku kirjutas: |
udusiil kirjutas: |
Taavi_R kirjutas: |
Kuhu editorisse sa seda kopeerida soovid?
Kui sul on mingi taoline editor nagu näiteks CKEditor, siis pead kleepima selle teksti "HTML" koodina, mitte tekstina.
Charset kirillitsal ISO 8859-5 |
Editoriks on siis Evrsoft FirstPage 2006. Lihtne ja arusaadav. Kust leida kirillitsa HTML-koodi? Võimalik, et olen valesti otsinud.
Ja kuna enamik soovitab UTF-8-t, siis muudangi vast praegusest ISO-8859-5 UTF-6 peale ära. |
See on igal juhul mõistlik, kuivõrd UTF-8 kodeering toetab põhimõtteliselt kõike, mida hing ihaldab. Võid samasse faili kirjutada segamini kirillitsat, jaapani ja/või hiina hieroglüüfe, Skandinaavia täpilisi ja kreeka tähestikku kasvõi. ISO vms. kodeeringutega majanadades vajaks iga selline keel erineva kodeeringuga salvestamist ning ühte faili kõike segamini suruda on oluliselt keerulisem. See siis natuke selgituseks, et miks UTF-8 on hea ja ISO, windows codepage'd ja muu eksootika saatanast.
Mulle isiklikult tundub, et kui kogu maailm UTF-8 kodeeringut kasutaks, oleks elu progejatele ja ka kasutajatele märkimisväärselt ilusam.  |
Kasutajatele küll, aga mitte progejatele. Progejatele meeldiks märksa rohkem UTF-16 kasutada, seda on lihtsam 'vajalikul määral' õieti teha. UTF-8 probleemideks on nt see, et ei saa eriti efektiivselt leida teksti pikkust tähemärkides (tähemärkide pikkus on 1-6 baiti) ja tekste jupitada. Varem olid ka veel hädad ühe ja sama sümboli erinevate kodeeringutega... A see muidugi enam veebilehekülgede tegemist ei puuduta .
Priit
_________________ Tšudes ne bõvajet. |
|
Kommentaarid: 27 loe/lisa |
Kasutajad arvavad: |
   |
:: |
0 :: |
0 :: |
27 |
|
tagasi üles |
|
 |
Fukiku
Kreisi kasutaja

liitunud: 06.11.2003
|
12.01.2011 15:52:39
|
|
|
priitr kirjutas: |
Fukiku kirjutas: |
See on igal juhul mõistlik, kuivõrd UTF-8 kodeering toetab põhimõtteliselt kõike, mida hing ihaldab. Võid samasse faili kirjutada segamini kirillitsat, jaapani ja/või hiina hieroglüüfe, Skandinaavia täpilisi ja kreeka tähestikku kasvõi. ISO vms. kodeeringutega majanadades vajaks iga selline keel erineva kodeeringuga salvestamist ning ühte faili kõike segamini suruda on oluliselt keerulisem. See siis natuke selgituseks, et miks UTF-8 on hea ja ISO, windows codepage'd ja muu eksootika saatanast.
Mulle isiklikult tundub, et kui kogu maailm UTF-8 kodeeringut kasutaks, oleks elu progejatele ja ka kasutajatele märkimisväärselt ilusam.  |
Kasutajatele küll, aga mitte progejatele. Progejatele meeldiks märksa rohkem UTF-16 kasutada, seda on lihtsam 'vajalikul määral' õieti teha. UTF-8 probleemideks on nt see, et ei saa eriti efektiivselt leida teksti pikkust tähemärkides (tähemärkide pikkus on 1-6 baiti) ja tekste jupitada. Varem olid ka veel hädad ühe ja sama sümboli erinevate kodeeringutega... A see muidugi enam veebilehekülgede tegemist ei puuduta .
Priit |
Kui seada eesmärgiks see, et kõik tähemärgid ühepikkused kahendkoodis oleks, siis oleks vaja UTF-32 kasutada, mitte UTF-16, UTF-16 kodeerib kas kahe või neljabaidiseks iga tähemärgi (UTF-8 on muide 1-4 baiti, mitte 1-6). Mis puutub efektiivsesse teksti pikkuse määramisse ja teksti jupitamisse, siis eks see oleneb vast tugevalt keelest, aga kaasaegses inimlikus programmeerimiskeeles võiks peale seda, kui baidijada on stringiks teisendatud, igasugused operatsioonid sellel stringil kenasti töötada ilma, et peaks multibait kodeeringute pärast pead vaevama.
_________________ Foxic is just a simple fox
Enne kui sa küsid oma küsimuse - küsi seda vannipardilt! Rangelt soovitatav enne programmeerimise alafoorumisse uue teema tegemist. |
|
Kommentaarid: 2 loe/lisa |
Kasutajad arvavad: |
   |
:: |
0 :: |
0 :: |
2 |
|
tagasi üles |
|
 |
priitr
HV kasutaja
liitunud: 17.06.2004
|
12.01.2011 17:21:32
|
|
|
Fukiku kirjutas: |
priitr kirjutas: |
Fukiku kirjutas: |
See on igal juhul mõistlik, kuivõrd UTF-8 kodeering toetab põhimõtteliselt kõike, mida hing ihaldab. Võid samasse faili kirjutada segamini kirillitsat, jaapani ja/või hiina hieroglüüfe, Skandinaavia täpilisi ja kreeka tähestikku kasvõi. ISO vms. kodeeringutega majanadades vajaks iga selline keel erineva kodeeringuga salvestamist ning ühte faili kõike segamini suruda on oluliselt keerulisem. See siis natuke selgituseks, et miks UTF-8 on hea ja ISO, windows codepage'd ja muu eksootika saatanast.
Mulle isiklikult tundub, et kui kogu maailm UTF-8 kodeeringut kasutaks, oleks elu progejatele ja ka kasutajatele märkimisväärselt ilusam.  |
Kasutajatele küll, aga mitte progejatele. Progejatele meeldiks märksa rohkem UTF-16 kasutada, seda on lihtsam 'vajalikul määral' õieti teha. UTF-8 probleemideks on nt see, et ei saa eriti efektiivselt leida teksti pikkust tähemärkides (tähemärkide pikkus on 1-6 baiti) ja tekste jupitada. Varem olid ka veel hädad ühe ja sama sümboli erinevate kodeeringutega... A see muidugi enam veebilehekülgede tegemist ei puuduta .
Priit |
Kui seada eesmärgiks see, et kõik tähemärgid ühepikkused kahendkoodis oleks, siis oleks vaja UTF-32 kasutada, mitte UTF-16, UTF-16 kodeerib kas kahe või neljabaidiseks iga tähemärgi (UTF-8 on muide 1-4 baiti, mitte 1-6). Mis puutub efektiivsesse teksti pikkuse määramisse ja teksti jupitamisse, siis eks see oleneb vast tugevalt keelest, aga kaasaegses inimlikus programmeerimiskeeles võiks peale seda, kui baidijada on stringiks teisendatud, igasugused operatsioonid sellel stringil kenasti töötada ilma, et peaks multibait kodeeringute pärast pead vaevama. |
Jajah, my bad. UTF standard lõpetab tõesti 10ffff peal ära ja seetõttu piisab 4 baidist UTF-8 jaoks. Efektiivsuse (kiiruse) huvides teisendatakse need UTF-8 andmed üldjuhul sisemiselt millekski kiireks töötlemiseks sobivamaks (UCS2, UCS4) ja opereeritakse siis sellega. Teisiti on kole aeganõudev nt 123453'ndat tähte stringist saada või kõiki '€' märke üles leida. Väljundi andmisel siis tehakse jälle teisendus UTF-8'sse. Ega ma väidagi, et see kõik ülikeerukas oleks, aga keerukam küll, kui 'vanasti'. Progejad võiksid ikka teada ja arvestada, et 100M tähemärki sisaldavate tekstide töötlemiseks ei kulu mitte 100MB mälu.
_________________ Tšudes ne bõvajet. |
|
Kommentaarid: 27 loe/lisa |
Kasutajad arvavad: |
   |
:: |
0 :: |
0 :: |
27 |
|
tagasi üles |
|
 |
Märt.
HV Guru

liitunud: 17.01.2004
|
12.01.2011 17:45:44
|
|
|
Noh, ma siin püüan alguses puhta HTML 4.01 koodiga läbi ajada. Eks MTÜ lehte arendades õpin tarkust juurde.
_________________ Albert Einstein: "Vaid kaks asja on lõpmatud, universum ja inimlik rumalus, ja selles esimeses pole ma nii kindel." |
|
Kommentaarid: 29 loe/lisa |
Kasutajad arvavad: |
   |
:: |
0 :: |
0 :: |
23 |
|
tagasi üles |
|
 |
MarkoBrain
HV vaatleja
liitunud: 23.10.2012
|
23.10.2012 17:01:54
|
|
|
TERE,
Kas tegelikult leidsid lahenduse, kuidas võimalik Evrsoftis teksti (vene keelt) kopeerida nii, et ei jääks küsimärke või lahendasid ikkagi nii, et konvertisid teksti _HTML-i keelde ka siis kopisid ülesse.
|
|
tagasi üles |
|
 |
Märt.
HV Guru

liitunud: 17.01.2004
|
27.10.2012 09:08:40
|
|
|
Just. Tekst HTML-i ja siis editorisse. Oli valutum, kuna tookord oli vaja teha ruttu ajutine leht, nüüd juba ammu kasutusel Wordpress ja qTranslate.
_________________ Albert Einstein: "Vaid kaks asja on lõpmatud, universum ja inimlik rumalus, ja selles esimeses pole ma nii kindel." |
|
Kommentaarid: 29 loe/lisa |
Kasutajad arvavad: |
   |
:: |
0 :: |
0 :: |
23 |
|
tagasi üles |
|
 |
|
lisa lemmikuks |
|
|
sa ei või postitada uusi teemasid siia foorumisse sa ei või vastata selle foorumi teemadele sa ei või muuta oma postitusi selles foorumis sa ei või kustutada oma postitusi selles foorumis sa ei või vastata küsitlustele selles foorumis sa ei saa lisada manuseid selles foorumis sa võid manuseid alla laadida selles foorumis
|
|
Hinnavaatlus ei vastuta foorumis tehtud postituste eest.
|