Avaleht
uus teema   vasta Tarkvara »  WWW »  Charset, vene keel ja muudki. märgi kõik teemad loetuks
märgi mitteloetuks
vaata eelmist teemat :: vaata järgmist teemat
Hinnavaatlus :: Foorum :: Uudised :: Ärifoorumid :: HV F1 ennustusvõistlus :: Pangalink :: Telekavad :: HV toote otsing
autor
sõnum Saada viide sõbrale.  :: Teata moderaatorile teata moderaatorile
otsing:  
Märt.
HV Guru
Märt.

liitunud: 17.01.2004




sõnum 10.01.2011 21:23:15 Charset, vene keel ja muudki. vasta tsitaadiga

Millist charseti on mõistlik kasutada vene keele puhul? Hetkel kasutan ISO-8859-5, kuid neid on veel...
Ja kuidas lahendada venekeelse teksti kuvamine editoris? Lihtne kopipasteet Wordist annab tulemuseks:
???????? ???? ????? ?????????


Salvestasin jutu veebilehena, siis sai selline märgisupp sortsust ümber kopeeritud:
Открылся фонд Ивана
Болдырева


Ja see märgisupi kuvand on siis:
Открылся фонд Ивана Болдырева


Editoriks on siis Evrsoft FirstPage 2006

Tahaks kuidagi lihtsamalt seda venekeelset teksti koodiaknasse saada, kui võimalik. Wordi genereeritud lehte küll otse välja panna ei soovi, mõttetut läbu on palju, sama tulemuse saab ka ju lihtsamalt HTML-is kribada.
Hüva nõu on tarviline vara...

_________________
Albert Einstein: "Vaid kaks asja on lõpmatud, universum ja inimlik rumalus, ja selles esimeses pole ma nii kindel."
Kommentaarid: 29 loe/lisa Kasutajad arvavad:  :: 0 :: 0 :: 23
tagasi üles
vaata kasutaja infot saada privaatsõnum mine selle kasutaja kodulehele
andrusny
Kreisi kasutaja
andrusny

liitunud: 20.03.2006




sõnum 10.01.2011 21:27:43 vasta tsitaadiga

UTF-8
_________________
Kommentaarid: 7 loe/lisa Kasutajad arvavad:  :: 0 :: 0 :: 7
tagasi üles
vaata kasutaja infot saada privaatsõnum mine selle kasutaja kodulehele
Märt.
HV Guru
Märt.

liitunud: 17.01.2004




sõnum 11.01.2011 15:15:24 vasta tsitaadiga

Olgu, aga kuidas saaks siiski normaalselt vene keelt Wordist või mujalt koodiaknasse kopeerida, ilma et jätaks mulle ülaltoodud küsimärkide rea? Millest see sõltub?
_________________
Albert Einstein: "Vaid kaks asja on lõpmatud, universum ja inimlik rumalus, ja selles esimeses pole ma nii kindel."
Kommentaarid: 29 loe/lisa Kasutajad arvavad:  :: 0 :: 0 :: 23
tagasi üles
vaata kasutaja infot saada privaatsõnum mine selle kasutaja kodulehele
Taavi_R
HV Guru
Taavi_R

liitunud: 30.09.2002



Autoriseeritud ID-kaardiga

sõnum 11.01.2011 22:58:38 vasta tsitaadiga

Kuhu editorisse sa seda kopeerida soovid?
Kui sul on mingi taoline editor nagu näiteks CKEditor, siis pead kleepima selle teksti "HTML" koodina, mitte tekstina.

Charset kirillitsal ISO 8859-5

_________________
raamatupidamine | laadakalender
Kommentaarid: 183 loe/lisa Kasutajad arvavad:  :: 2 :: 3 :: 163
tagasi üles
vaata kasutaja infot saada privaatsõnum
Fukiku
Kreisi kasutaja
Fukiku

liitunud: 06.11.2003




sõnum 11.01.2011 23:13:45 vasta tsitaadiga

Igasuguse UTF-8'st erinevate charsettide propageerimine tundub aastal 2010 saatanast olevat minuarust. Selles suhtes pole selle ISO'ga midagi peale hakata minu tagasihoidliku arvamuse järgi.
_________________
Foxic is just a simple fox
Enne kui sa küsid oma küsimuse - küsi seda vannipardilt! Rangelt soovitatav enne programmeerimise alafoorumisse uue teema tegemist.
Kommentaarid: 2 loe/lisa Kasutajad arvavad:  :: 0 :: 0 :: 2
tagasi üles
vaata kasutaja infot saada privaatsõnum
priitr
HV kasutaja

liitunud: 17.06.2004




sõnum 12.01.2011 12:26:17 vasta tsitaadiga

Vene kirillitsa erinevaid ühebaidiseid kodeeringuid on palju (IBM-855, KOI-8, CP-866, Windows-1251, ISO8859-5, ...), seega mõistlik inimene kasutab UTF-8.
_________________
Tšudes ne bõvajet.
Kommentaarid: 27 loe/lisa Kasutajad arvavad:  :: 0 :: 0 :: 27
tagasi üles
vaata kasutaja infot saada privaatsõnum
Märt.
HV Guru
Märt.

liitunud: 17.01.2004




sõnum 12.01.2011 13:07:11 vasta tsitaadiga

Taavi_R kirjutas:
Kuhu editorisse sa seda kopeerida soovid?
Kui sul on mingi taoline editor nagu näiteks CKEditor, siis pead kleepima selle teksti "HTML" koodina, mitte tekstina.

Charset kirillitsal ISO 8859-5

Editoriks on siis Evrsoft FirstPage 2006. Lihtne ja arusaadav. Kust leida kirillitsa HTML-koodi? Võimalik, et olen valesti otsinud.

Ja kuna enamik soovitab UTF-8-t, siis muudangi vast praegusest ISO-8859-5 UTF-8 peale ära.

EDIT: näpukas.

_________________
Albert Einstein: "Vaid kaks asja on lõpmatud, universum ja inimlik rumalus, ja selles esimeses pole ma nii kindel."


viimati muutis Märt. 12.01.2011 17:45:12, muudetud 1 kord
Kommentaarid: 29 loe/lisa Kasutajad arvavad:  :: 0 :: 0 :: 23
tagasi üles
vaata kasutaja infot saada privaatsõnum mine selle kasutaja kodulehele
Fukiku
Kreisi kasutaja
Fukiku

liitunud: 06.11.2003




sõnum 12.01.2011 13:46:33 vasta tsitaadiga

udusiil kirjutas:
Taavi_R kirjutas:
Kuhu editorisse sa seda kopeerida soovid?
Kui sul on mingi taoline editor nagu näiteks CKEditor, siis pead kleepima selle teksti "HTML" koodina, mitte tekstina.

Charset kirillitsal ISO 8859-5

Editoriks on siis Evrsoft FirstPage 2006. Lihtne ja arusaadav. Kust leida kirillitsa HTML-koodi? Võimalik, et olen valesti otsinud.

Ja kuna enamik soovitab UTF-8-t, siis muudangi vast praegusest ISO-8859-5 UTF-6 peale ära.
See on igal juhul mõistlik, kuivõrd UTF-8 kodeering toetab põhimõtteliselt kõike, mida hing ihaldab. Võid samasse faili kirjutada segamini kirillitsat, jaapani ja/või hiina hieroglüüfe, Skandinaavia täpilisi ja kreeka tähestikku kasvõi. ISO vms. kodeeringutega majanadades vajaks iga selline keel erineva kodeeringuga salvestamist ning ühte faili kõike segamini suruda on oluliselt keerulisem. See siis natuke selgituseks, et miks UTF-8 on hea ja ISO, windows codepage'd ja muu eksootika saatanast.

Mulle isiklikult tundub, et kui kogu maailm UTF-8 kodeeringut kasutaks, oleks elu progejatele ja ka kasutajatele märkimisväärselt ilusam. icon_smile.gif

_________________
Foxic is just a simple fox
Enne kui sa küsid oma küsimuse - küsi seda vannipardilt! Rangelt soovitatav enne programmeerimise alafoorumisse uue teema tegemist.
Kommentaarid: 2 loe/lisa Kasutajad arvavad:  :: 0 :: 0 :: 2
tagasi üles
vaata kasutaja infot saada privaatsõnum
priitr
HV kasutaja

liitunud: 17.06.2004




sõnum 12.01.2011 15:36:04 vasta tsitaadiga

Fukiku kirjutas:
udusiil kirjutas:
Taavi_R kirjutas:
Kuhu editorisse sa seda kopeerida soovid?
Kui sul on mingi taoline editor nagu näiteks CKEditor, siis pead kleepima selle teksti "HTML" koodina, mitte tekstina.

Charset kirillitsal ISO 8859-5

Editoriks on siis Evrsoft FirstPage 2006. Lihtne ja arusaadav. Kust leida kirillitsa HTML-koodi? Võimalik, et olen valesti otsinud.

Ja kuna enamik soovitab UTF-8-t, siis muudangi vast praegusest ISO-8859-5 UTF-6 peale ära.
See on igal juhul mõistlik, kuivõrd UTF-8 kodeering toetab põhimõtteliselt kõike, mida hing ihaldab. Võid samasse faili kirjutada segamini kirillitsat, jaapani ja/või hiina hieroglüüfe, Skandinaavia täpilisi ja kreeka tähestikku kasvõi. ISO vms. kodeeringutega majanadades vajaks iga selline keel erineva kodeeringuga salvestamist ning ühte faili kõike segamini suruda on oluliselt keerulisem. See siis natuke selgituseks, et miks UTF-8 on hea ja ISO, windows codepage'd ja muu eksootika saatanast.

Mulle isiklikult tundub, et kui kogu maailm UTF-8 kodeeringut kasutaks, oleks elu progejatele ja ka kasutajatele märkimisväärselt ilusam. icon_smile.gif


Kasutajatele küll, aga mitte progejatele. Progejatele meeldiks märksa rohkem UTF-16 kasutada, seda on lihtsam 'vajalikul määral' icon_wink.gif õieti teha. UTF-8 probleemideks on nt see, et ei saa eriti efektiivselt leida teksti pikkust tähemärkides (tähemärkide pikkus on 1-6 baiti) ja tekste jupitada. Varem olid ka veel hädad ühe ja sama sümboli erinevate kodeeringutega... A see muidugi enam veebilehekülgede tegemist ei puuduta icon_smile.gif.

Priit

_________________
Tšudes ne bõvajet.
Kommentaarid: 27 loe/lisa Kasutajad arvavad:  :: 0 :: 0 :: 27
tagasi üles
vaata kasutaja infot saada privaatsõnum
Fukiku
Kreisi kasutaja
Fukiku

liitunud: 06.11.2003




sõnum 12.01.2011 15:52:39 vasta tsitaadiga

priitr kirjutas:
Fukiku kirjutas:
See on igal juhul mõistlik, kuivõrd UTF-8 kodeering toetab põhimõtteliselt kõike, mida hing ihaldab. Võid samasse faili kirjutada segamini kirillitsat, jaapani ja/või hiina hieroglüüfe, Skandinaavia täpilisi ja kreeka tähestikku kasvõi. ISO vms. kodeeringutega majanadades vajaks iga selline keel erineva kodeeringuga salvestamist ning ühte faili kõike segamini suruda on oluliselt keerulisem. See siis natuke selgituseks, et miks UTF-8 on hea ja ISO, windows codepage'd ja muu eksootika saatanast.

Mulle isiklikult tundub, et kui kogu maailm UTF-8 kodeeringut kasutaks, oleks elu progejatele ja ka kasutajatele märkimisväärselt ilusam. icon_smile.gif


Kasutajatele küll, aga mitte progejatele. Progejatele meeldiks märksa rohkem UTF-16 kasutada, seda on lihtsam 'vajalikul määral' icon_wink.gif õieti teha. UTF-8 probleemideks on nt see, et ei saa eriti efektiivselt leida teksti pikkust tähemärkides (tähemärkide pikkus on 1-6 baiti) ja tekste jupitada. Varem olid ka veel hädad ühe ja sama sümboli erinevate kodeeringutega... A see muidugi enam veebilehekülgede tegemist ei puuduta icon_smile.gif.

Priit
Kui seada eesmärgiks see, et kõik tähemärgid ühepikkused kahendkoodis oleks, siis oleks vaja UTF-32 kasutada, mitte UTF-16, UTF-16 kodeerib kas kahe või neljabaidiseks iga tähemärgi (UTF-8 on muide 1-4 baiti, mitte 1-6). Mis puutub efektiivsesse teksti pikkuse määramisse ja teksti jupitamisse, siis eks see oleneb vast tugevalt keelest, aga kaasaegses inimlikus programmeerimiskeeles võiks peale seda, kui baidijada on stringiks teisendatud, igasugused operatsioonid sellel stringil kenasti töötada ilma, et peaks multibait kodeeringute pärast pead vaevama.
_________________
Foxic is just a simple fox
Enne kui sa küsid oma küsimuse - küsi seda vannipardilt! Rangelt soovitatav enne programmeerimise alafoorumisse uue teema tegemist.
Kommentaarid: 2 loe/lisa Kasutajad arvavad:  :: 0 :: 0 :: 2
tagasi üles
vaata kasutaja infot saada privaatsõnum
priitr
HV kasutaja

liitunud: 17.06.2004




sõnum 12.01.2011 17:21:32 vasta tsitaadiga

Fukiku kirjutas:
priitr kirjutas:
Fukiku kirjutas:
See on igal juhul mõistlik, kuivõrd UTF-8 kodeering toetab põhimõtteliselt kõike, mida hing ihaldab. Võid samasse faili kirjutada segamini kirillitsat, jaapani ja/või hiina hieroglüüfe, Skandinaavia täpilisi ja kreeka tähestikku kasvõi. ISO vms. kodeeringutega majanadades vajaks iga selline keel erineva kodeeringuga salvestamist ning ühte faili kõike segamini suruda on oluliselt keerulisem. See siis natuke selgituseks, et miks UTF-8 on hea ja ISO, windows codepage'd ja muu eksootika saatanast.

Mulle isiklikult tundub, et kui kogu maailm UTF-8 kodeeringut kasutaks, oleks elu progejatele ja ka kasutajatele märkimisväärselt ilusam. icon_smile.gif


Kasutajatele küll, aga mitte progejatele. Progejatele meeldiks märksa rohkem UTF-16 kasutada, seda on lihtsam 'vajalikul määral' icon_wink.gif õieti teha. UTF-8 probleemideks on nt see, et ei saa eriti efektiivselt leida teksti pikkust tähemärkides (tähemärkide pikkus on 1-6 baiti) ja tekste jupitada. Varem olid ka veel hädad ühe ja sama sümboli erinevate kodeeringutega... A see muidugi enam veebilehekülgede tegemist ei puuduta icon_smile.gif.

Priit
Kui seada eesmärgiks see, et kõik tähemärgid ühepikkused kahendkoodis oleks, siis oleks vaja UTF-32 kasutada, mitte UTF-16, UTF-16 kodeerib kas kahe või neljabaidiseks iga tähemärgi (UTF-8 on muide 1-4 baiti, mitte 1-6). Mis puutub efektiivsesse teksti pikkuse määramisse ja teksti jupitamisse, siis eks see oleneb vast tugevalt keelest, aga kaasaegses inimlikus programmeerimiskeeles võiks peale seda, kui baidijada on stringiks teisendatud, igasugused operatsioonid sellel stringil kenasti töötada ilma, et peaks multibait kodeeringute pärast pead vaevama.


Jajah, my bad. UTF standard lõpetab tõesti 10ffff peal ära ja seetõttu piisab 4 baidist UTF-8 jaoks. Efektiivsuse (kiiruse) huvides teisendatakse need UTF-8 andmed üldjuhul sisemiselt millekski kiireks töötlemiseks sobivamaks (UCS2, UCS4) ja opereeritakse siis sellega. Teisiti on kole aeganõudev nt 123453'ndat tähte stringist saada või kõiki '€' märke üles leida. Väljundi andmisel siis tehakse jälle teisendus UTF-8'sse. Ega ma väidagi, et see kõik ülikeerukas oleks, aga keerukam küll, kui 'vanasti'. Progejad võiksid ikka teada ja arvestada, et 100M tähemärki sisaldavate tekstide töötlemiseks ei kulu mitte 100MB mälu.

_________________
Tšudes ne bõvajet.
Kommentaarid: 27 loe/lisa Kasutajad arvavad:  :: 0 :: 0 :: 27
tagasi üles
vaata kasutaja infot saada privaatsõnum
Märt.
HV Guru
Märt.

liitunud: 17.01.2004




sõnum 12.01.2011 17:45:44 vasta tsitaadiga

icon_smile.gif Noh, ma siin püüan alguses puhta HTML 4.01 koodiga läbi ajada. Eks MTÜ lehte arendades õpin tarkust juurde.
_________________
Albert Einstein: "Vaid kaks asja on lõpmatud, universum ja inimlik rumalus, ja selles esimeses pole ma nii kindel."
Kommentaarid: 29 loe/lisa Kasutajad arvavad:  :: 0 :: 0 :: 23
tagasi üles
vaata kasutaja infot saada privaatsõnum mine selle kasutaja kodulehele
MarkoBrain
HV vaatleja

liitunud: 23.10.2012




sõnum 23.10.2012 17:01:54 vasta tsitaadiga

TERE,
Kas tegelikult leidsid lahenduse, kuidas võimalik Evrsoftis teksti (vene keelt) kopeerida nii, et ei jääks küsimärke või lahendasid ikkagi nii, et konvertisid teksti _HTML-i keelde ka siis kopisid ülesse.
tagasi üles
vaata kasutaja infot saada privaatsõnum
Märt.
HV Guru
Märt.

liitunud: 17.01.2004




sõnum 27.10.2012 09:08:40 vasta tsitaadiga

Just. Tekst HTML-i ja siis editorisse. Oli valutum, kuna tookord oli vaja teha ruttu ajutine leht, nüüd juba ammu kasutusel Wordpress ja qTranslate. thumbs_up.gif
_________________
Albert Einstein: "Vaid kaks asja on lõpmatud, universum ja inimlik rumalus, ja selles esimeses pole ma nii kindel."
Kommentaarid: 29 loe/lisa Kasutajad arvavad:  :: 0 :: 0 :: 23
tagasi üles
vaata kasutaja infot saada privaatsõnum mine selle kasutaja kodulehele
näita postitusi alates eelmisest:   
uus teema   vasta Tarkvara »  WWW »  Charset, vene keel ja muudki.
[vaata eelmist teemat] [vaata järgmist teemat]
 lisa lemmikuks
näita foorumit:  
 ignoreeri teemat 
sa ei või postitada uusi teemasid siia foorumisse
sa ei või vastata selle foorumi teemadele
sa ei või muuta oma postitusi selles foorumis
sa ei või kustutada oma postitusi selles foorumis
sa ei või vastata küsitlustele selles foorumis
sa ei saa lisada manuseid selles foorumis
sa võid manuseid alla laadida selles foorumis



Hinnavaatlus ei vastuta foorumis tehtud postituste eest.