Kódová stránka

Od: kolemjdouci 18.01.22 17:09

Poradí někdo o jakou kódovou stránku jde?

doplněno 18.01.22 18:02:

nějak se nepřiložila příloha

7 odpovědí na otázku

Řazeno dle hodnocení

herd®

18.01.22 21:09

Tady je podrobně polopaticky postup kódování UTF-8 en.wikipedia.org/... (sekce encoding)Příklad:Hned vidíme že před háčky je Ï a před čárkami Â. en.wikipedia.org/... a en.wikipedia.org/... Ty mají kód C2h/ CF (ISO8859x) nebo 62h /77 (EBCDIC)Dvě možnosti - zjistit si zápis těchto dvou znaků v různých kódování nebo zjistit si kód Unicode en.wikipedia.org/... Pro háček a čárku: To je U+0301h ́ 769Combining Acute Accent v bitech: 11 0000 0001b: Proloženo : 110x xxxx + 10xx xxxx = 1100 1100 1000 0001b= CC 81hU+030Ch ̌ 780Combining Caron.11 0000 1100b. Proloženo: 1100 1100 1000 1100 =CC 8ChTento Unicode symbol (né písmeno nebo znak, protože teprv s následujícím znakem latinky tvoří znak). Má zápis ze dvou bajtů jak víme. Zápis jsem zapsal k nim nahoru:ČEMU TYTO ZNAKY ODPOVÍDAJÍ? CC, 81, 89? To mi nesouhlasí... prostě je tam asi nějaká další transformace

[přidat komentář]

herd®

18.01.22 17:25

a víš vůbec co myslíš? Můžeš to zkusit trefit, když si otevřeš soubor v sublime text a budeš postupně měnit File Reopen with encoding.

Nebo vědečtější přístup, že si v textu najdeš zmíněný bajt, zjitíš, jakému písmenu odpovídá a na wikipedii si najdeš Heslo tabulka kódování nebo přímo dané písmeno např ď - a mělo by tam mít jaký mu odpovída bajt v různých kódování.. Ale to ti neurčí kódování jednoznačně. Např písmena áíé jsou stejné asi pro cp1250 a pro iso 8559-2, ale rozchátí se v ďťň...

[přidat komentář]

arne1®

18.01.22 17:18

No a o co vlastně jde? Žádné informace nevidím

arne1®

18.01.22 19:24

To vypadá na Unicode, v kodovani UTF8. Běžné znaky jsou normální, znaky s diakritikou vidím jako dvojznaky, přitom ten první je většinou stejný.

[přidat komentář]

stepm®

18.01.22 19:15

O špatně zvolenou.

[přidat komentář]

herd®

18.01.22 20:10

Z obrázku to fakt bude přepisovat jen filantrop nebo altruista.Kromě toho je se tam asi nějaké znaky ztratily a takhle to fakt nikdy nevytáhne, protože není co. Je potřeba stream bajtů.

Tvůj dotaz je špatně formulovaný... To může být text v jakékmoli kódování... Ale předpokládám, že má jít o text "srozumitelný"českých slov tedy "hůř"..

Já tipuji že jde o text UTF-8 interpretovaný jako jiné kódování, které následně některé znaky zahodilo.

I kdyby někdo přepsal text z (toho obrázku), tak ho nepřevede, ale možná rekonstruuje na základě reverzního inženýrství.

Možná můj další tip, že jde o nějaký UTF 8 s použítí combining characters. Jelikož tam vidím vždy dvojice nesmyslné písmeno+ písmeno bez diakritiky.

Zde:

en.wikipedia.org/...

[přidat komentář]

joudic*

21.01.22 10:03

je to utf8 text na strance s kodovanim cp1250

Skočit na otázku
Vložit novou otázku

[přidat komentář]

Přidat svou odpověď

Přihlásit se k odběru odpovědí z této otázky:

Neneseme odpovědnost za správnost informací a za škodu vzniklou jejich využitím. Jednotlivé odpovědi vyjadřují názory jejich autorů a nemusí se shodovat s názorem provozovatele poradny Poradte.cz.

Používáním poradny vyjadřujete souhlas s personifikovanou reklamou, která pomáhá financovat tento server, děkujeme.