Nejste přihlášen/a.

Přihlásit se do poradny

 

Kódová stránka

Od: kolemjdouci odpovědí: 7 změna:

Poradí někdo o jakou kódovou stránku jde?


doplněno 18.01.22 18:02:

nějak se nepřiložila příloha


Kódová stránka

 

 

7 odpovědí na otázku
Řazeno dle hodnocení

 

 

hodnocení

2x
avatar herd
Tady je podrobně polopaticky postup kódování UTF-8 en.wikipedia.org/... (sekce encoding)Příklad:Hned vidíme že před háčky je Ï a před čárkami Â. en.wikipedia.org/... a en.wikipedia.org/... Ty mají kód C2h/ CF (ISO8859x) nebo 62h /77 (EBCDIC)Dvě možnosti - zjistit si zápis těchto dvou znaků v různých kódování nebo zjistit si kód Unicode en.wikipedia.org/... Pro háček a čárku: To je U+0301h ́ 769Combining Acute Accent v bitech: 11 0000 0001b: Proloženo : 110x xxxx + 10xx xxxx = 1100 1100 1000 0001b= CC 81hU+030Ch ̌ 780Combining Caron.11 0000 1100b. Proloženo: 1100 1100 1000 1100 =CC 8ChTento Unicode symbol (né písmeno nebo znak, protože teprv s následujícím znakem latinky tvoří znak). Má zápis ze dvou bajtů jak víme. Zápis jsem zapsal k nim nahoru:ČEMU TYTO ZNAKY ODPOVÍDAJÍ? CC, 81, 89? To mi nesouhlasí... prostě je tam asi nějaká další transformace

 

hodnocení

1x
avatar herd

a víš vůbec co myslíš? Můžeš to zkusit trefit, když si otevřeš soubor v sublime text a budeš postupně měnit File Reopen with encoding.

Nebo vědečtější přístup, že si v textu najdeš zmíněný bajt, zjitíš, jakému písmenu odpovídá a na wikipedii si najdeš Heslo tabulka kódování nebo přímo dané písmeno např ď - a mělo by tam mít jaký mu odpovída bajt v různých kódování.. Ale to ti neurčí kódování jednoznačně. Např písmena áíé jsou stejné asi pro cp1250 a pro iso 8559-2, ale rozchátí se v ďťň...

 

hodnocení

0x
avatar arne1

No a o co vlastně jde? Žádné informace nevidím

To vypadá na Unicode, v kodovani UTF8. Běžné znaky jsou normální, znaky s diakritikou vidím jako dvojznaky, přitom ten první je většinou stejný.

 

hodnocení

0x

O špatně zvolenou.

 

hodnocení

0x
avatar herd

Z obrázku to fakt bude přepisovat jen filantrop nebo altruista.Kromě toho je se tam asi nějaké znaky ztratily a takhle to fakt nikdy nevytáhne, protože není co. Je potřeba stream bajtů.

Tvůj dotaz je špatně formulovaný... To může být text v jakékmoli kódování... Ale předpokládám, že má jít o text "srozumitelný"českých slov tedy "hůř"..

Já tipuji že jde o text UTF-8 interpretovaný jako jiné kódování, které následně některé znaky zahodilo.

I kdyby někdo přepsal text z (toho obrázku), tak ho nepřevede, ale možná rekonstruuje na základě reverzního inženýrství.

Možná můj další tip, že jde o nějaký UTF 8 s použítí combining characters. Jelikož tam vidím vždy dvojice nesmyslné písmeno+ písmeno bez diakritiky.

Zde:

en.wikipedia.org/...

 

joudic*
hodnocení

0x
je to utf8 text na strance s kodovanim cp1250

 

 


 

 

 

Přihlásit se k odběru odpovědí z této otázky:

Neneseme odpovědnost za správnost informací a za škodu vzniklou jejich využitím. Jednotlivé odpovědi vyjadřují názory jejich autorů a nemusí se shodovat s názorem provozovatele poradny Poradte.cz.

Používáním poradny vyjadřujete souhlas s personifikovanou reklamou, která pomáhá financovat tento server, děkujeme.

Copyright © 2004-2025 Poradna Poradte.cz. Všechna práva vyhrazena. Prohlášení o ochraně osobních údajů. | [tmavý motiv]