Unicode je znaková sada zahrnující většinu znaků dnes používaných v nejrůznějších oblastech. Všechny znaky jsou jednoznačně definovány indexem (slovní zkratkou) a pozicí v tabulce.
Otevřený formát dokumentu – je založený na živých prvcích, například na editovatelném textu, a proto je nutná i nezávislost na použitém fontu. Soubory s fonty nelze až na vyjímky volně přenášet mezi počítači (platí pro ně stejná pravidla jako pro SW ), proto text, nezávislý na fontu, má své nevýhody při interpretaci některých znaků, které jsou dostupné jen v některých písmech (matematické operátory, symboly měn apod.). Typickým otevřeným formátem jsou soubory s koncovkou txt, rtf, doc apod.
Uzavřený formát dokumentu – je založený na bezpečném uchování vzhledu dokumentu při přenášení mezi počítači. Dokument je finálním produktem, do kterého již nebude nikdo zasahovat. Typickým uzavřeným formátem jsou soubory s koncovkou pdf, ps, prn apod.
Aby mělo použití otevřených formátů smysl, musí být význam znaku zaznamenán správně jako kód v odpovídající znakové sadě. Jeho vizuální interpretace je až druhotná záležitost. Následuje přehled, který ukazuje na problémy při špatném zápisu znaků. Popis vztahující se k zápisu znaků je popsán pro operační systémy Windows.
1. V sazbě se vyhýbejte problémům se zaměnitelností znaků. U některých písem vhodných pro zobrazení v nižším rozlišení a zároveň v menších velikostech byly některé znaky očesány o rozlišovací prvky a čitelnost tak může být tímto nedostatkem velmi trpět. Těžko může obstát bezpatkové písmo (sans-serif) fontu Humanist v čitelnosti znaků I, l a I (velké i, malé l a číslovka 1).
Až nápadná podobnost je vidět při srovnávání znaků různých abeced. V latince verzálka B je tvarově totožná s řeckým znakem Β (verzálka znaku beta) a s В v cyrilice (verzálka znaku V). Podobná situace je v odlišení tvarů minusek ß (ostré s) na pozici 223 a β (beta) na pozici 946 ve znakové sadě Unicode. Běžně se objevuje tento problém ve spojení malá velikost písma vs. předimenzovaná střední výška na úkor horních a dolních dotahů.
2. Často jsou některé znaky formátovány tak aby se podobaly jiným znakům. Tato snaha bolí, protože sazbu je nutné provést tak, aby ji bylo možné přeformátovat (na jinou velikost, typ písma apod.).
Nejčastěji se objevuje napodobenina znaku stupně o vytvořená zmenšením písmene „o“. Podobných znaků se ve fontech vyskytuje více. Příkladem může být znak stupně se znakem jemu podobným, ale s významem řadové číslovky: 2° (dvoustupňový) nebo 2º (secundo). V tomto případě jsou v ukázce dva tvarově podobné znaky použité ve stejné sekvenci znaků, jeden na pozici 176 a druhý na pozici 186 v Unicode sadě. Nahrazení uvedených významů jinými znaky, například použitím tvaru písmene “o” (2o) nebo číslovky “0” (20) ve tvaru horního indexu je sémanticky i typograficky nepřípustné. Podobným příkladem je písmeno “a” s kroužkem (používá se v zemích Skandinávského poloostrova), které pro autory není těžké vytvořit horizontálním posunem stupně nebo kroužku nad písmeno “a”.
3. Sada Unicode je natolik rozsáhlá, že je v ní definováno také mnoho alternativních tvarů znaků. Jejich významnou část tvoří slitky (ligatury). Nejběžnější příklad fi (f a i) lze rozložit na dva znaky aniž by se změnil význam. Použití slitků ale nepramení jen z potřeby vizuálně obohatit sazbu. V některých případech se při jejich použití zvyšuje srozumitelnost. Tyto slitky nemusí zapříčinit vizuální změnu příslušných písmen, ale uvnitř jen skrývají specifický význam, který může být důležitý pro případ hlasového výstupu. Například vizuálně nepostřehnutelný rozdíl je při použití slitku ℃ (stupeň Celsia Alt + 8451), který je zpravidla sázen ve stejné podobě, ale jako dva nezávislé znaky °C (stupeň a velké písmeno C). Bohužel je většina ligatur dostupná jen v Unicode sadě, navíc systémová písma ℃°C stupeň Celsia (Alt + 8451) stupeň (C) (Alt + 0176) tyto znaky obsahují jen zřídka. V otevřených formátech bychom neměli sázet slitky přímo, aby nedošlo k nechtěné náhradě za jiný znak v případě, že ve finálním zlomu bude písmo, v němž nebude slitek dostupný.
Zajímavostí pak je, že na tento problém existují mechanismy, kdy se do textu nevkládají ligatury přímo, ale sází se z více znaků. K výslednému zobrazení ligatur pak dochází dodatečně u koncového uživatele, a to prostřednictvím podpory OpenType fontů, resp. knihovny OTLT (OpenType Layout Tables).
4. Co se týče korektur sazby, je nutné počítat s tím, že typograf bude sazbu kontrolovat pouze vizuálně. Protože existuje řada znaků (čárka vs. počáteční česká uvozovka [srov., a ‚], minus vs. pomlčka pro verzálky, stupeň vs. indikátor mužského rodu vs. znak pro odeznívající tón, černá kružnice vs. operátor kolečko aj.), které jsou svým vzhledem ve většině písem naprosto totožné, panuje u mnoha autorů mylná představa, že rozhoduje vzhled, případné záměny někdo za ně opraví. Problém bude v elektronickém publikování opět při vyhledávání textu a při čtení textu přes hlasový výstup. S reprodukováním vzhledu znaků v otevřeném formátu bohužel jsou, a budou, vždy problémy. Někdy se lze problému se zobrazením vyhnout i tím, že se při problémech s použitím odlišné znakové sady, například záření γ, význam opíše jako gama záření.
5. Pozice, tučnost, stínování tahu mohou napovědět, o jaký znak se jedná nebo aspoň do jaké oblasti bude znak patřit. Znak se stínováním tahu Ø (přešktrnuté velké „O“ Alt + 0248) patří mezi znaky abecedy. Naopak matematické značky prázdná množina (Alt + 8709) a průměr (Alt + 8960) bývají zpravidla strohé bez stínování tahu.
Dvojsmysly (a nesmysly)
Bohužel se v sazbě textu objevují i nesmyslná sdělení, jak uvádím zde ve třech příkladech:
1. Nicneříkající zápis x=1-3 můžeme při nahrazení spojovníku pomlčkou reprodukovat jako rozsah proměnné x = 1–3 (x je rovno hodnotě od jedné do tří) nebo jako rovnici x = 1 − 3 (x se rovná jedna minus tři). V prvním případě je proměnná x sázena skloněným řezem a v druhém případě je pro dosažení správného významu velmi důležité použití mezer okolo znaku minus.
2. Správný význam můžeme věštit z koule i v tomto textu: Jeli jsme po trase Ostrava-Zábřeh-Brno-Praha-Florenc.
Správný zápis je buď „Ostrava–Zábřeh–Brno–Praha-Florenc“ nebo také „Ostrava-Zábřeh–Brno–Praha-Florenc“. Při použití spojovníku (divis) „-“ se jedná o Zábřeh, který je městskou částí Ostravy a v případě pomlčky „–“ jde o město Zábřeh na Moravě
3. Zápis Obsahuje 2x… je samozřejmě nesmysl. Věta má význam při použití mezery před písmenem „x“. Navíc takto zkrácený zápis ve větě komplikuje čtení. Obsahuje 2 x… je lépe zapsat Obsahuje dvě „iks“ … Výjimkou jsou například rovnice 2x = (y + z)2, kde je zvyklostí vypouštět mezeru pro přehlednost. Jiný význam by měl zápis Obsahuje 2×… Znaménko krát správně vypadá jako dvě čáry, které by měly být kolmo protnuty – „ד (tento tvar zůstává stejný i ve skloněných řezech). Ve větě bychom znaménko „ד vypsali slovy: Obsahuje dvakrát…
Seriál byl vytvořen dle publikace Roberta Janáka Jak zpracovávat text při tvorbě posterů a prezentačních materiálů.