The words you are searching are inside this book. To get more targeted content, please make full-text search by clicking here.
Discover the best professional documents and content resources in AnyFlip Document Base.
Search
Published by Gintautas Grabauskas, 2017-12-20 02:07:48

el. leidiniu bylu formatai

el. leidiniu bylu formatai

KAUNO TECHNOLOGIJOS UNIVERSITETAS
MECHANIKOS INŽINERIJOS IR DIZAINO FAKULTETAS

GAMYBOS INŽINERIJOS KATEDRA

DAŽNIAUSIAI PUBLIKUOJAMŲ EL. LEIDINIŲ BYLŲ
FORMATŲ ANALIZĖ

Parengė: DB I-2 gr. stud. Gintautas Grabauskas
Priėmė: doc. K. Vaitasius

Kaunas
2017

Turinys 3
4
1. Įvadas 5
2. Trumpa el. leidinių bylų formatų istorija 5
3. El. leidinių bylų formatai 5
6
3.1. Grynasis tekstas (.txt) 8
3.2. Raiškusis tekstas (.doc, .docx) 9
3.3. Portable Document Format (.pdf) 10
3.4. DjVu (.djvu, .djv) 11
3.5. Hiperteksto žymėjimo kalba (.html) 12
3.6. EPUB (.epub) 13
3.7. Mobipocket (.mobi) 13
3.8. Kindle (.azw, .azw3, .kfx) 15
3.9. FictionBook (.fb2) 16
3.10. iBook (.ibooks) 17
4. El. leidinių bylų formatų palyginimas
5. Išvados
6. Literatūra

2

1. Įvadas

Publikuojant el. leidinius skaitytojui turi būti sudarytos sąlygos su bet kokiu
skaitymui skirtu įrenginiu prieiti prie informacijos internete, todėl labai svarbu
parinkti tinkamą leidinio formatą. Ši galimų formatų įvairovė sukelia leidėjams
pasirinkimo sunkumų.

Formatas yra tam tikrų taisyklių rinkinys, apibrėžiantis, kokia informacija
yra ir turi būti pateikiama kompiuterio faile. Jei nebūtų failų formatų, nebūtų įmanoma
kaupti informacijos ir ja keistis. Failų formatų yra labai daug, tačiau kai kurie jų
naudojami tik specifinėms užduotims atlikti, tokie nėra plačiai paplitę, o standartinių
failų formatus naudoja daugelis programų.

El. leidiniams peržiūrėti yra sukurta nemažai įvairių formatų. Turinio
formatai gali būti skirtingi: verbalinis, garso ir vizualinis. Nuo pateikiamo formato ir
jam naudojamų technologijų priklauso ir el. leidinio rūšis, tačiau šiuo metu jau galimos
ir visų šių trijų formatų jungtys ar įvairios kombinacijos.

Šiame darbe bus apžvelgti populiaresni el. leidinių failų formatai, jų
palyginimas.

3

2. Trumpa el. leidinių bylų formatų istorija

1971 m. pradėtas Gutenbergo projektas. Jo tikslas – suskaitmeninti ir
padaryti prieinamus visuomenei tekstus iš viešos nuosavybės knygų, kurioms baigėsi
autorinių teisių galiojimas arba kurios niekad nebuvo autorinės teisės objektas. 2006
metų pabaigos duomenimis, bibliotekoje yra apie 19000 knygų elektroniniu formatu.
Kaip ir pačios pirmosios projekto knygos, dauguma suskaitmenintų leidinių bibliotekoje
pateikiami kaip neformatuotas (ASCII) tekstas.

1983 m. pasirodo pirmoji tekstinio redaktoriaus Microsoft Word versija. Ši
programa sparčiai populiarėja, jos bylų formatas DOC tampa visuotiniu standartu.

1990 m. Tim Berners-Lee, CERN mokslininkas, sukuria hiperteksto
žymėjimo kalbą (HTML). Šios kalbos dėka mes dabar kasdien naršome internete
ieškodami informacijos, naujienų, bendraujame.

1993 m. kompanija Adobe sukuria dokumentų formatą PDF ir pristato
programinę įrangą Acrobat, kuria galima kurti ir peržiūrėti PDF bylas. Formatas
greitai išpopuliarėja dėl savo nepriklausomumo nuo aparatinės ir programinės įrangos
ir tikslaus dokumentų atvaizdavimo.

2000 m. prancūzų kompanija Mobipocket sukuria el. knygų formatą .mobi ir
knygų skaityklę Mobipocket Reader.

2007 m. Amazon išleidžia Kindle el. knygų skaityklę, kuri palaiko savą el.
knygų formatą Kindle.

Tais pačiais metais sukuriamas EPUB formatas, kurį savo standartu
paskelbia International Digital Publishing Forum (IDPF). Šiuo metu el. knygų formatas
EPUB yra populiariausias.

4

3. El. leidinių bylų formatai

3.1. Grynasis tekstas (.txt)
Tekstinius failus (.txt) sudaro ASCII arba Unicode tekstas, jie yra lengvai
kompiuterių perskaitomi ir redaguojami, formatą palaiko visi tekstiniai redaktoriai.
Nepalaiko teksto formatavimo, DRM, dažniausiai į juos neįeina meta duomenys apie
dokumentą, taigi kūrėjai turėtų nusiskaityti duomenis taip, kad būtų galima
interpretuoti informaciją tokią, kokia ji yra, be papildomo žinojimo apie dokumento
struktūrą (meta duomenų). Gali būti problemų, naudojant grynojo teksto failus
skirtingose operacinėse sistemose. MS Windows, Mac OS X ir Unix kiekviena savaip
pasako kompiuteriui, kad jau pasiekė failo pabaigą. Grynojo teksto failai yra nedideli,
jų dydis baitais tiesiog priklauso nuo simbolių skaičiaus. Pavyzdžiui, Biblija, kurioje
sudaro maždaug 800.000 žodžių, yra apie 4 MB. Pirmosios e. knygos Gutenbergo
projektui buvo parengtos grynojo teksto formatu.

Pav. 1. Grynasis tekstas, surinktas Windows programa Notepad

3.2. Raiškusis tekstas (.doc, .docx)
Kompanijos Microsoft programinio paketo Office teksto redaktoriaus Word
bylų formatas DOC yra tapęs standartu de facto. Microsoft šį formatą naudoja nuo 1983
m., nors jis sukurtas buvo 1979 m. DOC palaiko teksto formatavimą, renkamas tekstas,
kuriame panaudotos raiškos priemonės: šriftas, ženklų dydis, spalva, teksto skaidymas
į pastraipas, puslapius ir pan. Skaitmeniniai DOC failai dažnai turi daugiau teksto

5

formatavimo informacijos nei kai kurie kiti dokumentų failų formatai, pavyzdžiui,
raiškiojo teksto formatas (RTF) ir hiperteksto žymėjimo kalba, bet paprastai yra mažiau
suderinami.

DOC failai, sukurti naudojant Microsoft Word versijas, skiriasi. Microsoft
Word versijos iki Word 97 naudojo kitokį formatą inegu Microsoft Word 97 - 2000.
Microsoft Word 2007 ir vėlesnėse versijose DOC formatas buvo pakeistas numatytuoju
Office Open XML (DOCX) formatu, nors Word vis tiek gali kurti DOC failus. DOCX yra
suspaustas XML pagrindu sukurtas formatas, skirtas elektroninėms lentelėms,
diagramoms, pristatymams ir teksto apdorojimo dokumentams pateikti.

Pav. 2. Microsoft Word programos langas

Kiti teksto redaktoriai, tokie kaip OpenOffice.org Writer, IBM Lotus
Symphony, Apple Pages, AbiWord ir kiti, taip pat gali kurti ir skaityti DOC failus, nors
ir su tam tikrais apribojimais. Tačiau galimas ir nesuderinamumas, netinkamas
dokumento atvaizdavimas.

3.3. Portable Document Format (.pdf)
PDF (angl. Portable Document Format) yra atviro standarto formatas, skirtas
elektroniniam dvimačiam dokumentui atvaizduoti. PDF sukurtas 1992 m. ir tvarkomas
korporacijos Adobe Systems. Į PDF failą gali būti įtraukiami tekstas kartu su jam

6

naudojamais šriftais, vektoriniai, rastriniai ir daugialypės terpės vaizdai. PDF leidžia
CMYK ir RGB spalvų paletes. Rastriniai vaizdai gali būti keliais būdais suspaudžiami.
Formatas numato dokumento elektroninį parašą. PDF formatas plačiai naudojamas,
kai norima užtikrinti, kad gavėjas matytų tokį patį vaizdą, kaip ir dokumento siuntėjas.
Bylas galima suspausti, apsaugoti slaptažodžiu, palaiko semantinę struktūrą ir DRM.
Tai vienas populiariausių formatų saugant bei keičiantis e. dokumentais internete. Taip
pat PDF formatu dažniausiai saugomi sumaketuoti, parengti spaudai leidiniai. Bylas
šiuo formatu atvaizduoja dauguma interneto naršyklių, e. knygų skaityklių, mobiliųjų
įrenginių. Kurti PDF bylas paprasta, šiuo formatu išsaugoti e. leidinį gali dauguma
teksto redaktorių, maketavimo programų.

Pav. 3. PDF failų peržiūros programa Adobe Acrobat Reader

Kadangi formatas sukurtas atvaizduoti fiksuoto išdėstymo puslapius,
paprastai leidinius PDF bylose skaityti mobiliujų įrenginių ir e. knygų skaityklių
ekranuose nėra patogu: puslapių plotis automatiškai neprisitaiko prie įrenginio ekrano
pločio, tad tenka dokumento puslapį slankioti iš kairės į dešinę ir atgal norint
perskaityti eilutę, o padarius taip, kad visa eilutė tilptų per ekrano plotį, tekstas
pasidaro per smulkus, sunkiai įskaitomas. Šiuos apribojimus panaikina PDF/UA
(PDF/Universal Accessibility) formatas.

7

3.4. DjVu (.djvu, .djv)

DjVu yra formatas, skirtas nuskenuotiems dokumentams saugoti. Jis
naudoja pažangius suspaudimo metodus, optimizuotus mažo spalvingumo vaizdams,
tokiems kaip tekstiniai dokumentai. Taip pat tinka dokumentų, leidinių
skaitmenizavimui, kuriuose yra teksto, brėžinių, spalvotų vaizdų ir nuotraukų derinys.
Atskirose bylose gali būti vienas ar daugiau puslapių. DjVu bylų puslapiai yra fiksuoto
išdėstymo.

Formatas naudoja tokias technologijas, kaip teksto ir fono/vaizdų atskyrimas
vaizdų sluoksniu, laipsniškas įkrovimas, aritmetinis kodavimas ir suspaudimas
vienspalviams vaizdams. Tai leidžia kokybiškus nuskaitytus vaizdus saugoti nedidelės
apimties bylose, kad jie būtų prieinami internete. DjVu buvo kuriamas kaip PDF
alternatyva, šio formato failai yra mažesni nei PDF. DjVu kūrėjai teigia, kad spalvotų
žurnalų puslapiai suspaudžiami iki 40-70 kB, juodai balti techniniai dokumentai
suspausti iki 15-40 kB, o senovės rankraščiai suspausti iki maždaug 100 kB;
patenkinamam JPEG vaizdui paprastai reikia 500 kB. Kaip ir PDF, DjVu gali turėti
OCR teksto sluoksnį, todėl paprasta atlikti kopijavimo ir įterpimo bei teksto paieškos
operacijas.

Pav. 4. Nuskenuota el. knyga DjVu formatu

8

DjVu palaiko daugybė dokumentų peržiūros ir elektroninių knygų skaitymo
programinės įrangos tiek Linux (Okular, Evince), tiek ir Windows (SumatraPDF,
IrfanView) operacinėms sistemoms. Nepaisant formato privalumų, DjVu nėra plačiai
palaikomas nuskaitymo ir peržiūros programinės įrangos.

3.5. Hiperteksto žymėjimo kalba (.html)

Pav. 5. Encyclopædia Britannica Online naršyklės lange

HTML (Hyper text Markup Language, Hiperteksto žymėjimo kalba) – tai

kompiuterinė žymėjimo kalba, naudojama pateikti turinį internete. Dažniausiai

vartojama tinklalapiams aprašyti. Taip pat el. leidiniams publikuoti internete:

enciklopedijoms, žinynams, laikraščių, žurnalų el. versijoms. Hiperteksto struktūrai,

išdėstymui ir formatams aprašyti kalboje vartojamos gairės ir atributai. Yra gana daug

HTML kalbos rašyklių tinklalapiams rengti. Kalba paprasta. Įgudus ja galima parašyti

tinklalapį ir grynojo teksto rašykle. Kai html dokumentą atidarome su naršykle, html

žymės naršyklei nurodo, ką atvaizduoti puslapyje, todėl ji neatvaizduoja pačių žymių,

bet atvaidzuoja jų turinį. Nors kalbą standartizuoja W3 konsorciumas, visgi egzistuoja

nemažai HTML kalbos standartų, tad neretai interneto turinį skirtingos naršyklės

atvaizduoja ne visiškai tiksliai.

9

3.6. EPUB (.epub)

2005 metais The Open eBook Forum buvo pervadintas į Tarptautinį
skaitmeninės leidybos forumą (International Digital Publishing Forum, IDPF), o OeB
standartas – į EPUB (iš angl. žodžių electronic publication). Šiuo metu tai yra
universaliausias ir populiariausias skaitmeninių knygų formatas. 2011 metų pabaigoje
pasirodė trečios kartos EPUB specifikacija, turinti naujas kokybines galimybes. Dabar
tokio formato knygose galima naudoti ne tik tekstą ir paveikslus, bet ir vaizdo įrašus,
garsus bei kitokius interaktyvius elementus.

EPUB failas yra tarsi suarchyvuota interneto svetainė: tai ZIP archyvas,
saugantis HTML failus, vaizdus, CSS pakopinius stilius, metaduomenis. Naudojant
HTML5 standartą, į leidinius galima įtraukti video, audio failus. EPUB formato
ypatumai:

puslapių prisitaikymas prie bet kokio ekrano;
fiksuoto puslapių išdėstymo palaikymas;
kaip ir HTML interneto svetainė, formatas palaiko rastrinius ir vektorinius
vaizdus, metaduomenis, CSS stilius;
puslapių žymėjimas;
teksto pažymėjimas ir pastabų rašymas;
keičiamas šriftas bei jo dydis, keičiamos teksto bei fono spalvos;
DRM apsauga nuo kopijavimo.

Pav. 6. Epub formato el. knyga įvairiuose įrenginiuose

10

3.7. Mobipocket (.mobi)

Mobipocket formatą sukūrė prancūzų kompanija 2000 m. kartu su
Mobipocket Reader programine įranga mobiliesiems įrenginiams ir kompiuteriams,
dabar formatas priklauso Amazon. E. knygų formatas sukurtas Open eBook standartu
naudojant XHTML ir gali turėti įtrauktus JavaScript ir rėmėlius. Mobipocket Reader
programine įranga galima individualizuota spaudos apžvalga naudojant Mobipocket
Web Companion, automatinė turinio ištraukimo priemonė, skirta spaudos
straipsniams. Mobi formatas palaiko ir DRM apsaugą. Apsaugotos knygos turi DRM ir
unikalų parašą, taip pat e. knygos pirkimo metu pridedamas laiko žymuo.
Neapsaugotas knygas galima skaityti Amazon Kindle įrenginiuose, taip pat naudojantis
Amazon Kindle programine įranga Mac OS X, iOS, Android, Windows OS
naudojančiuose įrenginiuose. Vartotojas gali kurti dokumentus Mobipocket formatu ir
naudoti visus asmeninius komentarus, žymes kita visuose įrenginiuose, palaikančiuose
šias funkcijas. Be to, Amazon siūlo nemokamą programą KindleGen, kuri gali
konvertuoti ar kurti dokumentus Mobipocket formatu.

Pav. 7. El. knygų skaitymo programinė įranga Mobipocket Reader

11

3.8. Kindle (.azw, .azw3, .kfx)
Kindle failo formatas yra Amazon sukurtas el. knygos formatas su plėtiniu
.azw, kurį galima atsisiųsti ir skaityti įrenginiuose (išmaniuosiuose telefonuose,
planšetiniuose kompiuteriuose ar elektroniniuose skaitytuvuose), turinčiuose Amazon
Kindle programinę įrangą. Kindle įrenginiai ir programos skirtos naudoti Amazon
elektroninių knygų formatus:
AZW, pagrįstą Mobipocket formatu;
AZW3, dar vadinamas KF8, ketvirtosios ir vėlesnės kartos Kindle
skaitytuvuose;
KFX, septintosios ir vėlesnės kartos Kindle skaitytuvuose.

Pav. 8. Amazon Kindle el. knygų skaityklė

Kindle nepalaiko daugelio kitų elektroninių knygų skaitytuvų naudojamo
EPUB failo formato. Panašiai kaip ir EPUB, Amazon failų formatai skirti
perkraunamam, raiškiai suformatuotam elektroninių knygų turiniui, palaiko DRM
apribojimus, tačiau, skirtingai nuo EPUB, Kindle nėra atviras formatais. 2007 m. AZW

12

failai pasirodė su pirmuoju Amazon Kindle. AZW3 palaiko HTML5 ir CSS3 funkcijas,
veikdamas kaip konteineris MOBI turinio dokumentui. 2015 m. visi Kindle skaitytuvai,
išleisti per pastaruosius dvejus metus, buvo atnaujinti naudojant naują rinkmenų ir
išdėstymo variklį, kurio pagrindu sukurtas patobulintas rinkmenų formatas Kindle
Format 10 (KFX).

3.9. FictionBook (.fb2)

FictionBook yra atviras XML pagrindu sukurtas populiarus e. knygų
formatas. FictionBook formatas nenurodo dokumento išvaizdos, vietoje to jis apibūdina
dokumento struktūrą. Pavyzdžiui, yra specialios etiketės epigrafams, eilutėms ir
citatoms. Visi metaduomenys (autoriaus vardas, pavadinimas, leidėjas ir kiti) taip pat
yra e. knygos byloje. Todėl formatas patogus automatiniam apdorojimui, indeksavimui
ir e. knygų bibliotekos valdymui, taip pat leidžia automatiškai konvertuoti į kitus
formatus. Formatas nenaudoja kopijavimo apsaugos, įterpia metaduomenis, siūlo savo
žanro aprašymo schemą, palaiko Unicode kodavimą, keičia puslapių išdėstymą.

Priešingai nei kiti e. knygų formatai (pvz., epub), FictionBook dokumentas
susideda iš vieno XML failo. Vaizdai yra konvertuojami į Base64 ir įterpiami žymės
<binary> viduje, todėl įterptųjų vaizdų dydis padidinamas maždaug 37%. FictionBook
failai dažnai platinami Zip archyvuose, o dauguma programinės ir techninės įrangos
skaitytuvų gali nuskaityti ir suspaustą FictionBook failą (.fb2.zip) tiesiogiai.
Metaduomenys ir paprasto teksto duomenys visada dedami FictionBook failo pradžioje,
o pabaigoje dedami daugiau vietos užimantys dvejetainiai vaizdai. Tai leidžia
programinei įrangai pradėti apdoroti e. knygą, kol failas bus visiškai užkrautas.

Formatas palaikomas nemažos dalies programinės įrangos skaityklių
(FBReader, AlReader, STDU Viewer, CoolReader, Fly Reader, Okular), taip pat kai
kurių e. knygų skaityklių gamintojų. Amazon's Kindle, Barnes & Noble's Nook, and
Sony įrenginiai FictionBook formato tiesiogiai nepalaiko.

3.10. iBook (.ibooks)

iBook formatas sukurtas Apple kompanijoje, jį naudoja tos pačios kompanijos
platinama nemokama iBooks Author e. knygų kūrimo programinė įranga. Šis formatas
pagrįstas EPUB standartu, kuriame yra skirtumų CSS žymėse, naudojamų ibooks
formato rinkmenoje, dėl to jis yra nesuderinama su EPUB specifikacija. Šiuo metu ši
programinė įranga gali importuoti ir eksportuoti e. knygas trimis formatais. ibook,

13

paprastas tekstas ir PDF. iBooks Author 2.3 ir vėlesnės versijos palaiko importuojamą
EPUB ir eksportuoja EPUB 3.0 formatą.

14

4. El. leidinių bylų formatų palyginimas

1 lentelėje pateiktas aukščiau apžvelgtų bylų formatų palyginimas pagal jų
atvaizdavimo galimybes, interaktyvumo, saugos, pastabų, žymų palaikymą.

1 lentelė. Formatų rūšys ir jų galimybės

Formatas
Failo plėtinys
DRM palaikymas
Paveikslėlisi
Lentelės
Audio palaikymas
Interaktyvumas
Eilučių laužymas
Atviras standartas
Pastabų palaikymas
Žymų naudojimas

Grynasis .txt - - - - - ++ - -
tekstas

Raiškusis .doc ?++? ?+ - ? ?

tekstas .docx ? +++ ? + - ? ?

PDF .pdf + + + + + - + + +

DjVu .djvu, ? + + - - - +++
.djv

HTML .html, - ++ - +++ - -
.htm

EPUB .epub + + + + + + + + +

Mobipocket .mobi + + + - -+ - ++

Kindle .azw,
.azw3, + + + + - + - + +
.kfx

FictionBook .fb2 - +? - - +++?

iBook .ibooks + + + + + + - + +

Paaiškinimas: + palaiko; – nepalaiko; ? – nežinoma

Šaltinis: https://en.wikipedia.org/wiki/Comparison_of_e-book_formats

15

5. Išvados

Formatų, kuriais galima publikuoti elektroninius leidinius, yra labai daug.
Šiame darbe apžvelgti labiau paplitę.

Kaikurie jų retai benaudojami elektroniams leidiniams. Pavyzdžiui, grynojo
teksto formatas. Jis neturi teksto formatavimo galimybės, ir tokį leidinį skaityti nėra
patogu, taip pat įrenginio ekrane jis atrodo neišvaizdžiai.

DOC ir PDF formatai labai dažnai naudojami ir yra tapę kaip ir standartais.
DOC patrauklesnis dėl redagavimo galimybių, o PDF populiarus dokumentų
vaizdavimo tikslumu – kad ir kokiu įrenginiu bei programine įranga jį atidarysi, vaizdą
matysi visada tokį pat.

Tarp formatų, skirtų elektroninėms knygoms, populiariausias yra EPUB
formatas. Jis išsiskiria universalumu, papildomomis galimybėmis, daugelio el. knygų
skaityklių palaikymu.

Apibendrinant, negalima pasakyti, kuris formatas geriausias. Daugelis jų
turi savų privalumų ar trūkumų. Ir toliau sparčiai tobulėjant technologijoms, bus
sukurta naujų formatų, galbūt tapsiančių plačiai naudojamais standartais. Visgi
kuriant elektroninius leidinius, patartina pasirinkti populiarius (DOC, PDF, HTML,
EPUB) formatus, leidinį publikuoti dviem ar trim skirtingais formatais.

16

6. Literatūra

1. Gudaitytė, Gintarė. El. leidyba – pasaulio tendencijos ir lietuvos realijos: magistro
baigiamasis darbas [interaktyvus]. Prieiga per:
https://vb.vdu.lt/object/elaba:1952766/1952766.pdf

2. Comparison of e-book formats [interaktyvus]. Prieiga per:
https://en.wikipedia.org/wiki/Comparison_of_e-book_formats

3. Limanauskienė, Virginija. Elektroninių išteklių tipai, laikmenos ir prieiga prie jų
[interaktyvus]. Prieiga per:
http://edok.sf.library.lt/leidyba/2MM/2MMa/resources/documents/2mm_a_1_teorija.pdf

4. [Interaktyvus] Prieiga per: https://fbreader.org/content/book-formats-supported-and-not-
supported

5. The best format for ebooks [guide for self-publishing writers] [interaktyvus]. Prieiga
per:https://proactivewriter.com/blog/ebook-formats-a-quick-guide-for-self-publishers

6. Digital ebook Guides: An Overview [interaktyvus]. Prieiga per:
https://support.lonelyplanet.com/hc/en-us/articles/218157947-Digital-ebook-Guides-An-
Overview

17


Click to View FlipBook Version