Ebokens väg på hälleberget: om inspirerande experiment, frustrerande begränsningar och ePub3

Under den gångna hösten har vi på Publit gjort en lång och grundlig djupdykning i de mest obskyra aspekterna av det format som blivit en synonym med ebok: ePub. Detta format, som såg dagens ljus för drygt tre år sedan är en så kallad öppen standard som förlag och teknikföretag enats om i samarbetsorganisationen IDPF, där även Publit är medlem.

Att branschen lyckats komma överens om vilket format som ska gälla är bra, men fortfarande finns mycket att önska. Problemen kan grovt räknat delas in i två kategorier. För det första är de specifikationer som definierar ePub-formatet ganska förlåtande. Det gör att två olika ePub-filer kan se lika fina ut när de öppnas i en läsare, men ändå skilja sig åt väldigt mycket vad gäller den underliggande kodens kvalitet.

Alla som arbetade med webbutveckling i Internets barndom känner igen det här problemet: tjusiga webbsidor som byggde på spagettikod var regel snarare än undantag. Idag är det en självklar hederssak för alla webbutvecklare att mer eller mindre religiöst följa standarder. Det är bra, för det innebär att webben blir bättre anpassad, att inte bara människor utan även maskiner kan förstå och tolka information på webben, att applikationer och tjänster kan kommunicera med varandra utan mänsklig inblandning, och mycket mer.

Det finns flera problem med eböcker som (i bästa fall) är tjusiga men slarvigt kodade. Ta detta med metadata till exempel. I biblioteksvärlden har metadata - dvs. information om information, i det här fallet böcker - alltid varit central. Det är tack vare biblioteksväsendet vi idag exempelvis kan beskriva vilken genre en bok tillhör på ett sätt som gör att alla andra bibliotek i världen också kan förstå vad vi menar. Att boken blir digital borde öppna för oanade möjligheter att förfina metadata och även att baka in den i själva boken. (Metadata har ju traditionellt sett existerat skilt från det verk den beskrivit, ofta i gigantiska i arkivskåp). ePub-standarden ger utrymme för att märka en bok med oerhört högupplöst metadata*. Å andra sidan ligger ribban mycket lågt för vilken typ av metadata som måste inkluderas i filen för att den ska räknas som en ePub (=validera).

(*Den xml-standard som stora delar av den internationella bokbranschen enats kring - Onix - gör det till exempel möjligt att märka upp inte bara var en författare föddes, växte upp och gick i skolan, det finns även en tag för "flourished in"...)

Resource Description Framework, eller RDF är namnet på ett annat spännande xml-schema som gör det möjligt att länka metadata genom att kategorisera hur olika egenskaper förhåller sig till varandra i subjekt-predikat-objekt-tripletter. Nästa generation av ePub-formatet kommer ha utbyggt stöd för bägge dessa format.)

På Publit brinner vi för metadata (ursäkta geekfaktorn) och en stor del av höstens ansträngningar har gått till att jämföra ePub-filer från många olika leverantörer för att komma fram till ett slags "best practice", som det brukar kallas. Målet har både varit att definiera en lägstanivå för alla de eböcker vi producerar, men än viktigare att sätta upp ambitiösa mål för hur vi vill utvecklas. Vi har lärt oss mycket men framför allt insett hur lite vi kan. Och häpnadsväckande nog: hur få andra som verkar besitta kunskap på området. Åtminstone att döma av litteraturutbudet. Gör en sökning på valfritt annat data-relaterat område på exempelvis Amazon och du kommer få hinkvis med träffar, men ePub har nästan ingen skrivit om.

När Liz Castros bok om hur man producerar och kvalitetssäkrar eböcker kom ut i höstas så var det den första titeln som handlade om det hantverk som är en förutsättning för en industri som globalt sett omsätter fantasisummor. Märkligt. (Det samma gäller utbildningsutbudet: det har varit tunnsått med kurser om eboksproduktion. Nu planerar glädjande nog Södertörns högkola att hålla en kurs i ämnet där Publit kommer vara med och undervisa, mer om det framöver.)

I brist på mer formell expertis har vi haft en väldig glädje av att delta i diskussionerna inom ramen för IDPF, och särskilt av vårt samarbete med Mike Cook. Han driver den utmärkta sajten epubbooks.com och var passionerat intresserad av e-böcker redan långt innan ePub-formatet existerade. Så till "det andra problemet". Det andra problemet med eböcker är att ovan nämnda specifikationer inte räcker till. Det är till exempel fullt möjligt att "bädda in" ljudfiler eller video i en ebok idag, men det finns inte ett rätt sätt att göra det på. I den bästa av världar borde man kanske vänta tills specifikationen för ePub hinner ikapp (vilket den enligt plan ska göra i maj i år). Men i likhet med Edmund Hillary - som vid presskonferensen efter att ha bestigit Everest besvarade den helt rimliga frågan varför?! med "Because it's there" - vimlar det idag av ePub-bastarder med både ljud och video inbäddat. Vi har själva - tillsammans med några av våra användare - experimenterat på området med viss framgång och har mer på gång. Men detta är alltså tills vidare laglöst land, vilket resulterar i nödlösningar som att bädda in och samtidigt länka till en webbplats som "streamar" samma ljudfil. Det förra - alltså att spela upp inbäddade ljudfiler - fungerar utmärkt när man öppnar boken i Apples läsprogram iBooks, men inte i Adobes läsprogram Digital Editions. Det senare - alltså att klicka på en länk i boken vilket öppnar en webbsida med en ljudström - fungerar utmärkt i Digital Editions men inte i iBooks (eftersom varken iPad eller iPhone har stöd för Flash och eftersom den klient som som spelar upp ljudströmmen i just det här fallet var bygd i Flash). Och detta är inte den enda begränsningen med nuvarande ePub-specifikationen. Den arbetsgrupp inom IDPF som arbetar med nästa generation av formatet (vilket i "folkmun" kallas ePub3, men som i själva verket är version 2.1) listar 14 problemområden. Tanken är att man ska ha adresserat dem alla när de nya specifikationerna släpps i maj, vilket förstås vore fantastiskt men inte känns särskilt troligt. (Även i bästa fall kommer det för övrigt ta betydande tid från det att specifikationen är fastslagen, tills dess att alla de som producerar mjuk- och hårdvara för att läsa böcker också fullt ut stöder de nya riktlinjerna.)

Men hur som helst: listan över vad som behöver lösas är mycket inspirerande läsning och man skulle kunna skriva en lång bloggpost om varje punkt, vilket vi kanske också gör vad det lider, för vi tycker det är viktigt att diskussionen om vad eboken är för en udda fågel, förs även utanför IDPF.

Nyhetsbrev

Tack, vi hörs!

Tyvärr gick något fel.