Adventures from LaTeX to epub: a follow up

This is a follow up of a previous post. Please read the first post before if you didn’t already.

There were a couple of problems in publishing my selfpublished ePub from LaTeX with SPF Narcissus. They are really kind and professional! Substantially, the validation tool of Sigil is not good enough for the metadata. It is far better to validate through Three Press, which gives a sharp check of your file.

What I had to do was to convert my TeX source file through SimpleTeX4ht in XHTML as a single file, and then split chapters manually in Sigil. An hour work, not more, not less.

I had to modify metadata, in particular author, title, language, and checking TOC, which is still not perfect but valid.

Next time I will do even better…

How to make an ePub from LaTeX

Please also check the follow up post, there are some important updates to this small guide!

I’ve got interested in the production of ePub from LaTeX, and I realized that this topic is surprisingly not well covered yet on the web by now, so I will share my experience here. The goal was to publish a short story, called Mary Everest and the Mystery of the Pantelegraph (a steampunk short story written in Italian and currently under translation) which I have written in XeLaTeX for more font flexibility.

Of course, all with free software. No licences, no dependencies on third parts. Only you, your text, your ability and enthusiasm!

Caveat: the main limit in my current experience is that there is no math formulas in my short story, and so I couldn’t really test how ePub cope with this known problem. Anyhow.

First, after writing the first draft on pen and paper (warmly suggested if you are used to academic writing!) I put into bits & LaTeX through my beloved Aquamacs (Emacs clone for Mac).

Then, I converted all the source in XHTML by SimpleTeX4ht.

Then, you should import your XHTML files into Sigil, the best ePub editor I’ve found. Not all editors let you edit the source, in most cases they call them “editors” but they are really only batch converters (!). With Sigil you can keep your text in control.

Finally, while not strictly needed, if you want to convert your ePub in a Mobi (for Kindles, for instance) you can always use Calibre, a very good ebook manager for your reader.

Come citare i siti web in BibTeX

A seguito di qualche segnalazione dei miei studenti, dò qualche indicazione per indicare i siti web nelle bibliografie in BibTeX. Prima di passare agli aspetti più tecnici, si ricordi che citare una pagina web è da farsi solo quando non ci sia nessuna altra possibilità. In generale, ci si può basare sulla pagina di Wikipedia inglese dedicata alle citazioni o su questa pagina della Wikipedia italiana analoga. Quella in inglese secondo me è più chiara.

Inoltre, ricordate che Wikipedia in sè è un punto di partenza, non di arrivo: non consideratela mai come una fonte affidabile, come ci ricorda questa pagina wiki della Wikipedia inglese. In altre parole: controllate, controllate, controllate tutto quello che vi è scritto. Ci sono a volte degli strafalcioni grossissimi nelle pagine di Wikipedia. Se ne trovate uno, sarebbe cosa buona segnalarlo o direttamente modificare la pagina wiki in quel punto.

Passiamo ad alcuni esempi in BibTeX (estratti dalla bibliografia della mia tesi di dottorato), ordinati dal più autorevole al meno autorevole. Ciò che hanno in comune è la necessità o l’opportunità di avere un URL nell’entrata bibliografica.

@InBook{Montague1973,
author = "Montague, Richard",
title = "The Proper Treatment of Quantification in Ordinary English",
crossref = "xPortner2002",
pages = "17--34",
note = "Available on line",
url = "http://semantics.uchicago.edu/kennedy/classes/s08/semantics2/montague73.pdf",
annote = "Retrieved 11 Dec 2008"
}

Questo è un contributo dentro un libro a cura di Portner (da cui il riferimento incrociato, crossref) perciò è più autorevole del sito web dove è stato preso. Però è lì che l’ho letto, tale articolo, pertanto è corretto inserire la fonte — nel malaugurato caso che il PDF inserito non sia corretto, è giusto che il lettore sappia da dove ho preso l’articolo.

@TechReport{NovakCanas2006,
author = "Novak, Joseph D. and Ca\~{n}as, Alberto J.",
title = "The Theory Underlying Concept Maps and How to Construct Them",
institution = "IHMC CmapTools 2006-01, Florida Institute for Human and Machine Cognition",
year = "2006",
month = mar,
url = "http://cmap.ihmc.us",
note = "available online"
}

Questo esempio è di un rapporto interno a un istituto, meno autorevole dunque di un contributo in un libro stampato. Vanno inserite tutte le informazioni possibili. La pagina web da cui l’ho scaricato non sembrava particolarmente stabile, quindi ho deciso di mettere la home page. Ci sono abbastanza informazioni per permettere al lettore di recuperare il documento stesso.

@Misc{Sabaris2001,
author = "Sabar{\'i}s, Marcos F. and Alonso, Jose L. R. and Dafonte C. and Arcay B.",
title = "Multilingual authoring through an artificial language",
year = "2001",
note = "Available on line",
url = "http://www.xente.mundo-r.com/utl/"
}

L’ultimo esempio riguarda un documento pubblicato esclusivamente su un sito web. Perlomeno ha una data di pubblicazione, perciò non è necessario inserire la dicitura “retrieved {date}” o “controllato il {data}”. Notate la classificazione come @Misc, che si usa quando non è possibile trovare niente di meglio.

Se proprio dovete citare una pagina di Wikipedia, fatelo almeno come si deve! In ogni pagina di Wikipedia c’è un pulsante nel menù a sinistra, come in figura:

Al clic, vi trovate una pagina wiki standard con molte indicazioni. Scorrendo in basso troverete qualcosa di simile a questo (la pagina wiki che ho scelto è quella della Wikipedia inglese di oggi sulla Libia):

Wikipedia non è l’unico sito dove trovare il codice BibTeX già pronto, anzi! Il 99% dei siti di pubblicazioni accademiche o scientifiche permettono di esportare il codice BibTeX già fatto e completo. Per esempio, la Digital Library della ACM, un must per chi fa ricerca in informatica, ha il link già pronto, come potete vedere dall’esempio seguente (questa la pagina web da cui è tratta la fotografia dello schermo):

Tutto ciò per dire una pura e semplice verità: quando vi sentite di dover citare un sito web, chiedetevi se non ci sia forse qualcosa di meglio. Troppo spesso citare un sito web significa rimanere sulla superficie dell’argomento