The Ebook. Книга об электронных книгах - страница 41
Для сокращения ошибок, но ограничения масштабирования, некоторый текст в формате может быть заменён на другой тип. Например, математические формулы описанные текстом с использованием символьных шрифтов могут быть заменены иллюстрацией. Таким образом, текст заменяется графическим типом данных. Такой подход изменяет набор инструментов для дальнейшего редактирования, и масштабирование текста может быть непропорциональным по отношению к иллюстрации.
Графические форматы могут масштабироваться на экране пропорционально изображению, но если страница сделана полностью в графическом виде, то масштабирование может быть увеличено за видимые границы экрана, тем самым используется не увеличение масштаба содержимого, а фрагментация страницы в другом масштабе. Графический текст поддерживает жёстко заданные границы полей и страниц, в отличие от текстовых форматов, которые могут увеличивать общее количество страниц в документе в зависимости от размера начертания шрифта.
В зависимости от формата данных внутри структуры документа некоторые форматы лучше использовать для определённого контента:
• TXT – используется только для текста без разметки, типографикой в данном случае будет заниматься программное обеспечение.
• EPUB, FB2 и MOBI – содержат в себе смешанный тип данных, поэтому подходят для масштабирования текста во время чтения с сохранением заложенной разметки. Типографикой будет заниматься программное обеспечение, но оно заранее знает выделение фрагментов текста. Переносы слов обычно не описываются форматом, и этим точно будет заниматься только программное обеспечение по запрограммированному алгоритму естественного языка текста.
• PDF – следует описать отдельно, так как формат хоть и можно отнести к графическому типу, из-за жёсткой разметки текста и иллюстраций, но при наличии текста внутри структуры возможно масштабирование с потерей разметки. Класс TextFlow описывает содержимое текста и внутри есть описание параграфа, ссылок, графики и разделителей.
• DJVU – графический формат, хотя может содержать в себе дополнительные элементы с текстовыми данными. Популярность формата привела к тому, что внутри документа фактически находятся только графические образы страниц и ничего более. С подобной задачей справится любой контейнер с набором иллюстраций в строгой последовательности страниц.
• CBZ и CBR – это как раз наглядный пример контейнера с графическими данными, где название файла соответствует номеру страницы (например, 001, 002, 003 и так далее). В качестве контейнера используются популярные архиваторы ZIP или RAR (последняя буква в обозначении формата).
Таким образом, форматы определяют тип используемых данных и по ним можно предположить предназначение форматов.
EPUB, FB2 и MOBI – современные форматы для чтения литературы в текстовом виде. Особой разницы для потребителей контента в них не заложено. Они в равной степени могут почти одно и то же. Изменение размера шрифта позволяет адаптировать текст под размер экрана носителя с учётом предпочтений конечного пользователя. Для профессионалов это форматы, в которых набор текста может быть сложен для табличных и формульных данных. Это трудоёмко и требует особого внимания и терпения. Часто эти типы данных конвертируют или сохраняют в графическом формате, чтобы сократить время набора и ограничить количество вероятных ошибок при сборке итогового документа. Таким образом, внутри масштабируемого формата могут быть данные, которые не подлежат масштабированию с переносом строк.