Михаил Кондратович - Создание электронных книг в формате FictionBook 2.1: практическое руководство. Версия 1.0 Release Candidat 1 от 15.05.2008 г.
Процесс кодирования преобразует 3 входных символа в виде 24-битной группы, обрабатывая их слева направо. Эти группы затем рассматриваются как 4 соединенные 6-битные группы, каждая из которых транслируется в одиночный символ алфавита base64. При кодировании base64, входной поток байтов должен быть упорядочен старшими битами вперед.
Каждая 6-битная группа используется как индекс для массива 64-х печатных символов. Символ, на который указывает значение индекса, помещается в выходную строку. Эти символы выбраны так, чтобы быть универсально представимыми и исключают символы, имеющие специальное значение для SMTP-транспорта («.», CR, LF) и для синтаксиса вложенных тел MIME («-»).
Таблица: Алфавит Base64
Выходной поток (закодированные байты) должен иметь длину строк не более 76 символов. Все признаки перевода строки и другие символы, отсутствующие в таблице 1, должны быть проигнорированы декодером base64. Среди данных в Base64 символы, не перечисленные в табл. 1, переводы строки и т.п. должны говорить об ошибке передачи данных, и, соответственно, почтовая программа должна оповестить пользователя о ней.
Если в хвосте потока кодируемых данных осталось меньше, чем 24 бита, справа добавляются нулевые биты до образования целого числа 6-битных групп. А до конца 24-битной группы остается от 0 до 3-х недостающих 6-битных групп, вместо каждой из которых ставится символ-заполнитель «=». Поскольку весь входной поток представляет собой целое число 8-битных групп (т.е., просто байтных значений), то возможны лишь следующие случаи:
(1) входной поток как раз оканчивается 24-битной группой. В таком случае, выходной поток будет оканчиваться четырьмя символами Base64 без символа «=»;
(2) хвост входного потока имеет длину 8 бит. Тогда в конце выходного кода будут два символа Base64, с добавлением двух символов «=»;
(3) хвост входного потока имеет длину 16 бит. Тогда в конце выходного будут стоять три символа Base64 и один символ «=».
Т.к. символ «=» является хвостовым заполнителем, его появление в теле письма может означать только то, что конец данных достигнут. Но такой гарантии нет, если число переданных битов кратно 24.
Любые бессмысленные последовательности в коде Base64 вроде «=====» должны быть игнорированы.
Основано на:
Спецификация RFC 1521 «MIME — Multipurpose Internet Mail Extensions. Part one.»
Перевод: Антон ВоронинПриложение Ж
Описание стандарта ISBN
Международное агентство ISBN присваивает идентификатор группы, который обозначает либо группу стран (например, 0 — для англоязычных стран: Великобритании, США, Австралии, Канады, Ирландии и других), либо отдельную страну (например, 933 — для ШР). Количество цифр в идентификаторе группы зависит от годового объема книжной продукции страны.
Идентификаторы группы устанавливается международным агентством ISBN в следующих диапазонах чисел:
0–7
60–94
950–997
9980–9989
99900–99999
<...>
1. Общие положения1.1. Международный стандартный номер книги — универсальный идентификационный код, проставляемый на книгах и брошюрах.
1.2. В соответствии с ГОСТ 16447-70 «Издания. Термины и определения основных видов» книга — непериодическое текстовое издание объемом свыше 48 страниц, брошюра — непериодическое текстовое издание объемом свыше четырех, но не более 48 страниц.
<...>
3. Состав и структура ISBN3.1. Международный стандартный номер книги состоит из аббревиатуры ISBN (независимо от языка издания книги или брошюры), и 10 цифр.
3.2. Дня обозначения цифровой части ISBN применяется арабские цифры от 0 до 9. Последняя цифра ISBN - контрольная — может быть римской цифрой X, используемой для обозначения числа 10.
3.3. Цифровая часть ISBN состоит из четырех групп цифр, содержащих различное количество цифровых знаков, отделяемых друг от друга дефисом.
Цифровая часть отделяется от аббревиатуры ISBN пробелом.
3.4. Четыре группы цифр ISBN располагаются в следующей последовательности:
1) идентификатор группы;
2) идентификатор издательства;
3) порядковый идентификатор книги;
4) контрольная цифра.
Hапример: ISBN 5-05-000746-1, где
5 — идентификатор СССР;
06 — идентификатор издательства «Радуга»;
000746 — порядковый идентификатор книги;
1 — контрольная цифра.
3.5. Идентификатор группы устанавливается Международным агентством ISBN.
СССР присвоен однозначный идентификатор 5.
3.6. Идентификатор издательства присваивается Всесоюзной книжной палатой.
Идентификатор издательства вместе с идентификатором группы служит для идентификации издательства на международном уровне.
3.6.1. Идентификаторы издательства могут быть индивидуальными и собирательными.
Советским издательствам присвоены только индивидуальные идентификаторы.
3.6.2. Идентификатор издательства может содержать различное количество цифровых знаков (от двух до семи) в зависимости от объма выпускаемой книжной продукции.
Издательствам с большим объемом книжной продукции присваивается идентификатор с наименьшим количеством цифровых знаков. Издательством с небольшим объемом книжной продукции присваивается идентификатор с большим количеством цифровых знаков. Идентификаторы издательств устанавливается в пределах следующих диапазонов:
двузначные идентификаторы 00 – 19
трехзначные 200 – 609
четырехзначные 7000 – 0499
пятизначные 85000 – 09999
шестизначные 900000 – 949999
семизначные 9500000 – 9997999
3.7. Порядковый идентификатор книги служит для идентификации конкретного издания.
Порядковый идентификатор книги присваивается издательством.
3.7.1. Количество цифровых знаков порядкового идентификатора книги зависит от идентификатора издательства. Порядковый ISBN книги может содержать от одной до шести цифр. с таким расчетом, чтобы вместе с идентификатором группы, издательства и контрольной цифрой ISBN насчитывал десять цифр. Hапример:
ISBN 5-02-000000-0 («Hаука»)
ISBN 5-229-000000-0 («Металлургия»)
ISBN 5-85700-000-0 («Белорус. сов. энцикл.»)
ISBN 5-269-00000-0 («Сов. художник»)
3.0. Контрольная цифра служит для проверки правильности написания цифровой части ISBN и вычисляется следующим образом: каждая цифра, входящая в состав ISBN умножается на числовой весовой коэффициент — от 10 до 2.
Результаты умножений на весовые коэффициент складываются. Сумма произведений делится на модуль 11 — (постоянный делитель).
Из модуля 11 вычитается остаток от деления, который и является контрольной цифрой. Если остатка нет, контрольной цифрой является 0, если остаток 10, он записывается как X. Hапример:
Цифровая часть: 505000746
Весовые коэффициенты, расположенные в порядке убывания:
10 9 8 7 6 5 4 3 2
Результаты умножения на весовые коэффициенты:
50 0 40 0 0 0 28 12 12
Сумма произведений: 50 + 40+ 28 + 12 + 12 = 142
Сумма делится на модуль 142: 11 = 12 + остаток 10
Из модуля вычитается остаток 10: 11-10=1
Результат — контрольная цифра 1
Таким образом, полный ISBN будет: 5-05-000746-1
Из «Инструкции о присвоении Международного стандартного номера книги в СССР» (утверждено 11.02.1987) www.lib.ruПримечания
1
BBS — board bulletin system, компьютерная доска объявлений. Обычно представляла собой домашний ПК под управлением специального софта, подключаясь к которому напрямую по телефонной линии, пользователи могли обмениваться сообщениями и скачивать выложенные там файлы. Скачивание файлов обычно было лимитировано. Чтобы увеличить лимит, пользователю необходимо было повышать свой ранг, закачивая на BBS, полезные, с точки зрения хозяина BBS, файлы. Таким образом, BBS были предтечами не только сетевых файловых хранилищ, но и современных файлообменных сетей.
2
Esc-последовательности — последовательность кодов, в которой первый код, обычно 27 (ESCAPE), является признаком управляющей последовательности, а несколько следующих за ним — командой. Вначале ESC-последовательности использовались для управления печатью, позднее стали использоваться для оформления документов. Сейчас стремительно вытесняются XML.
3
Тэги (tags) — текстовые команды, используемые в гипертекстовой разметке. Заключены в угловые скобки. Бывают одинарные <tag> (или, сообразно специфике XML, <tag/>) и парные <tag>данные</tag>. Могут иметь дополнительные характеристики — атрибуты <tag attribyte="sense">.
1.1
Две других трактовки понятия «книга», как-то:
2. Сшитые в один переплёт чистые или разграфленные большие листы бумаги для записей.