Примерно полгода назад, нами был начат очередной проект по оцифровке. На сей раз, предметом проекта стала подшивка газеты ЗИК, получить информацию о которой можно например здесь.
Не смотря на крайние номера газеты в 2011-м году и продолженную в газете «Уральский федеральный» нумерацию, подшивка газеты ЗИК состоит из примерно трех с половиной тысяч выпусков, а не из шести с половиной. Внимательный читатель быстро найдёт причину.
Мы располагаем хорошей, но далеко не полной подшивкой газеты из фонда МВЦ УРФУ, основные проблемные места — тридцатые и сороковые годы, а в остальном всё не плохо. Единичные «дырки» позже будут закрыты посредством фондов РГБ, СОУНБ им. В. Г. Белинского и других источников.
На данный момент отсканировано, обработано и опубликовано в открытом доступе чуть более тысячи выпусков газеты, они доступны в Электронном научном архиве УРФУ. Было принято решение публиковать номера с утратами делая соответствующую пометку в поле dc.description.
Оборудование и ПО, на котором проводились работы:
- Сканеры Epson Expression 10000XL, Epson WorkForce DS–70000
- ABBYY FineReader 11, ABBYY FineReader 14 (лицензия УРФУ)
- Adobe Photoshop CS6 (лицензия УРФУ)
- ScanTailor, ScanTailor Advanced
Обработка, ставшая для нас типичной, позволяет получить из исходного файла TIFF/LZW 300DPI 24BIT (более быстрый Epson WorkForce DS–70000 не может 48BIT, да и не нужно) два итоговых файла — бинаризованный вариант в 600DPI со сжатием без потерь и цветной вариант в 300DPI со сжатием 70-75%. Оба варианта имеют текстовый слой, возможен полнотекстовый поиск.
Конкретных сроков у проекта нет, конкретного направления движения тоже. Видимо, будем двигаться вверх — из восьмидесятых в девяностые и до конца. Потом будет поиск тридцатых и сороковых. Планов постатейной росписи и создания указателя пока нет.
Если вы обладаете подшивкой газеты ЗИК, либо подшивками других газет УРГУ, УПИ или УРФУ и хотите пополнить данную подборку — свяжитесь с нами — обсудим, договоримся!