От amyatishkin Ответить на сообщение
К Prozer Ответить по почте
Дата 01.06.2006 22:56:30 Найти в дереве
Рубрики 1936-1945 гг.; Современность; Версия для печати

Re: Это не...

Например, выбираем за 1939 год книги, вышло 2744 страницы * 10 книжек. Адрес второй страницы :

http://1945.bookchamber.ru/search.aspx?&F210d=1939&F210d=1939&format_mode=biblio&format_date=ddmmyyyy&page_no=1

первой, соответственно, 0 на конце, у последней 2743.

Я файлы качаю Флашгетом, там есть возможность сделать пакетное задание (адрес + счетчик), и вдобавок он файлы с одинаковыми именами переименовывает без запроса. Т.е. просто сделал такое задание, и они все скачались.

А там уже дело техники - объединить все файлы и выбрать строки с инфой.

За 1939 год выйдет примерно 60 мб качать.

И это ВСЕ книги за эти годы (а мб и не все - я у одной нашел 2-е издание 1941 года, а первого нет, хотя по идее в 39-40 должно быть.)

В принципе каждой книжке соответствует запись в одном файле, можно попытаться эти файлы тянуть, но неизвестно, что вытянется.