>может попроще - скан в пдф и дежаву поскольку все это конвертируется из готовых ТИФов в эти форматы на раз и распознаные тексты с этих сканов в доках
Информации избыточной в журналах очень много. Например в АиК большое количество таблиц, схем, графиков. Да и идеалогии пустозвонной полно. Распознавать такое дело очень долго, у меня, например, рука не поднимается.
В принципе на все подряд время тратить жалко. Получается что-то вроде Родионовской хроники. Она вроде есть и вроде ее и нет, т.к. нет структуры -- все в куче.
Лучший вариант для меня -- тематические подборки. А для этого нужен массив отсканированных журналов.
Чуть позже выложу небольшой список того, что у меня есть в бумажном и эл. виде.