松下昇~〈 〉闘争資料

2008-09-04

pdfファイルからのテキスト化

「時の楔通信<0>号→<15>号」全冊揃い の注文があったのはたしか8月6日。

<6>号と<11>号以外の14冊のコピーを、8/27にやっと送付できた。

「いきなりPDF to Data」EXというソフトを2970円で、数日前に買った。

今回は時の楔通信のほぼ全データが6つのPDFファイルになっている。いまやってみたが*1、多ページのpdfファイルを一度にテキスト化することができた!

ただしこのコピーはページの構成がややこしく、例えば、表p34-p3 裏p4-p33というふうになっている。2段組なので、テキスト化するとさらにややこしくp34上-p3上-p34下-p3下という順になる。

今日は、第<4>号p30-31の「映画と風化」という記事をテキスト化してみた。まだUPはしていない。'81。5月の京大でのできごと。記事にはでていないが、わたしがピエロ的役回りを演じた。

*1:残念ながらwindowsでやるのだが