Grazie per le vostre opinioni, le tengo tutte in debito conto perchè certamente sono tutte condivisibili, nel senso che ogni formato ha i suoi pro e contro.
Ho provato a riassumerli schematicamente, se magari volete aggiungere qualcosa, fate pure.
Formato .txt (e-text o testo elettronico)
PRO:
1) Leggerezza (pochi kappa contro i mega necessari per le scansioni);
2) Versatilità (Possibilità di fare ricerche nel testo, di copiare e incollare il testo e di decidere il formato in cui - eventualmente - stamparlo.
CONTRO
1) Sono necessari lunghi tempi per la sua realizzazione (Prima occorre scansionare, poi fare l'OCR ed infine bisogna leggere e rileggere il documento per correggere gli inevitabili refusi. Per non parlare della presenza di schemi e grafici che vanno ricreati e resi con i caratteri ASCII.)
2) Il testo non è rappresentativo della realtà perchè non riproduce il formato, i colori, il layout del documento originale che quindi vengono inesorabilmente perduti.
Formato .pdf/.jpg
PRO:
1) Più veloce da acquisire rispetto al .txt
2) Il formato originale viene riprodotto *fedelmente*, senza mediazioni.
CONTRO
1) Occupa più spazio in Kilobytes
2) Non è possibile editare il testo.
Altra problematica, indipendente dal formato, è il reperimento dei manuali.
Affinchè una sezione sia riuscita c'è bisogno dell'apporto di più persone e fino ad ora nessuno ha mai inviato manuali testuali... ergo sarei intenzionato a cambiare rotta e passare al formato .jpg.
Una semplice scansione dovrebbe essere molto meno onerosa per chi volesse dare una mano ad arricchire il sito, rispetto ad un OCR.
Eppoi, volendo, per quanto possa essere noioso è sempre possibile ricavare un testo elettronico partendo da una immagine, mentre è impossibile fare il contrario.
@Overkiller: naturalmente qui si darebbe la priorità ai doc italiani, per quelli in inglese esiste già Project64.