estrarre testo da file *.djvu

Messaggioda blackdie » 14/05/2006, 20:21

Dove posso trovare un programma per estrarre il testo da immagini , in particolare da file *.djvu?


Ciao e grazie
Nessuno potrà cacciarci dal Paradiso che Cantor ha creato. (David Hilbert)
Avatar utente
blackdie
Average Member
Average Member
 
Messaggio: 382 di 718
Iscritto il: 16/11/2005, 21:21

Re: estrarre testo da file *.djvu

Messaggioda anonymous_be1147 » 14/05/2006, 21:18

Prova con djvulibre (mai usato). Il tool per estrarre le immagini dovrebbe essere ddjvu
anonymous_be1147
Cannot live without
Cannot live without
 
Messaggio: 55 di 3226
Iscritto il: 02/03/2006, 20:20

Messaggioda blackdie » 14/05/2006, 21:47

forse mi sono spiegato male...io ho un programma x vedere e aprire i djvu, a me serve un programma che prenda il testo presente in questo (o altri) formato di immagine e lo salvi in qualsiasi file di tipo testo(.doc,.txt...)...
Nessuno potrà cacciarci dal Paradiso che Cantor ha creato. (David Hilbert)
Avatar utente
blackdie
Average Member
Average Member
 
Messaggio: 383 di 718
Iscritto il: 16/11/2005, 21:21

Messaggioda anonymous_be1147 » 14/05/2006, 22:28

Non so se si possa da djvu a testo direttamente senza estrarre le immagini. In ogni caso mi sa che ti serve un programma OCR.
Ce ne sono svariati per tutte le piattaforme, free e non. Se nessun altro del forum ti sa consigliare direttamente il programma migliore, potresti provare a cercare su softpedia, impostando chiave di ricerca OCR, piattaforma, licenza d'uso etc. ;)
anonymous_be1147
Cannot live without
Cannot live without
 
Messaggio: 56 di 3226
Iscritto il: 02/03/2006, 20:20

Messaggioda blackdie » 15/05/2006, 17:36

anonymous_be1147 ha scritto:Non so se si possa da djvu a testo direttamente senza estrarre le immagini. In ogni caso mi sa che ti serve un programma OCR.


Ma cosa intendi x estrarre le immagini?


Cercando un po in rete vedo che nessuno supporta il formato in input di djvu....che devo fare?esiste un programma x convertirlo a jpg?
Nessuno potrà cacciarci dal Paradiso che Cantor ha creato. (David Hilbert)
Avatar utente
blackdie
Average Member
Average Member
 
Messaggio: 384 di 718
Iscritto il: 16/11/2005, 21:21

Messaggioda anonymous_be1147 » 15/05/2006, 18:15

blackdie ha scritto:Ma cosa intendi x estrarre le immagini?

Cercando un po in rete vedo che nessuno supporta il formato in input di djvu....che devo fare?esiste un programma x convertirlo a jpg?

Come dicevo, penso tu debba estrarre le immagini che ti interessano e convertirle in un formato adatto per un programma di OCR.
Per estrarre un'immagine (supponendo che il file che stiamo considerando sia un insieme di scansioni) puoi usare il pacchetto djvulibre, mediante il seguente comando

Codice:
ddjvu -format=tiff -page=<numero_pagina_che_ti_interessa> file_input.djvu file_output.tiff

Poi, con un qualsiasi programma di grafica/fotoritocco, converti l'immagine dal formato TIFF in JPEG (o forse meglio in GIF).

Comunque, mi pare che su softpedia ci fosse un programma che convertiva direttamente da djvu a Word se non sbaglio. Ovviamente la maggior parte di questi programmi per Windows sono shareware o a pagamento.
anonymous_be1147
Cannot live without
Cannot live without
 
Messaggio: 57 di 3226
Iscritto il: 02/03/2006, 20:20


Torna a Informatica

Chi c’è in linea

Visitano il forum: Nessuno e 1 ospite