Avrei bisogno di convertire dei pdf contenenti testo semplice (senza tabelle, formule o altro) in file html "pulito".
Esempio: se ho sul pdf "Oggi piove", voglio che mi restituisca "Oggi <em>piove</em>", senza tag sovrabbondanti. In word esiste questa funzione, ma restituisce un documento, appunto, con molte formattazioni, invece a me serve un documento in uscita che contenga solo i tag essenziali: grassetto, corsivo, sottolineato, a capo, apice e pochi altri.
Qualcuno conosce dei tool per fare questa cosa, eventualmente anche a pagamento se non troppo costosi?