OCR per PDF

Se si dispone di un file PDF contenente il risultato della scansione di un documento, come si può recuperare il testo del documento originale? Basta sottoporre il file PDF ad una applicazione di OCR, che traduca l’immagine dei caratteri in caratteri veri e propri. Una applicazione gratuita che ho provato e funziona abbastanza bene è

Advanced OCR Free

L’utilizzo è piuttosto semplice. Lavora pagina per pagina e non è velocissima, ma comunque svolge il suo compito. Pare che la qualità della estrazione dei caratteri dipenda dallo zoom con cui si osserva la pagina, perciò raccomando di procedere nel seguente modo:

  1. andare sulla pagina che si intende recuperare
  2. zoomare su di essa (comando Zoom In); attenzione che questa operazione è un po’ lenta e non sempre mostra la pagina zoomata; per quanto sembri strano, cliccando in sequenza su Zoom In e Zoom Out si ottiene di vedere la pagina zoomata
  3. mentre la pagina è zoomata, cliccare su OCR: nella finestra a destra appare il testo letto, che consiglio di copiare al volo in un file testo o word o libreoffice
  4. ripetere i passi per la pagina successiva

 

 

 

Collezioni di icone usabili per lavoro

Ho aggiornato la pagina Icone gratis per presentazioni aggiungendo alcune collezioni che ho trovato nel frattempo e togliendone parecchie che non erano di libero utilizzo per lavoro. Invito tutti a segnalarmi collezioni che rispettino i criteri indicati nella pagina e che possono essere così riassunti: tante, colorate, grandi e di uso libero anche per scopi commerciali.

Proiettare presentazioni con Acer Aspire One

Uno dei vantaggi del nuovo Linux4One rispetto a Linpus è la possibilità di selezionare le diverse risoluzioni grafiche supportate dalla scheda dell’Acer Aspire One, operazione che a sua volta semplifica drasticamente uno dei limiti più fastidosi dell’Aspire One se utilizzato per lavoro: la possibilità di proiettare presentazioni (o qualunque altra cosa  sia mostrata sul piccolo schermo dell’Aspire One, ad esempio un video), limitazione che nasce dalla “strana” risoluzione nativa dell’Aspire (1024 x 600) non riconosciuta automaticamente da quasi nessun proiettore.

Le risoluzioni messe a disposizione cliccando semplicemente su “Preferenze – Risoluzione Schermo”   vanno dal 1280 x 800 a scendee fino al 640 x 480, passando per le più comuni 1024 x 768 e 800 x 600: impostando l’Aspire One su queste due risoluzioni si può utilizzare qualsiasi proiettore o schermo digitale anche di medie e grandi dimensioni. Ecco ad esempio il mio Acerino collegato al televisore LCD di casa:

Acer Aspire One con Linux4One proiettato su uno schermo esterno in alta risoluzione
Acer Aspire One con Linux4One proiettato su uno schermo esterno in alta risoluzione

CDBurnerXP masterizza facile

Con Windows Vista mi è capitato spesso di masterizzare CD con le foto delle vacanze per condividerle con gli amici e poi vedermi tornare indietro il disco perché non leggibile sul computer o sul lettore DVD dell’amico. Dopo poco mi sono accorto che su VIsta il default di masterizzazione non “chiude” il disco preguidicandone la lettura su molti dispositivi e adesso ci sto attento. Però qualche problema ogni tanto capita ancora.  Guardandomi in giro per una alternativa facile da usare e gratuita ho trovato CDBurnerXP, che masterizza CD, DVD e pure i nuovi Blu-Ray e HD-DVD, crea CD audio e misti, legge e scrive file ISO,  comprende il formato bin/nrg e ha qualche altra funzioncella utile e simpatica. Il tutto con interfaccia in italiano e la licenza ne consente anche l’uso sul lavoro. Mica male per il prezzo (gratis!).

Google Docs dentro OpenOffice.org

I quattro lettori di questo blog sanno che io amo OpenOffice.org e lo uso regolarmente. E che sono un grande utilizzatore (benché sempre un po’ preoccupato per la mia privacy) degli strumenti on line di Google (GMail, Google Docs, Google Calendar) di cui apprezzo la possibilità di accesso da dovunque mi trovi.

Ho iniziato ad usare come “ponte” tra questi due mondi (OpenOffice.org sul mio pc e servizi Google in internet) l’estensione di OpenOffice.org oo2gd che consente di salvare e aprire file OpenOffice.org nel proprio spazio Google Docs restando dentro OpenOffice.org

E’ come disporre di un disco in internet, ma con parecchi vantaggi aggiuntivi: mantenimento delle versioni, condivisione con altri utenti OpenOffice.org, possibilità in caso di emergenza di poter modificare i documenti direttamente da web browser.

In dispetto al nome, l’estensione funziona anche con la versione 3 di OpenOffice.org Le istruzioni sono disponibili solo in polacco (!) ma sono estremamente intuitive: installare l’estensione dentro OpenOffice.org; chiudere e riaprire OpenOffice.org; usare la barra aggiuntiva che si rende disponibile; fornire le proprie credenziali Google.

Alcune avvertenze: (1) poiché Google Docs non accetta ancora il formato Impress, in fase di upload l’estensione costringe a convertire le presentazioni al formato MS Presentation (2) l’estensione non permette di scegliere la cartella in cui salvare il documento.

Una raccolta “certificata” di applicazioni open source

Il progetto The Open DVD raccoglie una selezione di applicazioni open source curata e “certificata” dal Politecnico di Torino. Nell’elenco si trovano programmi molto noti a chi ama ed usa abitualmente l’open source per lavoro e per diletto e in buona parte segnalati anche nel mio sito (OpenOffice.org Gimp Dia PDFCreator CamStudio Audacity Freemind ….) ma anche qualche software che personalmente mi era finora sfuggito (es. TuxGuitar). Un progetto da tenere sotto controllo e consultare periodicamente.

Guide all’uso di OpenOffice.org

OpenOffice.org è certamente una valida alternativa a Microsoft Office, sia sul lavoro (sperimentato personalmente a partire dalla primissima versione 1.0) sia a casa sia soprattutto in ambienti dove è giusto non legarsi ad un formato proprietario quale è quello prodotto dai vari Word, Excel, Powerpoint. Mi riferisco in particolare alle scuole e pubbliche amministrazioni.

Il passaggio da MS Office a OpenOffice.org non è però gratis: all’inizio per fare le stesse operazioni (es. preparare un documento) ci si impiega più tempo perché le funzioni non hanno lo stesso nome , le icone sono diverse e certe operazioni si fanno proprio in un modo differente. Quindi il passaggio si paga con l’inefficienza iniziale.

Per confinare il più possibile questa inefficienza, è necessario predisporre un buon piano di formazione, oltre che preparare un adeguato numero di modelli di lettere / tabelle ecc. da cui partire. Senza voler qui progettare un piano di formazione o di migrazione (è un compito professionale) e trascurando la documentazione relativa a versioni vecchie (1.x) posso qui suggerire qualche rimando a buoni testi di (auto)formazione su OpenOffice.org, gratuiti ed in italiano:

  • The Louise Doc 400 pagine di corso, corredate da 800 quiz, copre Writer e Calc. Molto ampio, da consultare via internet anche come “a domanda rispondo” grazie alla chiarezza dell’indice. Un neo: stranamente non copre un argomento su cui “cascano” spesso i neofiti di OpenOffice. org quale la creazione automatica degli indici.
  • Guida a OpenOffice.org Writer (135 pagine) e Guida a OpenOffice.org Calc (85 pagine) , scaricabili in formato PDF o OpenOffice, nascono come guide per un corso di 600 operatori organizzato da Federimpesa Modena. Ottimi manuali da usare sia per la formazione sia come enciclopedia da consultare in caso di dubbi.
  • Guida Introduttiva a OpenOffice.org è suddivisa in una ventina di documenti (PDF o OO2) ognuno dedicato ad un argomento. Copre tutti i moduli di OpenOffice.org quindi anche Impress, Draw, Base, Math, a livello introduttivo (es. il documento su Impress è di 24 pagine).

Sulla via della conversione

Download Day - ItalianI formati (d file) sono tanti e non sempre si dispone del giusto convertitore a bordo del pc su cui si sta lavorando. In questi casi io uso e consiglio il sito MediaConvert che, gratuitamente e senza iscrizione, accetta in upload il file da convertire, riconosce il formato di ingresso, consente di selezionare uno tra 200 formati di uscita (naturalmente un sotto insieme coerente con il formato di ingresso, es. da video a video), converte il file e lo mette a disposizione per il download.

Google Docs come editor di WordPress.com

Oggi ho scoperto una nuova funzione di Google Documenti: la possibilità di creare post di WordPress da Google Documenti.

Nelle impostazioni di Google Documenti è infatti possibile specificare un blog (che deve risiedere o sul googliano Blogger o su WordPress.com) fornendo le username e password di accesso al blog. Fatto ciò, nel comando “Pubblica” Google Documenti compare l’opzione “Pubblica su blog” che consente con un click di pubblicare il documento sul blog come nuovo post (la prima volta), modificarlo o anche cancellarlo. Non ci sono (ancora) funzioni più evolute di gestione post (es. ripresa in Google Documenti di post creati nativamente in WordPress).

Questo post che state leggendo è stato scritto dentro Google Documenti, con tutti i vantaggi di disporre di un editor più completo di quello disponibile in WordPress.com. Mi sono chiesto cosa succede nel caso di immagini incluse nel documento. La cosa è decisamente interessante: la foto che vedete a destra non è fisicamente su WordPress ma Google provvede a costruire nel post su WordPress il link giusto alla foto su Google Documenti. Rispetto all’editor interno di WordPress, Google Documenti consente di creare facilmente tabelle come questa

Funzione
Editor WordPress
Editor Google Documenti
Tabelle Non esiste un comando nell’editor visuale, occorre costruirla con il codice HTML o importarla con copia & incolla da un editor esterno. Le tabelle si costruiscono con un comando e si possono successivamente modificare in modo visuale
     

E per i tag ? Io amo i tag di WordPress e mi piacerebbe poterli inserire nel post che sto scrivendo con Google Documenti. Purtroppo per ora i documenti non sono taggabili (diversamente da tutti gli altri oggetti gestiti nella Google suite) ma solo organizzabili per cartelle. Ho verificato che anche mettendo un documento in una cartella, il nome della cartella non viene usato come tag in WordPress … quindi credo che dovrò aspettare l’aggiunta della gestione tag in Google Documenti per poterli “passare” a WordPress.

Tutto ciò funziona usando come editor l’editor di testi di Google Documenti. Non funziona con l’editor di fogli di calcolo né con le presentazioni e la cosa non stupisce, visto che non sono formati logicamente coerenti con i post di WordPress.

Nelle viscere dei file (e dei dischi)

Ogni tanto capita di dover guardare (e magari mettere le mani) nelle viscere dei file, cioè in quella sequenza di byte che compone qualunque file abbiamo sul nostro pc. Ad esempio, per cercare comandi non documentati di un applicativo e che spesso sono ben visibili come sequenze di caratteri in chiaro dentro il file stesso. Oppure per tradurre in modo “rapido e sporco” un software di cui non si abbiano i sorgenti.

Allo scopo serve un editor binario, capace di aprire file anche di grandi dimensioni e che consenta di cercare sequenze di caratteri e di sostituirle con altre. Ne ho provati alcuni, rigorosamente gratuiti anche per scopi commerciali e lavorativi, e finora il più completo che ho trovato è HxD Hexeditor di Maël Hörz, che entra così a pieno titolo nella mia personale selezione di software gratuiti per l’ufficio. Oltre a manipolare i file, HxD permette anche di esaminare e modificare il contenuto dei dischi e della memoria RAM, più qualche altra funzione accessoria quale la suddivisione di file grandi in file più piccoli.

La mia collezione di software per l’ufficio (e per casa)

Sto riordinando un po’ per volta la mia collezione di software gratuito che consiglio per il lavoro d’ufficio e per casa.  E’ tutto software gratuito, utile ed affidabile. L’affidabilità è basata su questa semplice “selezione naturale”: è il software che mi sono accorto di essermi trascinato dietro ad ogni cambio di computer o di lavoro in venti anni di attività d’ufficio e di informatica. Siccome uno non può imparare tutti i software di questo mondo, la selezione è abbastanza stretta.

Per chi è interessato, la collezione (in costruzione) è accessibile nella pagina “Software gratuito per l’ufficio” . Sono naturalmente gradite osservazioni, completamenti, critiche.

Casa 3-Dolce Casa

Mi sarebbe stato utile qualche anno fa quando ho traslocato ma potrebbe ancora venire buono, nella vita non si sa mai … Sweet Home 3D è una applicazione open source per il disegno di interni che ti aiuta a disporre il tuo mobilio su di una piantina 2D, con un anteprima 3D. In pratica, ti permette di disegnare la planimetria del tuo appartamento (o semplicemente della tua stanza o del tuo ufficio), di arredarla con i mobili (inclusi nella applicazione) e di vedere in 3D l’effetto che fa sia in vista prospettica sia “camminandoci dentro”.

Il mobilio base fornito con l’applicazione è solo di una ottantina di pezzi, cui si aggiungono altri 100 pezzi prodotti da utenti e disponibili gratuitamente, più altri mobili disponibili su altri siti (non so se gratuitamente). Oltre ovviamente alla possibilità di disegnare da noi stessi i mobili non già disponibili.

Essendo sviluppata in tecnologia Java Web Start, è possibile utilizzarla senza installarla sul pc, ma per usarla in assenza di una connessione continua con internet, è più conveniente scaricarla e poi lanciarla dal pc. Entrambi i link per l’uso da internet e fuori internet sono disponibili nella homepage.

Conversioni senza convertitori

Il servizio offerto gratuitamente da Media Convert è di quelli che conviene segnarsi (cosa che sto facendo con questo post ): converte file tra i formati più comuni di testo, tabelle, presentazione, archivi, video, immagini, musica (compresi suonerie dei telefonini) senza necessità di installare convertitori sul pc.

Su alcuni formati audio offre inoltre servizi particolarmente interessanti quali la possibilità di limitare l’intervallo temporale (dal secondo al secondo) del file risultante e di ascoltare il file iniziale per identificare quale sia l’intervallo interessante.

Il tutto senza pagare e senza neppure iscriversi. Ringrazio NeuroMemories per la segnalazione.

Gimp (grafica bitmap)

(aggiornamento di una notizia pubblicata per la prima volta il 14 aprile 2006)

Gimp è uno splendido software gratuito (come tutti quelli qui recensiti) che consente di manipolare immagini bitmap come le fotografie. Ha tutte le funzionalità di programmi come Photoshop ed è dotato di un numero sempre crescente di effetti. La nuova versione 2.4 appena uscita presenta parecchie novità ben descritte sul sito di Gimp Italia. Io non sono un cultore della materia, ma mi ha molto solleticato la descrizione della nuova funzionalità di “Estrazione primo piano”:

(…) è quasi una piccola meraviglia. Con esso si può estrarre un oggetto da un’immagine a prescindere da ciò che lo circonda. Per prima cosa, si traccia semplicemente un contorno approssimato intorno all’oggetto che si vuole estrarre, poi si può scarabocchiare su porzioni rappresentative dell’oggetto in rimo piano ed ecco che l’algoritmo magicamente trova il contorno dell’oggetto voluto.

Gimp non è di immediata comprensione, ma fortunatamente esiste un buon manuale utente in italiano la cui lettura è caldamente consigliata per non perdersi nei primi utilizzi. Esistono poi diversi siti e tutorial per esigenze specifiche, tra cui segnalo wwwtina-Gimp (in italiano) per le scritte glitterate  ed altri effetti,  ed una serie di tutorial per il ritocco fotografico (in inglese) con ottimi esempi.

Per un ottimo editor vettoriale cerca “Inkscape” in questo sito.