En algunos de los últimos capítulos de Emilcar Daily he tratado la filosofía Paperless, centrada en reducir la presencia de papel en nuestras vidas y digitalizar y archivar toda la información necesaria para su consulta posterior en nuestro Mac, iPhone o iPad.
En mi caso, he decidido escanear todos los documentos y mantener un archivo de los mismos bajo una jerarquía de carpetas en Dropbox, aunque conozco a algunos usuarios que hacen lo mismo pero en Evernote u otros sistemas de manejo de documentos e información. Respecto al tratamiento de esos documentos, voy a hacer una recopilación de todo lo comentado estos días:
- Emilcar Daily: he hablado del tema en los capítulos sobre Facturas en PDF, Hazel y Paperless y OCR para PDF.
- Escaner: yo uso un escaner de documentos Fujitsu Scansnap S1100 que incluye en su software el OCR de ABBYY FineReader con excelentes resultados. Hay otros modelos de Fujitsu más rápidos y que incluso escanean a doble cara, pero la versatilidad de este modelo no la cambio por nada en el mundo.
- Software OCR para Mac: aunque ABBY y otras marcas venden software de OCR para Mac, el más popular es PDFpen, que cuesta 54,99€. A este respecto, Jeroen Sangers del blog de productividad El Canasto, me comenta que usa este truco de Hazel para coger un PDF, detectar si necesita OCR y si es así, hacérselo automáticamente con PDFpen. Dado que, como veis, el uso de scripts es muy recurrente en este tipo de programas, yo evitaría comprarlos en la Mac App Store, ya que seguro que las versiones que se venden ahí no permiten usar estas automatizaciones.
- Software OCR para iOS: «Este es el Mesías, y yo sé de eso porque he seguido a varios». La cita de La Vida de Brian viene aquí al pelo porque yo he usado varias apps de OCR para el iPhone, que actúan sobre fotos de documentos tomadas con el mismo dispositivo o sobre imágenes o PDF que se le suministra. Es una opción válida para tickets y cosas así, pero para documentos en A4 con mucho texto, como una factura, se quedan cortas. De todas las probadas yo me he quedado con
Scanner Pro by ReaddleMy Scans Pro. - Evernote: la cuenta gratuita te hace OCR sobre jpg y la cuenta premium te lo hace también sobre PDF, así que puede ser otra solución viable y muy práctica si además le confiamos el archivo definitivo de los documentos (OJO: me comenta Jeroen Sangers que es un OCR dentro de la app, si sacas el PDF pierdes ese reconocimiento de caracteres).
- Paperless: la madre del cordero este libro de David Sparks, cuya versión recomendada es la de la iBooks Store, al integrar con el texto los vídeos explicativos de todo el sistema. Una gozada. Todo lo que necesitáis saber de esta filosofía está en este libro.
- Hazel: es la app para el Mac que uso para coger los PDF, inspeccionarlos, renombrarlos y moverlos, en función de una serie de reglas. El libro Paperless te enseña todo lo que necesitas saber al respecto, y por Internet encontrarás también varios tutoriales. Mi función favorita es contain match que me permite indicarle a Hazel el formato de fecha que debe esperar encontrar en una factura (por ejemplo) y posteriormente usar las partes de esa fecha para renombrar el PDF.
Básicamente esto es todo lo que hemos estado tratando durante estos días en el podcast y en los comentarios que me habéis hecho por twitter, correo electrónico etc. Si os habíais perdido algo, aquí está todo.
Comentarios
9 respuestas a «Recopilación sobre Paperless»
Hola Emilcar, muchas gracias por todo el trabajo que haces. Me gustaría saber si sabes alguna manera de hacer copia de seguridad de todas las reglas creadas en Hazel. En caso de perderlas nos crearía un gran trastorno. Saludos.
Export All Rules, en el icono de la rueda dentada.
Muchas gracias.
Yo uso un escaner de documentos portátil Iriscan Book, con el que estoy encantado, además incluye su software Readiris Pro.
Después mando todo a Evernote.
Buenas Emilcar,
Yo tengo Scanner Pro by Readdle pero desconocía que tuviera soporte para OCR y de hecho he entrado en la app para comprobarlo y no veo por ningún lado ninguna opción.
¿como funciona?
EDITO: Según veo el OCR solo funciona subiéndolo a Google Drive y lo hace automaticamente.
Muy interesante Emilio, me gustaría preguntarte dos cosas:
La 1ª es si has llegado a publicar alguna vez tus flujos de trabajo de Hazel para el Paperless.
Lo 2º es algo que no se si no se hacer bien, o que quizá te he entendido mal y no sea posible. Te entendí que al hacer OCR a un PDF, el contenido del mismo era accesible desde Spotlight, cosa que no consigo. Puede hacerse? Si es así, que estoy haciendo mal?
Muchas gracias por adelantado, me encantan tus dailys.
@FJTOL
1º – No, nunca los he publicado.
2º – No sé qué estarás haciendo mal. ¿Tienes seleccionado en «Preferencias del sistema» – «Spotlight» que te busque archivos PDF? Mi software tiene una opción específica para que el PDF resultante sea «buscable» ¿y el tuyo?
Gracias en primer lugar por la respuesta.
Sobre mi 2ª pregunta, Spotlight si me busca PDF’s, pero creo que sólo por el nombre del propio PDF. Mi duda, y lo que no hace mi equipo, es si se puede mostrar el documento PDF en los resultados de Spotlight en base a algo que haya buscado que esté dentro del PDF.
Mis Mac buscan dentro de mis pdfs sin que yo haga nada especial. Pero eso sí, tienen que ser PDF que tengan texto reconocible en su interior. He comprobado haciendo una búsqueda por una palabra que está dentro del pdf y en ningún otro sitio y sí, me encuentra el archivo. No sé qué más decirte porque no he hecho nada especial, que no sea el OCR al escanear. ¿Lo has probado con alguna factura pdf bajada directamente de algún proveedor como Movistar?