PDF/A ó PDF OCR es un tipo de ficheros que crea confusión entre los usuarios, ¿Porque?.
Muchos de nuestros clientes, sobre todos los usuarios de lexnet nos llaman solicitando que les exigen la presentación de un documentó en un fichero PDF/A o OCR dicen la mayoría.
Están sorprendidos y estresados por esta petición que les desconcierta porque ya presentan documentos PDF desde hace tiempo y nunca les habían requerido este tema antes.
Aunque en la Wikipedia hay muy buena información, es muy técnica, aquí no vamos a utilizar temas muy técnicos para que lo puedas comprender.
¿Qué es un fichero PDF?
Un fichero PDF es un contenedor de contenido electrónico, puede albergar fotografías, ficheros de texto, fuentes, Script (pequeños programas), etc …
Pensaras, si muy bien, pero yo creo ficheros PDF. Aquí comienza la confusión más común y me explico.
Muchos creamos ficheros PDF desde nuestro equipo multifunción que es estupendo, cargamos en la bandeja del escáner nuestros documentos y generamos nuestro PDF, perfecto ya lo tenemos.
Pues bien, en la mayoría de los casos lo que hemos obtenido en un conjunto de fotografías con las páginas de nuestro documento de papel ordenadas como si fueran páginas en el documento PDF.
Esto es maravilloso tenías papeles que ocupaba un montón de espacio físico y ahora tienes todo en un fichero PDF, que puedes enviar por mail, subir a plataformas de trabajo, almacenar de forma cómoda y barata, fácil de administrar, etc …
Como hemos visto introdujimos fotografías en un fichero y claro las fotografías son solo eso fotografías, cuando son de un paisaje, retratos, etc… son estupendas, pero si lo que contiene es la foto de un escrito el cual queremos procesar o simplemente realizar búsquedas de palabras o copiar algún texto que contenga, no nos servirá.
Ese tipo de fichero PDF solo lo pueden interpretar personas o programas OCR.
¿Entonces qué es un fichero PDF/A?
Un fichero PDF/A contiene distintas capas en una (lo que veos) las imágenes en otra los textos en formato electrónico como si fuera un fichero un Word, también puede incluir las fuentes de los textos y más cosas que no entraremos en detalles para no liarnos.
En formato PDF/A si podremos procesarlo con otros programas, realizar búsquedas de texto, un método muy como cuando tenemos un documento con decenas o cientos de páginas, copiar alguna frase para un nuevo documento, etc …
El tiempo que nos puede ahorrar si sabemos utilizarlo es considerable.
También reseñar que tienen la característica de que todo se ha de incluir dentro del mismo con lo que no dependerá de contenidos externos que se puedan modificar, siendo idóneo en el ámbito legal.
¿Cómo generar un fichero PDF/A?
La forma de generar un fichero PDF/A dependerá del origen en el que tengamos la información (fichero fuente), vemos los casos más habituales.
Contamos con un fichero de texto en Word o cualquier procesador de texto.
Si contamos con un fichero de texto en Word o cualquier procesador de texto solo tendremos que guardarlo como PDF o utilizar una impresora PDF y listo obtendremos nuestro fichero PDF/A.
Nuestro fichero fuente está en papel.
En este caso necesitamos convertir cada página en imagen y nuestra imagen en texto.
Aquí es donde aparece el OCR (Reconocimiento Óptico de Caracteres es español), que no es más que un programa que es capaz de interpretar las imágenes detectando caracteres y generar un fichero de texto, en definitiva, leer como una persona y escribir el texto.
En este caso es cuando colocamos nuestro documento en nuestra multifunción y creamos el PDF con las funciones que nos ofrece.
Pues bien, la gran mayoría de los equipos multifunción de gama baja y media no cuentan con la función de la creación de ficheros PDF/A, puedes consultarlo en la web del fabricante de tu equipo y activarla si cuenta con ella.
Si en tu oficina contáis con equipos multifuncionales de alta gama casi seguro que integran esta función, consulta con los técnicos del equipo como utilizarlo.
No es necesario que compres un equipo de alta gama para la creación de ficheros PDF/A hay otras soluciones. Si cuentas con un escáner con suficiente resolución, requerimiento muy importante ya que el OCR necesita obtener imágenes de mucha calidad para poder realizar bien su trabajo, además de tener un ordenador relativamente potente es un trabajo de cálculo intensivo el del OCR puedes adquirí un programa OCR para realizar esta función.
Los programas que realizan bien esta función son de pago, por más que hemos buscado no encontramos nada gratis, te aconsejo los siguientes:
- Adobe Acrobat DC a mi parecer el mejor y más caro, se distribuye en modo suscripción mensual.
- PDFSAM se compra por licencia definitiva y no está nada mal. (Es el que utilizo yo)
Estos programas para trabajar con ficheros PDF no solo te facilitaran funciones de OCR, si no muchas más, como opciones de edición, comprensión, creación, firma, etc …
El fichero lo tengo en fichero PDF normal, ¿Cómo lo paso a PDF/A?
En esta situación utilizaremos uno de los programas presentados anteriormente que entre sus muchas funciones esta es una de ellas.
En todos los casos conseguir una buena interpretación de los caracteres de texto depende de la calidad de las imágenes de nuestro fichero o escáner.
Mis consejos.
- Si esto te sucede puntualmente, coge tus papeles y busca una empresa de fotocopias cerca de tu oficina y pídeles que te lo pasen a formato PDF/A OCR, es la opción más rápida y barata.
- Si te sucede con frecuencia, compra un buen escáner con estas características asegurándote que genera fichero PDF/A y no subestimes adquirir alguno de los programas que te hemos presentado.
Otra opción es solicitarle a quien te envió el fichero PDF normal que lo imprima en formato PDF/A. (envíale el link de este artículo seguro que le es de ayuda.)
Espero haberte ayudado a entender que es un fichero PDF/A, ahora tú puedes ayudarnos compartiendo este artículo en tus redes sociales para que sigamos creando este tipo de contenido gratuito y si alguien necesita un informático puede contar con nosotros.
Si aun tienes dudas y necesitas un informático profesional para este tema o cualquier otros puedes consultarnos aquí.
Estimados: El programa pdf Sam con licencia perpetua sirve bien para lex net?, ¿lo recomendaria o es mejor a licencia anual? Gracias
Hola Ramón yo te recomendaria la suscripción de Acrobat, es la mas compatible con todos.