Últimamente he tenido que pensar mucho en los procesos necesarios para obtener los archivos de una publicación digital. Uno de los puntos más difíciles de discernir ha sido cómo hacer para que al final del proceso obtengamos archivos válidos para diferentes plataformas, pues finalmente la gran ventaja de editar digitalmente es poder utilizar una fuente para múltiples formatos. Sin embargo, esta capacidad puede conllevar una complicada implementación, puesto que requiere visualizar los distintos formatos que se generarán antes que se comience la producción de la publicación. Por el momento, la mejor solución para obtener un archivo maestro para varios formatos es marcar el contenido con XML (eXtensible Markup Language), uno de los mejores formatos para intercambiar información estructurada.
Por otro lado, antes de obtener el material que se marcará habrá que definir muchos otros procesos. Influye mucho la fuente de donde obtendremos el contenido de nuestra publicación; por ejemplo, si vamos a digitalizar un material ya publicado o si contamos con los archivos digitales. Al tener que digitalizar un acervo nos encontramos con la necesidad de establecer estándares de digitalización (dpi, tamaño y formato para obtener un archivo maestro). A su vez, si contamos con archivos digitales -Word, TXT, PDF, etcétera- deberemos establecer las características que deberán contar para trasladar de forma sencilla dichos formatos a XML. En Word se puede estructurar el archivo a través de secciones u otras funciones del programa para que, al guardar como XML, ya obtengamos los archivos marcados. No obstante, esta forma puede complicarse, puesto que, por lo regular, Word integra código basura a los archivos. Por lo mismo podemos limpiarlos o decidir marcarlos desde un origen con un Marcador de XML, esta última opción cuenta también para los formatos PDF, TXT, entre otros. Asimismo, cuando digitalizamos material impreso, antes de ponerse a escanear, deberemos establecer los parámetros que tendrán los archivos digitalizados, para que así obtengamos imágenes con la calidad suficiente: normalmente es suficiente con archivos a 300dpi y en escala de grises (para texto) o millones de colores para fotos, asimismo guardar las imágenes en formato TIFF (Tagged Image File Format), aunque estas características dependerán de la calidad del material a escanear -no es lo mismo escanear fotocopias que un libro con papel couche brillante. Todo esto debido a que si realizaremos procesos de limpieza para las imágenes o de OCR (Optical Character Recognition) contemos con la mejor eficacia en ellos. Siempre hay que mantener los archivos de calidad de la digitalización como maestros, dado que así podremos realizarles diferentes procesos sin tener que re-escanear el material.
Una vez que ya tengamos la información digital lista para marcarse, deberemos planificar todas las diferentes etiquetas que podremos usar. Este proceso de edición es muy importante puesto que a cada etiqueta le podremos dar especificaciones al momento de transformar los archivos en HTML, PDF o integrarlos en una base de datos para generar archivos dinámicos en línea. En esta etapa del proceso se necesitan diversos conocimientos, puesto que la generación de las XSL (eXtensible Stylesheet Language) para los distintos formatos implica conocimientos de programación, diseño web en CSS (Cascading Style Sheets), bases de datos, entre otros, claro está que estos dependerán de los formatos de salida que deseemos tener. Por lo mismo, deberemos contar con un equipo humano capaz de llevarlo a cabo, ya que incluso podemos obtener e-books para lectores digitales como Plastic Logic, Kindle o el mismo i-phone. Además, es muy importante que todos los cambios, que se le hagan al contenido, se realicen en los archivos XML, puesto que así, al volverlos a generar, no tendremos que reincorporar los cambios en los archivos de los diferentes formatos de salida. Cabe mencionar que incluso podemos importar estos archivos en programas de maquetación para publicaciones impresas, como InDesign y QuarkExpress, obteniendo así todo un proceso para publicaciones digitales e impresas. Respecto a las publicaciones impresas, en la actualidad existen propuestas para estandarizar el marcado XML y así se puedan intercambiar más fácilmente. Por último, me queda decir que en la actualidad es muy importante poder intercambiar la información y, debido al constante avance de la tecnología, casi siempre un formato puede dejar de tener actualidad e incluso podemos perder la capacidad para extraer el contenido de un archivo. Por lo tanto, si marcamos nuestra información en XML podremos exportarla a casi cualquier formato. Si de recuperación hablamos solo menciono que los archivos XML pueden visualizarse con el más sencillo editor de textos.