Publicidad

Artículo

El arte de recuperar y abrir archivos antiguos

Fabrizio Ferri-Benedetti

Fabrizio Ferri-Benedetti

  • Actualizado:

Los archivos envejecen, y envejecen muy mal. Mientras que un documento de papel se puede leer mientras siga intacto, un archivo incompatible o corrupto nada dice acerca de sus contenidos, al menos no hasta que apliques algunas técnicas de recuperación de datos y arqueología informática.

Busca ese viejo disquete que guardas en el cajón. O aquel disco duro antiguo. O incluso una de esas viejas cintas en las que solías hacer las copias de seguridad. Si consigues acceder a sus carpetas, la probabilidad de que te encuentres con archivos que eres incapaz de abrir es muy alta.

El arte de recuperar y abrir archivos antiguos

Voy a explicarte cuáles son las razones más habituales por las que los archivos antiguos son tan difíciles de abrir y qué puedes hacer para rescatar su contenido total o parcialmente. Ya verás que para ser un arqueólogo digital no hace falta látigo ni tampoco sombrero, pero sí algo de paciencia y habilidad.

¿Por qué un archivo antiguo no se puede abrir?

La lectura de soportes anticuados es solo una parte del problema al que se enfrentan quienes han de recuperar datos obsoletos, y a menudo es la menor de sus preocupaciones. El gran obstáculo es la apertura de los datos, que están a veces guardados en formatos desconocidos o incompatibles.

Para entender por qué es difícil leer archivos antiguos hay que saber primero cómo se almacena la información.

Los archivos son larguísimas hileras de ceros y unos que se graban en un soporte de almacenamiento, como un disco duro o una tarjeta de memoria. Para diferenciar entre un documento y otro, ese flujo de caracteres se encapsula en lo que llamamos “archivos”, que no son más que áreas delimitadas por cabeceras de código.

Un archivo típico: datos, una extensión (cabecera) y metadatos (información sobre los datos)

El formato de una archivo es como una gramática por la cual se rige la escritura de los datos, que se pueden organizar de muchísimas maneras. En algunos sistemas, como Windows, el formato suele indicarse por la extensión, que no es más que una serie de caracteres -a menudo un acrónimo- que sigue al nombre del archivo.

Estas “gramáticas” que permiten leer e interpretar el contenido de una archivo se detallan en las especificaciones de formato, documentos técnicos que pueden ser de público dominio o bien propietarios y, a veces, confidenciales. Por ejemplo, el formato de imagen de Adobe Photoshop, el conocido .PSD, se detalla aquí para todo el mundo.

Especificaciones del formato PSD

Un archivo .PSD (Photoshop) tiene una estructura compleja

Un formato simple, bien diseñado y de dominio público puede tener una vida útil muy larga. Los problemas empiezan cuando hay que tratar con archivos creados en formatos propietarios, poco o nada documentados o creados para aplicaciones que han sido abandonadas o que se han actualizado sin considerar la compatibilidad hacia atrás.

Lotus Ami Pro

Abrir hoy un documento creado con el procesador de textos Lotus Ami Pro puede ser complicado

Otros problemas surgen cuando el archivo está corrupto (parte de sus datos se han perdido o dañado) o comprimido en un formato a su vez desconocido. El cifrado, finalmente, acaba por convertir carpetas enteras en cajas de seguridad cuya llave ha sido tirada al mar.

Técnicas para recuperar y abrir archivos antiguos

Ahí tienes el soporte de almacenamiento y un lector apropiado. Te dispones a acceder al mismo para recuperar datos -si los hay-. Pero, antes de hacerlo, conviene que contestes una serie de preguntas, útiles para definir el escenario de recuperación:

  • ¿Qué es probable que contengan los archivos?
  • ¿Qué programas se usaron para editarlos?
  • ¿Con qué sistema operativo se trabajó?
  • ¿En qué idioma están los archivos?
  • ¿Se utilizó cifrado o compresión?

Más información previa tienes, más fácil y rápida puede ser la recuperación. En este artículo, no obstante, vamos a dar por sentado que tu conocimiento sobre los ficheros a rescatar es prácticamente nulo. Los pasos que explico a continuación permitirán contestar las preguntas anteriores (o por lo menos intentarlo).

1. Obtener una copia exacta de los archivos / soportes

Es una de las leyes fundamentales de la informática forense, y también de la recuperación de archivos: antes de intentar cualquier operación de apertura o manipulación de los datos, conviene obtener una copia lo más fiel posible del soporte original y trabajar exclusivamente con ella.

Los programas de clonado de unidades permiten obtener una imagen virtual de cualquier disco legible. Por otro lado, las herramientas de copia de bajo nivel son capaces de leer flujos de datos incluso si carecen de estructura o han sido dañados (o si el disco duro tiene problemas).

Las herramientas de copia de bajo nivel y clonado de discos que te recomiendo son las siguientes:

  • IsoBuster, capaz de leer todo tipo de unidades y crear imágenes ISO (recomendada)
  • Unstoppable Copier, una utilidad para copiar archivos ignorando los errores de lectura
  • El comando dd de Linux y Unix, muy potente para leer datos en bruto (para Windows, WinDD)
  • OSFClone, una herramienta arrancable que clona discos enteros (y OSFMount para leerlos)
  • Daemon Tools, indispensable para montar las imágenes en unidades virtuales

Si no quieres trabajar con imágenes, puedes usar las operaciones de copia clásicas del sistema operativo, pero puede que fallen en caso de errores de lectura. En Windows, utilidades de copiado fiables son Teracopy y SuperCopier.

IsoBuster en acción. A diferencia del copiado normal, el suyo puede con los errores

Para ver un ejemplo de cómo usar IsoBuster para leer un CD/DVD dañado, lee mi tutorial de recuperación. El procedimiento es similar al de otras utilidades gráficas. El objetivo final es que consigas tener una copia fiel de los archivos a examinar.

2. Identificar el tipo de archivo / formato

Ya tienes los archivos, pero quizá no conozcas su formato. Aquí hay dos situaciones posibles:

  • La extensión es visible, pero no la conoces
  • El archivo no tiene extensión en su nombre

Si el archivo tiene una extensión, puedes introducirla en buscadores de extensiones, como FileInfo o Filext. Una simple búsqueda en Google también puede ayudar. Un ejemplo popular: “abrir APK” (la extensión de las apps de Android).

Información sobre el formato SAM

La ficha de FileInfo sobre el formato .SAM. La página te indica también qué programas pueden abrirlo

Pero ¿qué ocurre si el archivo no tiene extensión o si la búsqueda no arroja resultados? En ese caso, debes analizar el archivo. Este método no siempre arroja una alta precisión, pero da pistas muy útiles sobre el contenido del archivo.

Hay una herramienta digna de CSI que hace ese trabajo de análisis por ti. Se llama TrID, y gracias a su amplia base de datos de firmas y cabeceras es capaz de identificar más de 5.000 formatos. Y es una base de datos en constante crecimiento.

Al parecer el archivo es casi seguramente una base de datos con imágenes en su interior

¿Una opción todavía más rápida y completa? Si el archivo tiene un tamaño inferior a los 10 megabytes, puedes subirlo a VirusTotal, que no solo lo escaneará en busca de malware, sino que además analizará su formato con TrID.

¿Sabias que VirusTotal también analiza el formato del archivo y sus metadatos?

Ahora bien, conocer el formato es solo la mitad del trabajo. Una vez que lo conoces, debes encontrar el programa capaz de abrirlo. Una rápida búsqueda en FileInfo o FileExt -o en Google- te dirá con qué aplicación puedes intentarlo.

3. Intentar la apertura con programas compatibles

En un mundo ideal, el archivo que has identificado está intacto y puedes abrirlo sin problemas con una de las aplicaciones que tienes instaladas. Como mucho, puede que te encuentres con pequeñas anomalías visuales, pero ya está.

Pero también puede ocurrir una de las siguientes situaciones:

  1. Tienes el programa, pero no se ejecuta en tu sistema operativo actual
  2. Tienes el programa, debería ejecutarse, pero no lo hace
  3. No tienes el programa o no lo encuentras por ninguna parte
  4. Tienes el programa, pero no consigues abrir el archivo

Caso 1: tienes el programa, pero no se ejecuta en tu PC

Un programa de hace muchos años puede que no se ejecute correctamente en tu ordenador por pura y simple falta de compatibilidad. Un ejemplo son muchas aplicaciones para MS-DOS o viejas versiones de Windows.

Mi consejo es que uses DOSBox para ejecutar esas aplicaciones antiguas. Es un emulador eficaz y muy fácil de configurar (aquí te lo explico). En contra de la creencia popular, DOSBox no solo sirve para juegos, sino también para aplicaciones estándar.

¿Necesitas una emulación más completa, quizá de otro sistema operativo? En ese caso, lo mejor que puedes hacer es configurar una máquina virtual, que no es más que un PC virtual dentro de tu PC. La que recomiendo es VirtualBox.

En este magnífico tutorial, Fede Diaz explica cómo instalar MS-DOS 6.22 y Windows 3.11 en VirtualBox

Caso 2: tienes el programa, debería ejecutarse, pero… no lo hace

Aun teniéndolo todo configurado a las mil maravillas -al menos teóricamente-, el Universo puede conspirar contra ti para que el programa que debía abrir tus documentos no consiga… abrirse.

Vaya… memoria insuficiente. Menudo fastidio, ¿no?

En mi artículo “10 motivos porque un programa no se abre” analizo las causas de cuelgue más frecuentes y ofrezco soluciones para las mismas. ¿Ninguna te ha servido? Pasa a los puntos siguientes…

Caso 3: no tienes el programa o no lo encuentras por ningún sitio

En ocasiones el programa original se ha perdido y ni siquiera en los sitios de abandonware es posible dar con ellos. Puede pasar. En ese caso, no desesperes todavía, pues puedes hacer algo al respecto.

La primera opción es convertir el archivo a un formato compatible usando un conversor específico para tu formato. Una búsqueda en Google con el formato “EXT1 to EXT2” o “EXT a EXT” te mostrará conversores aptos para la tarea.

Miles de personas se han enfrentado a tu problema antes, y quizá lo hayan resuelto (captura de GMayor)

Otra cosa que puedes intentar es buscar plugins o accesorios compatibles. Por ejemplo, si lo que tienes que abrir es un documento de texto, busca un plugin para un editor que tengas, o una versión anterior que sí es capaz de abrir el archivo.

Caso 4: tienes el programa y funciona, pero el archivo no se abre

Hay muchas razones por las que un archivo no pueda abrirse correctamente en su programa. Entre las más habituales:

  1. Ha sido dividido en segmentos (por ejemplo, con un programa tipo Hacha o HJ-Split)
  2. El contenido está comprimido o protegido por una clave desconocida (cifrado)
  3. El archivo tiene una extensión errónea o varias extensiones mezcladas
  4. Su contenido ha sido sobrescrito, borrado, corrompido o infectado con virus

En los dos primeros casos, debes prestar atención al contexto del archivo: ¿hay instrucciones en la carpeta? ¿Ha dejado alguien una clave? ¿Hay archivos con el mismo nombre que pudieran ser segmentos?

El caso 3 es fácil de resolver: solo requiere que vuelvas a analizar el archivo y cambies la extensión, o incluso que la dejes vacía y dejes que el programa intente adivinar el formato forzándolo a abrir un archivo desconocido.

El cuarto caso es el más peliagudo. Si el archivo ha perdido su integridad, su apertura de poco te podrá servir (a menos que el programa empleado sea muy tolerante a los errores). Lo que nos lleva al punto 4 de este artículo.

4. ¿Nada funciona? Hora de usar el bisturí…

Es el peor de los escenarios, y de veras espero que no hayas tenido que llegar a él. Si tus archivos no se abren de ninguna manera, vas a tener que extraer de ellos toda la información aprovechable. No es un procedimiento sencillo.

La extracción de datos implica casi siempre una lectura de bajo nivel similar a la que efectúan los recuperadores de archivos borrados. En algunos casos, sobre todo para recuperar texto, tendrás que usar un editor hexadecimal.

Hay formatos son más tolerantes con los errores que otros. A mayor compresión de datos, peor recuperación

Forzar la apertura con visualizadores rara vez funciona, sobre todo si los archivos tienen algún tipo de compresión (como muchos vídeos y archivos de sonido). Los formatos más recuperables tienen una estructura simple (como WAV o BMP).

Un editor hexadecimal, como HxD o WinHex, te ayudará en la ardua tarea de recuperar datos. Basta con abrir cualquier archivo para poder buscar cadenas de texto en su interior y copiarlas luego al portapapeles.

HxD ha encontrado texto, en este caso dentro de un procesos en la memoria. Exportarlo es muy fácil

Prevención: cómo facilitar la recuperación futura de tus datos

Guardar datos para la posteridad no es un asunto trivial. Como explican muy bien aquí, todos los programas son vulnerables a la obsolescencia, y los formatos de archivo usados por ellos, también.

Las tres palabras clave para evitar problemas de recuperación de datos son redundancia, transparencia y documentación. Tus datos deben estar guardados en formatos abiertos, poco sensibles a errores y bien documentados.

Algunos consejos prácticos de cara al futuro de tus archivos:

  • Emplea formatos de archivo de código abierto o muy populares
  • Guarda los documentos importantes en más de un formato
  • No usar cifrado o compresión a menos que sea realmente necesario
  • Acompañar los archivos de una descripción y/o metadatos
  • Almacenar los archivos importantes en más de una copia y soporte

Con algo de suerte, las generaciones futuras podrán acceder todavía a tus documentos y leerlos sin necesidad de acudir a laboratorios de arqueología digital o centros de preservación de documentos.

¿Cuál es el archivo más antiguo que tienes? ¿Con qué lo abres?

Sígueme en Twitter: @remoquete

Fabrizio Ferri-Benedetti

Fabrizio Ferri-Benedetti

Lo último de Fabrizio Ferri-Benedetti

Directrices editoriales