Curso : 202122, 202021, 201920
Area : Sistemas operativos, backup
Descripción : Copias de seguridad usando tar, rsync
Requisitos : GNU/Linux, Windows, SSH
Tiempo : 11 sesiones
Propuesta de rúbrica:
Criterio | Bien(2) | Regular(1) | Falta(0) |
---|---|---|---|
(4.1) Copia inicial | |||
(4.2) Recuperación de archivos | |||
(4.3) Programar las copias | |||
(6.3) rsync local | |||
(6.4) rsync remoto | . |
Vamos a realizar esta práctica con:
- 1 MV SO GNU/Linux (Configuración).
- 1 MV Windows (elegir el entorno de Windows para trabajar):
- (a) Con el entorno WSL (Configuración)
- (b) Con Cygwin. El programa Cygwin nos permite utilizar los mismos comandos de GNU/Linux dentro de un Windows.
Una vez elegida la MV, empezamos:
tar --version
, para comprobar que lo tenemos instalado en nuestro sistema.
Ahora vamos a crear la estructura de directorios y ficheros para probar con ellos las copias de seguridad.
- Iniciar sesión con nuestro usuario (
nombre-del-alumno
). - Estamos en el directorio
/home/nombre-del-alumno
- Crear directorio
mydocsXX
. - Crear archivo
mydocsXX/a.txt
. Dentro escribir nombre completo del alumno (Pista:figlet nombre-alumnoXX > a.txt
) - Crear archivo
mydocsXX/b.txt
. Dentro escribir la fecha actual (Pista:date > b.txt
).
Se ha creado lo siguiente:
mydocsXX
├── a.txt
└── b.txt
Este apartado no hay que hacerlo. Sólo es teoría sobre el comando.
Enlaces de interés:
El comando "tar" sirve para empaquetar. No para comprimir. Para comprimir se usan herramientas como zip/unzip, gzip/gunzip, etc.
El "tar" podemos usarlo en combinación con alguna herramienta de compresión para hacer las dos acciones en un sólo paso. Pero RECUERDA...:
- Empaquetar: es crear un fichero que contiene dentro 1 o más ficheros y directorios.
- Comprimir: es aplicar técnicas de compresión a un fichero X para reducir su tamaño sin perder el contenido. A veces aplicar técnicas de compresión consigue el efecto contrario y el fichero ocupa más comprimido que su original (Pero eso en raras ocasiones).
Crear backup:
tar cvf ...
: Crear fichero empaquetado.tar cvfz ...
: Crear fichero empaquetado y comprimido con formato gz.tar cvfa ...
: Crear fichero empaquetado y comprimido.
Consultar contenido del backup:
tar tvf ...
: Muestra el contenido del fichero empaquetado.tar tvfz ...
: Muestra el contenido del fichero empaquetado y comprimido gz.tar tvfa ...
: Muestra el contenido del fichero empaquetado y comprimido.
Extraer uno o varios ficheros del backup:
tar xvf ...
: Extrae el contenido del fichero empaquetado.- Extrae el contenido del fichero empaquetado en dir2.
tar xvf ... --directory dir2
tar xvf ... -C /dir2
tar xvf backup.tar --directory dir2 file3
: Extrae un archivo (file3) del fichero empaquetado en el directorio dir2. También valdríatar xvf backup.tar -C dir2 archivo
.tar xvfz ...
: Extrae el contenido del fichero empaquetado y comprimido gz.tar xvfa ...
: Extrae el contenido del fichero empaquetado y comprimido.
Otros parámetros de interés:
- Con el parámetro
-p
los ficheros mantienen su trayectoria absoluta dentro del empaquetado. - Con el parámetro
-z
podemos forzar compresión "gz".
Varios:
date +%Y%m%y
: Comando para mostrar la fecha actual en formato AAAAMMDD.gzip ...
: Comando para hacer la compresión en formato gz.zip ...
: Comando para hacer la compresión en formato zip.
- Iniciar sesión con nuestro usuario normal.
- Estamos en nuestro HOME
/home/nombre-alumno
. tar cvf backupXX-1-full.tar mydocsXX
, parea realizar una copia de seguridad total.tar tvf backupXX-1-full.tar
, comprobar el contenido de la copia de seguridad total.- Crear archivo
mydocsXX/c.txt
. Escribir dentro el título de tu película favorita. - Realiza copia seguridad total con el nombre
backupXX-2-full.tar
. - Comprobar el contenido.
Las copias de seguridad total son sencillas de hacer, pero no son eficientes en cuanto a optimizar el almacenamiento. Por ejemplo, es necesario volver a copiar los archivos a.txt, ni b.txt mientras no cambien.
La copia de seguridad realizada con "tar" es mejor que un copiado normal de las carpetas y/o ficheros porque con tar se preserva la información del propietario de los archivos y sus permisos pero en el caso de una copia normal no es así. Comprobemos:
- Entrar como superusuario.
- Nos movemos al directorio
/root
cp -r /home/alumno/mydocsXX /root/mydocsXXcopia
, hacemos un copiado recursivo de los archivos con el usuarioroot
.vdir mydocsXXcopia
, comprobar que el propietario de los ficheros ha cambiado y ahora esroot
. Esta copia a modificado/alterado los metadatos de los archivos.rm -r /root/mydocsXXcopia
, limpiamos.tar xvf /home/alumno/backupXX-1-full.tar -C /root
, restauramos los archivos de la copia de seguridad pero en una ruta diferente a donde estaban los archivos originales.- Vemos que el propietario de los ficheros restaurados se mantiene. La recuperación de backup mantiene los metadatos originales.
- Salir del superusuario.
Enlaces de interés:
- Entrar con nuestro usuario normal (NO usar el usuario root).
- Ir a nuestro directorio HOME
/home/nombre-alumno
. - Tenemos lo siguiente:
mydocsXXinc
├── a.txt
├── b.txt
└── c.txt
- Usaremos nuestro usuario normal. NO usar el usuario root.
- Ejecutamos
cd
para movernos a nuestro directorio HOME. Esto es/home/nombre-del-alumno
. Lo comprobamos conpwd
. tar cvf backupXX-3-init.tar mydocsXXinc -g mydocsXX.snap
, crear el full-backup inicial indicando el fichero de metadatos (snapshot file).- A continuación simulamos dos cambios
- Borrar el archivo mydocsXXinc/b.txt.
- Crear el archivo mydocsXXinc/d.txt.
tar cvf backupXX-4-inc.tar mydocsXXinc -g mydocsXX.snap
, y hacemos el backup incremental indicando el fichero de metadatos que ya tenemos creado.
Como podemos comprobar, la copia incremental sólo guarda los cambios realizados desde el último backup. El fichero snap va guardando el estado final de la copia. Esto es, qué ficheros permanecen y cuáles desaparecen.
- Realizar otra copia incremental (snap file
mydocsXX.snap
), pero usando como nombre de fichero de backup el siguiente:backupXX-5-inc.tar
- Comprobar el contenido de
backupXX-5-inc.tar
.
Sin hacer cambios en los ficheros, cuando volvemos a realizar otra copia incremental (basándonos en el snap file anterior), podemos comprobar... que NO se copia ningún archivo, porque no ha habido ningún cambio.
Podemos comprobar que la recuperación de archivos desde la última copia incremental, no refleja por sí sola, el verdadero estado final del directorio. El último backup incremental sólo permite restaurar los cambios del último "incremento".
Para conseguir restaurar el estado final completo del directorio, necesitaremos usar todos los backup. Esto es el "full-backup" inicial y todos los sucesivos incrementales.
Pasos para una recuperación completa:
- Primero descomprimir el "full-backup" inicial.
- Estamos en nuestro HOME.
mkdir restoreXXinc
tar xvf backupXX-3-init.tar -C restoreXXinc/
- Luego aplicar el incremental usando la opción
--incremental
.tar xvf backupXX-4-inc.tar -C restoreXXinc/ --incremental
tar xvf backupXX-5-inc.tar -C restoreXXinc/ --incremental
tree restore
Podemos comprobar que ha añadido el fichero creado (d.txt), pero también se ha borrado el fichero (b.txt) que había sido eliminado en el momento de hacer el incremental.
Curiosidad
La información final de los archivos que deben persistir entre todos los backups (full o inc) se guarda en el fichero snap. Pero como está en formato binario es difícil de ver, para ello usaremos un visor hexadecimal, de la siguiente forma:
$ hexdump mydocsXX.snap -C
00000000 47 4e 55 20 74 61 72 2d 31 2e 33 32 2d 32 0a 31 |GNU tar-1.32-2.1|
00000010 35 37 32 30 31 31 35 32 34 00 36 31 33 31 35 38 |572011524.613158|
00000020 34 37 32 00 30 00 31 35 37 32 30 31 31 33 31 34 |472.0.1572011314|
00000030 00 34 30 38 35 34 39 34 32 36 00 32 30 36 36 00 |.408549426.2066.|
00000040 36 38 34 32 31 36 00 6d 79 64 6f 63 73 00 4e 61 |684216.mydocs.Na|
00000050 2e 74 78 74 00 4e 63 2e 74 78 74 00 4e 64 2e 74 |.txt.Nc.txt.Nd.t|
00000060 78 74 00 00 00 |xt...|
00000065
De la salida anterior, comprobamos que los ficheros que persisten son:
- mydocsXXinc/a.txt
- mydocsXXinc/c.txt
- mydocsXXinc/d.txt
Copia | Características |
---|---|
Total (full-backup) | Son sencillas de hacer, pero desaprovechamos espacio duplicando archivos que no cambian entre backup y backup |
Incrementales (inc) | Permiten optimizar el espacio de almacenamiento no duplicando archivos, pero por contra, a la hora de recuperar nos lleva más trabajo |
Enlaces de interés:
Vamos a crear una configuración (crontab) para que las copias de seguridad se realicen de forma automática.
- Iniciamos sesión con nuestro usuario normal.
crontab -l
, vemos que no hay ninguna configuración creada.export VISUAL=nano
, para decidir que queremos usar el editor "nano" por defecto.
NOTA: Si usamos el editor vi:
- Pulsar
i
(insert) para activar el modo de empezar a escribir.- Para salir del editor vi hacemos lo siguiente:
- Pulsar la tecla
ESC
.- Escribir: ,
:
,wq
. Así grabamos(w=write) y salimos (q=quiet) del editor de crontab.
crontab -e
, se nos abre un editor para configurar crontab.
Información para configurar crontab:
- m: minuto
- h: hora
- dow: día del mes
- mon: mes
- dom: día de la semana (0=domingo, 1=lunes, etc)
- Comando a ejecutar
- Escribir algo parecido a lo siguiente, cambiando
alumno
por el nombre del alumno:
45 10 * * 1 tar cvfz /home/alumno/crontabXX-lun.tar.gz /home/alumno/mydocsXX
45 10 * * 2 tar cvfz /home/alumno/crontabXX-mar.tar.gz /home/alumno/mydocsXX
45 10 * * 3 tar cvfz /home/alumno/crontabXX-mie.tar.gz /home/alumno/mydocsXX
45 10 * * 4 tar cvfz /home/alumno/crontabXX-jue.tar.gz /home/alumno/mydocsXX
45 10 * * 5 tar cvfz /home/alumno/crontabXX-vie.tar.gz /home/alumno/mydocsXX
Esta configuración programa una copia de seguridad del directorio /home/alumno/mydocs
a las 10:45.
crontab -l
, consultar que las tareas están programadas correctamente.- Esperar a que se ejecute la copia de seguridad programada con crontab.
vdir /home/alumno/
, para comprobar que existe el fichero con la fecha esperada.
Enlace de interés:
- Partimos de que ya se ha realizado un "full-backup".
- Con el comando siguiente crearemos la copia diferencial de la copia completa que hemos realizado:
tar -cvf backupXX-7-diff.tar mydocsXX/* -N 2021-01-13
.
Para realizar backups diferenciales con tar usaremos su opción -N. Lo que nos permite esta opción es ordenar a tar que solo archive aquellos datos que han cambiado desde una determinada fecha, hasta la fecha de ejecución del comando.
Nota: Si pasados unos días, volviésemos a crear otra copia diferencial "backupXX-8-diff" con la misma fecha, esta copia contendría también los cambios reflejados en las copias diferenciales anteriores. Por esta razón su tamaño va aumentando en comparación con los backups incrementales.
Por ahora estamos guardando las copias de seguridad en el equipo local. Es aconsejable guardar las copias en otro equipo de nuestra red. Podríamos guardar los ficheros de las copias de seguridad en un servidor remoto usando SMB/CIFS, SCP, NFS, etc.
Ahora vamos a usar la herramienta rsync
para mantener sincronizadas réplicas de nuestros ficheros. Es otra forma de hacer backups.
Rsync transfiere archivos eficientemente por una red a otro sistema, desde el cual puede recuperarlos en caso de que le ocurra un desastre al sistema local.
La utilidad rsync es programa diseñado para replicar grandes cantidades de datos. Puede saltarse archivos copiados previamente y fragmentos y encriptar las transferencias de datos con SSH, haciendo copias de seguridad remota con rsync de manera más rápida y más segura que con herramientas tradicionales.
Opciones de rsync
Éstas son algunas de las principales opciones de rsync:
Oopción | Descripción |
---|---|
-g | Preserva los permisos de grupo de los archivos que se están duplicando |
-l | Copia los enlaces simbólicos con enlaces simbólicos |
-o | Preserva el usuario de los archivos que se replican |
-p | Preserva los permisos de los archivos que se replican |
-t | Preserva la hora de modificación de los archivos que se replican |
-r | Activa la recursividad, transfiriendo subdirectorios |
-a | Es lo mismo que "-Dgloprt" |
--partial | Activa las transferencias parciales. Si rsync se para, será capaz de completar el resto del archivo cuando se reinicie |
--progress | Muestra el progreso de la transferencia de archivos |
-P | Activa "--partial" y "--progress" |
-v | Lista los archivos que se están transfiriendo |
-vv | Igual que -v pero también lista los archivos que se ignoran |
-vvv | Igual que -vv pero también muestra información de depuración |
-n | Muestra los archivos que se transferirán |
--rsh='ssh' | Usa SSH para la transferencia. También se puede hacer definiendo la variable de entorno RSYNC_RSH como ssh |
-z | Activa la compresión |
-H | Preserva los enlaces |
-b` | Hace copia de todos los archivos destino en lugar de sustituirlos. Se usará cuando se desea mantener versiones antiguas de cada archivo |
Después de las opciones vienen los parámetros de origen y destino. Las rutas pueden ser locales o remotas (user@host:path
).
whereis rsync
, para comprobar si tenemos rsync instalado en el sistema. También podemos verificarlo con:rsync --version
,rsync --help
,zypper info rsync
, etc.- Si no está debemos instalarlo:
zypper install rsync
, instalar rsync en OpenSUSE.- También podemos usar el comando
apt install rsync
, para OpenSUSE o Debian/Ubuntu.
- Iniciar sesión con nuestro usuario normal.
- Crear la siguiente estructura de ficheros en nuestro directorio HOME (
/home/nombre-alumno
):
├── mydocsXXrsync
│ ├── a.txt
│ ├── b.txt
│ └── c.txt
└── replicaXXrsync
rsync -aP mydocsXXrsync replicaXXrsync
, para crear una réplica exacta demydocsXXrsync
en el directorioreplicaXXrsync
.- Si repetimos el proceso (
rsync -aP mydocsXXrsync replicaXXrsync
) no copia nada porque no es necesario. - Crear
mydocsXXrsync/d.txt
. - Volver a replicar. Comprobar que sólo se replican lo cambios.
- Eliminar
mydocsXXrsync/b.txt
. - Ejecutar
rsync -aP --delete mydocsXXrsync replicaXXrsync
. Comprobamos que sólo se replican lo cambios. En este caso se replica la eliminación del archivo.
- Crear MV2 con servidor SSH activo.
- Instalar
rsync
en la MV2. - Volver a la MV1.
ssh usuario2@IP-DE-LA-MV2
, comprobamos que funciona el acceso remoto SSH a la MV2.- Crear la carpeta
replicaXXremoto
en la MV2. exit
para salir de la sesión SSH.
Estamos en la MV1.
- Partimos de la siguiente estructura de ficheros en nuestro directorio (
/home/alumno
):
mydocsXXrsync
├── a.txt
├── c.txt
└── d.txt
rsync -aP --delete mydocsXXrsync usuario2@IP-DE-LA-MV2:/home/usuario2/replicaXXremoto
, para replicar los datos del directoriomydocsXXrsync
de mi máquina local, al directorio/home/usuario2/replicaXXremoto
, de la máquina remota MV2.- Ir a MV2 y comprobar que se han copiado los archivos.
- Ir a MV1
- Crear
mydocsXXrsync/b.txt
- Eliminar
mydocsXXrsync/d.txt
. - Volver a sincronizar con el servidor remoto.
- Ir a MV2 y comprobar los resultados.
- Ir a MV Windows.
- Entra en el entorno de comandos similar a GNU/Linux.
- Localiza la ruta
C:\Users\nombre-alumno
. - Abrir entorno Cygwin y probar los comandos tar, rsync, etc.
Enlaces de interés:
- Tar Vs Zip Vs Gz : Difference And Efficiency: Difference between Tar, Zip and gz explained and their performance compared. Find out which is the most efficient among the three.
- Reading files in a zip archive, without unzipping the archive - Stack Overflow