Ir al contenido principal

FP Grado Superior · Fundamentos de Computación en la Nube

Tema 7: Servicios de almacenamiento en la nube: objetos, bloques, ficheros y archivado

5 min de lectura

← Volver al listado de temas

1. Introducción

El almacenamiento es una pieza crítica de cualquier arquitectura cloud: aplicaciones, imágenes, vídeos, PDFs, logs, copias de seguridad y datos históricos dependen de él.

En cloud, el almacenamiento se consume como servicio. El proveedor gestiona infraestructura física y resiliencia base; el cliente elige el tipo correcto según uso, coste, rendimiento, frecuencia de acceso y requisitos de seguridad/compliance.

La idea clave: no todo almacenamiento sirve para lo mismo.

2. Concepto clave

Existen distintos modelos de almacenamiento según cómo se guardan y consumen datos.

TipoServicio AWSUso principal
ObjetosAmazon S3Archivos estáticos, backups, logs
BloquesAmazon EBSDiscos para EC2
FicherosAmazon EFSSistema de archivos compartido
ArchivadoS3 GlacierConservación a largo plazo

Esquema general

Servicios de almacenamiento en la nube │ ├── Objetos -> Amazon S3 ├── Bloques -> Amazon EBS ├── Ficheros -> Amazon EFS └── Archivado -> S3 Glacier

Almacenamiento de objetos (S3)

S3 guarda datos como objetos dentro de buckets.

Casos típicos:

  • imágenes,
  • vídeos,
  • PDF,
  • estáticos web,
  • backups,
  • logs,
  • exportaciones.

Bucket: campus-virtual │ ├── apuntes/tema7.pdf ├── imagenes/diagrama.png ├── videos/intro.mp4 └── backups/copia.sql

Ventajas: escalable, durable, bajo mantenimiento, integración con CDN/Lambda.

Limitaciones: no es disco de SO, no sustituye a EBS para BBDD en EC2, acceso por red/API.

Almacenamiento de bloques (EBS)

EBS es el disco virtual persistente de EC2.

Casos típicos:

  • disco de sistema,
  • aplicaciones instaladas en VM,
  • base de datos dentro de EC2,
  • workloads con baja latencia de bloque.

EC2 ├── Sistema operativo ├── Aplicación └── Volumen EBS ├── /var/log └── /datos

Ventajas: rendimiento, persistencia, snapshots.

Limitaciones: ligado a AZ, no se comparte fácilmente entre múltiples instancias.

Almacenamiento de ficheros (EFS)

EFS es un filesystem compartido por varias instancias EC2.

EC2 A ─┐ EC2 B ─┼── Amazon EFS (mismo filesystem) EC2 C ─┘

Útil cuando varias instancias necesitan leer/escribir el mismo contenido.

No es sustituto universal: suele costar más que S3 para almacenamiento masivo de estáticos.

Archivado (S3 Glacier)

Diseñado para datos de acceso infrecuente y retención larga:

  • backups antiguos,
  • expedientes históricos,
  • logs de auditoría,
  • evidencias legales.

S3 Standard -> Standard-IA -> Glacier -> Deep Archive

Ventaja principal: coste bajo a largo plazo.

Limitación principal: recuperación más lenta (y potencial coste de restauración).

Clases de almacenamiento S3

ClaseCuándo usar
S3 Standardacceso frecuente
S3 Standard-IAacceso poco frecuente
S3 One Zone-IAIA en una sola zona
Glacier Instant Retrievalarchivado con acceso rápido
Glacier Flexible Retrievalarchivado minutos/horas
Glacier Deep Archivearchivado muy largo plazo

Ciclo de vida

Políticas automáticas para mover objetos entre clases y optimizar costes.

Ejemplo:

  • Día 0: Standard
  • Día 30: Standard-IA
  • Día 180: Glacier
  • Año 5: Deep Archive o borrado

3. Ejemplo mínimo

Para una web educativa:

NecesidadServicio
Imágenes / PDFS3
Disco de EC2EBS
BBDD en EC2EBS
Compartir archivos entre varias EC2EFS
Backups antiguosGlacier

Web educativa │ ├── S3 (imágenes/PDF) ├── EC2 + EBS (SO + datos locales) └── Glacier (backups históricos)

4. Ejemplo completo

Caso: AulaStorage Cloud con web, entregas, materiales, varias instancias, backup y archivado.

AulaStorage Cloud │ ├── S3: materiales, entregas, imágenes, vídeos, exportaciones ├── EBS: discos de EC2 ├── EFS: ficheros compartidos entre EC2 ├── BBDD gestionada: almacenamiento propio del servicio └── Glacier: backups/logs/expedientes antiguos

Flujo típico de entrega:

Alumno -> app web -> bucket S3 entregas (objeto privado + metadatos)

Flujo de archivado:

Datos activos -> backup S3 -> transición Glacier -> Deep Archive.

5. Errores frecuentes

  • Usar S3 como si fuera disco local de sistema.
  • Usar EBS para compartir archivos entre muchas EC2.
  • Guardar todo en clase frecuente sin lifecycle.
  • No considerar tiempos/costes de recuperación en Glacier.
  • No cifrar.
  • Buckets públicos accidentalmente.
  • Permisos excesivos.
  • No monitorizar crecimiento y coste.
  • No documentar dónde vive cada dato y su retención.

6. Buenas prácticas

  • Elegir almacenamiento por patrón de uso real.
  • S3 para objetos y estáticos.
  • EBS para discos de EC2.
  • EFS solo cuando realmente hay acceso compartido.
  • Glacier para históricos.
  • Lifecycle policies obligatorias en datos de larga vida.
  • Versionado donde aporte recuperación.
  • Cifrado en reposo y tránsito.
  • Bloquear acceso público por defecto.
  • Separar buckets por función y entorno.
  • Etiquetar recursos para control de costes.
  • Revisar periódicamente almacenamiento y recuperación.

7. Ejercicio propuesto

Caso: CloudStorage Aula.

Tareas:

  1. Explicar objetos/bloques/ficheros/archivado.
  2. Diseñar buckets y estructura lógica.
  3. Justificar EBS para EC2 y cuándo no usar S3.
  4. Explicar cuándo usar EFS.
  5. Diseñar estrategia Glacier para históricos.
  6. Completar tabla necesidad -> servicio.
  7. Definir lifecycle para entregas.
  8. Definir controles de seguridad del almacenamiento.
  9. Enumerar errores críticos a evitar.

Solución orientativa

cloudstorage-aula ├── materiales/ -> S3 Standard ├── entregas/ -> Standard -> IA -> Glacier ├── imagenes/ -> S3 + CDN ├── backups/ -> S3 -> Glacier └── logs/ -> S3 -> Deep Archive

EC2 discos -> EBS Compartido EC2 -> EFS Históricos -> Glacier

Conclusión

El almacenamiento cloud no es “subir archivos y ya”. Es diseñar dónde, cómo, cuánto tiempo y con qué protección se guarda cada dato.

Una estrategia madura combina:

  • tipo correcto de almacenamiento,
  • clases y lifecycle,
  • seguridad por defecto,
  • gobernanza de acceso y costes,
  • y políticas de recuperación probadas.

Guardar datos bien en cloud significa equilibrar rendimiento, coste, seguridad y cumplimiento de forma intencional.

Contenido complementario a Moodle

Moodle mantiene entregas y calificaciones; este espacio amplía la visión arquitectónica y técnica.

Base curricular: Programación Didáctica de Fundamentos de Computación en la Nube (CFGS Informática).