BASES DE DATOS CENTRALIZADAS
Una base de datos centralizada es una base de datos almacenada en su totalidad en un solo lugar físico, es decir, es una base de datos almacenada en una sola máquina y en una sola CPU, donde los usuarios trabajan en terminales "tontas" que solo muestran resultados.
Los sistemas de bases de datos centralizadas son aquellos que se ejecutan en un único sistema informático sin interaccionar con ninguna otra computadora.
Características de las bases de datos centralizadas.
Entre las características más importantes de las bases de datos centralizadas se encuentran las siguientes:
- Se almacena completamente en una localidad central, es decir, todos los componentes del sistema residen en un solo computador o sitio.
- No posee múltiples elementos de procesamiento ni mecanismos de intercomunicación como las bases de datos distribuidas.
- Los componentes de las bases de datos centralizadas son: los datos, el software de gestión de bases de datos y los dispositivos de almacenamiento secundario asociados.
- El problema de seguridad es fácil en estos sistemas de bases de datos.
Ventajas:
- Se evita la redundancia.
- Se evita la inconsistencia. Ya que si un hecho específico se representa por una sola entrada, la no concordancia de datos no puede ocurrir.
- Pueden aplicarse restricciones de seguridad.
- Puede conservarse la integridad.
- El procesamiento de los datos ofrece un mejor rendimiento y resulta más confiable que los sistemas distribuidos.
Desventajas:
- Los mainframes no ofrecen mejor proporción precio/rendimiento que los microprocesadores de los sistemas distribuidos.
- Cuando un sistema de bases de datos centralizada falla, se pierde toda disponibilidad de procesamiento y sobre todo de información confiada al sistema.
- En caso de un desastre o catástrofe, la recuperación es difícil de sincronizar.
- Las cargas de trabajo no se pueden difundir entre varias computadoras, ya que los trabajos siempre se ejecutarán en la misma máquina.
- Un mainframe en comparación con un sistema distribuido no tiene mayor poder de computo
BASES DE DATOS DISTRIBUIDAS
Una base de datos distribuida es un conjunto de múltiples bases de datos lógicamente relacionadas, las cuales se encuentran distribuidas entre diferentes sitios interconectados por una red de comunicaciones, los cuales tienen la capacidad de procesamiento autónomo lo que indica que puede realizar operaciones locales o distribuidas.
Características de las Bases de Datos Distribuidas:
- Autonomía Local: los sitios distribuidos deben ser autónomos, es decir, que todas las operaciones de un sitio se controlan desde ese sitio.
- Operación continua: nunca debería apagarse para realizar alguna función, como añadir un nuevo sitio.
- Independencia con respecto a la localización: no debe haber dependencia de un sitio central para obtener un servicio.
- Independencia con respecto a la fragmentación: la fragmentación es deseable por razones de desempeño.
- Procesamiento distribuido de consultas: el objetivo es convertir transacciones de usuario en instrucciones para manipulación de datos, y así reducir el trafico en la red implica que el proceso mismo de optimización de consultas debe ser distribuido.
- Independencia con respecto al equipo.
- Independencia con respecto al sistema operativo.
- Independencia con respecto a la red.
- Puede leer y escribir datos localizados en diferentes nodos de la red.
Ventajas:
- Los datos son localizados en un lugar más cercano, por tanto, el acceso es más rápido.
- El procesamiento es rápido debido a que varios nodos intervienen en el procesamiento de una carga de trabajo.
- Nuevos nodos se pueden agregar fácil y rápidamente.
- La comunicación entre nodos se mejora.
Desventajas:
- Los datos residen en muchos nodos diferentes y se pueden consultar por nodos diversos de la red.
- La probabilidad de violaciones de seguridad es creciente si no se toman las precauciones debidas.
- Dado que los datos pueden estar replicados, el control de concurrencia y los mecanismos de recuperación son mucho más complejos que un sistema centralizado.
- La distribución produce un aumento en la complejidad del diseño y en la implementación del sistema.
Tabla comparativa de bases de datos centralizadas y base de datos distribuidas
tema
|
BD centralizadas
|
BD distribuidas
|
Los costos
|
Los
sistemas centralizados, por razones de economía de escala, son propios de
aplicaciones de mucha memoria.
Los
sistemas centralizados son propios de bases de datos que requieren mínima
redundancia de datos.
Los
sistemas centralizados se requieren cuando hay que invertir menos en recursos
humanos.
La
planeación centralizada minimiza los costos.
Al hacer un mejor uso de los recursos, por el hecho de estar en
un sitio, los costos tienden a ser menores que en los sistemas distribuidos.
|
Los sistemas distribuidos tienen un menor costo en las
comunicaciones.
Hay un mejor uso de los recursos tecnológicos, por el
aprovechamiento de los equipos existentes en los sitios.
|
Los aspectos políticos
|
Los departamentos de sistemas retienen el control de toda la
organización.
La centralización de datos da más poder a la gerencia.
La planeación central refleja las economías de la organización.
|
Los departamentos de sistemas requieren mayor autonomía local.
En los departamentos de usuarios se fomenta la responsabilidad
local.
Los usuarios aprenden a apreciar los costos de procesamiento.
La descentralización evita poner el poder en pocas manos.
Las estructuras son más flexibles.
|
Los aspectos técnicos
|
Los sistemas centralizados requieren un mantenimiento central de
datos.
Requieren un procesamiento total de datos.
No requieren replicación alguna.
Generalmente necesitan un control profesional de seguridad.
|
Tienen
mejores interfaces de usuario, como por ejemplo las de los sistemas
cliente-servidor.
Presentan
cierto grado de disponibilidad aún en caso de falla.
Tienen
un mejor tiempo de respuesta.
Las
aplicaciones son más adaptadas a las necesidades locales.
Los
volúmenes de procesamiento deben ser relativamente grandes a nivel local.
Los
usuarios comprenden mejor sus problemas.
Un
grupo de soporte local reacciona más rápido a las demandas locales.
Aprovechan
la proliferación de equipos.
|
La administración
|
Existe
un control total por parte del administrador de la base de datos global. Por
razones de seguridad, hay gran énfasis en el control y este debe
centralizarse.
|
Hay
un alto grado de autonomía por parte de los administradores locales. En bases
de datos distribuidas es posible identificar una estructura de control
jerárquica basada en el administrador de la bases de datos global y en los
administradores de las bases de datos locales. Estos pueden llegar a tener
mucha autonomía (a tal punto que el ABD pueda desaparecer) o todo lo
contrario (un control casi completamente centralizado).
|
La organización
|
La
independencia de los datos: La organización real de los datos es transparente
al programador de aplicaciones, es decir, los programas son escritos o
construidos teniendo en cuenta el esquema conceptual de los datos. En este
caso, los programas no son afectados por los cambios en la organización
física de la base de datos.
|
La
independencia de los datos revista igual importancia para las bases de datos
distribuidas.
La
transparencia de distribución es un aspecto adicional en las bases de datos
distribuidas. Los programas deben poderse construir como si la base de datos
no fuera distribuida. En este caso, los programas no son afectados por el
movimiento de los datos de un sitio a otro (aunque el rendimiento sí cambie).
|
La redundancia de datos
|
Se
reduce lo más que se pueda debido a la posibilidad de inconsistencias y al
desperdicio de espacio.
|
Es
una característica deseable ya que lo que se pretende es que haya localidad
de aplicaciones (la cual se incrementa si los datos se replican en los sitios
donde se necesitan) y disponibilidad de la base de datos (aún en caídas de
sitios). La disponibilidad de la base de datos depende de la relación consultas/actualizaciones.
|
Estructuras de acceso
|
Los
índices secundarios y las cadenas inter archivo (clusters) constituyen el
aspecto más importante de los sistemas manejadores de bases de datos
tradicionales, ya que su objetivo es lograr un acceso eficiente.
|
Estructuras
como los índices secundarios y los clusters inter archivo (o intertabla) no
son las apropiadas para lograr un acceso eficiente, ya que es difícil
construirlas y mantenerlas.
Pues
no son una respuesta tecnológica. No son la solución.
Los
accesos se logran a través de un plan de acceso distribuido, de tal manera
que los programas tengan la mayor localidad posible y los resultados
intermedios o las tablas sean transmitidos entre sitios.
|
Integridad
|
Deben
proveer el concepto de transacciones como unidades atómicas de ejecución
como, por ejemplo, en el caso de una transferencia de fondos. Aunque las
amenazas a la atomicidad existen como:
-Las
fallas, en la mitad de una transacción
-La
concurrencia, cuando una transacción ve el estado inconsistente (intermedio)
de otra.
|
La
aplicación del concepto de transacción se mantiene pero involucra un trabajo
más complejo. Si hay dos sitios involucrados en una transacción y uno de
ellos falla, hay dos posibilidades:
-Que
la transacción sea abortada
-
Que haya un sistema inteligente que termine la transacción correctamente
aunque los dos sitios no estén operando simultáneamente.
|
Recuperación
|
Los
sistemas encargados deben preservar la atomicidad de las transacciones en
presencia de fallas.
La
recuperación debe hacerse hacia atrás o hacia delante, dependiendo de si la
transacción se ha comprometido o no.
|
Deben
preservar la atomicidad de las transacciones aun en casos de fallas en
algunos sitios involucrados.
La
recuperación debe hacerse basado en protocolos complejos de compromiso en dos
o en tres fases.
|
Control de concurrencia
|
Asegurar
la atomicidad de las transacciones en la presencia de ejecución concurrente
de transacciones.
Trabajar
adecuadamente los tipos de bloqueos.
|
Asegurar
la atomicidad de las transacciones distribuidas a través de la red.
Trabajar
adecuadamente los bloqueos en cada uno de los sitios.
|
Privacidad y seguridad
|
El
DBA tiene un control centralizado a través del acceso autorizado a los datos.
Pero es más vulnerable a las violaciones de seguridad y privacidad que en
archivos separados, desde el punto de vista de la globalidad de la
información.
|
Los
administradores locales tienen el mismo problema de vulnerabilidad y
privacidad de los administradores globales.
Por
la autonomía de cada sitio, los propietarios de los datos tienen sus propias
protecciones, a veces buenas, a veces no tanto.
Las
bases de datos distribuidas presentan los problemas intrínsecos a los
sistemas distribuidos ya que las redes representan un punto débil en
protección.
|
link de la información:
link de descarga de información de la tabla comparativa
No hay comentarios:
Publicar un comentario