bases de datos distribuidas: actividad #4

BASES DE DATOS CENTRALIZADAS

Una base de datos centralizada es una base de datos almacenada en su totalidad en un solo lugar físico, es decir, es una base de datos almacenada en una sola máquina y en una sola CPU, donde los usuarios trabajan en terminales "tontas" que solo muestran resultados.

Los sistemas de bases de datos centralizadas son aquellos que se ejecutan en un único sistema informático sin interaccionar con ninguna otra computadora.

Características de las bases de datos centralizadas.

Entre las características más importantes de las bases de datos centralizadas se encuentran las siguientes:

- Se almacena completamente en una localidad central, es decir, todos los componentes del sistema residen en un solo computador o sitio.

- No posee múltiples elementos de procesamiento ni mecanismos de intercomunicación como las bases de datos distribuidas.

- Los componentes de las bases de datos centralizadas son: los datos, el software de gestión de bases de datos y los dispositivos de almacenamiento secundario asociados.

- El problema de seguridad es fácil en estos sistemas de bases de datos.

Ventajas:

- Se evita la redundancia.

- Se evita la inconsistencia. Ya que si un hecho específico se representa por una sola entrada, la no concordancia de datos no puede ocurrir.

- Pueden aplicarse restricciones de seguridad.

- Puede conservarse la integridad.

- El procesamiento de los datos ofrece un mejor rendimiento y resulta más confiable que los sistemas distribuidos.

Desventajas:

- Los mainframes no ofrecen mejor proporción precio/rendimiento que los microprocesadores de los sistemas distribuidos.

- Cuando un sistema de bases de datos centralizada falla, se pierde toda disponibilidad de procesamiento y sobre todo de información confiada al sistema.

- En caso de un desastre o catástrofe, la recuperación es difícil de sincronizar.

- Las cargas de trabajo no se pueden difundir entre varias computadoras, ya que los trabajos siempre se ejecutarán en la misma máquina.

- Un mainframe en comparación con un sistema distribuido no tiene mayor poder de computo

BASES DE DATOS DISTRIBUIDAS

Una base de datos distribuida es un conjunto de múltiples bases de datos lógicamente relacionadas, las cuales se encuentran distribuidas entre diferentes sitios interconectados por una red de comunicaciones, los cuales tienen la capacidad de procesamiento autónomo lo que indica que puede realizar operaciones locales o distribuidas.

Características de las Bases de Datos Distribuidas:

- Autonomía Local: los sitios distribuidos deben ser autónomos, es decir, que todas las operaciones de un sitio se controlan desde ese sitio.

- Operación continua: nunca debería apagarse para realizar alguna función, como añadir un nuevo sitio.

- Independencia con respecto a la localización: no debe haber dependencia de un sitio central para obtener un servicio.

- Independencia con respecto a la fragmentación: la fragmentación es deseable por razones de desempeño.

- Procesamiento distribuido de consultas: el objetivo es convertir transacciones de usuario en instrucciones para manipulación de datos, y así reducir el trafico en la red implica que el proceso mismo de optimización de consultas debe ser distribuido.

- Independencia con respecto al equipo.

- Independencia con respecto al sistema operativo.

- Independencia con respecto a la red.

- Puede leer y escribir datos localizados en diferentes nodos de la red.

Ventajas:

- Los datos son localizados en un lugar más cercano, por tanto, el acceso es más rápido.

- El procesamiento es rápido debido a que varios nodos intervienen en el procesamiento de una carga de trabajo.

- Nuevos nodos se pueden agregar fácil y rápidamente.

- La comunicación entre nodos se mejora.

Desventajas:

- Los datos residen en muchos nodos diferentes y se pueden consultar por nodos diversos de la red.

- La probabilidad de violaciones de seguridad es creciente si no se toman las precauciones debidas.

- Dado que los datos pueden estar replicados, el control de concurrencia y los mecanismos de recuperación son mucho más complejos que un sistema centralizado.

- La distribución produce un aumento en la complejidad del diseño y en la implementación del sistema.

Tabla comparativa de bases de datos centralizadas y base de datos distribuidas

tema	BD centralizadas	BD distribuidas
Los costos	Los sistemas centralizados, por razones de economía de escala, son propios de aplicaciones de mucha memoria. Los sistemas centralizados son propios de bases de datos que requieren mínima redundancia de datos. Los sistemas centralizados se requieren cuando hay que invertir menos en recursos humanos. La planeación centralizada minimiza los costos. Al hacer un mejor uso de los recursos, por el hecho de estar en un sitio, los costos tienden a ser menores que en los sistemas distribuidos.	Los sistemas distribuidos tienen un menor costo en las comunicaciones. Hay un mejor uso de los recursos tecnológicos, por el aprovechamiento de los equipos existentes en los sitios.
Los aspectos políticos	Los departamentos de sistemas retienen el control de toda la organización. La centralización de datos da más poder a la gerencia. La planeación central refleja las economías de la organización.	Los departamentos de sistemas requieren mayor autonomía local. En los departamentos de usuarios se fomenta la responsabilidad local. Los usuarios aprenden a apreciar los costos de procesamiento. La descentralización evita poner el poder en pocas manos. Las estructuras son más flexibles.
Los aspectos técnicos	Los sistemas centralizados requieren un mantenimiento central de datos. Requieren un procesamiento total de datos. No requieren replicación alguna. Generalmente necesitan un control profesional de seguridad.	Tienen mejores interfaces de usuario, como por ejemplo las de los sistemas cliente-servidor. Presentan cierto grado de disponibilidad aún en caso de falla. Tienen un mejor tiempo de respuesta. Las aplicaciones son más adaptadas a las necesidades locales. Los volúmenes de procesamiento deben ser relativamente grandes a nivel local. Los usuarios comprenden mejor sus problemas. Un grupo de soporte local reacciona más rápido a las demandas locales. Aprovechan la proliferación de equipos.
La administración	Existe un control total por parte del administrador de la base de datos global. Por razones de seguridad, hay gran énfasis en el control y este debe centralizarse.	Hay un alto grado de autonomía por parte de los administradores locales. En bases de datos distribuidas es posible identificar una estructura de control jerárquica basada en el administrador de la bases de datos global y en los administradores de las bases de datos locales. Estos pueden llegar a tener mucha autonomía (a tal punto que el ABD pueda desaparecer) o todo lo contrario (un control casi completamente centralizado).
La organización	La independencia de los datos: La organización real de los datos es transparente al programador de aplicaciones, es decir, los programas son escritos o construidos teniendo en cuenta el esquema conceptual de los datos. En este caso, los programas no son afectados por los cambios en la organización física de la base de datos.	La independencia de los datos revista igual importancia para las bases de datos distribuidas. La transparencia de distribución es un aspecto adicional en las bases de datos distribuidas. Los programas deben poderse construir como si la base de datos no fuera distribuida. En este caso, los programas no son afectados por el movimiento de los datos de un sitio a otro (aunque el rendimiento sí cambie).
La redundancia de datos	Se reduce lo más que se pueda debido a la posibilidad de inconsistencias y al desperdicio de espacio.	Es una característica deseable ya que lo que se pretende es que haya localidad de aplicaciones (la cual se incrementa si los datos se replican en los sitios donde se necesitan) y disponibilidad de la base de datos (aún en caídas de sitios). La disponibilidad de la base de datos depende de la relación consultas/actualizaciones.
Estructuras de acceso	Los índices secundarios y las cadenas inter archivo (clusters) constituyen el aspecto más importante de los sistemas manejadores de bases de datos tradicionales, ya que su objetivo es lograr un acceso eficiente.	Estructuras como los índices secundarios y los clusters inter archivo (o intertabla) no son las apropiadas para lograr un acceso eficiente, ya que es difícil construirlas y mantenerlas. Pues no son una respuesta tecnológica. No son la solución. Los accesos se logran a través de un plan de acceso distribuido, de tal manera que los programas tengan la mayor localidad posible y los resultados intermedios o las tablas sean transmitidos entre sitios.
Integridad	Deben proveer el concepto de transacciones como unidades atómicas de ejecución como, por ejemplo, en el caso de una transferencia de fondos. Aunque las amenazas a la atomicidad existen como: -Las fallas, en la mitad de una transacción -La concurrencia, cuando una transacción ve el estado inconsistente (intermedio) de otra.	La aplicación del concepto de transacción se mantiene pero involucra un trabajo más complejo. Si hay dos sitios involucrados en una transacción y uno de ellos falla, hay dos posibilidades: -Que la transacción sea abortada - Que haya un sistema inteligente que termine la transacción correctamente aunque los dos sitios no estén operando simultáneamente.
Recuperación	Los sistemas encargados deben preservar la atomicidad de las transacciones en presencia de fallas. La recuperación debe hacerse hacia atrás o hacia delante, dependiendo de si la transacción se ha comprometido o no.	Deben preservar la atomicidad de las transacciones aun en casos de fallas en algunos sitios involucrados. La recuperación debe hacerse basado en protocolos complejos de compromiso en dos o en tres fases.
Control de concurrencia	Asegurar la atomicidad de las transacciones en la presencia de ejecución concurrente de transacciones. Trabajar adecuadamente los tipos de bloqueos.	Asegurar la atomicidad de las transacciones distribuidas a través de la red. Trabajar adecuadamente los bloqueos en cada uno de los sitios.
Privacidad y seguridad	El DBA tiene un control centralizado a través del acceso autorizado a los datos. Pero es más vulnerable a las violaciones de seguridad y privacidad que en archivos separados, desde el punto de vista de la globalidad de la información.	Los administradores locales tienen el mismo problema de vulnerabilidad y privacidad de los administradores globales. Por la autonomía de cada sitio, los propietarios de los datos tienen sus propias protecciones, a veces buenas, a veces no tanto. Las bases de datos distribuidas presentan los problemas intrínsecos a los sistemas distribuidos ya que las redes representan un punto débil en protección.

link de la información:

link de descarga de información de la tabla comparativa

bases de datos distribuidas

martes, 3 de febrero de 2015

actividad #4

BASES DE DATOS CENTRALIZADAS

No hay comentarios:

Publicar un comentario