Sistemas de múltiples procesadores
El comportamiento cuando se compilan trabajos de IBM® InfoSphere DataStage es ejecutar todas las etapas activas adyacentes en un solo proceso. Esto tiene sentido cuando se ejecuta el trabajo en un sistema de un procesador.
Cuando se ejecuta en un sistema de múltiples procesadores, es mejor ejecutar cada etapa activa en un proceso diferente, para que los procesos puedan distribuirse entre los procesadores disponibles y ejecutarse en paralelo. Estas mejoras en los trabajos de servidor del Release 6 de InfoSphere DataStagepermiten estipular en el diseño que los trabajos se compilen de esta forman. Hay dos formas de hacerlo
- Explícitamente, insertando etapas InterProcess (IPC) entre las etapas activas conectadas.
- Implícitamente, activando el almacenamiento intermedio de filas entre procesos, ya sea en todo el proyecto (utilizando el Administrador de InfoSphere DataStage y QualityStage) o en trabajos individuales (en el recuadro de diálogo Propiedades del trabajo)
El recurso IPC también puede utilizarse para producir varios procesos en los que las etapas pasivas están conectadas directamente. Esto significa que una operación que lee en un origen de datos y graba en otro puede dividirse en un proceso de lectura y un proceso de grabación para aprovechar los sistemas de múltiples procesadores.
El diagrama siguiente ilustra el posible comportamiento de las etapas activas:
Figura 1. Comportamiento predeterminado
Figura 2. Imposición implícita de varios procesos mediante el almacenamiento intermedio de filas entre procesos
Figura 3. Utilización de las etapas de IPC para imponer varios procesos
El diagrama siguiente ilustra el posible comportamiento de las etapas pasivas:
Figura 4. Comportamiento predeterminado con la etapa Transformer invisible insertada en el tiempo de compilación
Figura 5. Utilización de la etapa IPC para imponer varios procesos, con las etapas Transformer invisibles insertadas en el tiempo de compilación
No hay comentarios:
Publicar un comentario