sábado, 3 de septiembre de 2011

Diseño Data Warehouse para la Empresa DISFRUVER Ltda.

PROPUESTA DE DISEÑO DE UN SISTEMA DE DATA WAREHOUSE PARA LA RED INFORMÁTICA DE LA EMPRESA DISFRUVER


1.  Información general

1.1 Nombre  del proyecto. Propuesta De Diseño De Un Sistema De Data Warehouse Para La Red Informática De La Empresa Disfruver

1.2 Entidad responsable:

Ingeniero Responsable:  Ing. Jose Norbey Zamudio Pardo.

Datos de Contacto:

Correo Electrónico: ing_norbey_zamudio@yahoo.com
Dirección Oficinas: 123 Castel Peak Road, Tin kau, Tsuen Wan, Kowloon, Hong Kong                     


2.  Introducción y diagnóstico

Cuando es necesario la consolidación eficaz de reportes e información referente a un área o tema especifico, es normal y común observar que los reportes pueden variar dependiendo quien o que área se quien lo expida, esto no implica que esté errónea la información o que haya faltantes. Esto generalmente sucede porque no todas las secciones de una empresa manejan los mismos datos o las mismos tipos de datos, entonces dependiendo de quien los emita, así mismo será la información que ofrecen internamente dichos reportes.

Mediante el análisis de las áreas y secciones especificas de trabajo y de acuerdo al tipo de información que deben manejar, se entrega una propuesta de diseño de un sistema de Almacenamiento de datos o Data WareHouse, para la empresa DISFRUVER que le permitirá una mejor manipulación de la información tanto actual, como histórica para la realización de reportes por parte de personal ajenos a las dependencias que originan la información y gestión de las bases de datos.

La implantación de un sistema de data Warehouse en la empresa DISFRUVER significa una gran inversión, determinada por la capacidad de los usuarios finales a adquirir la información en forma más rápida y eficiente

3.  Objetivo del proyecto

El objetivo principal del proyecto es el diseño de un sistema de almacenamiento de información para la empresa DISFRUVER LTDA que le permita el manejo de la información de la empresa, en forma eficaz, sin errores y disponibles en cualquier momento, de la forma que sea se necesite.

4.  Generalización de la Propuesta de Diseño:

4.1 Análisis de la Situación actual.

A partir del diseño inicial del sistema distribuido de la red DISFRUVER, se han definido las pautas a seguir en el respectivo diseño, sin necesidad de especificar los pasos intrínsecos para la elaboración del sistema de información, y de los servidores y aplicativos comunes de gestión.

Partiendo de un diseño inicial, y asumiendo las nuevas premisas sobre el uso de diversas tecnologías en las estaciones de trabajo,

Además observando las características del desarrollo comercial de la empresa se puede observar que se dedica a exportar frutas, especialmente al mercado común europeo, también comercializa sus productos en la sabana de Bogotá. Sus principales productos son pitahaya, higo, mango, piña, borojó, lulo, papaya, plátano bocadillo y anón.

Se encuentra dividida básicamente en tres áreas organizacionales

Ø      Área Financiera,  Compuesta por secciones de tipo operacional como:

Ø      Contabilidad
Ø      Facturación
Ø      Almacén
Ø      Presupuesto
Ø      Personal

o       Organiza la información relacionada sistemas contables, facturas, presupuestos designados entre otros

o       La información se Maneja bajo el Sistema de Aplicativos FSoft.

Ø      Área Recursos Humanos, conformada por seccionales de manejo de información de personal

v     Selección
v     Contratación
v     Nómina
v     Hojas de vida
v     Capacitación
v     Facturación

o       Almacena la información sobre todos y cada uno de las personas que laboran en la empresa.

o       La información se Maneja bajo el Sistema de Aplicativos RHSoft.

Ø      Área de Comercialización , encargada de:

v     Los Precios y Compras de Frutas
v     Mercadeo y  Ventas.           
v     Inventarios de Productos

o       Maneja datos sobre los productos y sus precios a nivel nacional e internacional para la realización de compras y ventas de los mismos,  de igual forma los relacionados con los clientes y proveedores.

o       La información se Maneja bajo el Sistema de Aplicativos COMSoft.

Ø      Unidad de Consultoría: está realizada de forma externa por la Empresa Consulting Internacional INC, que proporciona los servicios de:

Ø      Despachos Internacionales
Ø      Licencias de Exportación
Ø      Trámites Aduaneros
Ø      Embarques

o       Los aplicativos utilizados en el manejo de la información es propio.


4.2 Necesidades del negocio.

Ø      A continuación se puede referir los aspectos primordiales de las necesidades actuales de la empresa DSIFRUVER LTDA:

Ø      Ascenso de ventas cercanas a 6.500.000 de pesos, y volúmenes de comercialización a 4.300 Toneladas.

Ø      El 80% de las Ventas se realizaron a paises de Europa y del Caribe, el porcentaje restante en el mercado nacional.

Ø      La situación económica actual es muy buena, pero se esperan tiempo difíciles.

Ø      Existen algunas diferencias en los valores de los inventarios que se entregan mensualmente.

Ø      Próximamente la empresa incursionará en mercados nacionales importantes con una firma que posee grandes recursos e influencia en varias zonas del pais.

4.3 Información Requerida.

Mediante el análisis de las necesidades de la empresa, es posible generar una posible serie de información que los sistemas de cada área precisan obtener.

Ø      Presupuesto anual específico y detallado para compras de suministros  y productos.
Ø      Cantidad de unidades en productos vendidos por localidades
Ø      Cantidad de unidades de productos vendidos por clientes.
Ø      Cantidad de unidades vendidas por productos
Ø      Cantidad de unidades en productos comprados por proveedores
Ø      Cantidad de unidades compradas por productos
Ø      Reporte completo y combinado entre los reportes anteriores
Ø      Facturaciones anuales de compras y ventas de productos
Ø      Facturaciones anuales de compras de suministros

4.4 Usuarios del Data WareHouse.

El Data Warehouse será utilizado por los jefes de área de cada una de las dependencias que componen la empresa, así como también por personal del área administrativa que no conoce el proceso intrínseco de la producción.

4.5 Capacitación: Situación actual y Estrategias de difusión.

El personal que actualmente está asociado a cada una de las dependencias o secciones de las áreas operacionales, cuenta con manejos básicos y algunos con conocimientos avanzados en herramientas ofimáticas, como hojas de cálculo y procesadores de texto. A pesar de ello existe un desconocimiento completo referente al uso de un Data Warehouse, debido a esta falencia con respecto al tema, se administrará un programa de capacitación grupal sobre este nuevo concepto en la empresa, de tal forma que todos los nuevos usuarios puedan sacar el máximo de provecho de la nueva implantación del sistema de información.

La metodología de la capacitación podrá realizarse de varias formas, según sea conveniente en el entorno actual de la empresa, ya sea en forma presencial y según sea el caso se utilizarán los nuevos mecanismo de red implantados sobre el sistema INTRANET para realizarlo por métodos virtuales.

4.6 Arquitectura del Data WareHouse

Dentro de la arquitectura del Data WareHouse, uno de los aspectos bien importantes a tener en cuenta es el diseño de la arquitectura de Extracción, Transformación Y transporte. Para teal efecto se explica como se realizarán los requerimientos de cada uno de los procesos de la arquitectura:

v     Extracción: Siendo este el primer paso en la vía de la consecución de la información, es preciso conocer inicialmente el origen de los datos, de donde serán copiados para su posterior proceso.

Ø            Orígenes de Datos: Como se especificó anteriormente, las cuatro áreas que administran información en la empresa, cada una cuenta con un sistema diferente acorde a cada una de las labores locales, de tal forma que cada una genera, almacena y administra una base de datos interna, es allí donde se origina la información, desde allí los datos van hacia el Data WareHouse a través de los aplicativos FSoft para el área Financiera, RHSoft para el área de Recursos Humanos, COMSoft para el área de Comercialización, y por ultimo de la aplicación propia de la empresa de Consultoría Consulting Internacional INC.

Para realizar una correcta extracción de los datos es necesario seguir algunos lineamientos, de forma tal que se óptima la adquisición de la información en este punto, ya que de la efectiva extracción d elos datos, depende el correcto funcionamiento del Data Warehouse.

Algunos de los lineamientos a seguir son entre otros:

ü      Todos los procesos de extracción deben permitir el acceso múltiple a diversas fuentes de información.

ü      Es pertinente extraer los datos a un sistema temporal en caso que sea
            Necesario volver a realizar una extracción al sistema operacional.

ü      La extracción de información debe realizarse en forma periódica, mediante la obtención de los datos nuevos o modificados solamente. En caso que la identificación de los datos nuevos o modificados consuma demasiados recursos, ésta será cargada completamente.

ü      Correcta compresión de los datos para la carga.

v                 Transformación: Luego de la anterior Extracción de los datos, se procede a realizar la Transformación de los mismos para que sean observados por los usuarios finales, en forma estandarizada. Para la elaboración de este paso existe una serie de tipos de transformaciones y servicios:

ü      Corrección de Errores: Aquí se debe corregir errores de tipografía, ortografía, datos faltantes.

ü      Combinación de Fuentes de Datos: A través de búsquedas exactas de atributos o claves.

ü      Integración: Mediante la generación de claves subrogadas se elimina dependencias con las existentes en los sistemas operacionales.

ü      Seguimiento de cambios: Identificando la modificación de datos para la generación de históricos.

ü      Comprobación de Integridad referencial: En los procesos de carga y almacenamiento de ficheros log.

ü      Desnormalización y Normalización: de jerarquías de tablas e información de los sistemas operacionales.

ü      Conversión de Tipos de Datos para la homogenización  y formato de las fuentes de información.

ü      Cálculo Derivación y Distribución de registro para estandarizar los registro de presentación.

ü      Auditoría sobre el contenido de la información, que no contenga errores, es decir que el primer ítem de corrección de errores haya sido efectivo.

ü      Valores Nulos, mediante la normalización de datos generales que son desconocidos.

v                       Transporte: Una vez realizados los pasos anteriormente mencionados, se debe proceder a realizar el transporte de la información obtenida, por medio de procesos que permitan manejar grandes cantidades de datos.

ü      Múltiples Destinos, debe tener la capacidad de enviar información a diversos sistemas como Data Marts al mismo tiempo.

ü      Optimización de Cargas, Mediante los gestores de bases de datos relacionales convencionales, se utilizan métodos de optimización de carga para grandes volúmenes de información.

Las figuras 2 y 3 ubicadas en la sección de ANEXOS, ilustran los procesos anteriormente relacionados, los procesos generales desde el origen de los datos hasta la entrega al usuario final, así como también de la arquitectura del Data WareHouse sobre la Extracción, Transformación y transporte de la Información.

4.7 Condiciones de Orientación, Integración, Variabilidad en el tiempo, Volatilidad.

4.7.1 Orientación a Sujetos.

Mediante el análisis de los parámetros utilizados en la información que se trabajará en el Data WareHouse, se puede observar la orientación del sistema a los sujetos: Productos, Clientes, Proveedores y Empleados.

Los datos relacionados a la información pertinente de cada uno de los sujetos del sistema

ü      Productos.

§         Id Producto
§         Tipo
§         Humedad
§         Calidad
§         Tipo Producto
§         Peso


ü      Clientes

§         Id Cliente
§         Tipo Cliente
§         Nombre y Apellido
§         Identificación
§         Residencia
§         Ciudad
§         Número Telefónico

ü      Proveedores

§         Id Proveedor
§         Tipo Cliente
§         Nombre y Apellido
§         Identificación NIT
§         Dirección
§         Ciudad
§         Número Telefónico

ü      Empleados

§         Id Empleado
§         Fecha Nacimiento
§         Nombre y Apellido
§         Identificación
§         Dirección residencia
§         Ciudad
§         Número Telefónico

4.7.2 Integración.

El sistema de data WareHouse para la empresa DISFRUVER contará con las características de integración de datos mediante un sistema de transformación de información eficiente que implantará mecanismos de integración de claves subrogadas sobre los registro que lo ameriten permitiendo de tal forma que los sistemas de datos sean compatibles y estándares en todo el sistema de almacenamiento de la información. De igual forma se usarán sistemas de codificación de campos de registros, medición de atributos, convenciones de Nombramientos y documentación de la información para ser transferidas en forma múltiple cuando sea el caso.

4.7.3 Variabilidad en el tiempo.

La información se extenderá sobre un horizonte de 5 a 10 años, como sea necesario, mediante la elaboración de aplicaciones flexible para el manejo de información.

A través de la implantación de estructuras claves de tiempo sobre las bases de datos para realizar manejo de la información y su correcta monitorización.

Mediante el bloqueo de operabilidad en la actualización de la información que ha sido correctamente almacenada y registrada.

4.7.4 No Volatilidad.

Al no existir en el producto final la medida de actualización de la información, se contrarresta el problema de la volatilización de la información, de que la información sea cambiante constantemente. Esto permite realizar copias de seguridad, recuperación, transacción e integridad de los datos.

4.8 Herramientas de usuario.

Para el analisis, observación y manejo de la información existente dentro del sistema de data Warehouse es indispensable el uso de herramientas especilaizadas en tales funciones, que permitan el acceso, analisis, trasnformación de la información, entre otros.

Los software usados en el data warehouse se clasifican en Herramientas de Consulta y Reporte, Herramientas de Base de Datos Multidimensionales/ Olap (On Line Analytical Processing), Sistemas de Información Ejecutivos, Herramientas Data Mining y los Sistemas de Gestión de Bases de Datos propiamente.

5. Anexos



Figura 1. Arquitectura del sistema de Data Warehouse para la empresa DISFRUVER desde el punto de vista Extracción, Transformación y trasnporte de la información.
Fuente: Jose Norbey Zamudio


Figura 2. Arquitectura General del sistema de Data Warehouse para la empresa DISFRUVER.
Fuente: Jose Norbey Zamudio

No hay comentarios:

Publicar un comentario