Cómo acelerar el llenado de tablas con más datos aleatorios para probar el rendimiento de SQL Server

Muy a menudo, los desarrolladores y los QA necesitan descargar una gran cantidad de datos de prueba para estimar la velocidad a la que la base de datos se llena con los datos generados y analizar cómo cambia el rendimiento con el crecimiento de la base de datos.

Por ejemplo, puede ser útil crear muestras de datos para las pruebas de carga de la base de datos cuando sea necesario simular el comportamiento esperado de una aplicación en un entorno de cliente o para investigar qué tan rápido responde una aplicación a una carga dada o ciertas condiciones. Esto se puede lograr con la herramienta dbForge Data Generator para SQL Server, cuyo objetivo es llenar las tablas SQL con datos aleatorios y de línea de base utilizando más de 200 generadores de datos SQL significativos predefinidos y basados ​​en columnas.

En este artículo, aprenderemos cómo acelerar el llenado de datos de tablas SQL que contienen una gran cantidad de datos y evaluar el rendimiento en caso de un aumento en el volumen de la base de datos. El artículo cubre lo siguiente:

  • Defina el período de tiempo para crear los datos y la cantidad de datos que se completarán para la tabla SQL.
  • Automatice conjuntos de datos para scripts duplicados a través de la interfaz de línea de comandos.
Índice

    ¿Qué es la generación de datos de prueba?

    Los datos de prueba son datos que se pueden usar como requisitos previos para la ejecución o datos de entrada para verificar el comportamiento esperado de un programa o aplicación y garantizar su calidad. Los datos de prueba se pueden crear manualmente, importar desde un archivo, copiar de producción a un entorno de prueba o generar utilizando una herramienta de generación de datos como dbForge Data Generator for SQL Server.

    dbForge Data Generator for SQL Server es una forma más rápida, que requiere menos tiempo y recursos para generar datos ficticios y llenar la tabla con una gran cantidad de datos. El proceso consta de dos etapas:

    • Genere datos de una base de datos SQL seleccionada que se puede configurar usando ciertas opciones de generación de datos.
    • Rellenar los datos en una tabla SQL que depende de la cantidad de datos generados en el paso anterior.

    Para propósitos de demostración usamos AdventureWorks2014 una base de datos que incluye 71 tablas.

    Realice una generación de datos rápida con dbForge Data Generator para SQL Server

    Para comenzar, debe conectarse a SQL Server y configurar los ajustes de generación de datos. para hacer esto en Estándar barra de herramientas o en Empezar página, haga clic Una nueva generación de datos.

    У Propiedades del proyecto del generador de datos ventana que se abre, configure una conexión a SQL Server, seleccione la base de datos para generar los datos y haga clic en próximo. Sobre Opciones pestaña, debajo Modo de distribución de cadenas, Haz una de las siguientes:

    • Escoger Al generar datos a lo largo del tiempo. y especifique el período de tiempo en segundos para determinar cuánto tiempo llevará crear los datos para cada tabla.

      Esta opción le permite calcular el tiempo diferente requerido para generar datos para bases de datos con diferentes números de tablas. Además, desactive la casilla de verificación Recortar datos de la tabla antes de la generación si no desea que se abrevie la tabla seleccionada.

    Nota
    El tiempo de generación no coincidirá con el tiempo especificado si hay tablas con dependencias. En este caso, la herramienta no puede generar más del número especificado de filas válidas.

    • Escoger Según el número especificado opción y especifique el número de filas para llenar la tabla.

      Esta opción le permite controlar la cantidad de datos generados. Sin embargo, debe tenerse en cuenta que la herramienta creará diferentes números de registros para diferentes tablas debido a los diferentes tipos de columnas en la tabla.

    También se debe tener en cuenta que la velocidad de generación de datos depende directamente del tipo de datos, es decir. la generación de valores de cadena es mucho más lenta que los valores numéricos. Sin embargo, si necesita usar diferentes tipos de datos para cada iteración posterior del conjunto de datos, en Modo de distribución del valorSeleccione Al azar por marca de tiempo para todas las mesas.

    Después de configurar los parámetros de generación de datos, haga clic en Abierto. En el documento SQL que se abre, seleccione las tablas y columnas para completar, vea los datos que se crearán, configure las columnas y los archivos predeterminados y ejecute el conjunto de datos. Para obtener más información sobre cómo completar los datos de la tabla SQL, consulte la documentación de llenado de datos.

    El resultado

    Como resultado, estudiamos cuánto tiempo se tarda en cargar los datos en los casos en que el tiempo de generación de datos para cada tabla es de 30:

    • Se necesitaron 38 minutos para crear los datos.
    • Llevó 20 minutos completar los datos.

    Automatice el almacenamiento de datos a través de la interfaz de línea de comandos

    Después de configurar los parámetros de generación de datos para el proyecto, puede guardar la configuración del proyecto del generador de datos en un archivo .bat. Esto le permitirá automatizar scripts de llenado de datos duplicados.

    Para crear un archivo .bat, siga estos pasos:

    1. En el documento SQL, seleccione las tablas y columnas para completar y configure los ajustes predeterminados a la derecha si es necesario.

    2. Haga clic en Rellene los datos en la base de datos de destino para iniciar el proceso de llenado de datos.

    3. En el arte Asistente de población de datos que se abre, configure las opciones de relleno de datos (1) y luego presione Guarde la línea de comando (2).

    4. En el arte Opciones de archivo de ejecución de línea de comando ventana que se abre, verifique y configure los ajustes para controlar el texto del archivo * .bat.

    Desfile: Pase el cursor sobre el icono del signo de interrogación para determinar qué significa cada parámetro.

    5. Asegúrese de que la configuración de la línea de comandos sea válida y haga clic en Cheque.

    6. Para guardar la configuración del proyecto en un archivo .bat, haga clic en Ahorrar.

    Una vez creado el archivo .bat, podemos programar una tarea de generación de datos utilizando el Programador de tareas de Windows siguiendo estos pasos:

    1. Abierto Panel de control > Herramientas administrativas y seleccione Programador de tareas.

    2. En el arte Programador de tareas ventana, bajo c Comportamiento tablero, haga clic Crear una tarea básica para crear una tarea programada.

    3. En el arte Maestro en la creación de tareas básicas.ingrese un nombre y una descripción para la tarea y luego haga clic en próximo.

    4. Encendido Desencadenar pestaña, seleccione Cada día para ejecutar la tarea de completar los datos uno por día y luego haga clic en próximo.

    5. Encendido Cada día en la subred especifique la hora y 1 día para volver a consultar en Se repite cada... día cuadro y luego haga clic en próximo.

    6. encendido Acción pestaña, seleccione Ejecuta el programa para programar el programa para que se ejecute automáticamente, luego haga clic en próximo.

    7. encendido Ejecuta el programa almohadilla, clic Navegar para seleccionar el archivo .bat que creamos anteriormente a través de la interfaz de línea de comandos Asistente de población de datosy luego presione próximo.

    También puede establecer parámetros adicionales:

    • Agregar argumentos realizar una tarea con ciertas condiciones.
    • empezar en para agregar la carpeta en la que se ejecutará el programa.

    8. Encendido Terminar pestaña, verifique la configuración y haga clic en Terminar.

    El Programador de tareas de Windows ejecutará un conjunto de datos de 30 segundos para cada tabla a las 10 a. m. todos los días.

    Conclusión

    En este artículo, observamos qué tan fácil y rápido es generar datos de prueba realistas y probamos cuánto tiempo lleva cargar datos de prueba usando dbForge Data Generator para SQL Server. Resumiendo, nos gustaría señalar que el rendimiento y la velocidad de llenado de los datos dependen de los siguientes parámetros:

    • La velocidad de la PC (CPU y disco duro) en la que está instalada la herramienta Generador de datos
    • Estructuras de bases de datos
    • La velocidad del servidor en el que se crea la base de datos.
    • Tasa de transferencia de datos entre la PC y el servidor
    • Configuración del generador de datos

    Descargue una versión de prueba gratuita de 30 días del kit de herramientas dbForge SQL, que incluye dbForge Data Generator for SQL Server, para evaluar las características y capacidades que lo ayudarán a realizar tareas de SQL Server de manera fácil y eficiente.

    Artículos de interés

    Subir