Imagen: PixieMe/Shutterstock

Si los registros duplicados son buenos o malos depende de las convenciones específicas que determine, no de Excel. En la mayoría de los casos, los datos duplicados son comunes porque muchos registros repiten los mismos valores en la misma columna.

VER: 83 trucos de Excel que todo usuario debe dominar (República Tecnológica)

Por otro lado, un registro duplicado, donde se repiten todos los valores, puede generar problemas al informar y analizar el conjunto de datos como un todo. Es fácil encontrar duplicados; puede filtrarlos desde un conjunto de datos o formatearlos usando una regla de formato condicional. Lo que no puede hacer fácilmente en Excel es mostrar solo registros duplicados. La buena noticia es que es fácil con Power Query, por lo que en este artículo le mostraré cómo usar Power Query para mostrar una lista de duplicados.

Uso Microsoft 365, pero Power Query está disponible hasta 2010, como complemento. Excel Online no es totalmente compatible con Power Query, pero puede ejecutar consultas. Puede descargar el archivo de demostración .xlsx o trabajar con sus propios datos. Este artículo asume que tiene conocimientos básicos de Excel, pero incluso un principiante debería poder seguir las instrucciones para tener éxito.

Índice
  • ¿Qué es PowerQuery?
  • Establecer duplicado
  • Cómo listar valores duplicados con Power Query
  • Cómo enumerar registros duplicados con Power Query en Excel
  • Cómo utilizar los resultados de búsqueda de Power Query
  • ¿Qué es PowerQuery?

    Power Query le permite conectarse a datos locales y extranjeros y luego transformar esos datos para que pueda usarlos en Excel sin cambiar los datos de origen. Es fácil de usar, pero lamentablemente la mayoría de los usuarios no están familiarizados con él. Aunque estamos usando una funcionalidad simple en Power Query, este artículo no es una introducción básica a Power Query. Ahora usemos Power Query para mostrar los duplicados.

    Establecer duplicado

    Para trabajar eficazmente con duplicados, debe definir qué es un duplicado en el contexto de sus datos y cómo lo usa. Cualquier valor que aparezca varias veces en la misma columna es un duplicado. Por ejemplo, muchos registros en un conjunto de datos de seguimiento pueden tener la misma fecha de entrega o el mismo cliente. Estos son valores duplicados y son comunes.

    VER: Windows 10: Listas de comandos de voz para reconocimiento de voz y dictado (PDF gratis) (República Tecnológica)

    El término también puede definir un registro en el que cada valor del registro se repite en otro registro. En otras palabras, todo el registro es un duplicado. Por ejemplo, dos registros con la misma fecha de entrega, cliente y número de factura pueden causar problemas; no le gustaría cobrarle a un cliente dos veces por el mismo pedido. Estos son registros duplicados y, por lo general, querrá eliminar uno.

    Para nuestros propósitos en este artículo, usaremos Power Query para mostrar una lista de los dos tipos de duplicados: valores repetidos en la misma columna y valores repetidos en todas las columnas.

    Como puedes ver en Figura A, la hoja de demostración contiene valores duplicados. En un conjunto de datos tan pequeño, los duplicados no son difíciles de detectar. Trabajar con ellos es otro asunto, especialmente si el conjunto de datos es grande. También tenemos un registro duplicado.

    Figura A

    Cómo listar valores duplicados con Power Query

    Usemos Power Query para ver los valores repetidos en las columnas. Para hacer esto, haga clic en cualquier parte del conjunto de datos, haga clic en la pestaña Datos y luego haga lo siguiente:

    1. En el grupo Obtener y transformar datos, haga clic en Desde hoja. La ventana resultante muestra datos en Power Query (Figura B).
    2. Seleccione la columna que desea verificar en busca de duplicados. En este caso, la columna de fecha ya está seleccionada, así que usemos eso.
    3. En la pestaña Inicio (en Power Query, no en Excel), haga clic en la lista desplegable Mantener filas en el grupo Reducir filas.
    4. En la lista desplegable resultante, elija Conservar duplicados.

    Figura B

    Como puedes ver en Figura C, el conjunto de datos repite dos fechas al menos una vez. Para ver duplicados en otras columnas, seleccione una columna y repita el paso 3. Por ejemplo, Figura D muestra el valor duplicado en la columna de pentagrama.

    Figura C

    Figura D

    Ahora sabe que al menos dos columnas repiten al menos un valor. Si lo desea, busque duplicados en cada columna; encontrará que cada columna repite un valor al menos una vez.

    ¿Qué sucede si desea ver si hay un registro duplicado? Vayamos a eso a continuación.

    Cómo enumerar registros duplicados con Power Query en Excel

    Para recapitular rápidamente, un registro duplicado repite valores en todas las columnas. Para verificar el conjunto de datos en busca de registros duplicados, seleccione todas las columnas en Power Query. Para hacer esto, mantenga presionada la tecla Mayús mientras hace clic en cada columna. Luego elija Conservar duplicados en la lista desplegable Conservar filas. Figura E muestra el resultado. Como ya habrá adivinado, el resultado es el mismo que la consulta de personal en la última sección.

    Figura E

    Por supuesto, este es un ejemplo simple, y los resultados fueron fáciles de predecir. Esto no siempre será cierto, especialmente en un gran conjunto de datos.

    Cómo utilizar los resultados de búsqueda de Power Query

    Ver las grabaciones podría no ser suficiente. Afortunadamente, puede devolver los resultados a Excel como una hoja. Simplemente haga clic en Cerrar y cargar en el grupo Cerrar. Esto creará una nueva hoja y guardará el conjunto de datos resultante como se muestra en Figura F. Una vez que los datos están en Excel, puede usarlos como cualquier otro conjunto de datos.

    Figura F

    Este es un uso simple para Power Query. Tómese el tiempo para familiarizarse con las diferentes opciones para que pueda aplicarlas a tareas más complejas.