Glosario

El glosario de aditu es una recopilación de términos fundamentales en el análisis de datos, diseñada para facilitar la comprensión de conceptos clave en este campo. A medida que el uso de datos se vuelve cada vez más relevante en distintos ámbitos, entender su terminología es esencial para interpretar la información de manera efectiva.

Este glosario ofrece definiciones claras y accesibles, permitiendo que cualquier persona, independientemente de su experiencia, pueda familiarizarse con el lenguaje del análisis de datos. Su objetivo es servir como una referencia útil para quienes buscan ampliar sus conocimientos y mejorar su capacidad para trabajar con datos de manera informada y precisa.

Glosario  de términos fundamentales en el análisis de datos

A

Activación de Datos

Proceso de utilización de datos almacenados para personalizar experiencias, optimizar campañas de marketing y mejorar la toma de decisiones empresariales en tiempo real.

Activador (en GTM: Google Tag Manager)

Elemento en Google Tag Manager que se usa para desencadenar eventos cuando ocurren ciertas condiciones en una página web o aplicación.

AdWords (Google Ads)

AdWords fue el nombre original de Google Ads, la plataforma publicitaria de Google. Permite a los anunciantes mostrar anuncios en los resultados de búsqueda, la Red de Display y otros espacios asociados.

Algoritmo

Secuencia finita de instrucciones o reglas lógicas utilizadas para resolver un problema, realizar cálculos o procesar datos.

Análisis de correlación

Método estadístico que mide la relación entre dos variables y determina si existe una relación lineal entre ellas.

Análisis de regresión

Técnica estadística utilizada para modelar la relación entre una variable dependiente y una o más variables independientes.

Análisis de series temporales

Conjunto de métodos de análisis de datos que permiten modelar y predecir valores futuros basados en observaciones previas ordenadas en el tiempo.

Análisis del Customer Journey

Proceso de análisis del recorrido completo de un cliente a través de múltiples puntos de contacto con una empresa, con el objetivo de optimizar su experiencia y mejorar la conversión.

Análisis exploratorio

Método inicial de análisis de datos que permite identificar patrones, detectar valores atípicos y resumir información clave sin necesidad de hipótesis previas.

Análisis multivariante (Multivariate analysis)

Conjunto de técnicas estadísticas que permiten analizar la relación entre múltiples variables al mismo tiempo para extraer patrones y dependencias.

Análisis Predictivo

Uso de modelos estadísticos y algoritmos para analizar datos históricos y predecir eventos o tendencias futuras.

Analítica descriptiva

Técnica de análisis de datos enfocada en describir y resumir un conjunto de datos mediante estadísticas básicas y visualización de datos.

Analítica digital

Conjunto de técnicas y herramientas utilizadas para medir, analizar y optimizar el rendimiento digital de sitios web, aplicaciones y estrategias online.

Anonimización

Proceso que transforma datos personales en información no identificable, eliminando o modificando elementos que puedan permitir la reidentificación de individuos.

Apache Spark

Framework de código abierto para el procesamiento de grandes volúmenes de datos en entornos distribuidos, diseñado para alta velocidad y escalabilidad.

API (Application Programming Interface)

Interfaz de programación que permite la comunicación e integración entre diferentes sistemas, aplicaciones o plataformas.

Appsflyer

Plataforma de atribución y medición de marketing móvil que permite a las empresas rastrear el rendimiento de sus campañas publicitarias y analizar el comportamiento de los usuarios en aplicaciones móviles.

Aprendizaje Automático (Machine Learning)

Rama de la inteligencia artificial que permite a los sistemas informáticos aprender automáticamente patrones en los datos y hacer predicciones sin necesidad de programación explícita.

Aprendizaje no supervisado

Técnica de machine learning en la que los modelos identifican patrones en datos sin etiquetas previas, agrupando elementos similares o descubriendo estructuras ocultas.

Árbol de Decisión (Decision Tree)

Modelo de machine learning basado en una estructura jerárquica de decisiones que se utiliza para clasificar datos o hacer predicciones en función de reglas derivadas de los datos de entrenamiento.

Atribución

Proceso de asignación de valor a cada punto de contacto dentro del recorrido de un cliente hasta una conversión, permitiendo evaluar la efectividad de los canales de marketing.

Audiencias

Conjuntos de usuarios segmentados en función de características comunes, como comportamiento, intereses o demografía, utilizados en estrategias de marketing digital y personalización.

Aviso de Cookies

Notificación que informa a los usuarios sobre el uso de cookies en un sitio web y les permite aceptar o rechazar su uso en cumplimiento con normativas de privacidad.

Aviso legal

Documento legal que establece las condiciones de uso y las responsabilidades tanto de los propietarios como de los usuarios de un sitio web.

AWS (Amazon Web Services)

Plataforma de computación en la nube de Amazon que ofrece almacenamiento, procesamiento y análisis de datos, además de herramientas de inteligencia artificial y machine learning.

Azure (Microsoft Azure)

Plataforma en la nube de Microsoft que proporciona servicios de computación, almacenamiento, análisis de datos e inteligencia artificial para empresas y desarrolladores.

B

B2B (Business to Business)

Modelo de negocio en el que las transacciones comerciales se realizan entre empresas en lugar de entre empresas y consumidores finales.

B2C (Business to Consumer)

Modelo de negocio en el que una empresa vende productos o servicios directamente al consumidor final.

Back end

Parte de una aplicación o sistema que gestiona la lógica del negocio, la base de datos y la interacción con servidores, operando en el lado del servidor.

Backlink

Enlace entrante a un sitio web desde otra página externa, utilizado para mejorar la autoridad del dominio y el posicionamiento en motores de búsqueda.

Backup

Proceso de creación de copias de seguridad de datos para prevenir su pérdida en caso de fallos técnicos, ataques informáticos o errores humanos.

Base de datos (DB)

Sistema de almacenamiento estructurado que permite la organización y gestión eficiente de grandes volúmenes de datos.

Base de datos relacional

Tipo de base de datos que organiza los datos en tablas interrelacionadas mediante claves primarias y foráneas, utilizando SQL para la gestión de la información.

Behavioral modeling (en Google Analytics)

Proceso de modelado de datos que utiliza el aprendizaje automático para completar la información cuando el consentimiento de los usuarios es limitado.

Big Data

Conjunto de datos de gran volumen, velocidad y variedad que requiere tecnologías avanzadas para su almacenamiento, procesamiento y análisis.

BigQuery

Plataforma de almacenamiento y procesamiento de datos en la nube de Google, optimizada para consultas analíticas de alto rendimiento sobre grandes volúmenes de datos.

Booleano

Tipo de dato lógico que puede tener solo dos valores posibles: verdadero (true) o falso (false).

Bot

Programa automatizado que realiza tareas repetitivas en la web, como indexar contenido en motores de búsqueda, interactuar con usuarios o recopilar información.

Business Intelligence (BI)

Conjunto de estrategias y tecnologías utilizadas para transformar datos en información procesable, facilitando la toma de decisiones basada en evidencia.

C

Calidad de Datos (Data Quality)

Conjunto de procesos y estándares para garantizar la precisión, coherencia, integridad y fiabilidad de los datos dentro de una organización.

Campo Calculado

Variable calculada dentro de una herramienta analítica que permite obtener valores personalizados a partir de los datos existentes sin modificar la fuente original.

Canal (en Google Analytics)

En Google Analytics, un canal representa la agrupación de fuentes de tráfico según su tipo, como orgánico, pago, social o directo, para facilitar el análisis del rendimiento.

Canonical URL

Etiqueta en una página web que indica la URL preferida de un contenido cuando existen varias versiones de la misma, ayudando a evitar problemas de contenido duplicado en SEO.

CDP (Customer Data Platform)

Plataforma tecnológica que recopila y centraliza datos de clientes desde múltiples fuentes para construir perfiles unificados y activar campañas de marketing personalizadas.

CDP Componible (Composable CDP)

Modelo de Customer Data Platform (CDP) que permite integrar y personalizar módulos independientes según las necesidades de una empresa, en lugar de utilizar una solución cerrada.

Chi-square test

Prueba estadística utilizada para determinar si existe una relación significativa entre dos variables categóricas dentro de una muestra de datos.

Clasificación binaria

Técnica de machine learning en la que el objetivo es asignar una de dos categorías posibles a una observación en función de sus características.

Cloud Analytics

Uso de herramientas de análisis de datos en la nube para extraer información y tomar decisiones basadas en grandes volúmenes de datos almacenados en plataformas cloud.

Cloud computing

Modelo de prestación de servicios de computación a través de internet, proporcionando almacenamiento, procesamiento y redes sin necesidad de infraestructura física local.

Cloud Data Warehouse

Almacén de datos basado en la nube que permite integrar, almacenar y analizar grandes volúmenes de información provenientes de diversas fuentes empresariales.

Cluster analysis

Método estadístico utilizado para identificar grupos homogéneos dentro de un conjunto de datos, agrupando elementos similares en función de sus características.

Clustering

Técnica de machine learning utilizada para agrupar elementos similares dentro de un conjunto de datos sin etiquetas predefinidas, facilitando la segmentación de audiencias y la detección de patrones.

CLV (Customer Lifetime Value)

Métrica que estima el valor financiero total que un cliente aportará a una empresa durante toda su relación comercial, ayudando a optimizar estrategias de retención y fidelización.

CMP (Consent Management Platform)

Plataforma de gestión de consentimiento que permite a los sitios web recopilar y administrar el consentimiento de los usuarios para el uso de sus datos en cumplimiento con normativas de privacidad.

CMS

Sistema de gestión de contenidos que permite la creación, edición y publicación de contenido digital en sitios web sin necesidad de conocimientos avanzados de programación.

Computer generated data

Datos generados por computadoras mediante algoritmos o simulaciones, utilizados en inteligencia artificial, automatización y modelado predictivo.

Concurrencia

Capacidad de un sistema para ejecutar múltiples procesos simultáneamente sin afectar el rendimiento, optimizando el uso de recursos computacionales.

Conector (de fuentes de datos)

Elemento de software que permite conectar diferentes fuentes de datos y plataformas para la integración y el intercambio de información entre sistemas.

Connectif

Plataforma de automatización de marketing especializada en eCommerce que permite personalizar campañas y mejorar la conversión mediante first-party data.

Consent Mode

Función de Google que permite a los anunciantes ajustar la recopilación de datos en función del consentimiento del usuario, asegurando cumplimiento con regulaciones de privacidad.

Consent Rate Optimization

Proceso de optimización de la tasa de consentimiento de los usuarios en plataformas digitales, ajustando el diseño y la experiencia del usuario para aumentar la aceptación del uso de datos.

Consentimiento Explícito

Forma de consentimiento en la que el usuario proporciona de manera afirmativa y clara su autorización para el procesamiento de sus datos personales, generalmente mediante una acción explícita como marcar una casilla.

Consentimiento Granular

Enfoque de gestión del consentimiento que permite a los usuarios elegir qué tipos de datos desean compartir y con qué fines, ofreciendo un control detallado sobre su privacidad.

Consentimiento Implícito

Consentimiento inferido a partir de la interacción del usuario con un sitio web o plataforma, sin necesidad de una acción afirmativa explícita.

Cookie banner

Elemento de la interfaz de usuario en sitios web que informa a los visitantes sobre el uso de cookies y les permite aceptar o rechazar su uso en cumplimiento con regulaciones de privacidad.

Cookiebot

Plataforma de gestión del consentimiento de cookies que permite a los sitios web cumplir con normativas como el RGPD y la CCPA mediante la recopilación y administración del consentimiento del usuario.

Cookieless Analytics

Modelo de análisis de datos basado en técnicas que no dependen de cookies de terceros, como la identificación basada en first-party data o modelado probabilístico.

Correlación

Medida estadística que indica la relación entre dos variables, mostrando la fuerza y dirección del vínculo entre ellas.

Covarianza

Medida de la variabilidad conjunta de dos variables aleatorias, utilizada para analizar cómo cambian juntas sin normalizar su relación.

Crawler (Rastreador)

Programa automatizado que navega por la web indexando contenido para motores de búsqueda o recopilando información para análisis de datos.

Criteo

Plataforma de publicidad digital especializada en retargeting, que permite a los anunciantes mostrar anuncios personalizados a usuarios que han visitado previamente su sitio web.

CRM (Customer Relationship Management)

Sistema de gestión de relaciones con los clientes que permite almacenar, analizar y optimizar interacciones con clientes potenciales y existentes, mejorando la fidelización y el rendimiento de las ventas.

CRO (Conversion Rate Optimization)

Proceso de optimización que busca mejorar la tasa de conversión en sitios web o aplicaciones a través de cambios en el diseño, contenido y experiencia del usuario.

CSV (Comma-Separated Values)

Formato de archivo utilizado para almacenar datos en forma de texto, separando cada valor mediante comas, facilitando su intercambio entre diferentes plataformas y programas.

Cuadro de Mando

Herramienta de visualización que permite monitorear indicadores clave de rendimiento (KPIs) y tomar decisiones basadas en datos en tiempo real.

Custom expression

Expresión personalizada utilizada en herramientas de análisis de datos para calcular métricas o aplicar transformaciones específicas a los datos sin modificar la fuente original.

Customer Journey

Recorrido completo que un cliente realiza desde el primer punto de contacto con una empresa hasta la conversión o compra, incluyendo interacciones en múltiples canales.

Customer Single View

Visión única e integrada de un cliente a partir de la consolidación de datos provenientes de distintas fuentes, proporcionando un perfil detallado y coherente.

D

Dashboard

Interfaz visual que permite la exploración y análisis de datos a través de gráficos, métricas e indicadores clave, facilitando la toma de decisiones empresariales.

Data as a product

Enfoque en el que los datos se consideran un activo estratégico que puede ser empaquetado, distribuido y monetizado como un producto dentro de una organización.

Data Catalog

Repositorio centralizado que organiza, documenta y gestiona metadatos sobre los datos disponibles en una organización, facilitando su búsqueda y uso.

Data Cleanroom

Entorno seguro en el que múltiples partes pueden compartir y analizar datos agregados sin exponer información identificable individualmente, utilizado para análisis de audiencia y atribución sin comprometer la privacidad.

Data Cleansing (limpieza de datos)

Proceso de detección, corrección o eliminación de datos inexactos, incompletos o duplicados dentro de un sistema, mejorando su calidad y fiabilidad.

Data curation

Proceso de organización, mantenimiento y actualización de datos para garantizar su accesibilidad, usabilidad y precisión en una organización.

Data Dictionary

Repositorio de metadatos que describe los elementos de datos dentro de un sistema, incluyendo nombres, tipos y relaciones, facilitando la comprensión y el uso de la información.

Data Driven Marketing

Estrategia de marketing basada en la recopilación y análisis de datos para optimizar campañas, mejorar la segmentación de audiencias y maximizar el retorno de inversión.

Data engineering

Disciplina que se encarga del diseño, construcción y mantenimiento de infraestructuras de datos para permitir su almacenamiento, procesamiento y análisis.

Data Enrichment (enriquecimiento de datos)

Proceso de mejora y ampliación de conjuntos de datos mediante la incorporación de información adicional procedente de fuentes internas o externas, aumentando su valor para el análisis.

Data ethics

Principios y prácticas que regulan el uso responsable de los datos, asegurando su equidad, privacidad, transparencia y cumplimiento normativo.

Data ingestion

Proceso de recolección y almacenamiento de datos desde múltiples fuentes en una plataforma centralizada para su posterior análisis y explotación.

Data Integrity

Garantía de que los datos son precisos, consistentes y confiables a lo largo de su ciclo de vida, evitando errores que puedan afectar la toma de decisiones empresariales.

Data intelligence

Proceso de análisis avanzado de datos con el objetivo de extraer información relevante para la toma de decisiones estratégicas, optimización de procesos y mejora del rendimiento empresarial.

Data Interoperability

Capacidad de diferentes sistemas y plataformas de datos para intercambiar y utilizar información de manera efectiva, asegurando compatibilidad y estandarización.

Data joins

Operaciones utilizadas en bases de datos para combinar información de múltiples tablas en función de una clave común, facilitando la integración de datos.

Data Lake

Almacén centralizado de datos en su formato original, diseñado para permitir un análisis flexible y escalable sin la necesidad de una estructura rígida.

Data Layer (Capa de Datos)

Capa intermedia que gestiona la recolección, estructuración y transmisión de datos entre sistemas de analítica digital y herramientas de marketing.

Data literacy

Habilidad de los profesionales para comprender, interpretar y utilizar datos de manera efectiva en la toma de decisiones y estrategias empresariales.

Data lookup

Proceso de búsqueda y recuperación de información dentro de un conjunto de datos, basado en condiciones específicas y criterios de consulta.

Data mapping

Proceso de correlación de datos entre diferentes fuentes para alinear y estandarizar estructuras, facilitando la integración y análisis.

Data masking

Técnica de protección de datos que oculta información sensible mediante la sustitución o cifrado, garantizando la privacidad sin alterar la estructura del dato.

Data Mining

Proceso de exploración y análisis de grandes volúmenes de datos para identificar patrones ocultos, correlaciones y tendencias útiles para la toma de decisiones.

Data Privacy (privacidad de datos)

Principios y prácticas diseñadas para proteger los datos personales de los usuarios, asegurando su confidencialidad, integridad y cumplimiento con regulaciones de privacidad como el RGPD.

Data sandbox

Entorno seguro y controlado para el análisis y prueba de datos sin afectar los sistemas de producción, permitiendo la experimentación con modelos y algoritmos.

Data science

Campo interdisciplinario que combina estadística, programación y análisis de datos para extraer información valiosa y tomar decisiones basadas en evidencia.

Data Storytelling

Técnica que combina visualización de datos y narrativa para comunicar hallazgos de manera efectiva, facilitando la interpretación y la toma de decisiones.

Data Use Agreement

Acuerdo legal que define los términos y condiciones bajo los cuales se recopilan, almacenan y utilizan los datos, asegurando el cumplimiento normativo y la transparencia.

Data warehouse

Sistema de almacenamiento estructurado diseñado para centralizar grandes volúmenes de datos históricos con el objetivo de facilitar el análisis y la toma de decisiones.

DataForm

Herramienta de gestión de datos que permite la transformación y modelado de datos dentro de entornos analíticos y plataformas en la nube.

DataOps

Conjunto de prácticas y metodologías aplicadas a la gestión del ciclo de vida de los datos, mejorando la automatización, calidad y eficiencia de los procesos analíticos.

Dataset

Colección de datos organizados en un formato estructurado o no estructurado que se utiliza para el análisis y modelado de información.

Dataviz

Representación visual de datos mediante gráficos, dashboards e infografías para facilitar su comprensión e interpretación.

Datos cualitativos

Datos que describen cualidades o características no numéricas, como opiniones, sentimientos y percepciones, utilizados comúnmente en estudios de mercado y encuestas.

Datos cuantitativos

Datos numéricos que pueden ser medidos y analizados estadísticamente, como ingresos, edad, temperatura o tasas de conversión.

Datos desestructurados

Datos que no tienen un formato predefinido y no pueden ser fácilmente organizados en tablas o bases de datos tradicionales, como imágenes, videos y documentos de texto.

Datos estructurados

Datos que siguen una estructura organizada en filas y columnas dentro de bases de datos relacionales, lo que facilita su almacenamiento, búsqueda y análisis.

Datos semi-estructurados

Datos que combinan características de los datos estructurados y desestructurados, como archivos JSON o XML, que poseen cierta organización pero sin una estructura rígida.

DBScan

Algoritmo de clustering basado en densidad que agrupa datos en función de la proximidad de sus puntos, utilizado para la detección de patrones y anomalías en grandes conjuntos de datos.

Decision tree

Modelo de machine learning basado en una estructura jerárquica de decisiones que permite clasificar datos y hacer predicciones a partir de reglas extraídas de los datos de entrenamiento.

Deep Learning (aprendizaje profundo)

Subcampo del machine learning que emplea redes neuronales profundas con múltiples capas para procesar grandes volúmenes de datos y reconocer patrones complejos en imágenes, texto y voz.

Diccionario de datos

Repositorio de metadatos que describe los elementos de datos dentro de un sistema, facilitando su comprensión y estandarización en una organización.

Dimensión

Unidad de análisis en herramientas de analítica digital y business intelligence, que representa una categoría o característica de los datos utilizada para segmentación y visualización.

Distribución binomial

Distribución de probabilidad discreta que modela el número de éxitos en una secuencia de ensayos independientes con dos posibles resultados (éxito o fracaso) y una probabilidad constante de éxito.

Distribución discreta

Distribución de probabilidad en la que las variables solo pueden tomar un conjunto de valores finitos o contables, como la distribución de Poisson o la distribución binomial.

E

EEC (Enhanced Ecommerce)

Funcionalidad avanzada de Google Analytics que permite rastrear las interacciones de los usuarios con productos en una tienda en línea, como vistas de productos, adiciones al carrito y transacciones.

ELT (Extract, Load, Transform)

Proceso de integración de datos en el que primero se extraen los datos de múltiples fuentes, luego se cargan en un destino y posteriormente se transforman según las necesidades analíticas.

Embedded analytics

Incorporación de herramientas de análisis y visualización de datos directamente en aplicaciones de software o productos digitales, permitiendo a los usuarios acceder a insights sin salir de la plataforma.

Embudo de conversión (Conversion Funnel)

Modelo que describe las etapas por las que pasa un usuario desde que interactúa por primera vez con una empresa hasta que completa una conversión o compra.

Error de Cuota

Error estadístico que ocurre en estudios de mercado cuando la muestra no representa adecuadamente la población objetivo, afectando la precisión de los resultados.

Estadística bayesiana

Enfoque estadístico basado en la teoría de probabilidad bayesiana, que permite actualizar la estimación de la probabilidad de un evento en función de nueva evidencia.

Estrategia de datos

Plan de acción basado en el uso de datos para mejorar la toma de decisiones empresariales, optimizar operaciones y obtener ventajas competitivas.

Etiqueta (en GTM: Google Tag Manager)

Elemento dentro de Google Tag Manager que permite capturar y enviar datos de eventos a plataformas analíticas y de marketing en función de la actividad del usuario en un sitio web o aplicación.

ETL (Extract, Transform, Load)

Proceso de integración de datos que implica la extracción desde múltiples fuentes, la transformación en un formato adecuado y la carga en un sistema de destino para su análisis.

Eventos Personalizados

Eventos definidos por el usuario en herramientas de analítica digital para rastrear interacciones específicas que no están predeterminadas en la plataforma.

Exabyte

Unidad de medida del almacenamiento de datos equivalente a 1,000 petabytes o un trillón de bytes, utilizada para referirse a volúmenes masivos de información.

F

Falso negativo

Error en un modelo de clasificación en el que se predice incorrectamente la ausencia de una característica o evento cuando en realidad está presente.

Falso positivo

Error en un modelo de clasificación en el que se predice incorrectamente la presencia de una característica o evento cuando en realidad no está presente.

First Party Mode (de GTM)

Configuración a través de GTM que permite cargar la etiqueta de Google (gtag.js) desde el dominio propio del sitio web en lugar de hacerlo desde los servidores de Google.

First-Party Data

Datos recopilados directamente por una empresa a partir de interacciones con sus clientes, como registros, compras o formularios, considerados más precisos y valiosos para la personalización.

Flujo de datos (Data Pipeline)

Flujo de datos desde su origen hasta su destino a través de procesos de transformación, integración y almacenamiento, asegurando su disponibilidad para análisis y explotación.

Fourth-Party data

Datos obtenidos a partir de asociaciones entre empresas que comparten información para enriquecer sus modelos sin adquirir datos de terceros desconocidos.

Front end

Parte visible de una aplicación o sitio web con la que interactúan los usuarios, incluyendo la interfaz de usuario y los elementos gráficos.

Fuente (en Google Analytics)

En Google Analytics, la fuente representa el origen del tráfico que llega a un sitio web, como ‘Google’, ‘Facebook’ o ‘correo electrónico’.

Fuente de Datos

Origen de los datos en un sistema de almacenamiento o análisis, pudiendo ser bases de datos, APIs, archivos o herramientas analíticas.

G

GA4 (Google Analytics 4)

Versión más reciente de Google Analytics que introduce un modelo de medición basado en eventos y machine learning para un análisis más preciso del comportamiento del usuario.

Gestión del Consentimiento

Conjunto de procesos y tecnologías utilizadas para obtener, administrar y documentar el consentimiento de los usuarios respecto al uso de sus datos personales.

Gobernanza de datos (Data Governance)

Conjunto de principios y prácticas que regulan la gestión, disponibilidad, integridad y seguridad de los datos dentro de una organización.

Google Analytics

Plataforma de analítica digital de Google que permite recopilar, medir y analizar el tráfico y el comportamiento de los usuarios en sitios web y aplicaciones.

Google Search Console

Herramienta de Google que permite analizar la visibilidad de un sitio web en los resultados de búsqueda, proporcionando datos sobre indexación, errores y rendimiento SEO.

Google Tag Manager (GTM)

Sistema de gestión de etiquetas que permite a los usuarios implementar y administrar scripts de seguimiento en sitios web sin modificar el código fuente.

Gráfico de barras

Representación visual de datos en forma de barras rectangulares cuya altura es proporcional al valor de los datos representados, utilizado para comparar categorías.

Granularidad del consentimiento

Nivel de detalle con el que se recopila y gestiona el consentimiento del usuario, permitiendo definir qué tipos de datos pueden ser utilizados y para qué fines.

Gtag.js (Google Tag)

Etiqueta de seguimiento global de Google que unifica la recopilación de datos en distintas plataformas de analítica y publicidad.

Guía de Etiquetado

Documento que describe la estructura y configuración de las etiquetas de seguimiento utilizadas en una web o aplicación para garantizar una medición precisa y consistente.

H

Hash

Función criptográfica que transforma datos en un valor de longitud fija, utilizado en seguridad informática para almacenar contraseñas o verificar la integridad de la información.

Histórico de Datos

Conjunto de datos almacenados a lo largo del tiempo, utilizados para análisis históricos, modelado de tendencias y auditorías de información.

Hit (de Google Analytics)

En Google Analytics, un hit representa una interacción del usuario con el sitio web que se envía a los servidores de Analytics, como una vista de página o un evento.

I

IAG (Inteligencia Artificial Generativa)

Rama de la inteligencia artificial que se enfoca en la creación de contenido original, como imágenes, texto o código, mediante el uso de modelos avanzados de aprendizaje automático.

Indicador

Métrica utilizada para evaluar el desempeño de una variable o proceso, proporcionando información clave para la toma de decisiones.

Inferencia Bayesiana

Método de inferencia estadística basado en la probabilidad condicional, que permite actualizar creencias sobre un evento a medida que se obtiene nueva evidencia.

Inner join

Tipo de operación en bases de datos relacionales que permite combinar información de dos tablas en función de un campo común, devolviendo solo los registros coincidentes en ambas tablas.

Insight

Interpretación accionable de los datos que permite comprender patrones, tendencias o relaciones clave, facilitando la toma de decisiones estratégicas.

Integer

Tipo de dato numérico en programación y bases de datos que representa un número entero sin decimales.

Integración de datos (Data Integration)

Proceso de combinar datos de diferentes fuentes en un único sistema para mejorar su accesibilidad, coherencia y utilidad en análisis y toma de decisiones.

Integración de fuentes de datos

Consolidación de información proveniente de múltiples bases de datos, APIs y otras fuentes para facilitar el análisis y la explotación de datos en tiempo real.

Inteligencia artificial

Rama de la informática que desarrolla algoritmos y modelos que permiten a las máquinas realizar tareas que normalmente requieren inteligencia humana, como el aprendizaje y la toma de decisiones.

Intervalo de confianza

Rango de valores dentro del cual se encuentra el parámetro poblacional con un determinado nivel de confianza, utilizado en estadística inferencial.

J

JavaScript

Lenguaje de programación utilizado principalmente para el desarrollo web, permitiendo la creación de sitios dinámicos e interactivos mediante la manipulación del DOM y el uso de eventos.

JSON (JavaScript Object Notation)

Formato ligero de intercambio de datos basado en texto, estructurado mediante pares clave-valor, ampliamente utilizado en comunicación entre sistemas y APIs.

K

K-Means

Algoritmo de aprendizaje automático sin supervisión que agrupa datos en K grupos distintos basados en la similitud de sus características.

Keyword Research (Estudio de palabras clave)

Proceso de investigación y análisis de palabras clave utilizadas en motores de búsqueda para optimizar estrategias de SEO y publicidad digital.

Klaviyo

Plataforma de automatización de marketing enfocada en eCommerce que permite la segmentación de audiencias, personalización de campañas y análisis de datos de clientes.

KPI (Key Performance Indicator)

Métrica clave utilizada para medir el rendimiento de un proceso, campaña o estrategia, permitiendo evaluar su éxito en función de objetivos predefinidos.

L

Labeled data

Conjunto de datos utilizados en el entrenamiento de modelos de machine learning en los que cada observación tiene una etiqueta o categoría asignada de antemano.

Landing Page Optimization

Proceso de mejora y optimización de páginas de destino con el objetivo de aumentar la tasa de conversión mediante pruebas A/B, mejoras en UX y optimización de contenido.

Link Building

Estrategia de SEO enfocada en obtener enlaces de calidad desde sitios web externos hacia una página propia para mejorar su autoridad y posicionamiento en motores de búsqueda.

Lookalike Modeling (Segmentación por Similitud)

Técnica de segmentación de audiencias basada en el uso de modelos de machine learning para identificar usuarios similares a una audiencia previamente definida.

Looker Studio

Herramienta de visualización de datos de Google que permite la creación de dashboards personalizados con integración de múltiples fuentes de datos.

LTV

Valor de vida del cliente (Lifetime Value), métrica que estima los ingresos totales que un cliente generará para una empresa durante toda su relación con la marca.

M

Machine Learning (aprendizaje automático)

Subcampo de la inteligencia artificial que permite a los sistemas aprender patrones en los datos y realizar predicciones sin ser programados explícitamente.

MANOVA

Análisis multivariado de la varianza, método estadístico utilizado para evaluar el efecto de múltiples variables independientes sobre varias variables dependientes simultáneamente.

Marketing Automation

Uso de software y tecnologías para automatizar procesos de marketing como segmentación de audiencias, campañas de email marketing y personalización de contenido.

Marketing Cloud (Salesforce)

Plataforma de Salesforce especializada en marketing digital, que permite la gestión de campañas omnicanal, segmentación avanzada y automatización de interacciones con clientes.

Matomo

Plataforma de analítica web de código abierto que permite a los propietarios de sitios web rastrear y analizar el comportamiento de los visitantes sin depender de herramientas de terceros.

Medio (en Google Analytics)

En Google Analytics, el medio indica el tipo de tráfico que dirige a un sitio web, como ‘orgánico’, ‘pago’, ‘referencia’ o ‘email’.

Medium Data

Concepto que describe conjuntos de datos que no son tan grandes como el Big Data pero que requieren herramientas avanzadas para su análisis debido a su volumen, complejidad y variabilidad.

Metadata

Datos que describen otros datos, proporcionando información sobre su estructura, origen, formato y propósito dentro de un sistema de información.

Métrica

Valor cuantificable utilizado para evaluar el rendimiento de una acción o estrategia en marketing digital, analítica y business intelligence.

MMM (Marketing Mix Modeling)

Modelo estadístico utilizado para evaluar el impacto de diferentes canales de marketing en las ventas y la conversión, permitiendo optimizar la asignación de presupuestos publicitarios.

Modelo de Atribución

Estrategia utilizada en analítica digital para determinar cómo se distribuye el valor de una conversión entre los distintos puntos de contacto en el recorrido del cliente.

Modelo de datos (Data model)

Representación estructurada de datos que define sus relaciones, atributos y formatos dentro de un sistema de información.

Modelo de Propensión

Modelo basado en machine learning que estima la probabilidad de que un usuario realice una acción determinada, como comprar un producto o cancelar una suscripción.

Modelo Predictivo

Modelo estadístico que utiliza datos históricos para predecir eventos o comportamientos futuros con base en patrones identificados.

MySQL

Sistema de gestión de bases de datos relacionales de código abierto que permite el almacenamiento y consulta de datos estructurados utilizando SQL.

N

Naive Bayes

Algoritmo de clasificación basado en la teoría de probabilidad de Bayes, utilizado en tareas de categorización como filtros de spam y análisis de sentimientos.

Neural Networks

Modelo de machine learning inspirado en el funcionamiento del cerebro humano, compuesto por capas de nodos interconectados que procesan información y aprenden patrones complejos.

NLP (Natural language processing)

Campo de la inteligencia artificial que se enfoca en la interpretación y generación de lenguaje humano, permitiendo aplicaciones como chatbots, traducción automática y análisis de sentimientos.

No-code

Plataformas de desarrollo que permiten a los usuarios crear aplicaciones y automatizaciones sin necesidad de escribir código, facilitando la digitalización en empresas sin equipos técnicos especializados.

Noindex

Directiva utilizada en SEO para evitar que una página web sea indexada por los motores de búsqueda, impidiendo que aparezca en los resultados de búsqueda.

Normalización

Proceso de estandarización de datos para reducir la redundancia y mejorar la coherencia en bases de datos relacionales, facilitando la gestión eficiente de la información.

Normalización de datos

Técnica utilizada en la preparación de datos para asegurarse de que estén en un formato uniforme y estructurado, mejorando la calidad y compatibilidad en análisis y almacenamiento.

NoSQL (Not only SQL)

Modelo de bases de datos que no sigue el esquema de relaciones tradicional de SQL, permitiendo mayor flexibilidad en la gestión de datos semiestructurados y no estructurados.

NPS (Net Promoter Score)

Métrica utilizada para medir la lealtad del cliente basada en la probabilidad de que recomiende un producto o servicio, categorizando a los clientes en promotores, pasivos y detractores.

Numpy

Librería de Python utilizada para el cálculo numérico y el manejo de arrays multidimensionales, facilitando operaciones matemáticas y estadísticas avanzadas.

O

OLAP (Online Analytical Processing)

Modelo de procesamiento de datos que permite realizar consultas analíticas complejas sobre grandes volúmenes de información de manera rápida y eficiente.

Omnicanalidad

Estrategia de integración de múltiples canales de comunicación y ventas para ofrecer una experiencia de usuario fluida y coherente en todos los puntos de contacto.

OneTrust

Plataforma de gestión del consentimiento y cumplimiento normativo que ayuda a las empresas a administrar datos personales en conformidad con regulaciones como el RGPD.

Open data

Conjunto de datos accesibles públicamente, publicados por gobiernos, instituciones y organizaciones para su libre uso y reutilización.

Opt-in

Acción mediante la cual un usuario otorga su consentimiento explícito para recibir comunicaciones o compartir sus datos, generalmente a través de un formulario de suscripción.

Opt-out

Opción que permite a los usuarios revocar su consentimiento y darse de baja de una lista de comunicación o del procesamiento de sus datos personales.

Orquestación de Datos

Proceso que automatiza la gestión del flujo de datos entre diferentes sistemas y plataformas, optimizando su integración y disponibilidad en tiempo real.

Outer join

Operación en bases de datos que combina registros de dos tablas, incluyendo tanto coincidencias como registros de una tabla que no tienen correspondencia en la otra.

P

Parámetro de URL

Elemento en una URL que almacena información adicional, como identificadores de campañas de marketing o datos de seguimiento analítico.

Personalización de Contenido

Estrategia de marketing basada en la adaptación de contenido según el comportamiento, intereses o características de los usuarios para mejorar la experiencia y la conversión.

Pie Chart (Gráfico circular o de tarta)

Gráfico de representación visual de datos en forma de sectores circulares, donde cada segmento representa una proporción de un todo.

Plan de Medición

Documento o metodología que define los objetivos de medición de una empresa, incluyendo las métricas clave, herramientas y procesos necesarios para la recopilación y análisis de datos.

Plausible

Herramienta de analítica web enfocada en la privacidad que ofrece métricas sobre tráfico y comportamiento de usuarios sin depender de cookies ni rastreadores.

Política de Cookies

Documento legal que informa a los usuarios sobre el uso de cookies en un sitio web, incluyendo su propósito y opciones de gestión en cumplimiento con regulaciones de privacidad.

Política de Privacidad

Normativa que establece cómo una organización recopila, almacena, utiliza y protege los datos personales de los usuarios, garantizando su privacidad y seguridad.

PostgreSQL

Sistema de gestión de bases de datos relacionales de código abierto que permite el almacenamiento y consulta eficiente de grandes volúmenes de datos estructurados.

Power BI

Plataforma de Microsoft para la visualización y análisis de datos, permitiendo la creación de dashboards interactivos y reportes avanzados.

Pre-Producción

Etapa en el desarrollo de software y aplicaciones en la que se realizan pruebas y ajustes antes de su despliegue en un entorno de producción.

Preferencias de Consentimiento

Opciones configurables que permiten a los usuarios definir qué tipo de datos personales desean compartir con una plataforma o empresa, asegurando el cumplimiento de normativas de privacidad.

Privacy Sandbox

Iniciativa de Google que busca reemplazar las cookies de terceros con métodos más respetuosos con la privacidad para la segmentación y medición de anuncios.

Pruebas de Incrementalidad

Método de medición utilizado en marketing para evaluar el impacto real de una acción o campaña comparándola con un grupo de control que no ha sido expuesto a la misma.

Python

Lenguaje de programación ampliamente utilizado en análisis de datos, inteligencia artificial y desarrollo de software, con una sintaxis sencilla y una gran variedad de bibliotecas.

q

Query (Consulta)

Instrucción utilizada en bases de datos y herramientas analíticas para extraer información específica de un conjunto de datos.

R

R

Lenguaje de programación especializado en análisis estadístico y visualización de datos, ampliamente utilizado en entornos académicos y de ciencia de datos.

Random forest

Algoritmo de aprendizaje automático basado en la creación de múltiples árboles de decisión, mejorando la precisión de la predicción y reduciendo el sobreajuste.

Ratio de conversión (Conversion Rate)

Métrica utilizada en marketing digital que mide la proporción de visitantes que completan una acción deseada, como una compra o una suscripción, en relación con el total de visitantes.

Raw data

Datos en su estado original, sin haber sido procesados ni transformados, utilizados como base para análisis y modelado.

Reducción de la dimensionalidad

Técnica de machine learning y análisis de datos que reduce la cantidad de variables en un conjunto de datos, eliminando redundancias y optimizando el rendimiento de los modelos predictivos.

Regresión

Técnica estadística utilizada para modelar la relación entre una variable dependiente y una o más variables independientes con el fin de predecir valores futuros.

Remarketing

Estrategia de marketing digital que permite volver a impactar con anuncios a usuarios que han interactuado previamente con una marca, aumentando la posibilidad de conversión.

Repositorio de datos

Sistema de almacenamiento que organiza y centraliza datos provenientes de múltiples fuentes, facilitando su acceso y gestión.

RESTful APIs

Interfaz de programación de aplicaciones basada en los principios de REST, utilizada para la comunicación entre sistemas mediante solicitudes HTTP.

Retargeting

Estrategia de marketing digital en la que se muestran anuncios personalizados a usuarios que han visitado previamente un sitio web o interactuado con una marca.

Reverse ETL

Proceso que permite extraer datos de un data warehouse y enviarlos de vuelta a herramientas operacionales, como CRM o plataformas de marketing, para su activación.

RGPD / GDPR (Reglamento General de Protección de Datos / General Data Protection Regulation)

Regulación europea que establece normas sobre la recopilación, almacenamiento y procesamiento de datos personales, garantizando la privacidad y los derechos de los usuarios.

S

Second-party data

Datos obtenidos a partir de asociaciones con otras empresas que los comparten de manera directa, sin recurrir a intermediarios de datos externos.

Segment (CDP)

Plataforma de datos de clientes (CDP) que permite la recopilación, segmentación y activación de audiencias en diversos canales de marketing.

Segmentación de Audiencias

Proceso de clasificación de usuarios en grupos específicos según su comportamiento, intereses o características para mejorar la personalización de campañas publicitarias.

Segmentación de Clientes

Proceso de clasificación de clientes basado en características comunes, como hábitos de compra o interacción con la marca, con el objetivo de optimizar estrategias de marketing y fidelización.

Series Temporales

Conjunto de datos organizados en función del tiempo, utilizados para modelar tendencias, realizar pronósticos y detectar patrones estacionales.

Server Side (GTM / Tag Management)

Implementación de etiquetas de seguimiento en el lado del servidor en lugar del navegador del usuario, mejorando el control, seguridad y precisión de los datos recopilados.

Silo de datos (Data Silo)

Almacenes de datos aislados dentro de una organización que dificultan el acceso y la integración con otros sistemas, reduciendo la eficiencia del análisis y la toma de decisiones.

Similitud coseno (Cosine similarity)

Métrica utilizada en análisis de datos y machine learning para medir la similitud entre dos vectores, basada en el ángulo entre ellos en un espacio multidimensional.

SKU (stock keeping unit)

Identificador único asignado a cada producto en un inventario para su rastreo, gestión y control de stock. Muy utilizado en proyectos ecommerce.

Smart data

Enfoque en el uso eficiente de los datos, priorizando su calidad (por encima de la cantidad del Big Data), relevancia y aplicabilidad en la toma de decisiones estratégicas.

Social Listening

Proceso de monitoreo y análisis de conversaciones en redes sociales para identificar tendencias, opiniones y menciones sobre una marca, industria o tema específico.

SQL (Structured Query Language)

Lenguaje de consulta utilizado en bases de datos relacionales para la gestión y análisis de datos estructurados mediante operaciones como selección, inserción y actualización.

SSOT (Single Source of Truth)

Sistema o repositorio que actúa como única fuente fiable y consolidada de información dentro de una organización. Un SSOT garantiza que todos los equipos trabajen con los mismos datos, evitando discrepancias, mejorando la toma de decisiones y facilitando una visión unificada del negocio. Suele implementarse a través de dashboards que integran datos de múltiples fuentes de forma estructurada y coherente.

Supermetrics

Herramienta de automatización que permite extraer y consolidar datos de diversas fuentes, como plataformas publicitarias y analíticas, en hojas de cálculo o dashboards.

T

Tableau

Plataforma de visualización de datos que permite crear dashboards interactivos, facilitando la exploración y análisis de grandes volúmenes de información.

Tasa de rebote

Porcentaje de usuarios que abandonan un sitio web después de ver solo una página sin interactuar con el contenido, utilizado como indicador del engagement y relevancia de la web.

Tealium

Plataforma de gestión de datos del cliente (CDP) que permite la recolección, segmentación y activación de datos en múltiples canales de marketing.

Test A/B

Método de experimentación que compara dos versiones de un elemento, como una página web o un anuncio, para determinar cuál genera mejores resultados.

Text mining

Proceso de análisis de texto para extraer patrones, información y tendencias a partir de grandes volúmenes de datos no estructurados.

Third-Party Data

Datos adquiridos de fuentes externas que no tienen una relación directa con la empresa, utilizados en publicidad digital y segmentación de audiencias.

Transformación de datos

Proceso de conversión y estructuración de datos para facilitar su análisis, integración y explotación en sistemas de información.

Transformación Digital

Proceso de adopción de nuevas tecnologías y estrategias digitales para mejorar la eficiencia operativa y competitividad de una organización.

TSV (Tab Separated Values)

Formato de archivo de texto similar a CSV, pero que utiliza tabulaciones en lugar de comas para separar los valores en cada fila.

TTV (Time-to-value)

Tiempo requerido para que un usuario obtenga valor de un producto o servicio tras su implementación, utilizado como métrica en estrategias de adquisición y retención.

U

Universal Analytics

Versión anterior de Google Analytics que utilizaba un modelo de medición basado en sesiones y cookies de terceros, reemplazada por GA4.

Urchin

Software de analítica web desarrollado por Urchin Software Corporation y adquirido por Google, que sirvió como base para el desarrollo de Google Analytics.

UTM

Parámetros de URL utilizados en marketing digital para rastrear la efectividad de campañas y fuentes de tráfico en herramientas analíticas.

V

Valor atípico (Outlier)

Dato que se encuentra significativamente alejado de la mayoría de los valores en un conjunto de datos, pudiendo indicar errores, anomalías o información relevante para el análisis.

Variable

Elemento de un conjunto de datos que puede adoptar diferentes valores, siendo un componente clave en modelos estadísticos y de machine learning.

Variable (en GTM: Google Tag Manager)

Elemento dentro de Google Tag Manager que almacena valores dinámicos que pueden utilizarse en etiquetas y activadores para personalizar la recolección de datos.

Variable binaria

Tipo de variable que solo puede tomar dos valores posibles, generalmente representados como 0 y 1, verdadero o falso.

Variable categórica

Variable que representa diferentes categorías o etiquetas en un conjunto de datos, como colores, tipos de productos o regiones geográficas.

Variable dependiente

Variable cuyo valor es afectado por otras variables en un análisis estadístico o modelo predictivo.

Variable independiente

Variable que influye en el valor de otra variable en un análisis estadístico, utilizada para explicar cambios en la variable dependiente.

Varianza

Medida estadística que indica la dispersión de un conjunto de datos en relación con su media, mostrando qué tan dispersos están los valores individuales.

Ventana de Atribución

Periodo de tiempo durante el cual se asigna crédito a una conversión en un modelo de atribución, determinando el impacto de cada punto de contacto en el proceso de conversión.

Visualización de Datos (Data Visualization)

Representación visual de datos mediante gráficos, tablas e infografías para facilitar su interpretación y comunicación.

w

Web Scraping

Proceso automatizado de extracción de datos de sitios web mediante software especializado, utilizado para recopilar información estructurada a partir de fuentes en línea.

Webhook

Método de comunicación entre aplicaciones que permite enviar datos en tiempo real a través de solicitudes HTTP basadas en eventos.

x

XML

Lenguaje de marcado utilizado para almacenar y transportar datos estructurados de manera legible para humanos y máquinas.

y

Yottabyte

Unidad de medida de almacenamiento de datos equivalente a un billón de terabytes, utilizada para describir volúmenes masivos de información.

z

Zero-Party Data

Datos compartidos directamente por los usuarios con las empresas, como preferencias y opiniones, sin necesidad de rastreo ni inferencias.

Zettabyte

Unidad de medida de almacenamiento de datos equivalente a 1,000 exabytes, utilizada en el contexto del Big Data.