inside-estadistica-basica-para-analistas-de-negocios-digitales.jpg

Estadística básica para analistas de negocios digitales


NUEVE MINUTOS DE LECTURA ·· NIVEL INTERMEDIO
29 DE MAYO DE 2017

Instrúyase en los conceptos más elementales de la estadística para aprovechar todo el potencial de esta ciencia en la construcción y gestión de un negocio digital.

El mundo digital está plagado de datos e información, cada movimiento y cada plataforma tiene una métrica asociada que muestra el desempeño y los resultados obtenidos. Ningún otro escenario en el mundo de los negocios es tan métrico como la actividad digital. Debido a esto, el actuar de los equipos digitales está repleto de indicadores y gráficas que apoyan la toma de decisiones y que orientan la gestión. Pero, para darle un mejor uso a los datos y poder sacar de ellos el máximo provecho es necesario tener unas bases solidas en estadística, solo así se evitarán errores al interpretar la información.

Advertimos de arranque que esta publicación no pretende ser un curso intensivo de estadística, y tampoco espera ser una guía colmada de formulas para volverse experto en la materia. Buscamos crear un corto documento para conocer las piezas elementales de esta ciencia y, ojalá, motivar a las personas para que la exploren más y eleven sus competencias en ella. Algo que seguramente le dará ventajas competitivas como profesional y situará a la organización para la cual trabaja en la vanguardia.

¿Qué es la estadística?

«Generalmente sobrevaloramos lo que podemos medir e infravaloramos lo que no».

El primer concepto que debemos aclarar es la definición de estadística, para así sembrar las bases para su entendimiento. La estadística es una ciencia que se encarga de la acumulación, análisis, interpretación y presentación de datos numéricos; que busca explicar las correlaciones y dependencias de los fenómenos físicos o naturales que ocurren de forma aleatoria o condicional. Como ciencia se apoya en gran medida en el pensamiento y la deducción matemática, es por esto que la mayoría de las personas la categoriza como una rama de esta ciencia exacta. La estadística es transversal porque enriquece a múltiples disciplinas, entre las cuales están algunas asociadas a los negocios; porque gracias a ella se pueden identificar patrones y describir comportamientos en los mercados, algo que sirve para la toma de decisiones.

Para facilitar su estudio, la estadística se puede subdividir en dos ramas: descriptiva e inferencial, y para entender la diferencia entre ambas es necesario conocer primero las definiciones de población y muestra. La población se refiere al conjunto de personas u objetos que tienen alguna característica en común. Por su parte, una muestra solo es una parte de la población, pero debe ser una representación fiel de todo el conjunto. Es decir que, una muestra es un subconjunto representativo de la población. Con esta claridad podemos evidenciar las diferencias entre las dos ramas de la estadística: cuando un analista de negocios acumula y analiza datos de una población para describir o sacar conclusiones de ella está haciendo estadística descriptiva y, si por el contrario, dicho investigador elige tomar una muestra de la población para llegar a conclusiones sobre la población está haciendo estadística inferencial. Además, para complementar los conceptos, cuando un investigador toma una medida descriptiva de la población se dice que está estableciendo un parámetro, mientras que si el mismo investigador elige tomar una medida descriptiva de la muestra lo que se obtiene es un estadístico.

En estadística, ¿cuales son los tipos de datos y mediciones?

Otra pieza importante para entender la estadística es la relacionada con la medición de datos. Un punto es crítico porque la estadística es una ciencia numérica, pero que no siempre mide números; es decir, en muchos casos los números que se utilizan son una simple representación de cosas. Debido a esto, dentro de la estadística existen diferentes tipos de datos, algo que se debe entender antes de lanzarse a manipularlos.

Los cuatro niveles de datos son: nominal, ordinal, de intervalo y de razón. El nivel nominal es el más bajo en la medición de datos, en él se usan los números para clasificar o asignar categorías. Las descripciones demográficas de una población o muestra —sexo, grupo étnico, nivel socioeconómico, religión, entre otros— son un buen ejemplo de este nivel de medición. La medición de datos nivel ordinal es más alta que la anterior; aquí los números se usan para clasificar y ordenar objetos. Un buen ejemplo de datos ordinales son aquellos que se obtienen de las respuestas de un cuestionario que ofrece una escala de alternativas —de 1 a 5, donde 1 es poco y 3 mucho, ¿qué tan feliz es usted?—. La medición de datos de nivel de intervalo es el tercero en la escala y primero en el que los datos son siempre numéricos. Lo esencial para entenderlos es comprender que aquí la distancia entre números consecutivos es la encargada de ofrecer la información al investigador. Un excelente ejemplo de este nivel de datos es la temperatura, porque en ella el número representa algo en el imaginario del observador. El último tipo es la medición de datos de nivel de razón, aquí se encuentran la mayoría de métricas digitales. Los datos de razón tienen las mismas propiedades de los datos de intervalo, lo que los hace diferentes es que a este nivel existe un cero que representa la ausencia de la característica de estudio —en los de intervalo, el cero es posible pero hace parte de la escala—. Algunos de los mejores ejemplos de datos de razón son la estatura, peso, tiempo y volumen.

Los datos nominales y ordinales no son métricos y por lo general son conocidos como datos cualitativos. Por su parte, los datos de intervalo y de razón son métricos, y los investigadores los conocen como datos cuantitativos. Aclarado esto, podemos entonces separar las técnicas estadísticas en dos categorías: estadísticas paramétricas y no paramétricas; para la primera se necesita que los datos sean de intervalo o de razón, y para la segunda, nominales u ordinales. Es decir, que la analítica digital, en gran medida, es una técnica de estadística paramétrica y funciona con datos de nivel de razón.

Las medidas de tendencia central para el análisis de datos

Queremos cerrar esta publicación con la herramienta estadística más usada en los negocios, las medidas de tendencia central. Los investigadores, por lo general, necesitan encontrar un dato que los ayude a entender o representar una muestra o población, ese dato casi siempre lo proporciona una medida de tendencia central; una técnica estadística que sirve de mecanismo para la descripción de un conjunto de datos.

«En marketing lo importante es medir para corregir».

Las medidas de tendencia central ofrecen información acerca de la parte central, o media, de un grupo de números. Las cinco más populares son: la moda, la mediana, la media aritmética, los percentiles y los cuartiles.

La moda es la más elemental de las medidas de tendencia central, se obtiene buscando el valor que se presenta con más frecuencia dentro del conjunto de datos. Ahora, en la búsqueda de esta medida, es perfectamente posible que un conjunto tenga una, dos o varias modas; para estos casos se habla de muestras o poblaciones bimodales —cuando se tienen dos modas— o multimodales —cuando se tienen múltiples modas—. La moda es una excelente medida de tendencia central cuando se trabaja con datos de nivel nominal.

La mediana es el valor que se encuentra en el medio de un conjunto ordenado de números. Cuando calculamos la mediana nos podemos encontrar con dos escenarios, que son: un conjunto compuesto por una cantidad impar de datos o uno compuesto por una cantidad par. Para los conjuntos con un número impar de términos el cálculo de la mediana es simple, porque siempre existirá un dato en el medio. Mientras que en los conjuntos con un numero par de datos no existe un dato en la mitad; para este escenario, se necesitará calcular el promedio de los dos números de en medio. Una de las principales ventajas de la mediana es que como medida de tendencia central no se ve afectada por la magnitud de los valores extremos; es por esto que la mediana es muy utilizada para la representación de muestras y poblaciones. Por su parte, la principal desventaja de la mediana es que no usa toda la información de la muestra o población. Por último, el tipo de datos o de nivel de medida que se requiere para poder usar la mediana como medida de tendencia central es el ordinal.

La media aritmética es la más popular de las medidas de tendencia central, y se obtiene calculando el promedio de todos los datos. Es decir, sumando todos los datos de la muestra o población y dividiéndolos por la cantidad de datos. Aunque la media aritmética se ha convertido en un estándar en el mundo de los negocios, en algunos casos no es apropiado usarla como medida de tendencia central. Para datos de nivel nominal y ordinal no se recomiendo su uso. La principal ventaja —y a su vez desventaja— de la media aritmética es que ésta se ve afectada por todos y cada uno de los valores; esto significa que toda la muestra o población estará representada en la medida. Dicha particularidad es también una desventaja porque algunos valores extremadamente grandes o pequeños pueden alterar el resultado y dirigir la medida hacia un extremo.

Los percentiles y cuartiles son medidas de tendencia central que subdividen el grupo de datos. En el caso de los percentiles lo fragmentan en cien partes y en el caso de los cuartiles, en cuatro. Al hacer esta subdivisión, el investigador podrá encontrar límites para emitir enunciados del tipo: «El 70% de los datos está por encima o por debajo de X valor», con esto le podrá dar al analista una herramienta para interpretar la información y sacar conclusiones.


BIBLIOGRAFÍA

  • BLACK, Ken. «Business Statistics For Contemporary Decision Making». Cuarta Edición. John Wiley & Sons Editorial. 2004.
  • Imagen diseñada por Freepik.

Tags: estrategia digital mundo digital gerencia dirección estratégica emprendimiento management métrica analítica web estadística

Contacto

Móvil: (310) 824 6913
Email: Esta dirección de correo electrónico está protegida contra spambots. Necesita activar JavaScript para visualizarla.
Medellín, Colombia.