Saltar al contenido

Databetismo o Data Literacy: La habilidad de trabajar con datos

Las habilidades en datos conforman uno de los ejes que evaluamos en ixpantia para determinar el nivel de madurez en datos de las empresas. En este post vamos a examinar por qué es importante desarrollar estas habilidades, cuál es un nivel básico de databetismo y qué se debe tener en cuenta al diseñar un programa de habilidades en datos para su organización.

Introducción

Hay muchas razones para desarrollar habilidades en datos hoy en día, tanto desde la perspectiva individual como empresarial. Nunca antes hemos tenido tantos datos, tanto acceso a esos datos y tantas formas de procesarlos como ahora. Al igual que la lluvia de información en redes sociales nos obliga a ser cautelosos para discernir entre información verdadera y fake news, la abundancia de datos en el ámbito profesional requiere habilidades básicas para interpretarlos y extraerles valor.

Por otro lado, la demanda del mercado laboral sugiere que a todos como profesionales nos conviene desarrollar y mejorar nuestras habilidades en datos. Aunque no todos vamos a convertirnos en científicos de datos, llama la atención que esta es una de las ocupaciones con mayor crecimiento en el mercado estadounidense, según una proyección del Bureau of Labor Statistics. Mientras que la tasa de crecimiento promedio de todas las ocupaciones es de 5%, la de los científicos de datos es del 36%.

Cuando hablamos de habilidades en datos, o databetismo (data literacy) nos referimos a un conjunto de habilidades que incluyen organizar e interpretar la data, y poder comunicar a los demás los hallazgos resultantes. Algunas definiciones incluyen también la habilidad de generar predicciones, así como entender métodos de análisis de datos e implicaciones éticas de la aplicación de algoritmos1.

Según Gartner, el data literacy es un componente subyacente de la destreza digital - la habilidad y deseo de un empleado de usar tecnología emergente para alcanzar mejores resultados de negocio2. Por ende, las habilidades en datos no se limitan a capacidades técnicas o métodos avanzados de analítica. Existe un nivel de databetismo que está al alcance de cualquier colaborador que utilice datos en su día a día, y alcanzar ese nivel es beneficioso a nivel individual y empresarial.

Databetismo ABC

Antes de listar y explicar las habilidades en datos que consideramos básicas, es importante recordar que el análisis de datos no es un fin en sí mismo, sino que siempre debe estar dirigido a contestar preguntas de negocio y generar valor para la empresa. En este sentido, el databetismo busca crear un puente entre el análisis de datos y la toma de decisiones.

Usando herramientas de analítica, un científico de datos puede generar hallazgos que permitan tomar mejores decisiones, pero para llegar a ese punto es necesario plantear las preguntas adecuadas, interpretar correctamente la información, identificar esos hallazgos y posteriormente ser capaces de comunicarlos y discutirlos. Sin databetismo, la inteligencia humana no puede interactuar con la inteligencia implícita en los datos.

  • Habilidad A: Trabajar con datos de forma ordenada y limpia

La primera habilidad básica en datos es poder trabajar con ellos de forma ordenada y limpia, usando de forma adecuada la herramienta que se tenga al alcance.

Hemos mencionado en otras ocasiones que Excel no es nuestra herramienta preferida en ixpantia, y esto se debe a que Excel deja mucho espacio para el error humano3, y existen alternativas más eficientes, en volumen y rapidez de procesamiento. Aun así, saber trabajar con datos de forma ordenada y limpia (aun si es en Excel) implica ya un nivel básico de databetismo.

Por ejemplo, ser capaz de aplicar los lineamientos que la empresa exige para que los datos cumplan un estándar de calidad, verificar que haya uniformidad en un grupo de datos (por ejemplo, si se tuvo que corregir un grupo de observaciones, verificar que la corrección se hizo a todas las observaciones), utilizar signos y puntuaciones correctas, y evitar mezclar datos desactualizados con datos actualizados. Este tipo de habilidades son cruciales y básicas.

  • Habilidad B: Interpretar los datos

La segunda habilidad es la de poder interpretar la información que arrojan los datos. Una de las mejores formas para entender esta información es usando gráficos, porque el cerebro humano es capaz de procesar imágenes mucho más rápido que palabras y números. Un estudio de MIT del 20144 descubrió que las personas podemos extraer información conceptual de imágenes vistas por apenas 13 milisegundos5.

Al ver un gráfico, la persona debe ser capaz de entender la historia que cuentan esos datos, identificar patrones y tendencias, detectar valores atípicos y apoyarse en la imagen para comunicar esa información a otras personas. Pero, como dijo Claude Bernard, “quien no sabe lo que busca no entiende lo que encuentra”. Para extraer valor de un gráfico es útil tener claridad sobre qué es lo que buscamos, siendo lo más precisos posibles.

Cuando esa claridad falta, a menudo nos sentimos abrumados con la información presentada en el gráfico, y el proceso que lleva a tomar decisiones se ralentiza.

Hoy en día los gráficos están mucho más presentes en nuestras vidas que hace unas décadas atrás, en parte porque no existían las herramientas tan accesibles que tenemos ahora para crearlos. Más allá de nuestro trabajo, es frecuente tener que interpretar datos a partir de visualizaciones compartidas en medios de comunicación y redes sociales (por ejemplo, todos aprendimos de la importancia de “aplanar la curva” durante la pandemia).

Una eficaz técnica de estudio consiste en explicar el material a otra persona6, y es lo que recomendamos para verificar que entendemos una visualización de datos. Un nivel básico de databetismo implica que podamos interpretar un gráfico (o varios, en un tablero) y que seamos capaces de explicar y discutir nuestros hallazgos con un tercero.

  • Habilidad C: Entender los productos de datos que utilizo

Las habilidades por desarrollar dependen en gran medida de las herramientas que se utilicen en cada organización, y del rol de cada colaborador, pero lo primero es que todos los colaboradores conozcan cómo funcionan las herramientas que la empresa pone a su disposición para poder interactuar eficazmente con ellas.

Es indispensable que todos los miembros de la organización que utilizan productos de datos -ya sean dashboards, herramientas de automatización, o modelos predictivos de machine learning- sepan cuáles son los alcances y las limitaciones de estos productos, y entiendan de forma básica cómo funcionan. Por ejemplo, si se ha incorporado la automatización de un proceso, es importante que todos los usuarios sepan dónde y cómo se guardan los datos generados, cada cuánto se actualiza y captura la información, de dónde provienen los datos, etc.

Diseñar un programa de databetismo

En ixpantia hemos sido testigos de que en ocasiones las empresas hacen grandes inversiones en tecnología pero dejan de lado el databetismo necesario para aprovecharlas. Esto genera una gran frustración de ambos lados: el analista que implementó la herramienta ve su esfuerzo desperdiciado porque nadie la usa, y la empresa no ve el retorno esperado sobre su inversión. Para evitar esta desafortunada situación, lo ideal es implementar un programa de desarrollo de habilidades en datos.

1. Formular una estrategia de datos

Implementar un programa de desarrollo de habilidades en datos es una gran idea, pero no podemos olvidar que es un medio para alcanzar un fin, y ese fin debe estar definido dentro de la estrategia digital de la organización. Tener un norte claro hace la tarea menos abrumadora y permite priorizar los esfuerzos conforme a lo que la empresa necesita en el corto, mediano y largo plazo.

2. Definir un nivel básico de databetismo y luego uno para cada perfil

Es esencial definir cuáles habilidades y a qué nivel se necesitan para cada perfil dentro de la organización. Como mencionamos arriba, es recomendable empezar con un nivel básico de databetismo para todos los colaboradores. Una vez alcanzado, habrán departamentos o perfiles que deberán desarrollar habilidades más avanzadas. Esto dependerá de cuáles son las metas de cada departamento y de cuáles herramientas se van a utilizar. Por ejemplo, si dentro de mis objetivos estratégicos de mediano plazo está utilizar inteligencia artificial en campañas de mercadeo, un objetivo de corto plazo será capacitar al personal de mercadeo sobre esa tecnología, desde cómo funciona hasta cuáles son sus implicaciones éticas y de seguridad.

No todas las personas aprenden al mismo ritmo ni con las mismas técnicas. Ofrecer diferentes opciones de capacitación aumenta la probabilidad de que los colaboradores se involucren entusiastamente.

En lugar de ofrecer un curso de Udemy o Linkedin de 15 horas sobre análisis de datos, desarrolle primero un marco de referencia de las habilidades en datos necesarias. Luego, úselo para guiar la selección de diversos cursos, podcasts, videos y artículos que motiven el aprendizaje. La clave es cultivar calidad en lugar de cantidad (de horas)”.7

Por suerte, en el campo de data literacy abundan los recursos de aprendizaje. Basta dedicar un tiempo a buscar cursos online, o contratar a una empresa de ciencia de datos para impartir contenido a la medida de las necesidades de la empresa.

3. Diagnosticar el nivel de databetismo actual

A través de entrevistas y encuestas (idealmente anónimas, para máxima honestidad) es posible entender no sólo el nivel de habilidades en datos existente, sino también descubrir qué motiva e interesa a los colaboradores8, y qué expectativas, preocupaciones y miedos tienen sobre trabajar con datos. Además, puede ser útil para identificar los métodos de aprendizaje que los colaboradores prefieren. Con esta información, se puede diseñar un programa de habilidades en datos más personalizado y con mayores probabilidades de éxito.

4. Establecer un marco de referencia común para hablar de datos 9

Los procesos de gestión y análitica de datos son inherentemente colaborativos, y por ello es importante que las personas de una misma organización tengan un marco conceptual con base en el cual puedan hablar el mismo lenguaje en relación a datos. Además, discutir abiertamente los desafíos actuales de la organización y formar una visión compartida de hasta dónde puede llegar, es útil para ‘aterrizar’ un programa de habilidades en datos y que sus objetivos se perciban como alcanzables y valiosos.

Establecer métricas para medir objetivamente el éxito del programa

Los resultados del programa deben medirse de forma objetiva con métricas definidas a priori, tanto a nivel empresarial como a nivel de cada departamento o individuo. Este es un buen espacio para ser creativos y hacer la experiencia divertida y retadora para los participantes (por ejemplo, una meta individual podría ser que la persona genere y mantenga un dashboard, o que diseñe una plantilla para un informe automatizable).

Ahora bien, lo mejor es tener un enfoque iterativo en el desarrollo del databetismo. Recomendamos actualizar el diagnóstico de intereses, expectativas y habilidades existentes, actualizar las herramientas disponibles y, sobre todo, identificar las oportunidades que se van abriendo para la transformación digital de la organización una vez que sus colaboradores tengan cierto nivel de habilidad. La estrategia digital es un norte, y debe permitir flexibilidad en la ruta: ¡quizás algo que parecía imposible hace un año ahora es totalmente alcanzable!

Más técnicos: code o no-code?

Quizás una pregunta que se haga el lector es ¿es necesario aprender a programar? Este es uno de los aspectos donde hay distintas opciones, y la respuesta dependerá del contexto de cada organización. En términos generales, podemos decir lo siguiente: existen en el mercado herramientas útiles para analizar y visualizar data que no requieren que los usuarios sepan escribir código. Sin embargo, trabajar con código permite crear herramientas altamente personalizadas para cada empresa, sin depender de proveedores externos, y teniendo máximo control sobre el procesamiento de los datos, conforme a las políticas de gobernanza establecidas por la organización. Además, el entorno tecnológico hoy en día es tan cambiante y su evolución tan acelerada, que vale la pena invertir en desarrollar habilidades que permitan ser lo más flexibles y adaptables posible.

Por esta y otras razones, en ixpantia consideramos que aprender a programar en algún lenguaje10 (R, SQL, Python, JavaScript, Rust, etc.) es una habilidad que será cada día más valiosa para todo tipo de organizaciones. Como expresó Tareef Kawaf de Posit en este episodio del podcast DataLatam:

“(…) para nosotros, en cuanto a código la respuesta es siempre ‘sí’. Lo malo es que no puedes empezar hasta que sepas cómo escribir código. Así que la barra es más alta, en comparación con [métodos de] drag-and-drop y point-and-click, así que la gente debe pensarlo: ¿lo quiero o no lo quiero? Nuestra apuesta es que escribir código se convertirá en algo a lo que todo el mundo va a estar expuesto en su vida. Por ejemplo, ves jóvenes en middle school aprendiendo cómo programar aquí en los Estados Unidos. Y quizás la mayoría no serán muy buenos o ingenieros de software, pero en mi mente, no hay razón para que las personas no digan “genial, voy a usar el tidyverse11 para entender mis gastos de tarjeta de crédito (…)”.

Tomando en cuenta que antes (en un pasado no muy lejano) poder usar hojas de cálculo era una habilidad técnica exclusiva de ciertos departamentos, no es descabellado pensar que saber manipular datos con unas cuantas líneas de código sea una habilidad estándar en el futuro cercano.

Por último, es importante aclarar que la decisión de si usar plataformas no-code o analizar datos con código no es excluyente. No hay razón para no usar simultáneamente ambas soluciones, si tiene sentido desde el punto de vista de costo-beneficio y de las circunstancias específicas de cada empresa.

Conclusión

Tener habilidades en datos es importante hoy y será indispensable mañana, tanto desde la perspectiva empresarial como para quienes quieren mantenerse vigentes en el mercado laboral.

Lo más importante para evitar perdernos en el universo de la data es no perder de vista la importancia de alinear la sabiduría técnica con la del negocio12. Si bien las habilidades básicas aquí descritas son beneficiosas para cualquier organización e individuo, las habilidades más avanzadas y técnicas dependen en gran medida de lo que busque la organización. Queremos que los datos trabajen en función de los objetivos de negocio, y para esto se requiere una estrategia clara y personas que entiendan bien ambos mundos.

Referencias

Cowell, M. (2020): “The Role of Learning and Development in Data Literacy”, QuantHub, https://www.quanthub.com/upskilling-for-data-literacy/

DataLatam (2023): “Tareef, Posit y el rol del código abierto en el desarrollo de la industria de datos, Episodio 85”, 29.02.2023, https://datalatam.com/85/

European Spreadsheet Risks Interest Group: “EuSpRIG Horror Stories”, https://eusprig.org/research-info/horror-stories/

Foufa, N. (2020): “A Step-by-step Framework to Build a Data Literacy Program”, Sigma Computing, https://www.sigmacomputing.com/blog/how-to-build-a-data-literacy-program-a-step-by-step-framework-for-data-and-business-leaders

Panetta, K. (2021): “A Data and Analytics Leader's Guide to Data Literacy” Gartner, 26.08.2021, https://www.gartner.com/smarterwithgartner/a-data-and-analytics-leaders-guide-to-data-literacy

Potter, M., Wyble, B., Hagmann, C. (2014): “Detecting meaning in RSVP at 13 ms per picture”. Attention, Perception, and Psychophysics, Vol. 76(2), 270-279.

Sabar, R. (2021): “How Data Literate Is Your Company?” Harvard Business Review, 27.08.2021, https://hbr.org/2021/08/how-data-literate-is-your-company

Stock, E. (2019): “Want Students to Remember What They Learn? Have Them Teach It.” EdSurge, Voices: Practice and Implementation Strategies, https://www.edsurge.com/news/2019-01-24-want-students-to-remember-what-they-learn-have-them-teach-it

U.S. Bureau of Labor Statistics (2022): Occupational Outlook Handbook, https://www.bls.gov/ooh/

Notas

1 Sabar, R. (2021): “How Data Literate Is Your Company?” Harvard Business Review, 27.08.2021, https://hbr.org/2021/08/how-data-literate-is-your-company

2 Panetta, K. (2021): “A Data and Analytics Leader's Guide to Data Literacy” Gartner, 26.08.2021, https://www.gartner.com/smarterwithgartner/a-data-and-analytics-leaders-guide-to-data-literacy

3 Aquí una colección historias de horror con Excel, incluyendo titulares como “Drinks company £5.2M spreadsheet arithmetic error”, “Gene name errors are widespread in the scientific literature”, y “State fund for jobs loses €750k due to ‘human error’”.

4 Potter, M., Wyble, B., Hagmann, C. (2014): “Detecting meaning in RSVP at 13 ms per picture”. Attention, Perception, and Psychophysics, Vol. 76(2), 270-279.

5 Estudios anteriores indicaban una capacidad de procesar imágenes vistas por 100 milisegundos.

6 Stock, E. (2019): “Want Students to Remember What They Learn? Have Them Teach It.” EdSurge, Voices: Practice and Implementation Strategies, https://www.edsurge.com/news/2019-01-24-want-students-to-remember-what-they-learn-have-them-teach-it

7 Cowell, M. (2020): “The Role of Learning and Development in Data Literacy”, QuantHub, https://www.quanthub.com/upskilling-for-data-literacy/

8 Foufa, N. (2020): “A Step-by-step Framework to Build a Data Literacy Program”, Sigma Computing, https://www.sigmacomputing.com/blog/how-to-build-a-data-literacy-program-a-step-by-step-framework-for-data-and-business-leaders

9 Uno de los pasos indispensables dentro de los servicios de consultoría de Innovación Basada en Datos (IBD) de ixpantia es la ejecución de un taller de marco de referencia común. A través de este ejercicio, nos aseguramos que todos los participantes puedan hablar el mismo lenguaje en datos: se definen conceptos, se aclaran dudas y se alista el terreno para que todos puedan hablar sobre datos entre sí. Así mismo, sirve como espacio para discutir las limitaciones y desafíos en la ruta hacia la madurez en datos de la organización.

10 La selección del lenguaje es un aspecto que también depende de la organización, el tipo de data y el uso que se planee darle.

11 El “tidyverse” es un conjunto de paquetes del lenguaje de programación R desarrollado por Hadley Wickham que permite limpiar, ordenar, manipular datos y hacer cálculos y visualizaciones.

12 Sobre esto, recomendamos este interesante artículo de McKinsey.