Harvard Business Review definió al científico de datos (Data Scientist) como aquel que puede descubrir insights valiosos a partir de grandes volúmenes de datos(1). Hoy la profesión ha tenido un boom a nivel empresarial con crecimientos esperados por encima del 30% anual. En el siguiente artículo conoceremos los conceptos básicos que nos ayudarán a entender el Data Science y su aporte en la automatización de las decisiones en los negocios.
La ciencia de datos es un campo interdisciplinario que involucra las ciencias de la computación, matemáticas, estadística y de negocios con el objetivo de extraer conocimiento a partir de los datos. Uno de los métodos más usados para lograr esto es el machine learning.
Según IBM Cloud Education, el machine learning o aprendizaje automático es una rama de la inteligencia artificial (IA) que se centra en el uso de datos y algoritmos para imitar la forma en que aprenden los humanos, mejorando gradualmente su precisión(2). Además, mediante el uso de métodos estadísticos, los algoritmos de machine learning entrenan para hacer clasificaciones o predicciones, descubriendo información esencial dentro de áreas clave de los negocios.
El machine learning cumple varias funciones dentro de cada sector o área del mercado, su rol depende de cada necesidad que tenga la empresa y su manejo de la información. El análisis del cliente, la optimización de los procesos o el tiempo, hasta la seguridad son los diferentes roles que puede adoptar.
Análisis del cliente: con ayuda de la data histórica podemos encontrar el número de clientes con la probabilidad de irse, analizar su comportamiento previo y compararlo con nuestros clientes actuales para tomar acciones claves.
Atención al cliente: a partir del análisis del comportamiento se descubren nuevas palabras o preguntas claves que pueden ser respondidas por un bot.
Optimización del tiempo: podemos saber el momento exacto para tomar decisiones específicas como la reducción de la producción, recorte de personal o inversión.
Seguridad de la información: con el machine learning podemos proteger la información personal de nuestros clientes brindándoles seguridad y confianza.
Existen dos categorías principales de algoritmos de machine learning: supervisados y no supervisados.
Son aquellos que tienen un target definido de predicción, ya sea continuo o binario. El aprendizaje supervisado ayuda a las organizaciones a resolver una variedad de problemas desde predecir la probabilidad que un cliente compre un producto hasta predecir el nivel de ingresos que podría tener un cliente. Algunos métodos utilizados en el aprendizaje supervisado incluyen la regresión lineal, regresión logística, árboles de regresión, entre otros.
No tienen un target definido, sino que buscan generar una segmentación en base a las variables disponibles. Estos algoritmos descubren patrones ocultos o agrupaciones de datos sin necesidad de intervención humana por lo que son muy usados en el análisis exploratorio de datos. Los algoritmos utilizados en el aprendizaje no supervisado incluyen clusterización k-means, redes neuronales, clusterización jerárquica, entre otros(3).
Se puede entender que el machine learning (ML) es el subgrupo de tecnologías que engloba la inteligencia artificial. Mientras que el IA permite que una máquina simule el comportamiento de los humanos, el aprendizaje automático les brinda la data para que puedan obtener resultados más precisos.
Las empresas siempre buscan simplificar sus tareas para poder enfocar sus esfuerzos en nuevas estrategias para el cliente. Mientras más automatizados estén sus procesos, menor será la posibilidad de fallar y mejor será su productividad. Las ventajas abarcan son:
Para poder generar modelos de machine learning es imprescindible contar con datos estructurados. Estos datos pueden ser información de los clientes, de las transacciones que realiza, de sus compras, de la información de los productos que cotizan, entre otros.
Muchas empresas no han interiorizado el gran valor que tienen los datos para la toma de decisiones del negocio y no tienen datos estructurados lo que es un costo de oportunidad inmenso. Por ejemplo, si una empresa tuviera información como la edad de sus clientes, su género, ticket promedio de compra y frecuencia de compra, a través de un modelo de machine learning no supervisado podría generar una segmentación de sus clientes que le permita ofrecerles ofertas más personalizadas según sus características.
Por otro lado, si tuviera una base de clientes que cotizaron cierto producto y de ellos quienes compraron y quienes no, a través de un modelo de machine learning supervisado se podría predecir la probabilidad de compra de ese producto y con ello enfocarse mejor en los clientes más propensos a comprar ese producto.
La analítica predictiva, basada en machine learning, nos ayuda a hacer predicciones de lo que pasará en el futuro y son útiles en el presente. Con ello se pueden tomar mejores decisiones y adaptar el negocio para generar valor.
No obstante, si realmente queremos generar el máximo valor, debemos ir un paso más allá exactamente a la analítica prescriptiva. Debemos automatizar la toma de decisiones para obtener los resultados óptimos en el futuro. Por ejemplo, si queremos saber cuál es el precio que debería tener un determinado producto, no basta con usar analítica predictiva para calcular la probabilidad de compra dado el precio. También deberíamos construir un modelo prescriptivo que nos permita saber cuál es el precio que maximiza la utilidad y volumen del producto y con ello optimizar el valor.
De esta forma, a través de modelos de optimización, podemos solucionar problemas reales de los negocios y automatizar la toma de decisiones, ya que estamos tomando la mejor decisión posible dado la información que tenemos disponible.
La ciencia de datos se ha convertido en un campo en continua demanda. En la actualidad es necesario contar con profesionales que comprendan mejor los datos y puedan aplicar sus conocimientos en el negocio.
En Continua podrás aprender a acelerar la automatización y digitalización en tu organización adaptando soluciones a partir del uso de la tecnología y la aplicación de herramientas digitales. Conoce más aquí
(1) Harvard Business: “Data Scientist: The Sexiest Job of the 21st Century”. Tomado de: Harvard Business Review (hbr.org)
(2) IBM: “What is machine learning?". Tomado de: IBM Cloud Education (ibm.com)
(3) Visual Capitalist: “The 20 Fastest Growing Jobs in the Next Decade". Tomado de: Visual Capitalist (visualcapitalist.com)