¡Bienvenidos una semana más a la newsletter de Innovation by Default💡!
A los mandos de la nave Álex Fuenmayor (@adefuros). Esta semana, si me acompañas hasta el final daremos un paseo por la historia reciente de la humanidad, para explorar una pieza clave de la tremenda evolución tecnologica que hemos vivido en los últimos años y que es clave en el rompecabezas de la inteligencia artificial: los datos. O mejor dicho, la tremenda explosión de los mismos que hemos vivido en la última década.
En nuestro mundo hiperconectado, somos bombardeados con datos de todas partes: nuestros hábitos de compra, preferencias musicales, elecciones dietéticas e incluso inclinaciones románticas son capturados y transmitidos a una velocidad vertiginosa. Pero, ¿qué hacemos con esta avalancha de información? ¿Cómo transformamos estos vastos océanos de datos en algo verdaderamente útil?
La respuesta radica en cómo damos sentido a los datos. En esta edición, profundizaremos en cómo los modelos de IA no solo decodifican este flujo constante de información, sino que también nos guían en la comprensión de fenómenos complejos, a veces incluso contraintuitivos, permitiéndonos navegar mejor por el mundo y tomar decisiones más informadas.
Preparaos para sumergiros en el fascinante mundo de los datos y descubrir cómo estos son la llave maestra para desbloquear los secretos de los algoritmos de inteligencia artificial eficientes y transformadores.
¿Quién necesita adivinos cuando tienes algoritmos? En esta era de inteligencia artificial y aprendizaje automático, los meteorólogos han pasado de mirar las nubes y otros fenómenos atmosféricos a interpretar gigantescos conjuntos de datos. ¡Y sí, a veces aún así se equivocan!
En un mundo donde los modelos de predicción son más valorados que las bolas de cristal, la tecnología ha dado un salto cuántico para desvelar los misterios del futuro.
Mientras los científicos de datos trabajan en sus fórmulas mágicas para predecir desde el clima hasta las tendencias del mercado, los meteorólogos del siglo XX siguen mirando por la ventana preguntándose: "¿Lloverá? Bueno, hay un 50% de posibilidad... como siempre". En este fascinante cruce entre la precisión científica y los caprichos de la naturaleza, seguimos esperando esa predicción perfecta del tiempo. Pero la realidad es que la madre naturaleza es caprichosa, y aunque nosotros, como homo sapiens conscientes, seguimos pensando que podemos controlar y planificar cada minuto de nuestra, en muchas ocasiones, insignificante existencia en comparación con el ecosistema que habitamos.
En el episodio de esta semana, repasarmos lo que hay que saber para que los datos trabajen para usted, y como los modelos nos pueden a ayudar a interpretar y proyectar la realidad. Para ello, me apoyaré en algunos ejemplos del libro The model thinker de Scott E. Page.
Pero antes de comenzar, permíteme compartir contigo algunos de los contenidos que he publicado en LinkedIn esta semana: diferentes posts en los que he hablado sobre innovación, tecnología o como seguir aprendiendo para ser un mejor profesional:
𝔼𝕩𝕡𝕝𝕠𝕣𝕒𝕟𝕕𝕠 𝕝𝕒 𝕣𝕖𝕧𝕠𝕝𝕦𝕔𝕚ó𝕟 𝕕𝕖 𝕝𝕒 𝕀𝔸: 𝔻𝕖𝕤𝕕𝕖 ℂ𝕙𝕒𝕥𝔾ℙ𝕋 𝕙𝕒𝕤𝕥𝕒 𝕖𝕝 𝕚𝕟𝕗𝕚𝕟𝕚𝕥𝕠 𝕪 𝕞á𝕤 𝕒𝕝𝕝á 🤖
𝔼𝕩𝕡𝕖𝕔𝕥𝕒𝕥𝕚𝕧𝕒𝕤 𝕧𝕤 ℝ𝕖𝕒𝕝𝕚𝕕𝕒𝕕 𝕖𝕟 𝕝𝕒 𝕚𝕟𝕟𝕠𝕧𝕒𝕔𝕚ó𝕟 𝕥𝕖𝕔𝕟𝕠𝕝ó𝕘𝕚𝕔𝕒: 𝕃𝕖𝕔𝕔𝕚𝕠𝕟𝕖𝕤 𝕕𝕖 𝕝𝕒 𝕡𝕣𝕖𝕤𝕖𝕟𝕥𝕒𝕔𝕚ó𝕟 𝕕𝕖 𝔾𝕖𝕞𝕚𝕟𝕚 👬
¿𝔼𝕤𝕥á 𝕝𝕒 𝕣𝕖𝕘𝕦𝕝𝕒𝕔𝕚ó𝕟 𝕒𝕙𝕠𝕘𝕒𝕟𝕕𝕠 𝕝𝕒 𝕚𝕟𝕟𝕠𝕧𝕒𝕔𝕚ó𝕟 𝕥𝕖𝕔𝕟𝕠𝕝ó𝕘𝕚𝕔𝕒 𝕖𝕟 𝔼𝕦𝕣𝕠𝕡𝕒?
ℝ𝕖𝕕𝕖𝕤 ℕ𝕖𝕦𝕣𝕠𝕟𝕒𝕝𝕖𝕤 𝕃í𝕢𝕦𝕚𝕕𝕒𝕤: ¿𝔼𝕝 ℂ𝕒𝕞𝕚𝕟𝕠 𝕙𝕒𝕔𝕚𝕒 𝕦𝕟 𝔽𝕦𝕥𝕦𝕣𝕠 𝕊𝕠𝕤𝕥𝕖𝕟𝕚𝕓𝕝𝕖 𝕪 𝔼𝕗𝕚𝕔𝕚𝕖𝕟𝕥𝕖 𝕖𝕟 𝕝𝕒 𝕀𝔸?
𝔻𝕖𝕤𝕔𝕦𝕓𝕣𝕚𝕖𝕟𝕕𝕠 𝕖𝕝 𝔽𝕦𝕥𝕦𝕣𝕠 𝕕𝕖 𝕝𝕒 𝕀𝔸: 𝕃𝕠𝕤 𝕄𝕠𝕕𝕖𝕝𝕠𝕤 𝔾𝕖𝕟𝕖𝕣𝕒𝕝𝕖𝕤 𝕕𝕖𝕝 𝕄𝕦𝕟𝕕𝕠 (𝔾𝕎𝕄)
Suscríbete para leer esta y otras muchas historias sobre innovación, tecnología y negocios.
Así que, ajusta tu volumen, ponte cómodo y déjate llevar por una nueva edición de Innovation by Default💡.
Los modelos nos ayudan a predecir el futuro
Los modelos, algoritmos, o como lo quieras llamar, nos ayudan a predecir el futuro. Aunque no siempre lo hacen perfectamente, como bien sabrá cualquier persona que haya sido sorprendida por un pronóstico del tiempo erróneo.
En junio de 2009, el vuelo AF 477 de Air France se estrelló en el océano Atlántico. Después de buscar en vano durante semanas, y tras un segundo intento fallido de búsqueda un año después, las autoridades francesas finalmente recurrieron al uso de modelos de datos complejos para localizar el avión. Utilizando datos sobre las corrientes oceánicas y modelado sofisticado, identificaron una pequeña región donde predijeron que el fuselaje podría estar. ¡En una semana lo habían encontrado!
El éxito en la localización del vuelo AF 477 muestra el poder de los modelos. Al simplificar el mundo en variables sencillas, los modelos reducen el ruido de fondo y identifican los factores verdaderamente significativos que determinan los resultados en el mundo real. ¿Suena un poco abstracto? Piensa en modelos del mundo real como, por ejemplo, los de la física que explican las trayectorias de los misiles, o modelos ecológicos que explican la distribución de especies en un ecosistema. Cada uno se basa en hechos observables para explicar por qué las cosas suceden de la manera en que lo hacen.
Fijémonos en otro grupo, siempre criticado por su alta tasa de fallo: los encuestadores. Recuerda las proyecciones de resultados electorales de los últimos años en España, tanto los barómetros previos como las encuestas a pie de urna, tienen una relativa credibilidad. Mi teoría es que nos gusta mentir en este tipo de encuestas.
Pero hay muchas teorías sobre por qué esto sucede, y una razón seguramente tiene que ver con los creadores de las encuestas: nosotros, los seres humanos. Somos falibles y cometemos errores, al igual que nuestros modelos. Aunque confían en la lógica y las matemáticas, los modelos son, en última instancia, creaciones nuestras y pueden estar equivocados.
Entonces, ¿cómo mejoramos las explicaciones, predicciones y diseños que proporcionan los modelos? ¿Qué podemos hacer para que sean más precisos?
Imagina que estás enfrentando una gran decisión. Si eres como la mayoría de la gente, probablemente confíes en algunos amigos cercanos. Al escuchar una diversidad de opiniones, esperas tomar una decisión mejor y más racional.
Un enfoque similar funciona con los modelos. Consultar una serie de modelos en lugar de confiar en uno único puede ser más efectivo.
De hecho, hay un teorema, el teorema del jurado de Condorcet, que confirma esta idea. Piensa en ello en términos de un jurado de la corte. Matemáticamente, se deduce que un grupo de miembros del jurado tiene más probabilidades de tomar la decisión correcta que cualquier individuo. A medida que se suman las probabilidades, las posibilidades de un veredicto mayoritariamente incorrecto disminuyen.
Esto también se aplica al modelado. Si cada modelo es correcto con más frecuencia, agregar más modelos aumenta la precisión general. El desafío es que el uso de muchos modelos diversos es más fácil de decir que de hacer. Por ejemplo, en la predicción de elecciones, podríamos construir un modelo basado en ingresos y otro en educación. El problema es que estas categorías a menudo se superponen, lo que significa que nuestra "variedad" de modelos puede ser menos diversa de lo que esperamos.
Seguramente tú también habras notado que, en lo que respecta al análisis de datos, hemos caído en una simplificación extrema, en parte la culpa es de modelos mentales muy poderosos son el Teorema de Pareto o la famosa campana de Gauss.
Aunque estos modelos son útiles, a menudo simplifican demasiado la complejidad del mundo real. Me he dado cuenta de que, al aplicar el Teorema de Pareto, que sugiere que el 80% de los efectos proviene del 20% de las causas, corremos el riesgo de ignorar el impacto significativo del restante 80% de las causas. Esta simplificación puede llevarnos a una comprensión incompleta y a tomar decisiones basadas en un análisis parcial.
Por otro lado, la famosa curva de Gauss, aunque aplicable en muchas situaciones, no siempre refleja con precisión la distribución de todos los fenómenos. Considero que asumir que la mayoría de las variables siguen una distribución normal puede ocultar importantes desviaciones y particularidades. En el ámbito educativo, por ejemplo, pensar que las calificaciones se distribuyen normalmente alrededor del suficinte puede enmascarar el impacto de factores como el entorno socioeconómico o los métodos de enseñanza en el rendimiento de los estudiantes. Esta perspectiva generalizadora puede ser perjudicial, ya que desalienta la personalización y adaptación a situaciones específicas.
Además, al observar la distribución de la riqueza, me doy cuenta de que algunas variables en nuestra sociedad no se ajustan a una distribución normal. La desigual distribución de la riqueza es un claro ejemplo de cómo los modelos simplificados pueden fallar en representar la realidad. Al ignorar estas desigualdades y asumir una distribución más equitativa, podríamos pasar por alto problemas críticos de justicia social y económica.
En conclusión, aunque veo el valor de la curva de Gauss y el Teorema de Pareto como herramientas analíticas, también soy consciente de sus limitaciones. Creo firmemente que deben ser utilizados con cautela y complementados con un análisis más detallado y contextual para obtener una comprensión más completa y precisa de los complejos fenómenos que enfrentamos en nuestro mundo.
Si te gusta lo que estas leyendo, no olvides que también tienes disponible el podcast de Innovation by Default 💡.
Más allá de la bola de cristal en el mundo de la ciencia de datos
A parte de la distribución normal, hay otra serie de modelos matemáticos que nos pueden ayudar a proyectar el futuro, en función de los datos del pasado. Así que dejame presentarte alguno de estos modelso que explicaré en detalle a continuación, como son la distribución de cola larga, la regresión lineal o la famosa función de perdida.
Además de la distribución normal, existe otro tipo importante de distribución conocido como distribución de cola larga. Esta distribución se caracteriza por una "cola" que se extiende a lo largo del eje horizontal, a diferencia de la simetría de la campana en una distribución normal. Un ejemplo común de esto es la distribución de ley de poder, que describe sistemas donde algo se amplifica o exagera, como la forma en que la riqueza genera más riqueza o la popularidad de los videos virales.
El modelo de asociación preferencial explica cómo ciertas cosas crecen en relación con su tamaño actual, siguiendo el principio de "más conduce a más", o también el conocido “dinero llama dinero”. Un ejemplo claro es el crecimiento de clubes en un campus universitario: los estudiantes tienden a unirse a clubes ya establecidos en lugar de formar nuevos, pasa lo mismo con las newsletters o los podcast, acabamos escuchando aquellos que tienen más seguidores. Así, un club o un poscast con muchos miembors o suscriptores atrae a más miembros, lo que se traduce en una ley de poder donde el crecimiento facilita más crecimiento. Este modelo ilustra cómo en ciertos sistemas, especialmente en redes sociales y económicas, los grandes se vuelven más grandes, creando distribuciones desiguales.
Así que ya sabes, recomienda esta humilde newsletter para que más se unan a nosotros y las leyes de las mátematicas empiecen a hacer su trabajo de forma efectiva.
Los modelos lineales, aunque simples, son fundamentales para explicar varios sistemas en nuestro mundo, como los efectos de la educación en los ingresos o del ejercicio en la esperanza de vida. Para determinar si un fenómeno puede explicarse con un modelo lineal, se utiliza la regresión lineal. Este método implica graficar un conjunto de valores y verificar si forman una línea recta, indicando una relación lineal entre las variables.
Por ejemplo, al investigar la relación entre el consumo de té y el riesgo de depresión, si al graficar las variables observamos que no se puede trazar una línea recta, nuestra hipótesis inicial sobre una asociación lineal debe ser descartada. Sin embargo, si los datos se alinean en una línea recta, esto indica una correlación, ya sea negativa o positiva, entre beber té y las tasas de depresión. Importante es recordar que una correlación no implica causalidad; una asociación identificada solo muestra que las variables están relacionadas, no que una causa a la otra. Para establecer causalidad, serían necesarios experimentos más detallados. La regresión lineal, por tanto, es una herramienta valiosa para sugerir vías de investigación que merecen ser exploradas más a fondo.
Imagínate que, tras una larga caminata y sin haber comido en horas, decides recompensarte con una pizza grande al llegar a casa. Tu disfrute inicial es máximo, pero disminuye progresivamente a medida que avanzas en la comida, ilustrando una función cóncava en un gráfico, donde el disfrute se curva y cae suavemente. Este concepto de función cóncava no solo se aplica a experiencias personales como comer una pizza, sino también a dominios más amplios, como la economía de escala en la producción empresarial, donde los costos unitarios disminuyen a medida que la producción aumenta.
Por otro lado, el beneficio por unidad podría curvarse hacia arriba, formando una función convexa. Estas funciones cóncavas y convexas son fundamentales para predecir cambios, especialmente en sistemas que operan de manera no lineal. Un ejemplo claro es el crecimiento económico, como se observó en Japón entre 1960 y 1970 y en China desde 2013, donde el crecimiento inicialmente alto se estabiliza en una curva cóncava. Esto demuestra que muchos sistemas importantes operan de manera no lineal y que los modelos no lineales son esenciales para entender y predecir su comportamiento.
Food for thought
Para cerrar la edición de esta semana, hablemos sobre los retos y como hemos de enfrentar a una realidad ineludible: vivimos en un mundo de complejidad creciente, donde los modelos se convierten en herramientas indispensables para desentrañar y comprender los sistemas que nos rodean. Desde la distribución normal hasta las funciones cóncavas y convexas, cada modelo ofrece una ventana única a diferentes aspectos de nuestra realidad. Sin embargo, es crucial recordar que no existe un modelo único que pueda explicarlo todo.
La diversidad y relevancia de los modelos son fundamentales para optimizar nuestra comprensión y predicciones. Ya sea analizando fenómenos económicos, comportamientos sociales o tendencias del mercado, la aplicación de múltiples modelos nos permite capturar la riqueza y variedad de los sistemas en juego. En última instancia, el poder de los modelos radica no solo en su capacidad para explicar el mundo y predecir el futuro, sino en su habilidad para expandir nuestra visión, permitiéndonos crear nuevos diseños y soluciones para los desafíos que enfrentamos.
Por lo tanto, en nuestra búsqueda de respuestas y soluciones, debemos ser meticulosos y reflexivos en la elección de nuestros modelos, combinando diferentes enfoques y perspectivas. Solo así podremos aspirar a comprender plenamente la complejidad del mundo que nos rodea y navegar con éxito en el futuro incierto que nos espera.