Tema 5: Correlación: caso continuo

Los alumnos del curso de humanidades “Ciencia para pensar mejor” podéis dejar aquí comentarios, observaciones, preguntas… todo lo que penséis que puede aclarar cuestiones o aportar algo a los demás.

Un Comentario

  1. Gonzalo Sofío Toro

    Buenas tardes a todos;
    El otro día en clase empezamos el tema 5, en el cual estuvimos aplicando la correlación el el caso discreto al caso continuo. Al final llegamos a un parámetro bastante significativo al que llamamos coeficiente de correlación (r), que quedaba definido como la covarianza de x e y dividido entre las desviaciones típicas de ambas.
    En una de mis asignaturas este año estamos utilizando este parámetro «r» para calcular algo que seguro les llamará mucho la atención. Estoy en 4º de biomédica y tengo una asignatura llamada Dispositivos e Instrumental Médico. Es una asignatura muy enfocada al laboratorio, en la cual tenemos un proyecto que consiste en fabricar un pulsioxímetro.
    Un pulsioxímetro es un aparato que, al ponértelo en el dedo, es capaz de medir tu pulso y tu saturación de oxígeno. Este aparato funciona a partir de la atenuación de la luz a través del dedo de dos diferentes LEDs: uno rojo y otro infrarrojo. No entraré mucho en detalles, pero investigando la relación entre la atenuación de ambas longitudes de onda somos capaces de calcular estos parámetros. Es decir, obteniendo el valor de r para una gráfica de la atenuación del rojo y la del infrarrojo, y desnormalizando este valor, podemos saber la saturación de oxígeno del paciente (el pulso se obtiene de otra forma, no con r).
    Espero que os haya resultado interesante esta aplicación del coeficiente de correlación que estamos utilizando en mi curso, demostrando que este parámetro puede llegar a ser muy útil.
    Gracias por vuestra atención, que tengáis un buen fin de semana.

  2. Mikael Daher Kokkonen

    Hola,
    quería hacer una breve explicación respecto al tema de correlación visto la pasada semana en clase, haciendo referencia especial al nombre de la asignatura «Ciencias para pensar mejor». Muchas veces abstraemos información a partir de unos datos que nos inducen a aciertas asociaciones, como por ejemplo que una persona con un IMC alto tiene sobrepeso.

    Retomando el caso de la altura vs el peso de los alumnos de esta asignatura el año pasado, vimos una correlación que analizamos en cierta medida: las chicas tienden a pesar y medir menos que los chicos, la contribución en la covarianza de datos como el chico que media casi 2m y pesaba unos 110kg, etc. En sistemas de este tipo, creo que es conveniente alejarse de conclusiones que muchas veces tendemos a sacar en vista de algunos datos, como por ejemplo asociar sobrepeso a una persona que se encuentre bastante dispersa (alejada de la recta promedio), digamos que mide 170cm y pesa 88kg. Más allá de lo matemático, hay que tener en cuenta factores que no se pueden expresar con números, como la constitución fisica de las personas. Esta persona del ejemplo, que por su medida y peso se puede asociar a una persona obesa, podría ser perfectamente un culturista. Luego, no es obeso.

    La conclusión a lo explicado es que debemos pensar siempre que estamos ante un mero modelo matemático y que no siempre podemos extrapolar información a base de una herramienta matemática. Es fundamental saber que un dato no siempre conlleva una asociación que a priori se pueda otorgar a este, pues debemos saber fundamentalmente qué estamos analizando y cómo es en esencia este dato realmente.

  3. María Cuadrado Prado

    Buenas tardes,

    Indagando acerca del concepto regresión a la media, y con lo comentado en clase, me parece un concepto muy interesante, que deberíamos tener en cuenta en nuestro día a día, para llevar mejor nuestra vida y para evitar posibles frustraciones. Si lo tenemos en cuenta estoy segura que podemos ser mucho más felices de forma prolongada y sobretodo sostenida en el tiempo. De ahí la importancia que veo a tener este concepto presente en nuestro día a día ya que normalmente tendemos a los extremos en nuestra vida.
    Pensando, me he planteado este ejemplo que me podría pasar en una situación de lo más cotidiana:
    si estoy en el trabajo y el éxito de una operación ha sido gracias a mi, estoy pletórica y llego a poder sentir que soy esencial en éste. Por lo tanto, puede que me asciendan dentro de poco o por lo menos se que no cabe la posibilidad de que me despidan.
    Por el contrario, si mi operación es un fracaso y en parte es por mí, ese día seguramente estaré frustrada y con temor a que alguien decida que no soy válida para ese trabajo.
    Este caso, es debido a no aplicar el concepto estudiado, y en consecuencia puede ocasionar inestabilidad anímica en nuestra vida que provoca que no podamos conseguir la felicidad sostenida que al final buscamos e incluso llegar a desequilibrios emocionales que en algunos casos puedan llegar a derivar en enfermedades mentales como la depresión.
    Por lo que debemos de darle gran importancia a este concepto y tenerlo muy presente.

    Por último, os adjunto el siguiente texto que he encontrado y que me ha parecido una buena conclusión:
    “Es decir, tu talento real es la media que sostienes en el tiempo, no tu último suceso extremo. Es fácil buscar explicaciones causales y predicciones intuitivas, asumimos que alguien tiene talento o es un genio, o está acabado o no durmió anoche, basándonos en la última observación. Buscamos causas, la aleatoriedad no las tiene. Nos basamos en el hoy, y hoy no explica una vida. Lo importante es la suma de todo, con tus buenos, medios y malos días. Un caso no puede explicar una tendencia. Por tanto, la próxima vez que lo hagas terriblemente mal o brillantemente bien, no dejes que te afecte, espera a ver cómo lo haces las siguientes veces. O mejor, valora cómo lo has hecho en un amplio periodo de tiempo, ese es realmente tu desempeño.”
    Página web:
    https://hipertextual.com/2017/03/regresion-a-la-media

  4. DAVID MESA LOPEZ

    Buenas tardes, hoy hemos visto en clase como una distinta desviación típica puede hacer completamente diferente dos distribuciones con la misma media. Una de las graficas vistas en clase ha sido sobre el controvertido tema entre la diferencia de distribución del CI en hombres y mujeres. Quería compartir con vosotros una pagina que analiza brevemente las consecuencias que vemos dia a dia de esta distribución, y como afecta socialmente a los diferentes géneros (temas como el techo laboral o la enorme diferencia que hay de hombres vagabundos y mujeres vagabundas).

    http://www.burbuja.info/inmobiliaria/conspiraciones/779714-curva-distribucion-cociente-intelectual-explicar-hombres-comenten-mas-crimenes-y-ganan-mas-dinero.html

    ¿Que opináis sobre el tema?

  5. JOSE ROMERO SOLIS

    Buenas tardes,

    Me ha parecido muy oportuno aprovechar el tema de la correlación para enlazar con lo que ahora tanto se habla y todos conocemos: Big Data.

    Se puede decir que el Big Data es la herramienta que debe gobernar la investigación y el desarrollo del conocimiento. En el post que he puesto en la parte inferior, Sergio Parra nos menciona que un investigador no debe olvidar que correlación no implica casualidad. Esto quiere decir, que dos hechos sucedan al mismo tiempo no significa que necesariamente uno sea causa del otro. Esta máxima también es conocida como CINAC (Correlation is not a cause) y nos repite en varias ocasiones que olvidarlo puede llevarnos a conclusiones erróneas.

    Existen muchos ejemplos sobre esto. Se menciona el controvertido tema de la homeopatía, donde los consumidores de un tipo de producto tienen una cierta mejoría en su patología y se atribuye al producto tomado. Cuando la mejora podría haber sido de manera espontanea.

    En la web Spurious Correlations hay curiosos ejemplos de conclusiones absurdas, por ejemplo, «la inversión de USA en ciencia,espacio y tecnología es la causa de los suicidios por estrangulamiento» tiene una correlaciona muy grande pero no significa gran cosa.

    Aun asi, la búsqueda de correlaciones es la revolución del conocimiento de hoy en día. Google es capaz de mostrar el contenido que estas buscando, corrigiendo el termino de búsqueda, todo esto, basándose en coincidencias.

    https://www.xatakaciencia.com/psicologia/correlacion-no-implica-causalidad-hay-que-decirlo-mas

  6. RUTH BORQUE GALLEGO

    Buenas tardes,

    Como ampliación de lo que hemos hablado hoy en clase sobre la distribución normal en grandes espacios muestrales (población sobre la que se realiza la estadística), quería añadir que cuando el número de muestras no es tan elevado en
    ocasiones se utiliza la distribución t-Student. Su forma es parecida a la de una distribución normal pero más ancha y esta anchura depende del tamaño del espacio muestral de manera que, conforme se aumenta el número de muestras, más se parece a una normal.

    La distribución t-Student es muy utilizada en análisis estadísticos, como decidir si hay diferencias estadísticamente significativas entre dos medias muestrales cuando n < 30.

    • Rubén García Orgaz

      Buenas noches compañeros.
      Como habéis comentado alguno de vosotros, a mí también me ha parececido muy interesante el tema de regresión a la media, y después de leer algún comentario y pensarlo me ha producido un sentimiento de cierta pena. Este hecho se debe a que dos datos que tengan un valor extraordinario tienden a generar datos completamente corrientes, como era por ejemplo el caso comentado en clase de la altura de los padres con respecto al de los hijos.
      La sensación que me produce este fenómeno es de cierta pena debido a que al darse este hecho de regresión a la media, resulta realmente complicado generar de forma continuada hechos extraordinarios.
      Un saludo

  7. Silvia Andueza

    Buenas noches,

    Hoy en clase hemos dado el tema de regresión a la media y he estado buscando información sobre ello.
    Este término fue usado por primera vez por Francis Galton, quien descubrió una relación lineal entre la altura de padres e hijos donde se dio que los hijos de padres altos son, en su mayoría, más bajos que sus padres y viceversa, lo comentado en clase. A este hecho por aquel entonces le llamaron regresión hacia la mediocridad, una tendencia natural de puntuaciones extremas a regresar a sus valores medios cuando se repite la medición.

    Podemos encontrar numerosos ejemplos de regresión a la media en nuestra vida cotidiana. Por ejemplo en la universidad, si has hecho un examen y te ha salido muy bien, esperas que el segundo te salga igual o mejor, sin embargo, al regresar a la media, lo normal es que te salga peor. Otro ejemplo muy frecuente ocurre con las películas, siempre hemos escuchado ‘segundas partes nunca fueron buenas’, analizamos está frase haciendo referencia al dinero recaudado por las películas y observamos el fenómeno de regresión a la media, sí la primera tuvo una alta recaudación la segunda parte tendrá una recaudación más baja, pero esto mismo ocurre al contrario siendo las segundas partes mejores que las primeras.

    Un saludo.

  8. MARIA PEÑA GUTIERREZ

    Hola a todos,
    Hoy en clase hemos estado hablado de Francis Galton, quien explicó el fenómeno de la regresión a la media, usó por primera vez la distribución normal, describió las propiedades de la distribución normal bivariada y su relación con el análisis de regresión y también introdujo el concepto de correlación posteriormente desarrollado por Pearson y Sperman.

    De toda la información que he leído acerca de Galton, cabe destacar su obsesión por medir todo lo medible y lo no medible. De ahí que cuente con múltiples investigaciones y trabajos, muchos de ellos publicados en la revista Nature. Aquí cuento algunos de los que he encontrado más peculiares, entre los que se encuentra el “mapa de la belleza” (citado en clase) en el que Galton caminando por las principales calles de las grandes ciudades con un contador en su bolsillo, registraba en secreto si las personas que pasaban a su lado eran guapas, medianamente bellas o feas.

    Otra de las investigaciones estadísticas más peculiares que he encontrado han sido aquellas sobre la eficacia de las oraciones: uno de los trabajos de Galton que más polémica causó fue el estudio de la eficacia de rezar a Dios. Dado que los miembros del clero se pasaban la vida rezando, Galton intentó correlacionar ese hecho con una expectativa de vida más prolongada. Tras un exhaustivo estudio a partir de cientos de datos biográficos, Sir Francis llegó a la conclusión de que tanto médicos como abogados tendían a morir más tarde que los clérigos lo que hizo que pusiese en duda el poder de la oración.
    Pero hay más: en 1897 publicó en la revista Nature un trabajo sobre la longitud que debía tener una soga para que, durante el ahorcamiento, rompiera el cuello de un criminal sin decapitarlo.

    Además, estudió la duración de las penas de prisión mostrando ciertos patrones subconscientes en las sentencias de los jueces. De 10.000 sentencias que estudió descubrió preferencias por condenas de 2, 3, 9, 12, 15, 18 y 24 meses, no hallando condenas de 17 y pocas o muy pocas de 11 o 13. También mostró que las penas impuestas no guardaban correlación con la gravedad del delito.

    En definitiva, Francis Galton cuantificaba todo lo que se ponía por delante de él.
    Espero que os haya resultado interesante.

  9. Christian Durán González

    Buenas noches,

    Hoy en clase estuvimos discutiendo sobre las muestras y cómo deberíamos escogerlas para poder realizar una encuesta. He estado investigando sobre el tema y he encontrado bastante información.
    Como vimos en clase, obviamente si realizamos más muestras la precisión es mayor, debiendo tomar muestras aleatorias y no de un grupo en concreto. Buscando información en Internet encontré el siguiente enlace en el que explica una forma simple de poder realizar una encuesta de una forma razonablemente fácil de entender. https://www.google.es/url?sa=t&rct=j&q=&esrc=s&source=web&cd=4&cad=rja&uact=8&ved=0ahUKEwizw-zcq4rXAhXBVhoKHUJ8AOYQFgg_MAM&url=https%3A%2F%2Fes.surveymonkey.com%2Fmp%2Fsample-size%2F&usg=AOvVaw3M4NoAnaebMhBgHDKfdwWv
    Sin embargo, también pude encontrar una fórmula para poder calcular cuál debería ser la muestra total que deberíamos de realizar en función de la precisión que deseamos tener (obviamente será máxima) y de la población total sobre la que va la encuesta (si es sobre las elecciones generales en España, la población total será cerca de 47 millones de habitantes que tiene el país). Aquí dejo el enlace: https://www.questionpro.com/blog/es/como-determinar-el-tamano-de-una-muestra/

    Espero que la información os sea útil.

    Muchas gracias.

    Un saludo,

    Christian

  10. Adrián Medina González

    Buenos días,

    Me ha resultado muy interesante el concepto de regresión a la media y he podido relacionarlo con varios aspectos de nuestra vida cotidiana, en los cuales achacamos los resultados a ciertas cosas aunque no necesariamente tiene por que ser así.
    En primer lugar lo he relacionado con las enfermedades. Cuando cogemos un resfriado mismamente, llegamos a un punto en el cual nos encontramos fatal, y es entonces cuando empezamos a tomar algún tipo de medicación. Podemos decir que en este punto nos encontramos en el »extremo» de la enfermedad. Al día siguiente empezamos a notar cierta mejoría e inmediatamente se lo achacamos al medicamento que hemos tomado. Es cierto que el medicamento haya podido tener algo que ver, pues para eso son, pero estoy seguro que el concepto de regresión a la media también tiene mucho que ver, pues si estás en el peor momento de la enfermedad, lo más normal es que empieces a recuperarte en días posteriores.
    Otro ejemplo con el cual he podido relacionar este concepto es con el mundo del deporte. Cualquier equipo y cualquier deportista pasan a lo largo de su carrera por momentos buenos y momentos malos. Cuando se tiene una racha de malos resultados, es muy común ver como se produce un cambio de entrenador. Con el nuevo entrenador los resultados empiezan a mejorar, e inmediatamente volvemos a achacar estos resultados al trabajo del entrenador, lo cual puede ser cierto, pero con casi toda seguridad esta mejora se deba a la regresión a la media. Lo mismo pasa con una racha positiva, cuando se lleva una buena racha de todo victorias y de repente se empiezan a dar algunas derrotas consecutivas, tendemos a pensar que esto se debe a la falta de ganas, relajación, etc., pero nada más lejos de la realidad, volvemos a tener presente el concepto de regresión a la media.
    A continuación dejo un enlace que he encontrado en el que se trata un ejemplo parecido al expuesto por el profesor en clase, en este caso habla de los niños deprimidos tratados con una bebida energética mejoraron tras un periodo de seis meses:
    https://hipertextual.com/2017/03/regresion-a-la-media

    Por último me gustaría dejar también un enlace relacionado con el ejemplo visto en clase que relacionaba la supervivencia con el CI. Habla de las correlaciones espureas (variables que correlacionan entre sí, pero que no tienen relación lógica), y expone algunos ejemplos, algunos de ellos incluso los hemos visto en clase:
    http://www.lne.es/blogs/psicoactiva-mente/margarina-divorcios-y-otras-correlaciones-espureas.html

    Un saludo.

    • Manuel Fernandez Blanco

      Buenas tardes Adrian,
      He leído tu comentario y me ha resultado muy interesante, ya que veo que hablas de la regresión a la media como solución a los problemas. En mi opinión, yo creo que hay que ser un poco cautos y no dar todo el mérito a la regresión a la media. En el ejemplo de la enfermedad, justificas la mejoría con la regresión, «como ya he alcanzado el punto maximo de la enfermedad, pues mañana tengo que estar algo mejor». A mi, me resulta incomprensible pensar que voy a estar mejor porque no hay posibilidad de estar peor ya que nunca vamos a saber cuando vamos a estar peor de la enfermedad ni cuantos dias vamos a estar en ese punto maximo de la enfermedad.
      Lo mismo pasa en el ejemplo de entrenador-jugador, ya que para mi el entrenador que llega no hace milagros pero si puede cambiar los habitos del jugador, pero si esos hábitos siguen sin funcionar no va a empezar a ganar el jugador y seguirá en una mala racha.
      Por eso creo que es un error caer en la trampa y no justificar las diferentes mejorías o cambios con la regresión a la media.

  11. Alfonso de la Vega Esteban

    Buenas noches compañeros:
    El martes pasado en clase comentamos un poco el tema de las encuestas. Vimos un ejemplo de una revista de tendencia republicana, que en 1936 trató de predecir los resultados de las elecciones presidenciales de Estados Unidos realizando una encuesta entre sus lectores. Evidentemente, le dieron la victoria al partido republicano, y por supuesto se equivocaron. Cometieron un sesgo clarísimo en la muestra.
    A partir de ahí me planteé por qué motivo las encuestas electorales fallan tanto últimamente. Los ejemplos más claros que recuerdo son la votación por el Brexit y las elecciones de EEUU en las que se impuso Donald Trump. En mi caso, nunca me ha preguntado nadie por mi intención de voto, pero siempre he pensado que si me preguntaran, ¿por qué iba a contestar la verdad?¿por qué iba a contestar siquiera? Sin embargo, suponiendo que la gente sí que contesta, sí que deberían conseguir una muestra bastante amplia y variada como para conseguir una mayor precisión en sus predicciones.
    Uno de los motivos de fallo puede encontrarse en algo de lo que ya hablamos en el primer tema: el efecto halo. Puede que la gente busque coherencia entre su respuesta y quien lo pregunta. Es decir, no dicen lo verdad, dicen lo que les puede hacer quedar mejor.
    De todas formas os dejo aquí el enlace a un artículo que analiza este tipo de encuestas por si queréis mirarlo:
    https://blogs.20minutos.es/ciencia-para-llevar-csic/2016/05/05/por-que-fallan-las-encuestas-electorales/
    Gracias por la atención y mucha suerte con el examen de mañana.
    Un saludo.
    Alfonso

  12. Gonzalo Gómez Ortega

    Hola a todos,
    en la última clase estuvimos hablando de la regresión a la media, y he encontrado información acerca de ello que me gustaría comentar.
    En primer lugar, definir este concepto como el fenómeno por el que las cosas tienden a igualarse desde los extremos, es decir, si una variable es extrema en la primera medición, tenderá a acercarse a la media en su segunda medición.
    Este término puede llevarse, por ejemplo, al mundo del cine, en el que siempre se ha dicho aquello de «las segundas partes nunca fueron buenas». Si hacemos la representación en unos ejes cartesianos la comparación de la taquilla que tuvo la primera parte de una película frente a la de su segunda parte, probablemente se pueda observar que, en promedio, la taquilla de la segunda fue inferior. Sin embargo, también ocurre lo contrario, «segundas partes que fueron mejor que la primera».
    Este concepto, según Rousseeuw (estadístico Belga), también se ve en la calidad de diferentes publicaciones a revistas. Un artículo, si antes de ser publicado, ha recibido una crítica muy positiva. Sin embargo, cuando se emita un nuevo juicio, en promedio, va a ser menos positivo que todos los anteriores. Lo que dice Rousseeuw al respecto, es que cuando un artículo está catalogado como «bueno», la calidad del mismo va a ser menos de que lo realmente el editor piensa.
    Espero que estos ejemplos os hayan resultado de interés y hayan ayudado a entender la regresión a la media.

    Un saludo.

  13. Nina Sonneborn

    Hola a todos,
    Quiero elaborar en el tema de la regresión a la media. Hemos discutido en clase el ejemplo de altura de hijos. Me gustaría hablar de otra aplicación de este fenómeno que describe Daniel Kahneman en su libro, que es el talento y el suerte. Se propone las ecuaciones:
    Éxito = talento + suerte
    Gran éxito = un poco más de talento + un cúmulo de suerte
    Describe dos jugadores de golf en una competencia: Uno que hace muy bien en día 1 (golfista A), y otro que hace mal el día 1 (golfista B). Lo más probable es que no es una diferencia en talento, si no de suerte. Por eso, es probable que en el día 2, nos vemos algo que es menos intuitivo en sus puntuaciones. Lo más probable es que golfista A continua a hacer bien, pero menos bien que el día 1, y que golfista B continua a hacer mal, pero mucho mejor que el día 1: los dos acercarán a la media (por regresión a la media).
    Kahneman también explica el ejemplo famoso de «la maldición del Sports Illustrated,» el patrón de cuando el imagen de alguna deportista aparece en la portada de Sports Illustrated, su temporada siguiente casi siempre está peor. A la gente le gusta atribuirlo al exceso de confianza, presión, etc.. Pero de hecho, solo es la regresión a la media.

    Me interesa este aplicación del tema porque demuestra como siempre queremos asignar causas: el éxito es por el talento, temporada malo es por el presión, pero en la realidad, mucho que asignamos causas solo es por la suerte/por el azar.

    • Nina Sonneborn

      También me gustaría introducir un enlace divertido relacionado con regresión y el coeficiente de correlación. Es un juego de estimar el coeficiente de correlación. Es divertido y se ayuda a entender la fuerza de una correlación por una gráfica. http://guessthecorrelation.com/

  14. Maria Cuadrado de Marcos

    ¡Hola a todos!
    Como hemos estado viendo en clase estos días, nuestra vida diaria está llena de correlaciones, pero he querido investigar más a fondo y relacionar esto con el mundo ingenieril, concretamente, con algo muy sonado en los últimos años en el campo de las telecomunicaciones, el “Big Data”.
    Supongo que todos sabréis lo que es, pero lo explico por si acaso. El “Big Data” es el proceso de almacenamiento masivo de datos y su análisis para encontrar información ocultas, buscar recurrencias y correlaciones entre esos datos. Por ejemplo, las funciones de Google muchas de ellas utilizan esta tecnología, desde el autocorrector, la búsqueda por voz, las respuesta intelegentes de Gmail…
    Dicho esto os voy a contar algunos ejemplos que he buscado en los que se ve como actúa la correlación:
    1.Hubo una temporada que las compañías líderes en telefonía, sólo sacaban ofertas para los clientes nuevos y entonces se empezó a notar cierto descontento entre los viejos clientes. Por eso, T- Mobile, una compañía líder en telefonía a nivel mundial, decidió invertir en el Big Data, recogió información de cada cliente sobre como era su consumición, minutos que utilizaba de llamadas, megas de Internet que gastaba, SMS que enviaban y a raíz de esa información sacaban ofertas personalizadas, según el caso.
    2. Coca cola utiliza el Big Data también ¿Os parecerá sorprendente no? Pues sí, lo utilizan para vender más, relacionan la región/país para el que van vender los productos y hacen los productos en función como les gusta en esa región, de esta manera podrán satisfacer más al cliente.

    Espero que os haya resultado interesante.
    Un saludo.

  15. Christian Durán González

    Buenos días compañeros,

    La regresión a la media que vimos en clase me ha llamado mucho la atención porque tenía cierta curiosidad sobre si algunos aspectos cotidianos realmente la cumplían o no. Un simple ejemplo es que si tienes un mal día o un buen día, seguramente los posteriores serán normales cumpliendo la regresión a la media, como en este artículo que os enlazo se comenta:
    https://hipertextual.com/2017/03/regresion-a-la-media

    En este artículo también se explica la regresión a la media con otros ejemplos como que los niños deprimidos tratados con una bebida energética mejoraron tras unos meses. En este caso también se cumple la regresión a la media porque se trata de un grupo que está en un extremo y que por estadística es cuestión de tiempo que se acerque a la media aunque no se haga nada, así que cuando nos dicen que la bebida energética ayuda a aquellos con depresión nos mienten. De hecho en el artículo se comenta que para saber si realmente se cumple la regresión a la media se debe tomar un grupo de control al que no se le da nada y así podemos observar que se cumple la regresión a la media porque se tomen algo o no se acaban a cercando a la media y por tanto cumplen la regresión a la media.

    Espero que os resulte interesante mi comentario.

    Un saludo,

    Christian

  16. DANIEL GOMEZ ILLANES

    Buenas noches, me gustaría dejar un último comentario valorando un poco la asignatura ya que no me dio tiempo a realizarlo durante el examen. En general me han parecido interesantes los contenidos de la asignatura y la forma en la que se han impartido. Me parece que una asignatura así es necesaria para pensar un poco sobre lo que se presupone que sabemos y darle una vuelta más para darnos cuenta de la verdadera razón de ser de algunas cosas. Temas como el de las relaciones entre magnitudes me han parecido interesantes para ayudar a pensar mejor sobre nuestro entorno y como éste funciona. En general, como ya he dicho, me ha parecido una asignatura interesante al la vez que necesaria.

    Un saludo

  17. Elena López Gil

    Hola a todos,

    Intentando entender un poco mejor el último tema de la asignatura , he encontrado este articulo sobre la regresión a la media que además ayuda a entender una de las preguntas del examen, en la que se nos pedía calcular la altura esperada de los hijos de los padres altos:
    https://elpais.com/diario/2008/12/21/negocio/1229866887_850215.html

    Como nos explica el artículo, ni los hijos de padres altos son más altos ni los de padres bajos son más bajos. Este ejemplo se aplica a otros más globales, sobretodo relacionados con la política y en este caso en concreto, con el caso Madoff.
    Este caso me ha ayudado a comprender la importancia de saber interpretar bien los hechos y guiar mejor mis pensamientos sobre los hechos que nos rodean.

    Espero que os resulte interesante.
    Saludos a todos

  18. JuanMS

    Como en los otros capítulos ordeno los comentarios por temas:

    ***Sobre el coeficiente de correlación

    Gonzalo Sofío, efectivamente no entras en muchos detalles, pero no me extraña que uses el coeficiente de correlación; en el fondo, lo estamos usando siempre que hay un ajuste por mínimos cuadrados, como vimos en clase, y eso se hace constantemente.

    Nina Sonneborn, me ha encantado el juego de estimar el coeficiente de correlación, lo recomiendo a todos los que habéis participado en el curso.

    Mikael Daher, es verdad que cuando hacemos una gráfica y calculamos el coeficiente de correlación estamos sólo haciendo un modelo matemático (estadístico) y no podemos sacar conclusiones sobre los individuos. Pero eso no significa que la información que nos da el modelo no sea útil para estudiar el patrón general y las relaciones entre variables, y esas relaciones son las que nos permiten a menudo entender las cosas.

    ***Sobre regresión a la media

    María Cuadrado Prado, es una buena conclusión práctica para quedarse como moraleja sobre la regresión a la media. Como dice el título del enlace que nos traes, “Regresión a la media o por qué después de hacerlo muy bien lo harás mal y es normal”. Quizá esta conclusión dé ánimos a Rubén García, que sacaba un mensaje pesimista.
    En relación a esto, os recomiendo el comentario de Nina Sonneborn. La “ecuación” que nos traes:
    Éxito = talento + suerte
    Gran éxito = un poco más de talento + un montón de suerte
    …es la que Kahneman menciona como su favorita (aquí podéis ver la página de su libro) y cuando lo leí la primera vez me pareció un poco decepcionante (al fin y al cabo, yo habría mencionado las ecuaciones de Maxwell, soy físico 🙂 ). Pero pensando sobre ello, me parece que contiene una gran cantidad de sabiduría que nos hace ver la vida de otra manera.

    Silvia Andueza, tienes razón: que “segundas partes nunca fueron buenas” es la regresión a la media en acción, y el dicho tiene razón porque generalmente sólo se hace una segunda parte si la primera ha tenido mucho éxito (por lo que estadísticamente es probable que la segunda tenga menos). Gonzalo Gómez también pone el mismo ejemplo, y menciona a Rousseeuw (estadístico Belga) sobre la calidad de diferentes publicaciones a revistas. ¿Podrías ponernos la refencia?

    Adrián Medina, yo creo que el 50% por lo menos de los comentarios deportivos nos los podríamos ahorrar simplemente invocando la regresión a la media… Creo que la crítica de Manuel Fernandez se basa en no apreciar que aquí estamos hablando en sentido estadístico. Es claro que nunca sabemos cuándo estamos en el peor punto de una enfermedad, pero sí que cuando nos sentimos muy mal estamos muy lejos de nuestro nivel medio de salud, y que, salvo que vayamos a morir o sea una enfermedad crónica, acabaremos alcanzando de nuevo ese nivel. Así que estadísticamente hay más probabilidades de que mejoremos que de que empeoremos, simplemente por lo improbable de nuestra situación en ese momento.

    Christian Durán, el artículo que enlazas está bien pero ya lo habían aportado dos compañeros antes… tenéis que leer antes que enlazar 😉

    Elena López, el papel de la regresión a la media en los mercados financieros es muy interesante y no lo hemos llegado a tocar, así que es oportuno el artículo que nos traes.

    ***Sobre el big data

    José Romero, por muy cierto que sea que “correlación no implica causación”, el caso es que la causa te interesa para entender las cosas, pero si sólo quieres aprovecharte de ellas, te vale con conocer la correlación… por eso tantas empresas y gobiernos están entusiasmadas con el big data.

    Maria Cuadrado de Marcos, los ejemplos que nos traes son sólo dos entre miles… Técnicas como la del reconocimiento facial se basan en big data (¡por eso los líderes son empresas chinas, que tienen a su disposición 700.000 de fotos de rostros cedidos por el gobierno). Ahora se dice que los datos son el petróleo del siglo XXI, lee por ejemplo esto.

    ***Sobre otros aspectos estadísticos

    David Mesa, el autor que empieza el hilo que enlazas parte del dato de que la varianza de la distribución de CI es mayor en los hombres; dato que, por lo que sé, está comprobado con mucha fiabilidad (sobre todo por la famosa encuesta escocesa de los años 30 que os enlacé en las transparencias). Que las consecuencias que saca estén justificadas me parece más dudoso sobre todo en algunos casos, porque el CI no lo explica todo, y aunque esté correlacionado con más sueldo, por ejemplo, la correlación (ya lo vimos) no es tan grande. En cualquier caso, creo que es un dato que se debería conocer más para añadir un poco de sensatez a estos debates tan polémicos.

    Ruth Borque, hay varias distribuciones que en el límite de n grande tienden a la gaussiana… la verdad es que cuando se entra en detalles la estadística puede ser bastante líosa, pero por fortuna para casi todo puede sacarse una idea bastante correcta con los conceptos más simples que hemos visto en clase.

    María Peña, todo un personaje Francis Galton, hoy bastante olvidado. Te ha faltado poner una referencia, por ejemplo ésta, que seguro que has usado.

    Christian Durán, gracias por los enlaces sobre el tamaño de una muestra en función del margen de error que queremos admitir. Los leeré con calma, porque entran en más detalles de los que hemos dado nosotros y me gustaría saber los fundamentos que manejan.

    Alfonso de la Vega, un tema muy interesante y de mucha actualidad el de por qué fallan las encuestas. El enlace que aportas está bien, y aunque no se moja demasiado, trae un dato que me ha sorprendido: que la mayoría de las encuestas en España siguen siendo telefónicas y consultando sólo números fijos. En el caso de, por ejemplo, Trump, yo creo que había mucho voto oculto, de gente que pensaba, como tú dices, “¿y por que le voy a contar yo a este entrevistador a quién voy a votar realmente?”, por tratarse de una opción electoral no demasiado bien vista.

    ***Sobre otros temas

    Daniel Gómez, me alegro de que te haya parecido útil e interesante la asignatura, era mi objetivo. Gracias.