ArgenSteel
http://argensteel.org/

8 señales obvias sobre la manipulación de estadísticas
http://argensteel.org/viewtopic.php?f=21&t=35264
Página 1 de 1

Autor:  Neon_Knight [ Dom Jun 14, 2015 11:50 am ]
Asunto:  8 señales obvias sobre la manipulación de estadísticas

8 señales obvias que muestran la mentira detrás de la manipulación de estadísticas


Código:
http://www.cracked.com/blog/8-obvious-signs-statistics-are-lying-to-you/

Las estadísticas adecuadas son herramientas poderosas, pero las estadísticas erróneas son como hechizos mágicos: encantamientos crudos compuestos por más creencia que ciencia tratando desesperadamente de convencer a la gente de cambios en el mundo. Al igual que muchos hechizos malvados, suelen ser vistas en libros con caras en ellos. Y al igual que el Necronomicon, las redes sociales revelan la oscuridad dentro de la gente que creen conocer. Las estadísticas confunden a la gente porque el único momento en que parecen importarles las desviaciones del estándar es cuando leen cómo 50 sombras de Grey hizo mal todo lo que tiene que ver con sadomasoquismo. Encontrarían mejores consejos de vida en Mario Kart 8. Y esa es la razón por la cual debemos prepararnos para combatir estas ilusiones de mierda. A continuación, ocho formas libres de matemática para descubrir cuales números ignorar.
Código:
http://mancave.cbslocal.com/2015/02/10/6-relationship-tips-from-mario-kart-8/

8. Quién las comparte

Lo primero que hay que hacer para verificar los datos es ver quién los comparte. Esto suena muy poco científico, ya que se supone que debemos respetar los datos en lugar de parcializarlos según quién los presenta, pero éstos ya fueron parcializados por su presentación. La ciencia sólo funciona cuando usás el todo. Hay que considerar todos los resultados, no sólo aquellos que apoyan lo que nos gusta. Sin embargo, los "expertos" suelen buscar títulos que se ajusten a aquello en lo que ya creen, y luego sacan citas de contexto para verificar el poder de la CIENCIA. Es como sacar la parte más deslumbrante de un motor Lamborghini y hacer alarde de que ahora uno puede andar a 300 kilómetros por hora.

Los datos científicos apropiadamente preparados están libres de parcialidad, pero gran parte de esa preparación involucra eliminar estas parcialidades, intencionales o no. La razón de ser del análisis numérico es la de no cagarla en el momento en que nos emocionamos. Y es la razón por la cual hay que ignorar a la gente que se limpia la boca con la mano cuando comienzan a gritar que las estadísticas los apoyan. Y por más interesante que suene, deberían tomar el título del paper y leerlo en la fuente. Si un estudio realmente probó [algo], van a escuchar sobre eso en las noticias, y no en [una radio al azar].

7. Quién es la fuente

No hay un comité especial llamado "Un Estudio" conspirando para asegurarse de que sólo se les permita a los científicos eminentes lanzar gráficos de barra y porcentajes. "Un estudio" simplemente significa "un puñado de gente escribió algo". Un niño con una calculadora puede calcular algunos números con la misma facilidad, (...) pero el hecho de que use números no significa que sea inteligente. Es nuestra responsabilidad verificar la fuente antes de enojarnos por lo que dice.

La infografía promedio de Internet es una página llena de diseño gráfico, una frase sobre números, y una esquina muy pequeña, al fondo a la derecha, con la fuente escrita en color celeste sobre fondo azul. Es imposible ver quién está detrás de la cosa hasta el final. Lo cual es extraño. En la vida real, verificamos quién habla antes de escuchar su discurso entero. No evaluamos una presentación de media hora de [un problema], y recién después verificamos si se trata de [un medio importante] o [una persona cualquiera].

Primero, verificamos si la figura tiene alguna fuente. Si no la tiene, es basura. Y luego, verificamos la fuente. Puede ser la Organización Mundial para la Salud o la Liga de la Libertad Médica para Vivir Íntegramente. Una es una agencia experta especializada de las Naciones Unidas. La otra es solamente una colección de palabras cuyos redactores esperan que vos pienses que suenan bien. Y aún así, hasta el nombre más lindo puede dar pie para una cueva llena de villanos Bond. Hablar de integridad y libertad no significa que no se trate de una secta fundamentalista dedicada a la incubación y lanzamiento de plagas biológicas sobre la población civil.

6. ¿Cual es la muestra?

(...) Si al tamaño de la muestra no se le da el mismo énfasis que a los resultados, esos resultados son basura potencial. Si el tamaño de la muestra ni siquiera aparece, esos resultados son definitivamente basura creada para inundar nuestros cerebros con información engañosa y hacer que nos inclinemos hacia el lado de las opiniones del escritor en lugar de informarnos para crear nuestras propias opiniones.

A lo largo de la historia, hubo algunos estudios espectaculares de cohorte sobre décadas de médicos profesionales, esfuerzos colosales para reunir datos médicos y sociológicos de precio incalculable. También hubo desperdicios de papel potencial de baño, con estudiantes aburridos mientras caminaban una mañana soleada por el campus diciendo: "No le vamos a pedir a la gente que puede venir que lo haga, vamos a pedirles a aquellos que no entienden que esto es algo que deba pagarse y que están dando vueltas en lugar de estar en clases." Y la encuesta resultante muestra que "la gente" no necesita realmente cupones de alimento. Cuando todo lo que realmente revela es a los imbéciles involucrados en cada paso de la publicación de ese paper. Desde la fuente que pensó de esa manera, hasta quien estaba encargado de escribir eso, a la publicación que aceptó el paper por una comisión en lugar de revisión de partes.

5. ¿Cuales son los márgenes de error?

¿Qué tan grandes son las barras de error en el gráfico? Si son pequeñas, los datos pueden ser útiles; si son grandes, los datos son menos precisos pero siguen siendo útiles; y si no aparecen, los datos son basura. Los números exactos suenan más científicos, pero a nivel sociológico solamente revelan ignorancia de números. Podemos cuantificar los puntos de porcentaje preciso en los experimentos con física de partículas, pero cualquiera que diga que cualquier cosa en la escala humana es exactamente del 37.8% está tratando de conseguir su respeto recitando dígitos sagrados. No podrían calcular exactamente el 37.8% de cualquier cosa humana aún si sólo usaran una de ellas, una buena regla, y un cuchillo extremadamente afilado. El acto del corte causaría puntos extra de porcentaje ensuciando todo el lugar.

Solía compilar datos sobre la profundidad de los agujeros que los láseres hacen en los materiales. Una longitud clara bajo examinación literalmente microscópica, y los cráteres generados por láseres son la marca más definitiva que pueden hacer en cualquier cosa con tecnología moderna. Y aún así seguíamos incluyendo barras de error en los resultados. Porque no es posible medir las cosas perfectamente. Sigue siendo posible tener datos útiles teniendo en cuenta el error, pero también es posible (y mucho, mucho más fácil) engañar al mundo ignorando esto. Para más detalles, aquí hay una muy buena publicación sobre la importancia de las barras de error y un artículo secuela más detallado explicando cómo los ayudan a ustedes a evitar ser engañados.
Código:
http://berkeleysciencereview.com/importance-uncertainty/
http://berkeleysciencereview.com/errorbars-anyway/

(...) La gente asume que el no mencionar errores significa que es preciso. No mencionar ningún error significa que no quieren mostrarles los errores. Y deberían querer saber el por qué.

4. Lo "último" no significa lo "mejor"

Una forma fácil de generar títulos contrarios es actuar como si el último estudio invalidara todo el conocimiento anterior en lugar de agregar más. Los estudios no son iPhones: Los últimos no son automáticamente superiores. Si ya tienen un millón de estudios sugiriendo algo, uno que diga lo contrario no es un repentino quiebre de ese malentendido. Es hacer una declaración extraordinaria frente a todo lo que ya sabíamos, y tiene evidencia presente mejor y extraordinaria.

Van a ver esto muy seguido con la comida. Los tabloides suelen hablar sobre los huevos siendo buenos para la gente, luego malos para la gente, luego buenos para la gente, como si las gallinas estuvieran poniendo alternativamente huevos buenos y malos para joder a sus amos.

Los opositores a la ciencia (la "gente que sabe que ella revela lo que hay detrás de su mierda") intentan utilizar esto para desacreditarla. Usan estudios alternados para erosionar cualquier clase de confianza en el progreso científico, proclamando que los "ñoños" no pueden ponerse de acuerdo. Sin embargo, el cambio de opinión basado en evidencia es la razón por la cual tenemos un cerebro en primer lugar. La fe absoluta en una idea sin aceptar nueva evidencia es usar las mayores funciones cerebrales para simular el daño cerebral.

Sólo con pruebas es posible revertir presunciones previas: Desarrollar una teoría que explica los resultados, diseñar un experimento donde la presunción hace una cosa y la teoría hace otra, y llevar el experimento a cabo. Si se presume que la gravedad es realmente una especie de gremlins realmente rápidos que empujan a todos al suelo, no se puede proclamar que el 100% de los participantes (...) estén de acuerdo. Hay que diseñar un experimento. Y si se lo corre, y todo termina con un goblin gravitacional siendo empalado, entonces si, tenemos que hacer un repensamiento serio. Pero hasta entonces, quien diga lo contrario va a ser visto como loco.

3. "Hasta" no es bueno

¿Cual es la razón de ser de los números si no se pueden usar números ESCALOFRIANTES? La respuesta: Ese es el punto exacto.

(...) La razón de ser de los análisis es la de tener respuestas inmunes a la contaminación emocional. Y aquí es en donde vemos cabeceras con "hasta". ¡Esta cosa que uno hace todos los días puede incrementar el riesgo de colapso genital espontáneo hasta un 100%! Y estamos tan ocupados horrorizándonos imaginando lo que es "colapso genital espontáneo" para darnos cuenta de que "hasta un 100%" incluye todos los números que están antes. Especialmente el cero. Lo cual no es nada interesante.

"Hasta" ("Up to") es cómo la gente justifica enfocarse en las rarezas y los casos extremos, aún si eso es lo opuesto al uso de estadísticas en primer lugar. "Es verdad, las matemáticas dicen que este caso tiene menos del 0.0001% de chance de ocurrir a alguien en el mundo," dice el clickbaiter, "pero eso no asusta. Además, si no escribo un artículo sobre cada bosta que llega a mi escritorio, tendría que trabajar más para generar los artículos suficientes."

2. Matemáticas Post-Mercado

A veces los números no son lo suficientemente escalofriantes. Pero el escritor tiene una calculadora a su alcance. Así que cuando un estudio dice que sólo hay una chance de uno en un millón en el mundo para que alguien de verdad desarrolle la plaga de la sangre corrupta, el escritor multiplica eso por 7 billones de gente y LOS RESULTADOS ASUSTAN!

No importa que el factor ya esté incluido en el número original. O que la figura original fuera desarrollada por gente que sabía lo que estaba haciendo, mientras que muchas imágenes escalofriantes dando vueltas por las redes sociales eran generadas por gente que dependía de su corrector ortográfico, por más que deletrear palabras sea su único trabajo.

Si sólo se pudiera multiplicar las estadísticas por números, no necesitaríamos las estadísticas. Porque todos estaríamos muertos por miles de cosas imposibles que de repente serían mortales. En el mismo momento que un escritor comienza a explayarse sobre las estadísticas, deberían actuar como si estuvieran turbocargando el motor de su auto con algo de nitroglicerina que ellos encontraron. No están trabajando con lo que piensan que están trabajando, no entienden los términos, y no deberían ir a ningún lugar al que estén tratando de llevarlos porque todo le va a explotar en su cara.

1. Factores Basura

¿El artículo explica exactamente la probabilidad de que algo pase, o hace énfasis en lo probable que se ha vuelto? Porque eso aumenta la probabilidad de que sea basura.

[Muchos medios] suelen extrapolar títulos a partir de estudios en los cuales los factores clave suelen ser "17 personas de 4.045" y "nos da náuseas intentar deletrear correlación o causa".

[Cada vez que nos paramos, muchas cosas malas, (entre ellas, cosas trágicas, horribles y letales), tienen una gran probabilidad de ocurrencia sólo con el hecho de estar parados.] Sin embargo, toda esa charla de cuan horrible sería si pasara no cambia lo ínfima que es en realidad la probabilidad de que pase, en primer lugar. (...)

Esto se ve con frecuencia en discusiones relacionadas con la comida, donde se suele proclamar que algo triplica su posibilidad en un 0.0000001% (basándose en un metaestudio entre 200 hombres adultos que no tuvieron nada mejor que hacer más que llenar un formulario sobre comida).

Las estadísticas pueden mostrar resultados impresionantes. Operan en un nivel muy lejano a nuestra habilidad de imaginar, porque la mente humana no puede lidiar con la idea de que hay 7 billones de cualquier cosa. Sin embargo, las estadísticas son barretas matemáticas: herramientas muy útiles en las manos de científicos inteligentes, pero que también pueden ser usadas para herir gente y tomar cosas y llegar a posiciones que la gente común no debería alcanzar.

Sigan estas reglas, y van a estar protegidos de gran parte de la mierda. Si, eso incluye ignorar muchas de las cosas que se comparten online, pero eso está bien, porque la única estadística universalmente aplicable es la Ley de Sturgeon: el 90% de todo es mierda. El desafío, entonces, es buscar el 10% restante de cosas que valen la pena, y construir un mundo a partir de ello.

Página 1 de 1 Todos los horarios son UTC - 3 horas
Powered by phpBB® Forum Software © phpBB Group
https://www.phpbb.com/