(#449). AUMENTO DE CASOS DE GLIOBLASTOMA TAMBIÉN EN FRANCIA

[MONOTEMA] Como explicamos en el post anterior, la incidencia de glioblastoma creció significativamente en Inglaterra, Canadá y Estados Unidos en el periodo 1995-2015.

Hace escasos meses, en julio de 2019, la agencia pública francesa “Santé Publique France”, que actúa bajo la supervisión del Ministerio de Sanidad, publicó este informe donde se estima la incidencia y mortalidad por cáncer en la Francia metropolitana entre los años 1990 y 2015, con proyecciones hasta 2018.

Los número de casos histológicamente confirmados se han multiplicado por 4 en el periodo considerado, tal y como puede contemplarse en la figura siguiente:

Los autores del estudio hacen referencia también a la investigación realizada en Australia por Dobes et al. (2011), donde la incidencia de glioblastoma creció significativamente de 3.2 a 3.96 casos por 100000 personas/año en el periodo 2000-2008.

Los investigadores franceses plantean varias hipótesis para justificar el incremento importante de casos de este tipo de cáncer cerebral, entre ellas la de exposición a radiación electromagnética no ionizante que, como ya sabemos, incluye la radiación de los teléfonos móviles.

Todos los posts relacionados




(#448). INCREMENTO DE LA INCIDENCIA DE GLIOBLASTOMA

[REVISIÓN DE ARTÍCULO] En esta investigación publicada en Neuro-Oncology, los autores reportan la incidencia de glioblastoma, un tumor de las células de la glía, y que en otros estudios se ha planteado que pueda estar relacionado con diversos factores ambientales (como las radiaciones no inonizantes, y entre ellas el uso del teléfono móvil).

Tras estandarizar por edad, muestran los datos en el periodo 1995-2015 para Inglaterra, Canadá y Estados Unidos.

En los 3 países es evidente que la incidencia ha aumentado en el periodo considerado, siendo más moderada en Canadá y Estados Unidos con respecto a Inglaterra.

Los investigadores tratan de justificar que ese incremento de más del 100% de incidencia en Inglaterra puede ser debido a malas clasificaciones y confusión en cómo se codifica el tumor o se recogen los datos.

Así, son prudentes al concluir que ese incremento de incidencia sea debido a factores ambientales, demandando más estudios epidemiológicos al respecto.

Comentarios

Pese a que los autores sostienen que el gran incremento de incidencia de glioblastoma en Inglaterra pueda ser debido principalmente a factores de registro, y son muy prudentes a la hora de posicionarse por cualquier explicación ambiental, lo cierto es que estos datos muestran claramente que la incidencia de este tumor ha subido en los 3 países analizados.

Dado que es un tipo de tumor cerebral (aunque también puede desarrollarse en la médula espinal), y que se ha asociado al uso del teléfono móvil, aquí tenemos una evidencia importante de que sí que hay datos que indican un incremento de cáncer desde los años 90.

Ir más allá en la asociación requiere de futuras investigaciones y de prudencia, lo que es mucho más científico que decir que no hay datos que muestren que ciertos tumores cerebrales hayan aumentado desde la diseminación de los teléfonos móviles.

LEE EL ARTÍCULO ORIGINAL AQUÍ:

Davis, F. G. et al.  (2019). Glioblastoma incidence rate trends in Canada and the United States compared with England, 1995-2015. Neuro-Oncology, doi: 10.1093/neuonc/noz203

 
Indicadores de calidad de la revista*
  Impact Factor (2018) Cuartil Categoría
Thomson-Reuters (JCR) 10.091 Q1
ONCOLOGY
Scimago (SJR) 4.098
Q1 ONCOLOGY

* Es simplemente un indicador aproximado para valorar la calidad de la publicación

Todos los posts relacionados




(#446) RENDIMIENTO EN BASE A VICTORIAS PRODUCIDAS POR LOS JUGADORES

[MONOTEMA] El índice PTC se construye en base a los factores que determinan la producción (FDP) en cada partido. Pasar de FDP a PTC se hace mediante una relación de equivalencia, por lo que las unidades de PTC no tienen sentido en sí mismas, pero sí a nivel relativo, por supuesto, es decir, para comparar jugadores.

En cualquier caso, y quizá perdiendo un poco de rigor, pero ganando facilidad interpretativa, hay una forma de convertir los valores de PTC a victorias producidas.

Para ello, hemos tomado los datos de PTC de los equipos de la NBA desde la temporada 1996/97 hasta la 2018/19, junto con el número de victorias. A través de una regresión lineal simple podemos relacionar ambas variables:

Los resultados son:

Es cierto que tenemos una varianza explicada no demasiado buena, pero aquí el interés se centra principalmente en la predicción de las victorias, y menos en la bondad del modelo. Es decir, con lo que tenemos, que es un índice PTC formado por equivalencia, por lo que el teóricamente relacionado con el diferencial de cada partido es el FDP, hemos de arreglárnoslas para realizar una predicción medianamente aceptable. Y esto es lo que acabamos de hacer.

En mi opinión, y para salvar algunos problemas de unidades e interpretabilidad, lo mejor es construir esos valores de victorias producidas con referencia a la media de los jugadores de la NBA (o de las ligas donde se aplique). De este modo, ya no vamos a tener problemas con el intercept  durante cada momento de la temporada (haría que las victorias producidas estuvieran en negativo durante muchos meses).

Por tanto, ya estamos en condiciones de presentar el nuevo índice de victorias producidas, al que podemos llamar PTCwins, y que se calcula de la manera siguiente, para cada jugador :

Y esto es lo que vamos a ir mostrando cada semana (más o menos) tanto para la NBA como para la Liga ACB.

En consecuencia, el PTCwins para cada jugador se interpretaría como el número de victorias estimadas producidas en relación a la media de la liga. Un PTCwins positivo indicaría que el jugador produce más victorias que la media, y PTCwins negativo sugeriría que produce menos victorias que el jugador promedio.

Todos los posts relacionados




(#445) LOS JUGADORES MÁS PRODUCTIVOS DE LA ACB 2019/20

[MONOTEMA] Importante: toda la información se actualizará en mi nueva web:  www.playertotalcontribution.com

Tal y como estamos haciendo con la NBA, realizamos un seguimiento de las productividad de los jugadores de la Liga ACB, empleando como siempre el índice PTC (Player Total Contribution), que creé a comienzos de 2019, y cuya génesis puede consultarse aquí.

Puedes ordenar de mayor a menor las productividades en la columna correspondiente. El mínimo para aparecer en la tabla es haber jugado al menos un tercio de los partidos de la temporada (en cada momento de la misma) y un 12.7% de los minutos.

Por último, estos datos no tienen en cuenta el momento del partido en el que se realizan las acciones (el valor de cada acción en función del resultado, y las posesiones restantes), cuyo método de cálculo puede encontrarse aquí.

Presento, asimismo, el PTC al lado de la Valoración ACB (que es un índice arbitrario y sin sustento teórico y empírico), y el diferencial entre ambas, para dar una idea de lo sobrevalorados o infravalorados que están los rendimientos si se emplea la Valoración ACB. Sería un paso importante que la ACB dejara de emplear la Valoración y utilizara un índice de rendimiento más robusto (obviamente desde aquí le invito a que use PTC).

Actualizado 20/11/19 

[table “4” not found /]

Todos los posts relacionados




(#444). ¿ES LUKA DONCIC UNA ESTRELLA DE LA NBA? ANÁLISIS DE PRODUCTIVIDAD COMPARADA

[MONOTEMA] Importante: toda la información se actualizará en mi nueva web:  www.playertotalcontribution.com

En esta página vamos a ir incorporando los datos de productividad (PTC/MP) de Luka Doncic comparado con otras estrellas de la NBA. El objetivo es analizar al jugador esloveno, tomando como referencia otros jugadores consagrados y futuras estrellas.

La elección de los jugadores a comparar es subjetiva, en base a gustos personales y relaciones interesantes.

Iremos actualizando los datos mes a mes. La lista completa de jugadores con la productividad agregada puede consultarse aquí.

Actualizado 21/11/19 



Todos los posts relacionados




(#443). LOS JUGADORES MÁS PRODUCTIVOS DE LA NBA 2019/20

[MONOTEMA] Importante: toda la información se actualizará en mi nueva web:  www.playertotalcontribution.com

Mantendré actualizada cada semana (más o menos) la productividad por partido de los jugadores de la NBA. Para ello emplearé el índice PTC (Player Total Contribution), que creé a comienzos de 2019, y cuya génesis puede consultarse aquí.

Puedes ordenar de mayor a menor las productividades en la columna correspondiente. El mínimo para aparecer en la tabla es haber jugado al menos un tercio de los partidos de la temporada (en cada momento de la misma). Primero se muestra el Top-10.

También hay una estimación de las victorias producidas en relación al jugador promedio (PTCwp), cuya justificación está aquí. Recordad que es una estimación para dar algo de sentido a las unidades de PTC, pero hay una imprecisión a tener en cuenta, por lo que es sólo una aproximación.  Cuantos más partidos se juegue mayor será el PTCwp, ya que es un índice que mide las victorias producidas totales.

Debajo, además, se pueden consultar dos gráficos de los equipos; En el primero de ellos se refleja la distribución de las productividades entre los jugadores, mientras que en el segundo se muestra la concentración de productividades dentro  de cada equipo. La idea es aproximarnos a la importancia que tiene cada jugador dentro de su equipo.

Por último, estos datos no tienen en cuenta el momento del partido en el que se realizan las acciones (el valor de cada acción en función del resultado, y las posesiones restantes), cuyo método de cálculo puede encontrarse aquí. Y es evidente, que un índice numérico no va a reflejar todos los intangibles, aunque es cierto que la génesis del PTC explica más de un 80% de variación del diferencial de puntos de los partidos, sólo con las variables del box-score. De este modo, es una aproximación muy a tener en cuenta.

Actualizado 20/11/19 

[table “3” not found /]





En cuanto al jugador más mejorado, aquí mostramos algunos candidatos:

Todos los posts relacionados




(#438).TEORÍA DE PROBABILIDAD E INFERENCIA ESTADÍSTICA SEGÚN ARIS SPANOS (IIIe)

[MONOTEMA]  Avanzamos con el quinto apartado del tercer capítulo de Probability Theory and Statistical Inference, de Aris Spanos.

Parámetros y momentos

Además del histograma de la distribución de datos observados, también disponemos de ciertos números que caracterizan la distribución como la media o la varianza. Esos valores numéricos están relacionados con los momentos de la distribución, que son esperanzas matemáticas de ciertas funciones de la variable aleatoria , genéricamente denotadas por .

Si escogemos diferentes funciones  obtendremos diferentes momentos de la distribución. Por ejemplo:

Media 

Para variables continuas:

Para variables discretas:

Varianza

Una forma conveniente de calcular los momentos de una distribución es a través de la función generatriz de momentos (mgf), donde

Para variables aleatorias discretas las integrales se vuelven sumatorios.

Por ejemplo, para una variable aleatoria X que sigue una distribución de Poisson:

Dado que: 

Entonces:

A partir de los momentos de la distribución se puede estudiar la asimetría y el apuntamiento. De este modo, podemos caracterizar la forma de la distribución a partir de los momentos.

Todos los posts relacionados




(#437). TEORÍA DE PROBABILIDAD E INFERENCIA ESTADÍSTICA SEGÚN ARIS SPANOS (IIId)

[MONOTEMA] En esta cuarta entrega del tercer capítulo de Probability Theory and Statistical Inference, de Aris Spanos, seguimos profundizando en la relación entre espacio de probabilidad y modelo de probabilidad.

Cuando las probabilidades son funciones conocidas de ciertos parámetros desconocidos , entonces podemos transformar el espacio probabilístico en un modelo de probabilidad definido por:

donde  es una colección de funciones de densidad que dependen de un conjunto de parámetros  en el espacio paramétrico .

Podríamos usar también la función de distribución:

Pongamos un ejemplo usando la distribución Beta como modelo de probabilidad:

 

Podemos analizar el porcentaje de acierto en los tiros libres de los jugadores NBA hasta 2015 (el acumulado en sus respectivas carreras), para aquellos que hubieran lanzado al menos 30 tiros libres.

El histograma de la distribución es el siguiente:

data:read_list(file_search("RUTADELARCHIVO.txt"));
datatranspose:transpose(data);
estatura:datatranspose;
histogram (
estatura,
nclasses=15,
frequency=density,
xlabel="Espacio muestral. Porcentaje acierto tiros libres",
ylabel="Densidad de probabilidad",
fill_color=green,
fill_density=0.5);

Para ello nos ayudamos de nuevo de Stata 13.0, y estipulamos una distribución Beta de parámetros (18, 7.5). 

Es decir, para la modelización empírica debemos postular a priori una familia de densidades que refleje el mecanismo estocástico que da origen a los datos observados. Para ello, tiene espacial relevancia el rango de valores de la variable aleatoria.

Estamos todavía al comienzo, pero ya hemos intuido cómo se plantea un modelo de probabilidad.

Todos los posts relacionados




(#436). TEORÍA DE PROBABILIDAD E INFERENCIA ESTADÍSTICA SEGÚN ARIS SPANOS (IIIc)

[MONOTEMA]  Continuamos con el tercer apartado del tercer capítulo de Probability Theory and Statistical Inference, de Aris Spanos.

Si vemos  como sólo una función del punto final del intervalo , entonces podemos definir la distribución acumulada (cdf):

Ahora sí hemos generado una función que relaciona el número real asignado a cada posible evento con su probabilidad de ocurrencia. Pero en este caso es la probabilidad acumulada.

Para el caso simple (discreto) tenemos la función de densidad:

Por tanto, los espacios probabilísticos pueden simplificarse en el caso de variables aleatorias discretas y continuas a los siguientes:

Spanos se plantea en este punto si se pueden definir funciones de densidad para variables continuas y funciones de distribución para variables discretas, y la respuesta es que sí.

La estatura de los jugadores de la NBA se puede considerar como una variable continua. Desde el inicio de la NBA hasta el año 2015, hay 3984 jugadores cuya estatura se muestra en este archivo.

El histograma de la distribución es el siguiente:

data:read_list(file_search("RUTADELARCHIVO.txt "));
datatranspose:transpose(data);
estatura:datatranspose;
histogram (
estatura,
nclasses=15,
frequency=density,
xlabel="Espacio muestral. Estatura jugadores NBA (cm)",
ylabel="Densidad de probabilidad",
fill_color=green,
fill_density=0.5);

Es una distribución que se aproxima a una Normal, pero que no sabemos realmente si lo es. Recordemos que una distribución Normal tiene como función de densidad:

De este modo, podemos tomar como media y desviación típica la de la muestra, como una estimación de los parámetros poblacionales.

El resultado, tras emplear Stata 13.0, es el mostrado en el gráfico siguiente:

Sin embargo, otras distribuciones también podrían ajustarse a los datos. Por ejemplo, la distribución Weibull:

En Maxima podemos representar las 3 distribuciones, Normal, Weibull y logística, de la siguiente forma:

load(distrib);
plot2d([pdf_weibull(x,18,198.2),pdf_logistic(x,198.2,5.5),
pdf_normal (x, 198.2, 9.32)],
[x,160,230],[y,0,0.05],
[xlabel, "Espacio muestral. Estatura jugadores NBA (cm)"],
[ylabel, "Densidad de probabilidad"],
[legend, "Weibull", "Logistica", "Normal"]);

Las 3 distribuciones consideradas, estipulan que . Esto es un elemento a tener en cuenta porque en este caso tenemos  una distribución de estatura cuyos valores no pueden ser nunca cero o menor que cero. Por tanto, . Desde el punto de vista práctico quizá para este ejemplo no tenga demasiada importancia, pero a nivel didáctico nos sirve para justifica la búsqueda de otra función de densidad que sólo permita valores positivos.

Una opción es emplear la función chi-cuadrado:

 es la función Gamma.

Así, para r=198, y con la ayuda de Stata 13.0, vemos la distribución chi-cuadrado en azul.

Como se puede apreciar, el ajuste no es tan bueno como la distribución Normal, aunque pese a que la Normal tenga un rango de valores teórico fuera del permitido por este caso.

En definitiva, hemos visto que podemos simplificar los espacios probabilísticos empleando funciones de densidad y de distribución. Así, con la adecuada elección de la función de densidad podemos relacionar los eventos con su probabilidad de ocurrencia, teniendo en cuenta que en distribuciones continuas lo pertinente es analizar la probabilidad entre 2 puntos de la distribución.

Todos los posts relacionados




(#435).TEORÍA DE PROBABILIDAD E INFERENCIA ESTADÍSTICA SEGÚN ARIS SPANOS (IIIb)

[MONOTEMA] Avanzamos en el tercer capítulo de Probability Theory and Statistical Inference, de Aris Spanos, dando una noción general de variable aleatoria:

La variable aleatoria simple es un caso particular contenido en esta definición general. El espacio de eventos discreto está contenido en este continuo.

Spanos define la pre-imagen  de la variable aleatoria  como  una función que mapea números reales en el espacio de eventos:

De este modo, si , entonces:

En la definición general de variable aleatoria:

  

El conjunto de todos esos intervalos es un Borel-field :

De este modo: 

Y así Spanos realiza una metamorfosis del espacio probabilístico gracias a la función variable aleatoria:

que es el espacio inducido por la variable aleatoria.

Todos los posts relacionados