jueves, 2 de mayo de 2024

p-Valor en tiempo de IA

Alberto Requena
14 julio 2023
1.270
p-Valor en tiempo de IA

Decía Ortega que sin la técnica el hombre no habría existido ni existiría jamás. La Ciencia descubre cómo funciona la Naturaleza. La técnica adapta ésta para facilitar la vida y bienestar humanos. Claro que todo el conocimiento científico, sumido en los desarrollos técnicos, es difícil, si no imposible, que un humano los retenga, mantenga y utilice en cada instante en que se presenta útil hacerlo. A lo largo de nuestra vida, acumulamos mucho conocimiento que, empleamos y algunos llegan a ser sabios por las habilidades que han desarrollado y la capacidad adquirida de emplear los conocimientos oportunamente. La edad juega mucho en esto. Y es muy complicado saltarse escalones. Los orientales lo han entendido esto con más claridad y lo manejan con mayor soltura. Que en occidente.

La irrupción de la Inteligencia Artificial anda cambiando los escenarios. En algunos aspectos, sustancialmente, por cuanto al estar basada en una memoria externa, capaz de mantener una cantidad de datos que supera en mucho a las capacidades humanas y disponer de un mecanismo de tratamiento de esos datos con velocidades muy superiores a las humanas, pues toma ventaja. Recordar algo, traer a colación una circunstancia o advertirnos de un peligro lo puede hacer una IA con mayor solvencia que un humano. La combinación de IA y humano no tiene parangón con ningún aditamento conocido o implementado en sustitución de alguna actividad humana. Ya estamos disfrutando de alguna de estas ventajas. El ya simple GPS, nos conduce con solvencia por ciudades desconocidas, nos lleva y nos trae y lo hemos incorporado al acervo personal de aditamentos para la conducción segura, rápida y eficaz. Ya no somos capaces de imaginar que sería de nuestra vida sin el GPS de por medio para desplazarnos, no importa a qué lugar, país o circunstancia.

En el ámbito científico es frecuente utilizar el denominado contraste de hipótesis, también denominado test de hipótesis o prueba de significación que, en el marco de la inferencia estadística, es un procedimiento para juzgar si una propiedad, que se supone en una población estadística, es compatible con lo observado en una muestra de dicha población. La propuso inicialmente Ronald Fisher y posteriormente perfilada por Jerzy Neyman y Egon Pearson. En el marco del contraste de hipótesis, se aborda el problema de una hipótesis concreta H0, denominada nula (sin valor, lo que quiere decir que nada cambia, lo que hay en el momento del análisis) y una alternativa H1 y se evidencia cual de las dos se escoge en razón de aplicar el problema estadístico a un cierto número de experimentos.

Conocer la garantía que tiene una hipótesis es clave para desenvolverse en la vida. Es una forma de estimar la “veracidad” de un hecho, circunstancia o situación. En el universo de los lanzamientos de monedas, manidos ejemplos azarosos, podemos sospechar que al lanzar una moneda al aire ésta está trucada si se producen más caras que cruces, por ejemplo, tras efectuar 30 lanzamientos, digamos. Si obtuviéramos un valor alto, como 25, por ejemplo, o más, el resultado es poco compatible con la hipótesis de que la moneda no está trucada. Las observaciones contradicen la hipótesis. La cuestión central es a partir de qué valor debemos rechazar la hipótesis, garantizando que la probabilidad de cometer un error es un valor conocido a priori.

El p-valor es la denominación que en estadística concreta la probabilidad que tenemos de equivocarnos. Supongamos que vamos al trabajo y nos planteamos tomar un café antes de iniciarlo. La hipótesis nula podría ser tomar el café (H0). La hipótesis alternativa (idea contraria) sería continuar hacia la mesa de trabajo (H1). Si encontramos una fuerte evidencia empírica en contra de la hipótesis nula, decimos que la rechazamos y, como consecuencia, aceptamos la alternativa. Esta evidencia sería lo que yo pudiera llegar a saber, después de investigarlo, sobre las ventajas de tomar café o ponerme directamente a trabajar. El p-valor es el que responde a esa “fuerte evidencia empírica, que es la probabilidad de equivocarnos si rechazamos la hipótesis nula, con la información que disponemos. Cuanto más pequeño sea el p-valor, más improbable es que nos equivoquemos al rechazar la hipótesis nula, por tanto, más fácil que acertemos con el rechazo. La cuestión es cuando tendríamos que asumir la hipótesis alternativa (ir al trabajo). Todo dependerá del riesgo que estemos dispuestos a asumir. Pero el p-valor es un dato objetivo. Si está por debajo del nivel de riesgo, rechazaremos la hipótesis alternativa. Por ejemplo, un p-valor de 0.7%, nos diría que la probabilidad de la hipótesis alternativa es de 99,3 %.

En un futuro conjeturado, estaremos investidos de un dispositivo de realidad aumentada capaz de procesar el pensamiento y detectar el dilema de tomar café o ponernos a trabajar. Un p-valor estimado de 0,676, nos haría decidir ponernos al trabajo inmediatamente. Podría deberse a que la urgencia de lo que tiene que hacer no permite perder diez minutos, cosa que hubiere ocurrido de pararse a tomar café. Pero el dispositivo si disponía de esta información, porque los datos almacenados permiten hacerlo a la máquina y no necesariamente a la persona. Pensemos que un dispositivo como unas gafas de realidad virtual pueden ser capaces de buscar todo el rastro que ha ido dejando una persona en las redes sociales en un instante, muchísimo menos tiempo que el que hubiera empleado cualquiera en hacer lo mismo. En cualquier instante, está en condiciones de procesar mayor cantidad de información que lo puede hacer el humano y puede determinar la probabilidad de las hipótesis alternativas.

Hoy vemos estas situaciones muy lejanas, pero cualquier dispositivo electrónico está en ventaja sobre nosotros para emplear el p-valor que aporta un menor riesgo de equivocarse en sus afirmaciones con la evidencia empírica humana de los datos de una muestra. Naturalmente, que una muestra no es la población entera y es una muestra imperfecta. Eso implica que el p-valor nunca será ni 0% ni 100%, a la hora de valorar las alternativas, por tanto, nunca dispondremos de una seguridad absoluta a la hora de decidir, pero el riesgo al tomar alternativas queda mitigado sensiblemente.

Se trata del manejo de la información relevante a escala individual, haciendo uso de los datos colectivos a disposición y de manejar cantidades significativas de los mismos. Gran cantidad de situaciones de la vida corriente se adaptan al contraste de hipótesis. Desde las relaciones personales, hasta las alternativas para cambiar de trabajo, incluyendo las relaciones con los demás o el encaje en la estructura cultural de un colectivo y un largo etcétera, se pueden plantear en términos de contraste de probabilidades de equivocarnos. La probabilidad de equivocarnos o de acertar son elementos muy valiosos para reconducir rumbos vitales, también. El p-valor está en eso, en afirmar una idea o la contraria. Si encontramos una evidencia empírica alta que cuestiona la hipótesis nula, la podemos rechazar y aceptar la alternativa. El concurso de la IA y de la computación, en general, es un factor positivo de apreciación a la hora de la toma de decisiones. Nuevos datos, nuevas formas, nuevas capacidades. De eso se trata, de encontrar la forma de reubicar los papeles a desempeñar, buscando siempre las ventajas competitivas.

Alberto Requena
Alberto Requena
Acerca del autor

Este blog pretende ser una depresión entre dos vertientes: la ciencia y la tecnología, con forma inclinada y alargada, para que por la vertiente puedan circular las aguas del conocimiento, como si se tratara de un río; o alojarse los hielos de un glaciar de descubrimiento, mientras tiene lugar la puesta a punto de su aplicación para el bienestar humano. Habrá, así, lugar para la historia de la ciencia, las curiosidades científicas y las audacias científico-tecnológicas. Todo un valle.

El eldense Alberto Requena es catedrático emérito de Química de la Universidad de Murcia.

Leer más

Bloqueador de anuncios detectado

Por favor, desactiva el bloqueador de anuncios o añade www.valledeelda.com a la lista de autorizados para seguir navegando por nuestra web.

Volver a cargar

Las cookies son importantes para ti, influyen en tu experiencia de navegación. Usamos cookies técnicas y analíticas. Puedes consultar nuestra Política de cookies. Al hacer click en "Aceptar", consientes que todas las cookies se guarden en tu dispositivo o puedes configurarlas o rechazar su uso pulsando en "Configurar".

Aceptar Configurar