La última prueba realizada por Microsoft para la industria, arroja unos datos que dejan patente que la tecnología de aprendizaje automático de Alibaba Group tiene mejor comprensión lectora que los propios humanos.
La prueba tuvo lugar el pasado 20 de junio y fue desarrollada por científicos de la Academia DAMO, el programa de investigación global de Alibaba. El modelo tuvo un puntuaje de 0.54 en la tarea de respuesta a preguntas de MS Marco. Estas evalúan la capacidad de una máquina para usar el lenguaje natural y la forma de comunicarse de los humanos para responder a preguntas.
Para llegar a conseguir una puntuación ganadora, estos modelos de aprendizaje automático deben responder a las consultas reales planteadas por el motor de búsqueda de Microsoft. El conjunto de datos de MS Marco que cuenta con más de tres millones de documentos web, en los que hay más de 180,000 respuestas reales escritas por humanos.
«Las respuestas y las preguntas realistas ayudan a los sistemas de capacitación a lidiar mejor con los matices y las complejidades que las personas normales realmente hacen , incluidas las preguntas que no tienen una respuesta clara o múltiples respuestas posibles» según los desarrolladores de MS Marco en una publicación del blog.