Lanzado el benchmark ABC-Bench para evaluar IA en laboratorio y bioseguridad
Investigadores presentaron el Agentic Bio-Capabilities Benchmark (ABC-Bench) en un estudio, informó Sciencecast. El benchmark incluye una serie de pruebas que obligan a los grandes modelos de lenguaje a programar robots de manipulación de líquidos, diseñar fragmentos de ADN y evadir los filtros de síntesis de ADN. Al evaluarlos, los agentes de IA superaron a los expertos humanos promedio en estas tareas.
Los resultados también revelaron el carácter de doble uso de la tecnología, generando preocupaciones sobre riesgos de bioseguridad. La publicación del benchmark ofrece una herramienta estandarizada para medir las capacidades de IA en contextos de laboratorio y bioinformática.