Lanzado el benchmark ABC-Bench para evaluar IA en laboratorio y bioseguridad

Lanzado el benchmark ABC-Bench para evaluar IA en laboratorio y bioseguridad

Investigadores presentaron el Agentic Bio-Capabilities Benchmark (ABC-Bench) en un estudio, informó Sciencecast. El benchmark incluye una serie de pruebas que obligan a los grandes modelos de lenguaje a programar robots de manipulación de líquidos, diseñar fragmentos de ADN y evadir los filtros de síntesis de ADN. Al evaluarlos, los agentes de IA superaron a los expertos humanos promedio en estas tareas.

Los resultados también revelaron el carácter de doble uso de la tecnología, generando preocupaciones sobre riesgos de bioseguridad. La publicación del benchmark ofrece una herramienta estandarizada para medir las capacidades de IA en contextos de laboratorio y bioinformática.

Actores

OpenAI scientists

Ubicaciones

Sin registros

Artículos

10 de junio de 2026
1 en total
ABC-Bench: An Agentic Bio-Capabilities Benchmark for Biosecurity
ABC-Bench: An Agentic Bio-Capabilities Benchmark for Biosecurity

Sciencecast • 10 de jun 03:12

Researchers introduced ABC-Bench, a suite of tests that measures large language models' ability to conduct laboratory and bioinformatics tasks, finding AI agents outperform average human experts while highlighting potential dual-use concerns.

Credibilidad 90% Manip. 10% Centro