Estudio Encuentra que los Modelos de Lenguaje de IA Mejoran el Rendimiento de Novatos en Tareas Complejas de Biología
Investigaciones indican que los grandes modelos de lenguaje mejoran significativamente la precisión de novatos al abordar problemas biológicos relacionados con la bioseguridad, lo que plantea consideraciones para el progreso científico y la seguridad.
Investigaciones recientes indican que los grandes modelos de lenguaje (LLMs) mejoran significativamente el rendimiento de personas con experiencia limitada en biología al enfrentar tareas complejas relacionadas con la bioseguridad. En un estudio que involucró a participantes trabajando en ocho problemas desafiantes de biología, aquellos con acceso a LLMs fueron más de cuatro veces más precisos que quienes dependían únicamente de recursos en internet. Notablemente, en tres de cuatro puntos de referencia donde se disponía de datos de desempeño experto, los novatos asistidos por LLM igualaron o superaron la precisión de los expertos. Sin embargo, los LLMs autónomos a menudo superaron a las colaboraciones humano-LLM, lo que sugiere que los usuarios pueden no estar aprovechando completamente las capacidades de los modelos. Además, el 89.6% de los participantes reportaron dificultad mínima para acceder a información de doble uso, a pesar de las salvaguardas existentes. Estos hallazgos subrayan la necesidad de evaluaciones continuas sobre el impacto de los LLMs tanto en el avance científico como en la bioseguridad.