Выпущен бенчмарк ABC-Bench для оценки ИИ в лаборатории и биобезопасности

Выпущен бенчмарк ABC-Bench для оценки ИИ в лаборатории и биобезопасности

Исследователи представили бенчмарк Agentic Bio-Capabilities Benchmark (ABC-Bench) в научной работе, сообщила Sciencecast. Бенчмарк включает набор задач, в которых крупные языковые модели должны программировать роботов для работы с жидкостями, разрабатывать фрагменты ДНК и обходить системы скрининга синтеза ДНК. При тестировании ИИ-агенты превзошли средних человеческих экспертов по этим показателям.

Однако результаты также выявили двойственный характер применения технологии, вызывая опасения по поводу биобезопасности. Выпуск бенчмарка создаёт единый стандарт для оценки возможностей ИИ в лабораторных и биоинформатических задачах.

Участники

OpenAI scientists

Места

Нет записей

Статьи

10 июня 2026
Всего 1
Новый бенчмарк оценивает производительность ИИ в биологических задачах и рисках биобезопасности
Новый бенчмарк оценивает производительность ИИ в биологических задачах и рисках биобезопасности

Sciencecast • 10 июня, 03:12

Учёные представили ABC-Bench, набор тестов, измеряющий способность крупных языковых моделей выполнять лабораторные и биоинформатические задачи, обнаружив, что ИИ-агенты превосходят средних человеческих экспертов, при этом подчёркивая потенциальные двойные применения.

Дост. 90% Манипул. 10% Центр