Платформа Evo-PI улучшает медицинский визуальный вопрос-ответ, эволюционируя принципы рассуждения
Новый обучающий фреймворк под названием Evo-PI позволяет принципам надзора адаптироваться во время обучения, повышая точность мультимодальных ИИ-моделей в задачах медицинского визуального вопрос-ответа до 24,6%.
Исследователи представили Evo-PI, обучающий фреймворк, который рассматривает принципы рассуждения как языковые сигналы, которые могут быть сгенерированы, оценены и итеративно уточнены. В отличие от традиционного статического надзора, Evo-PI создает коэволюционный цикл, в котором производительность ИИ-модели информирует обновления руководящих принципов, а обновленные принципы, в свою очередь, формируют последующее рассуждение.
Подход был оценен на задаче медицинского визуального вопрос-ответа, требующей интегрированного анализа изображений и текста. Тесты на восьми бенчмарках и нескольких базовых моделях показали стабильные улучшения, при этом прирост точности достигал 24,6% по сравнению с предыдущими методами.
Авторы полагают, что механизм динамического надзора может быть применён в других областях, требующих структурированного, экспертного уровня рассуждения, и они публично опубликовали код для поддержки дальнейших исследований.