Затраты на геолого-разведочные работы (ГРР) в России в реальном выражении снижаются, а объемы поисково-разведочного бурения уменьшаются. При этом средний объем извлекаемых запасов нефти открываемых месторождений составляет всего 4,2 млн т. Несмотря на это, в традиционных и новых, слабо изученных регионах сохраняется значительный ресурсный потенциал для открытий.
Для оценки перспективных объектов геологи тратят много времени на поиск данных и их анализ для субъективной оценки шансов геологического успеха (gCoS). Использование генеративного искусственного интеллекта (ГенИИ) должно повысить эффективность их работы и результативность ГРР. Для этого нами был разработан MVP GeoAssistant, включающий модули поиска релевантных исследований, предобработки исходных данных, извлечения структурированных данных и сравнения качества ответов различных БЯМ.
Бенчмаркинг показал, что коммерческие иностранные языковые модели лучше справляются с извлечением данных, чем опенсорсные. Доля корректного извлечения значений параметров, необходимых для расчета Рнм (одного из факторов gCoS) у лучшей модели превысила 68%, а у худшей - 44%. Российские модели пока не пригодны для решения этой задачи. При определенной доработке ГенИИ-системы могут успешно применяться для создания структурированных баз данных, в качестве ассистентов эксперта и для генерации отчетов в секторе разведки и добычи.
Для оценки перспективных объектов геологи тратят много времени на поиск данных и их анализ для субъективной оценки шансов геологического успеха (gCoS). Использование генеративного искусственного интеллекта (ГенИИ) должно повысить эффективность их работы и результативность ГРР. Для этого нами был разработан MVP GeoAssistant, включающий модули поиска релевантных исследований, предобработки исходных данных, извлечения структурированных данных и сравнения качества ответов различных БЯМ.
Бенчмаркинг показал, что коммерческие иностранные языковые модели лучше справляются с извлечением данных, чем опенсорсные. Доля корректного извлечения значений параметров, необходимых для расчета Рнм (одного из факторов gCoS) у лучшей модели превысила 68%, а у худшей - 44%. Российские модели пока не пригодны для решения этой задачи. При определенной доработке ГенИИ-системы могут успешно применяться для создания структурированных баз данных, в качестве ассистентов эксперта и для генерации отчетов в секторе разведки и добычи.
Исследование