Искусственный интеллект (ИИ) давно перестал быть просто полезной игрушкой для пользователей сети, генерирующей фантастические пейзажи или собирающей информацию по заданиям школьников и студентов. Его стали использовать в бизнесе, управлении и коммуникациях. Но он может решать и узкие отраслевые задачи. Надо только научить. О том, как можно использовать ИИ в нефтегазовой отрасли, почему его необходимо внедрять в России, и в чем отличие ИИ от обычного программного обеспечения (ПО) рассказал директор "ВЫГОН Консалтинг" Григорий Выгон.
- Зачем России нужен ИИ в нефтегазовом секторе, то есть в той сфере, где мы уже давно и успешно работаем?
Григорий Выгон: Искусственный интеллект в нефтегазе - это такой же инструмент автоматизации производства и ускорения принятия управленческих решений, как и в любой другой отрасли. Но есть важный нюанс: вклад топливно-энергетического комплекса (ТЭК) в бюджет и экономику нашей страны сейчас является превалирующим и будет оставаться таковым еще долгое время. Для поддержания конкурентоспособности отрасли на мировом нефтегазовом рынке необходимо заниматься развитием технологий, в том числе ИИ.
- Насколько широко применяется ИИ в мировом нефтегазе, и отдельно в нашей стране?
Григорий Выгон: Для ответа на этот вопрос стоит разделять классический ИИ и генеративный. Первый может анализировать большие числовые структурированные данные. Классический ИИ с глубоким машинным обучением уже более 10 лет успешно используется в нефтегазовой отрасли у нас и за рубежом. Спектр выполняемых нейросетью задач в обоих случаях схож. Например, в секторе "Разведка и добыча углеводородов" это моделирование и обработка данных в геологоразведке, повышение эффективности разработки месторождений, оптимизация производственных процессов и т.д.
С практическим использованием генеративного ИИ, специализирующегося на задачах обработки естественного языка, ситуация выглядит несколько иначе, чем с классическим, поскольку прорыв в технологии произошел лишь несколько лет назад. Иностранные компании уже начинают использовать этот вид нейросетей в качестве аналитических ассистентов геологов и разработчиков месторождений. Например, Saudi Aramсo и Eni заявили о создании собственных решений на базе генеративного ИИ, позволяющих инженерам мониторить состояние производственного объекта или процесса, определять причины поломок оборудования и повышать эффективность его эксплуатации. Наш нефтегазовый сектор только начинает интересоваться этой темой, технология "пилотируется" рядом наиболее продвинутых компаний.
- А не пытаемся ли мы "изобрести велосипед" из-за того, что доступ к иностранному программному обеспечению (ПО) закрыт?
Григорий Выгон: Функционал генеративного ИИ и обычного ПО различен. Это, скорее, взаимодополняющие инструменты. Большая языковая модель может выступать в роли интерфейсной надстройки или "оркестранта" для существующих программных продуктов, когда пользователь на обычном языке формулирует задачу для одного или нескольких приложений. Например, сегодня сетки размещения скважин на месторождениях определяются с помощью специализированного ПО - гидродинамических симуляторов. Инженер может поставить языковой модели следующую задачу: подбери оптимальную схему разработки исходя из бюджетных ограничений, наличия и возможностей бурового оборудования, максимизации экономического эффекта и т.п. Алгоритм запустит симулятор гидродинамического моделирования с учетом указанных параметров и с его помощью после ряда итераций (последовательных проверок и перепроверок - "РГ") найдет необходимое решение. При этом эксперты на этот процесс потратят на 30% меньше времени, чем команда из людей без участия ИИ.
Конечно, существующие сегодня модели генеративного ИИ пока не способны решать такие задачи. Но мировая ИИ-индустрия развивается стремительно. Каждый месяц в мире появляются 8-10 новых языковых моделей, одновременно растут их интеллектуальные способности. За 2020-2023 год суммарные глобальные инвестиции в генеративный ИИ составили около 50 млрд долл., из них половина пришлась на 2023 год. Таким образом, очень скоро нейросети научатся не только помогать инженерам в эксплуатации производственных активов, но и проектировать процессы, оборудование и инфраструктуру, а также анализировать существующие технологии и создавать новые.
Если в России будут созданы реальные стимулы развития собственных нейросетей, то наш нефтегаз получит эффективный инструмент для интенсификации импортозамещения и обеспечения технологического суверенитета. А это два вопроса самого существования российского ТЭК, живущего в условиях санкционных ограничений, переориентации экспортных потоков и энергоперехода.
- Можно ли оценить масштаб затрат на внедрение генеративных ИИ-решений и потенциальный эффект для нефтегазовой отрасли?
Григорий Выгон: Учитывая потенциальный спрос на генеративный интеллект в различных сегментах экономики, не только в нефтегазе, инвестиции в технологию вполне оправданы. При ежегодных затратах в 100 млрд руб. совокупный отраслевой эффект составит около 340 млрд руб. в год. Так что игра стоит свеч.
- На каких мощностях можно проводить вычисления для генеративного ИИ?
Григорий Выгон: Дефицит вычислительных мощностей - это один из первых барьеров для развития генеративного ИИ в нашей стране. По разным оценкам, в российских компаниях и дата-центрах сегодня имеется 5-10 тысяч графических процессоров - видеокарт A100 (используемых для дата-центров - "РГ") или сравнимых. Для разработки продвинутой мега-модели размером свыше 1 триллиона параметров нужно более 25 тыс. карт нового поколения H100, которые стоят около 40 тыс. долл. каждая. Соответственно затраты только на процессоры для обучения "с нуля" до уровня лучших мировых коммерческих моделей уже приближаются к 1 млрд долл. Это не смогут себе позволить отдельные, даже очень крупные нефтегазовые компании.
- Каким образом может быть организовано взаимодействие ключевых игроков на рынке, Биг-Техов и нефтегазовых компаний?
Григорий Выгон: Разработанные Сбером и Яндексом базовые модели уже умеют классифицировать и резюмировать информацию, способны к простым логическим рассуждениям, но для использования в ТЭК их надо дообучать. Сегодня возможны несколько сценариев развития генеративного ИИ для нужд российского нефтегаза. Один предполагает создание каждой компанией собственной отраслевой модели "с нуля". Другой - использование готовой отечественной языковой модели без глубоких отраслевых знаний с дальнейшей адресной донастройкой под задачи конкретного заказчика. Как я уже говорил, первый вариант не по силам одной компании. При реализации второго будет происходить дублирование усилий и затрат, т.к. в нефтегазовых предприятиях решаемые инженерные проблемы, в которых может использоваться генеративный ИИ, практически совпадают.
Наиболее эффективным решением является единая технологическая платформа, объединяющая базовую языковую модель, набор дата-сетов и методик ее обучения отраслевой специфике для выполнения конкретных задач. Это позволит нефтегазовым компаниям сократить расходы как на саму модель, так и на ее глубокое погружение в отрасль. Такой подход также будет выгоден нашим Биг-Техам. Они смогут заработать на разработке базовой модели и на ее обучении для выполнения прикладных производственных задач. Проектная команда по созданию и донастройке отраслевой программы должна включать не только ML-инженеров (machine learning - машинное обучение), но и отраслевых экспертов-учителей, обладающих глубокими знаниями по всем сегментам нефтегазового комплекса. Это рынок для профильных вузов и консультантов. Минэнерго и Минпромторг могли бы взять на себя роль консолидаторов, предоставив свои площадки для диалога со всеми отраслевыми игроками, заинтересованными в развитии генеративного ИИ на базе такой платформы.
- Кроме дефицита "железа" что еще мешает развитию генеративных моделей ИИ?
Григорий Выгон: Нехватка качественных данных для обучения моделей - это еще один барьер. Интеллектуальные способности ИИ с каждым годом увеличиваются за счет роста их размера, объема данных для обучения и совершенствования архитектуры. В последнее время из этих трех составляющих больше внимания стали уделять увеличению качества и размера обработанных данных. В перспективе потребности в "железе" и затраты на него будут продолжать расти вместе с расходами на подготовку больших данных для обучения и дата сетов для дообучения моделей на решение специальных задач.
Наконец, один из самых важных барьеров - это потребность в квалифицированных людях, обладающих отраслевыми знаниями, опытом разработки решений на базе ИИ, составлением специальных методик обучения ИИ. Фактически технология предъявляет очень строгие требования к будущим "учителям" языковых моделей.
- Зачем компаниям (Сбер, Яндекс) давать свои наработки в области генеративного ИИ и вычислительные мощности энергетическому сектору, рискуя попасть под санкции?
Григорий Выгон: При тестировании иностранных моделей на предмет нефтегазовых знаний мы обнаружили, что они ограничивают доступ к информации, которая может быть использована для технологического развития и импортозамещения. Кроме того, зарубежные модели потенциально могут создать угрозу IT-безопасности - внешние атаки на информационную инфраструктуру, промышленный шпионаж и т.д. В этих условиях российские крупные технологические компании, в том числе Сбер и Яндекс, прекрасно осознают, что без их участия дальнейшее развитие генеративного ИИ в отечественном нефтегазе невозможно.
- Зачем России нужен ИИ в нефтегазовом секторе, то есть в той сфере, где мы уже давно и успешно работаем?
Григорий Выгон: Искусственный интеллект в нефтегазе - это такой же инструмент автоматизации производства и ускорения принятия управленческих решений, как и в любой другой отрасли. Но есть важный нюанс: вклад топливно-энергетического комплекса (ТЭК) в бюджет и экономику нашей страны сейчас является превалирующим и будет оставаться таковым еще долгое время. Для поддержания конкурентоспособности отрасли на мировом нефтегазовом рынке необходимо заниматься развитием технологий, в том числе ИИ.
- Насколько широко применяется ИИ в мировом нефтегазе, и отдельно в нашей стране?
Григорий Выгон: Для ответа на этот вопрос стоит разделять классический ИИ и генеративный. Первый может анализировать большие числовые структурированные данные. Классический ИИ с глубоким машинным обучением уже более 10 лет успешно используется в нефтегазовой отрасли у нас и за рубежом. Спектр выполняемых нейросетью задач в обоих случаях схож. Например, в секторе "Разведка и добыча углеводородов" это моделирование и обработка данных в геологоразведке, повышение эффективности разработки месторождений, оптимизация производственных процессов и т.д.
С практическим использованием генеративного ИИ, специализирующегося на задачах обработки естественного языка, ситуация выглядит несколько иначе, чем с классическим, поскольку прорыв в технологии произошел лишь несколько лет назад. Иностранные компании уже начинают использовать этот вид нейросетей в качестве аналитических ассистентов геологов и разработчиков месторождений. Например, Saudi Aramсo и Eni заявили о создании собственных решений на базе генеративного ИИ, позволяющих инженерам мониторить состояние производственного объекта или процесса, определять причины поломок оборудования и повышать эффективность его эксплуатации. Наш нефтегазовый сектор только начинает интересоваться этой темой, технология "пилотируется" рядом наиболее продвинутых компаний.
- А не пытаемся ли мы "изобрести велосипед" из-за того, что доступ к иностранному программному обеспечению (ПО) закрыт?
Григорий Выгон: Функционал генеративного ИИ и обычного ПО различен. Это, скорее, взаимодополняющие инструменты. Большая языковая модель может выступать в роли интерфейсной надстройки или "оркестранта" для существующих программных продуктов, когда пользователь на обычном языке формулирует задачу для одного или нескольких приложений. Например, сегодня сетки размещения скважин на месторождениях определяются с помощью специализированного ПО - гидродинамических симуляторов. Инженер может поставить языковой модели следующую задачу: подбери оптимальную схему разработки исходя из бюджетных ограничений, наличия и возможностей бурового оборудования, максимизации экономического эффекта и т.п. Алгоритм запустит симулятор гидродинамического моделирования с учетом указанных параметров и с его помощью после ряда итераций (последовательных проверок и перепроверок - "РГ") найдет необходимое решение. При этом эксперты на этот процесс потратят на 30% меньше времени, чем команда из людей без участия ИИ.
Конечно, существующие сегодня модели генеративного ИИ пока не способны решать такие задачи. Но мировая ИИ-индустрия развивается стремительно. Каждый месяц в мире появляются 8-10 новых языковых моделей, одновременно растут их интеллектуальные способности. За 2020-2023 год суммарные глобальные инвестиции в генеративный ИИ составили около 50 млрд долл., из них половина пришлась на 2023 год. Таким образом, очень скоро нейросети научатся не только помогать инженерам в эксплуатации производственных активов, но и проектировать процессы, оборудование и инфраструктуру, а также анализировать существующие технологии и создавать новые.
Если в России будут созданы реальные стимулы развития собственных нейросетей, то наш нефтегаз получит эффективный инструмент для интенсификации импортозамещения и обеспечения технологического суверенитета. А это два вопроса самого существования российского ТЭК, живущего в условиях санкционных ограничений, переориентации экспортных потоков и энергоперехода.
- Можно ли оценить масштаб затрат на внедрение генеративных ИИ-решений и потенциальный эффект для нефтегазовой отрасли?
Григорий Выгон: Учитывая потенциальный спрос на генеративный интеллект в различных сегментах экономики, не только в нефтегазе, инвестиции в технологию вполне оправданы. При ежегодных затратах в 100 млрд руб. совокупный отраслевой эффект составит около 340 млрд руб. в год. Так что игра стоит свеч.
- На каких мощностях можно проводить вычисления для генеративного ИИ?
Григорий Выгон: Дефицит вычислительных мощностей - это один из первых барьеров для развития генеративного ИИ в нашей стране. По разным оценкам, в российских компаниях и дата-центрах сегодня имеется 5-10 тысяч графических процессоров - видеокарт A100 (используемых для дата-центров - "РГ") или сравнимых. Для разработки продвинутой мега-модели размером свыше 1 триллиона параметров нужно более 25 тыс. карт нового поколения H100, которые стоят около 40 тыс. долл. каждая. Соответственно затраты только на процессоры для обучения "с нуля" до уровня лучших мировых коммерческих моделей уже приближаются к 1 млрд долл. Это не смогут себе позволить отдельные, даже очень крупные нефтегазовые компании.
- Каким образом может быть организовано взаимодействие ключевых игроков на рынке, Биг-Техов и нефтегазовых компаний?
Григорий Выгон: Разработанные Сбером и Яндексом базовые модели уже умеют классифицировать и резюмировать информацию, способны к простым логическим рассуждениям, но для использования в ТЭК их надо дообучать. Сегодня возможны несколько сценариев развития генеративного ИИ для нужд российского нефтегаза. Один предполагает создание каждой компанией собственной отраслевой модели "с нуля". Другой - использование готовой отечественной языковой модели без глубоких отраслевых знаний с дальнейшей адресной донастройкой под задачи конкретного заказчика. Как я уже говорил, первый вариант не по силам одной компании. При реализации второго будет происходить дублирование усилий и затрат, т.к. в нефтегазовых предприятиях решаемые инженерные проблемы, в которых может использоваться генеративный ИИ, практически совпадают.
Наиболее эффективным решением является единая технологическая платформа, объединяющая базовую языковую модель, набор дата-сетов и методик ее обучения отраслевой специфике для выполнения конкретных задач. Это позволит нефтегазовым компаниям сократить расходы как на саму модель, так и на ее глубокое погружение в отрасль. Такой подход также будет выгоден нашим Биг-Техам. Они смогут заработать на разработке базовой модели и на ее обучении для выполнения прикладных производственных задач. Проектная команда по созданию и донастройке отраслевой программы должна включать не только ML-инженеров (machine learning - машинное обучение), но и отраслевых экспертов-учителей, обладающих глубокими знаниями по всем сегментам нефтегазового комплекса. Это рынок для профильных вузов и консультантов. Минэнерго и Минпромторг могли бы взять на себя роль консолидаторов, предоставив свои площадки для диалога со всеми отраслевыми игроками, заинтересованными в развитии генеративного ИИ на базе такой платформы.
- Кроме дефицита "железа" что еще мешает развитию генеративных моделей ИИ?
Григорий Выгон: Нехватка качественных данных для обучения моделей - это еще один барьер. Интеллектуальные способности ИИ с каждым годом увеличиваются за счет роста их размера, объема данных для обучения и совершенствования архитектуры. В последнее время из этих трех составляющих больше внимания стали уделять увеличению качества и размера обработанных данных. В перспективе потребности в "железе" и затраты на него будут продолжать расти вместе с расходами на подготовку больших данных для обучения и дата сетов для дообучения моделей на решение специальных задач.
Наконец, один из самых важных барьеров - это потребность в квалифицированных людях, обладающих отраслевыми знаниями, опытом разработки решений на базе ИИ, составлением специальных методик обучения ИИ. Фактически технология предъявляет очень строгие требования к будущим "учителям" языковых моделей.
- Зачем компаниям (Сбер, Яндекс) давать свои наработки в области генеративного ИИ и вычислительные мощности энергетическому сектору, рискуя попасть под санкции?
Григорий Выгон: При тестировании иностранных моделей на предмет нефтегазовых знаний мы обнаружили, что они ограничивают доступ к информации, которая может быть использована для технологического развития и импортозамещения. Кроме того, зарубежные модели потенциально могут создать угрозу IT-безопасности - внешние атаки на информационную инфраструктуру, промышленный шпионаж и т.д. В этих условиях российские крупные технологические компании, в том числе Сбер и Яндекс, прекрасно осознают, что без их участия дальнейшее развитие генеративного ИИ в отечественном нефтегазе невозможно.
Интервью подготовили Сергей Тихонов и Олег Капранов
Полный текст - на сайте "Российской газеты"