Модели развития
Информационный бюллетень
Исследования
ENG
EN
RU   EN
Пресс-центр

«Качество датасетов, дефицит венчурного финансирования и компетенций – главные барьеры в развитии LLM» - Григорий Выгон

Конференции и семинары
Низкое качество данных для обучения, дефицит вычислительной инфраструктуры и недостаток компетенций у разработчиков и клиентов – так, по мнению главы «ВЫГОН Консалтинг» Григория Выгона, выглядит круг ключевых проблем на пути массового внедрения больших языковых моделей (LLM) в России. Эта тема обсуждалась на сессии «Перспективы применения ИИ в промышленных процессах предприятий ТЭК: безопасность и риски», включенной в деловую программу Евразийского нефтегазового форума.
Вместе с Григорием Выгоном в дискуссии, посвященной возможностям и особенностям применения нейросетей в российском ТЭК участвовали заместитель Министра энергетики РФ Эдуард Шереметцев, директор по информационной инфраструктуре Госкорпорации «Росатом» Евгений Абакумов, директор по контролю за изготовлением основного технологического оборудования Тагир Нигматулин, руководитель Академии технологий, данных и кибербезопасности «Сберуниверситета» Дмитрий Зубцов, исполнительный директор - руководитель группы по трансформации промышленных компаний ТеДо Алексей Нестеренко, директор по информационным технологиям Группы компаний «Специальные системы и технологии» Валентин Каськов, генеральный директор ГК УльтимаТек Павел Растопшин. Модератором сессии выступил коммерческий директор Positive Technologies Михаил Турундаев.

Глава «ВЫГОН Консалтинг» рассказал присутствующим о LLM-решениях для выполнения бизнес-задач в нефтегазовой отрасли, особо подчеркнув способность генеративных моделей ИИ извлекать ценные инсайты из неструктурированных данных и управлять знаниями - обрабатывать и систематизировать техническую документацию, научные статьи и эксплуатационные руководства. Среди самых распространённых сегодня ИИ-технологий для нефтегаза - вопросно-ответные системы, так называемые Ассистенты.
Так, например, Ассистенты инженеров помогают в анализе и предотвращении причин поломок нефтедобывающего оборудования, дают рекомендации по их устранению, подбору методов борьбы с осложнениями механизированной добычи. Ассистенты геолога используются для определения шанса геологического успеха (gCoS). LLM также может ассистировать разработчикам месторождений в подборе значений подсчетных параметров для оценки запасов, в прогнозировании запускного дебита скважины и коэффициентов извлечения нефти и газа (КИН/КИГ), что повышает точность прогнозов и оптимизирует процессы добычи.

Корпоративный ассистент юриста на базе LLM автоматизирует широкий спектр юридических задач, включая генерацию проектов документов и правовую экспертизу. Внедрение такого ИИ-решения позволяет оптимизировать рабочие процессы в пяти ключевых направлениях: работа с внутренними нормативными документами, договоры с контрагентами, обучение сотрудников, анализ регулирующих НПА и поддержка в судебных процессах.
Говоря о барьерах, мешающих разработке и внедрению GenAI-решений в российском нефтегазе Григорий Выгон акцентировал внимание участников дискуссии на низком качестве данных, необходимых для обучения моделей. Имеющиеся у регуляторов на сегодняшний день статистические данные - геологические, промысловые и экономические - к сожалению, невозможно использовать для подготовки датасетов. Они хранятся в архивах регуляторов в непригодном для использования формате. Общеотраслевая база для обмена технологической информации отсутствует, а обсуждаемая ранее идея создания единой отраслевой платформы для развития LLM-технологий не нашла поддержки у компаний и профильных ведомств.

Тормозящим фактором также выступает дефицит вычислительных мощностей. В российских компаниях и дата-центрах сегодня по разным оценкам имеется 5-10 тысяч графических процессоров А100, а для обучения одной большой модели нужны десятки тысяч самых современных дорогостоящих GPU. Такие затраты не могут себе позволить отдельные, даже очень крупные нефтегазовые компании и биг-техи. «Привлечение венчурного финансирования в LLM-проекты, и на развитие вычислительной инфраструктуры в том числе, в настоящее время является практически невыполнимой задачей. Государство ограничивает свой интерес НИИ и ВУЗами, оставляя без должного внимания инициативы представителей бизнеса», - подчеркнул управляющий директор «ВЫГОН Консалтинг».
Еще одним барьером эксперт видит недостаток компетенций – как у разработчиков ИИ-решений, так у заказчиков таких продуктов. «В нашей стране при всей перегретости рынка труда для ИИ-индустрии присутствует острый дефицит специалистов с глубокими знаниями в computer science, отраслевых доменах и высоким уровнем интеллекта. Такие кадры могут обеспечить сильные технические вузы», - отметил он.

В компаниях-клиентах цифровые подразделения и бизнес-функции сегодня не готовы к использованию решений на базе GenAI. Менеджеры и рядовые сотрудники не горят желанием изучать принцип работы и возможности LLM для решения прикладных бизнес-задач. В нашем нефтегазе пока только две компании активно ведут пилотирование GenAI технологий. «Это очень мало для отрасли, которая призвана стать флагманом в достижении технологического суверенитета России в условиях санкций, изменения экспортных потоков и энергоперехода, - подчеркнул Григорий Выгон. - Без объединения усилий мы неконкурентоспособны и будем отставать от всего мира, активно осваивающего нейросети для будущего экономического рывка».