Создать видео или картинку, попросить чат GPT написать текст или ответить на любой вопрос – теперь эти задачки стали простыми и повседневными благодаря искусственному интеллекту (ИИ). И когда говорят, что ИИ захватит мир, то это уже, в принципе, не фантазия, а реальность. А как эта технология может помочь геологу?
Мария Костина, главный редактор GeoConversation, поговорила о том, чем отличается искусственный интеллект от машинного обучения и как инструменты ИИ внедряются в рабочие процессы с экспертами – геофизиком 1 категории Института Карпинского Андреем Карамышевым и руководителем по развитию продукта DeepCore в компании Digital Petroleum, геологом Евгением Барабошкиным.
Искусственный интеллект, машинное обучение и нейросети. Что это?
Если поискать в Интернете – можно найти десятки определений технологий искусственного интеллекта, машинного обучения и нейросетей. Эксперт Евгений Барабошкин рассказал, как эти понятия обычно визуализируют в виде кругов Эйлера. Условно, если нарисовать большой круг – это будет искусственный интеллект, внутри него круг поменьше – это машинное обучение. И третий круг, еще ближе к центру – нейронные сети глубокого обучения. На основе этих технологий можно создать те самые чат-боты, которые, как некоторые предполагают, умеют думать сами, хотя это не так. Отдельной веткой идёт развитие General AI, общего искусственного интеллекта, который может самостоятельно принимать решения и выполнять те или иные задачи.

Получается, что любую технологию, имитирующую принятие решения с помощью тех или иных алгоритмов, можно назвать ИИ, но не каждую – машинным обучением или нейронной сетью. При этом именно машинное обучение и нейросети применяются в геологии. Давайте вместе разбираться, что это такое и как обучать машину, чтобы она была полезной для разведки и добычи полезных ископаемых.
Откуда взялся искусственный нейрон?
Первой формальной моделью нейронных сетей была модель МакКаллока – Питтса. Она как будто бы пыталась объяснить, как работает реальный биологический нейрон, но еще не была полноценной нейронной сетью. Первые нейросетевые архитектуры, такие как перцептрон Розенблатта, появились позже, в 1957 году.
Напомним, что биологический нейрон (или нервную клетку) можно представить как устройство с несколькими входами и одним выходом. От одного нейрона передается электрохимический импульс следующим нейронам, и все вместе они составляют центральную нервную систему. Пока еще не до конца изучено, как работают человеческие нервные клетки – в головном мозге общая нейронная сеть состоит примерно из 90 миллиардов нейронов, которые соединены друг с другом триллионами связей. Тем не менее, именно сложная нервная система стала прототипом для искусственного нейрона.
Развитие ИИ напоминало американские горки – были периоды, полные открытий, и были моменты некоторого спада интереса к технологии. Но к современным чат-ботам пришли благодаря открытиям, случившимся уже в нашем веке.
«Ученый Джеффри Хинтон в 1986 году дополнил алгоритм обратного распространения ошибки, по которому нейросети учатся. Впоследствии, в 2012 году Алекс Крижевский и Илья Суцкевер (которые активно сотрудничали с Джеффри Хинтоном) предложили модель AlеxNet для распознавания изображений. Это была первая модель, которая обогнала человека по качеству и скорости распознавания образов. После этого открытия и развития технологий компьютерного зрения случился настоящий бум нейросетей, который позже привел к популярности генеративного ИИ»
Андрей Карамышев

Сегодня мы наблюдаем третью волну развития ИИ – в мире все больше говорят об Агентном искусственном интеллекте (AI), выходящим за рамки генеративного AI и способного автономно решать сложные задачи.
Какие бывают нейронные сети?
Геофизик Андрей Карамышев объяснил, что классификаций нейросетей много, но в основном мы оперируем двумя видами: сетями полносвязных слоев и глубокими сверточными нейронными сетями (СНС). У них есть один общий признак – первый слой нейронов, задача которого – принимать и распределять входные сигналы по остальным нейронам. Но по структуре полносвязные сети и СНС отличаются.
Сети полносвязных слоев
Полносвязные многослойные сети – самые старшие по происхождению и самые простые для понимания. Такие сети состоят из слоев с нейронами: из входного, где нейроны принимают сигналы извне в сеть, из скрытых (их может быть сколько угодно или не быть вовсе), где сигналы обрабатываются, и выходного, где нейроны передают результат обработки сети. Также в такой сети каждый нейрон связан со всеми нейронами предыдущего слоя.

Полносвязные сети являются основой многих простых нейронных сетей и подходят для задач, где данные не имеют явной структуры, например, для работы с табличными данными. Но если добавлять дополнительные скрытые слои, то можно расширить такие сети для решения более сложных задач. Все зависит от количества данных.
Глубокие сверточные нейронные сети (СНС)
Сверточные сети работают по-другому. Используется скользящий фильтр – то, что называется ядро свертки или кернель. Он сканирует входную карту признака. Допустим, мы подали набор геофизических полей с любым количеством слоев. Можно сделать частотную фильтрацию, разложить его на отдельной гармонике и сделать тысячу разных срезов на различных интервалах. У нас, соответственно, получается своего рода трехмерный тензор – кубик, у которого по осям X и Y координаты-фильтры, а по оси Z – набор разных данных.

Машинное обучение или как «кормить» нейросеть правильно
Как научить машину думать так, чтобы мы могли ей доверять? Эксперты утверждают, что один из самых важных факторов – это качество данных, на которых учатся нейросети.
«Если на вход нейронной сети подать абсолютную бессмыслицу, то у нее на выходе «зажжется» случайный вход (в выходном слое). То есть мы получаем случайный или, точнее, бессмысленный с точки зрения оператора результат, хотя и обусловленный внутренней структурой сети. Как говорится, garbage in, garbage out. Поэтому намного важнее то, как мы подготовим данные и как сформулируем проблему, чем то, какой алгоритм мы применим для ее решения. Чем больше обучающих примеров мы ей подадим на вход, тем тоньше настраиваются веса, и тем точнее будет ответ».
Андрей Карамышев
Чтобы нейросеть работала нажатием одной кнопки, нужно предварительно ее обучить
Есть два больших класса машинного обучения: самостоятельная тренировка и обучение с учителем.
Обучение без учителя
В случае тренировки без учителя нейронная сеть обучается на неразмеченных данных. Главная задача нейросети, которая учится самостоятельно – найти скрытые закономерности без какой-либо предварительной информации о результатах. В основном речь идет о кластеризации (группировке похожих объектов) и поиске аномалий (объектов, которые отличаются от большинства). Например, вы загружаете какой-то набор входных данных в алгоритм, говорите ИИ, что у вас есть выборка по минеральному составу горных пород и есть шесть классов, по которым мы распределяем все данные. ИИ без руководства человека (который задает только количество классов) так или иначе разделяет эту выборку на шесть классов. Сеть обучается итерациями, с каждым разом давая все более точный ответ.
Обучение с учителем
Метод с учителем – это когда мы берем предразмеченные (например, геологами) базы данных и задаем алгоритм. Обученная модель является альтернативой аналитически заданному фильтру, при этом она настраивается сама, мы только задаем параметры обучения, архитектуру сети, метрики качества. На основании наших параметров (от учителя) модель вырабатывает внутри себя некоторую зависимость. Это может быть аналитическая зависимость, а точнее ее аналог, заданный с помощью тонко настроенных весов связей. В отличие от аналитических фильтров, которые требуют ручного описания правил, нейросеть самостоятельно выявляет сложные зависимости в данных, даже если их невозможно выразить формулой. Мы подгоняем одну зависимость к другой и, соответственно, считаем (и верим), что сеть правильно интерпретирует данные.
То есть, условно, у нас есть какой-то набор параметров: пористость, проницаемость, удельное сопротивление, и др. Обученная сеть выдает прогноз, что при таких-то параметрах у нас показатель пористости будет такой или зернистость будет вот такая.
Обучение тоже итерационное, как и в случае с тренировками без учителя. Прошла одна эпоха обучения, ИИ увидел, где и насколько он ошибается, в какую сторону нужно исправляться. Чуть-чуть сдвигается по весам и обучается по новой, множество раз, до тех пор, пока за счет алгоритма градиентного спуска (ред. – алгоритм оптимизации в машинном обучении, используется для минимизации ошибок в модели за счет итеративной корректировки параметров) и с учетом множества переменных сеть не найдет глобальный минимум ошибочных ответов. Фактически, ИИ учится на своих ошибках и совершенствуется.

Заменит ли ИИ геолога?
У многих пользователей нейросетями создается иллюзия, что ИИ нас понимает и знает абсолютно все, и что машина может легко заменить человека на рабочем месте. На самом деле это заблуждение – у нейросетей нет самосознания и эмоционального интеллекта. Они знают ровно то, чему их научил человек. Фактически, обученная сеть будет имитировать видение определенного эксперта, в том числе геолога. И кстати, если придет другой геолог и скажет, что все не так, то модель придется переучивать.
«В связке с ИИ обязательно должен быть человек, который обладает достаточными компетенциями, чтобы проверить результаты на адекватность. Так что геологам нужно углублять свои знания в таких глобальных, фундаментальных вещах как, например, процессы рудообразования или формирования геологических структур, а рутину у них заберет и автоматизирует ИИ. Например, процесс ручной интерпретации заменит машинный алгоритм».
Андрей Карамышев
Эксперт уточняет, что речь идет о замещении именно рутинного процесса, связанного с визуальным анализом и сопоставлением данных различных методов, выделением и атрибуцией аномалий. Выводы пока все же делает эксперт, и вряд ли в ближайшем будущем это изменится. Поэтому не нужно забывать, что ИИ – это просто очень умный инструмент, но самая важная работа – принимать управленческие решения – остается за специалистом. А вот потребность в дешевой рабочей силе с появлением ИИ может действительно сокращаться. Этот тезис подтвердил в своем недавнем интервью Данил Ивашечкин, руководитель направления по разработке и внедрению искусственного интеллекта в «Норникеле». Еще он сообщил, что на предприятии не используют ИИ в управлении производственными процессами, ведь если что-то произойдет из-за некорректного совета нейросети, то специалисты не смогут разобраться в причинах возникновения проблемы и узнать, почему ИИ посоветовал сделать то, что привело к инциденту. Так что мы видим –технологии применимы не везде.

По идее ИИ может взять на себя не только рутину, но и какие-то не самые приятные вещи. Например, геолог-документатор будет только рад не выезжать на месторождение и не делать вручную описание того же керна. Но совсем от участия специалиста в процессе документирования на местности тоже нельзя отказаться – бывают моменты, которые необходимо визуально проверить.
«Найти хорошего геолога зачастую проблематично, а сейчас нужны такие, которые смогут работать с искусственным интеллектом».
Евгений Бабошкин
А бывает так, что ИИ-ассистент вдруг перестает работать, например, кабель поврежден и данные перестают поступать на сервера. В этой ситуации оператор сразу принимает управление на себя. Так что даже в перспективе речь скорее о работе в тандеме ИИ + Эксперт, где машине тоже нужна поддержка со стороны человека.
Три примера, как ИИ помогает геологам
Использование глубокого машинного обучения открывает для геологов новые возможности для понимания геологических процессов и оптимизации добычи природных ресурсов. Мы подобрали три примера, когда ИИ стал рабочим инструментом геолога.
Пример 1. ИИ найдет минералы и рудные залежи
Прогнозное картирование минерального потенциала месторождений (Mineral Prospectivity Mapping) – это многоэтапный процесс и предполагает сбор колоссального объема данных, которые даже опытному геологу сложно интерпретировать вручную. Поэтому на добывающих предприятиях к разведке подключается искусственный интеллект. Обученная нейронная сеть позволяет автоматически находить закономерности между географическим положением известных месторождений (целей) и геологическими факторами, влияющими на их образование (признаками), а также учитывать все возможные паттерны, например, интенсивность минерализации или ее пороговые значения, другие физические и геохимические параметры. Таким образом геолог получает точные ответы и прогнозы быстрее.
То, что ИИ позволяет выделять рудные узлы, полезно также на этапе получения лицензии на разработку месторождения. Нейросеть может в ограниченное время исследовать большие площади на предмет их перспективности и помогает инвестору четко понимать, какую площадь лицензировать. Об этом способе применения технологии рассказала начальник управления технологий геологоразведочных работ геологической дирекции «Полиметалла» Тамара Головина, когда выступала на отраслевой конференции «Актуальные проблемы поисковой геологии».

Пример 2. ИИ опишет горные породы
Без изучения керна нельзя построить геологическую модель месторождения, но это очень трудоемкий процесс. Если его автоматизировать, геолог может задокументировать 50 метров скважины за 40 минут. А если делать эту же задачу вручную, уйдет минимум рабочий день.
Команда исследователей из Сколтеха, которую возглавлял наш эксперт Евгений Барабошкин, обучила нейронную сеть эффективно распознавать по фотографиям ящиков керна образцы горных пород. Это позволило ускорить процесс анализа до 20 раз, а также автоматизировать описание керна.
Программа в автоматическом режиме определяет геологические характеристики керна и сама создает отчеты для проверки геологом. И все это только по фото.

Ещё один пример — программный комплекс «Цифровой керн», разработанный с собственным ИИ. Его создали специалисты Тюменского нефтяного научного центра (входит в научно-проектный блок «Роснефти») совместно с компанией «Иннопрактика». Программный комплекс позволяет моделировать лабораторные испытания на цифровой копии породы, полученной из томографических данных.
Пример 3. ИИ интерпретирует сейсмические данные
В процессе интерпретации сейсмических кубов геофизики осуществляют рутинные действия, которые отнимают экстремально много времени — приходится десятки раз просматривать каждый из сотен сейсмических разрезов, вручную нанося каждую линию разлома. Этот процесс может занять от нескольких недель до месяцев.
Чтобы ускорить обработку сотен гигабайтов геофизической информации и избежать ошибок, связанных с человеческим фактором, создали нейросеть с алгоритмами компьютерного зрения. Корреляция горизонтов, структурных несогласий, выделение тектонических разломов, оконтуривание геологических тел — машина сделает это вместо геофизика всего за несколько часов, а не недель, и не пропустит ни одной детали. А алгоритмы машинного обучения делают сейсмические данные чище, убирают некогерентный шум, избавляются от реликтов следов расстановки.

Никто, кроме тебя ИИ
В российской геологоразведке накоплены геоданные на многие тысячи терабайт, и все их нужно обрабатывать и интерпретировать, учитывая миллиарды возможных вариаций. Для того, чтобы человек справился с этой задачей, потребуется очень много времени. Так что для качественного скачка в развитии геологии требуется комплексный подход, сочетающий ИИ, экспертные знания и большие данные. Проблема в том, что многие производства еще не оцифрованы и собирают недостаточное количество данных или они некачественные, и это тормозит повсеместное внедрение технологии ИИ. По оценке управляющего директора НИИ холдинга «Росгеология», академика РАН Михаила Эпова, на сегодняшний день к внедрению ИИ готово не более 5–10% геологоразведочных предприятий страны.
Тем не менее, крупные компании с высоким уровнем цифровизации и возможностями для инвестирования в технологии уже тестируют силу ИИ на своих месторождениях. И в следующих статьях мы подробнее расскажем о том, как машинное обучение помогает при описании керна, обработки сейсмических данных, картировании разведки и добычи полезных ископаемых, а еще поговорим, как геологу самому учить нейросети.
А есть ли у вас опыт взаимодействия с нейросетями в вашей работе? Верите, что будущее за ИИ? Делитесь мнениями в комментариях под статьей.
Алексей
«Шаг в сторону» стоило делать лет 10 назад, когда это только начинало внедряться. Сейчас это неактуально. Сейчас ML начинают использовать повсеместно, только без понимания сути технологии (я бы сказал, что пытаются запрыгнуть в последний вагон). И никто не делает всесторонней систематизации, останавливаясь только на «шаге в сторону».
Вот ссылка 2019 года (как пример) на написанный доступным языком небольшой обзор по ML —
https://www.science.org/doi/10.1126/science.aau0323. Но за прощедшие 6 лет уже продвинулись ещё дальше.
Мария Костина
Спасибо за ссылку — добавим её в подборку материалов при подготовке следующих статей по теме ИИ. Ваша статья действительно хорошая, но важно понимать: это научный обзор, а у нас — научно-популярный формат с другими задачами и принципами подачи. Мы не пишем для узкой экспертной аудитории, а стараемся объяснять сложные темы доступным языком для тех, кто только начинает разбираться.
Это, кстати, распространённая ошибка у экспертов— думать, что «все уже давно в теме». Но таких людей — меньшинство. А тех, кто только входит в тему, — всегда больше. Именно для них мы и делаем контент. Судя по откликам и просмотрам, наша статья оказалась полезной для многих — и это самый важный показатель.
Валерий
Мария, привет! Главное твое утверждение, что ИИ не панацея для поисков, а очередной инструмент для ускорения процессов геологической обработки! А вот , что заложишь, то и получишь. Крупного специалиста, ГЕОЛОГа ничем не заменишь. Да и не надо! Просоветская школа геологов постарела и почти ушла с производства, а «молодая» часто смотрит только на ИИ и прочие методы ПО, забывая, что молоток никогда не изживет себя. Мне все у тебя понравилось! Молодец, поздравляю! С уважением, Валерий.
Мария Костина
Валерий, спасибо большое за тёплые слова и поддержку! Вы очень точно подметили: ИИ — это не замена геологу, а инструмент, и многое зависит от того, кто и как им пользуется. Никакой алгоритм не заменит мышление, опыт и интуицию специалиста. Я всегда за баланс: новые технологии — да, но на базе фундаментальных знаний. Очень приятно читать такие отклики!
Алексей
Тема не раскрыта от слова совсем.
Только рассказали базовые понятия и показали примеры без пояснения проблематики… Данный материал является «описанием к методичке», а не обзором по ИИ. Да, в России в геологии технологии ИИ только начинают внедряться, но в мире есть очень много научных работ с широким описанием проблематики. И главное, чётким пониманием того, какое место ИИ занимает в получении нового знания.
Мария
Спасибо за ваш отклик! Не совсем согласна — статья как раз и задумывалась как шаг в сторону объяснения, что такое ИИ и где его уже применяют, а не как компиляция научных публикаций. Мы специально ушли от абстрактной теории и сделали фокус на прикладном применении на практике.
Да, можно копнуть глубже — и мы это обязательно сделаем в следующих материалах, где подробно расскажем про кейсы. Но даже сейчас, по нашей задумке, это вполне содержательный и структурный обзор, просто написанный простым языком и ориентированный не только на специалистов по машинному обучению.
Буду рада, если вернётесь к теме, когда выйдут новые материалы по теме искусственного интеллекта — и, возможно, поделитесь своими источниками или примерами.
Дмитрий
Статья описывает возможности применения и с точки зрения простого освещения нынешней ситуации ИИ в геологии, что очень круто и для меня полезно! Но есть очень важная деталь любого ИИ. Эта деталь очень редко освещается — ИИ «тупеет» со временем. Условно это выглядит, как подгон значений человеком. Например, мы сидим на уроке и ведем диалог с учителем, чтобы долго не считать уравнение в голове, у которого нет целочисленного ответа, а знаков после запятой очень много, мы обычно даем ответ приблизительный к самому близкому целому числу. Условно, ИИ делает тоже самое. В определенный момент времени своего обучения и своей работы, он начинает выдавать неправильные значения. Поэтому ИИ нужнается в постоянном контроле и обновлении данных. Очень хотелось бы увидеть описание данной проблемы, особенно в геологической среде!
Андрей Карамышев
Дмитрий, описанная вами проблема более характерна для моделей с адаптивным обучением, т.е. обновляющихся в реальном времени, подстраиваясь под новые данные. В этом случае, действительно, модель может со временем терять обобщающую способность, обучаясь на аномалиях и артефактах и смещая веса в сторону некорректных паттернов. Во всех же трех приведенных в статье примерах, насколько я знаю, речь идет о статических моделях сегментации пространственных данных. После завершения основного цикла обучения они работают просто как сложные фильтры, однозначным образом переводящие набор покрытий в карту классов или вероятностей. При этом веса моделей не меняются. Проблемы начинаются, когда на вход подаются данные, существенно отличные от обучающих, или меняются сами зависимости между данными и целевыми объектами. Например, при переносе модели на новые для нее геологические обстановки. В этом случае решается задача доменной адаптации, т.е. подгонки модели под новые условия задачи, например, путем дообучения на небольшой размеченной выборке из нового датасета. Чтобы при этом модель не деградировала, качество ее работы на валидации нужно в первую очередь оценивать с точки зрения сохранения геологической осмысленности, а не только на основании метрик
Николай
Прочитал ) статья передает краткий курс по введению в нейронные сети. Очень качественно и интересно)
Расширила мою область знаний в геологии )
Мария Костина
Спасибо, возможно сможем перетянуть тебя на свою геологическую сторону))
Мария Костина
Я активно использую ИИ в работе. Он помогает структурировать мысли, редактировать, подбирать формулировки, писать подводки и даже оформлять заявки на гранты. Это не замена собственной головы, а отличный инструмент, когда нужно быстро пройти путь от идеи до готового материала. Особенно когда одновременно ведёшь редакцию, готовишь статьи, заявки на гранты и презентации для инвесторов.
Для меня ИИ — это про ускорение процессов и снижение рутинной нагрузки, а не про «пусть всё делает машина». Главное — понимать, зачем ты это делаешь и какую задачу решаешь.
Сейчас как раз готовлю статью для редакционной колонки — о том, как меняется подход к этике в эпоху ИИ и где проходит граница между помощником и соавтором. Думаю, это один из самых интересных вопросов нашего времени.
Алексей
Мария,
«быстро пройти путь от идеи до готового материала» — это и есть замена головы! Так как сгенерированный текст/обзор будет считаться корректным и правиться в минимальном объеме.
Мария
Понимаю, о чём вы — но тут, думаю, мы немного по-разному видим роль ИИ. Быстро пройти путь от идеи до готового материала — это не «заменить голову», а наоборот, максимально ее задействовать. ИИ не работает сам по себе. Чтобы он выдал внятный результат, нужно чётко понимать задачу, дать ему контекст, свои идеи и оценивать результат критически. Он не пишет за тебя — он помогает сократить путь от мысли к черновику.
Рутину он действительно берёт на себя, но идею, структуру, нюансы, оценку и корректировку всё равно делает человек. Поэтому, чтобы использовать ИИ эффективно, нужно очень хорошо разбираться в том, что ты делаешь. Иначе получится не результат, который решает твои задачи, а что-то среднее по больнице.