Издаётся с марта 1959 года
Выходит 6 раз в год
Научно-технический журнал "Химические волокна"
+7 (916) 900-66-85
 
     Поиск по сайту журнала "Химические волокна"
Поиск по сайту
Главная  |  Архив журнала "Химические волокна" 2008 год  |  "Химические волокна" №3, 2008 год  |  Нейросетевые модели для прогнозирования свойств химических соединений
Нейросетевые модели для прогнозирования свойств химических соединений
Н. Фёдорова*, Ю. Зупан*, М. Нович*, М. Врачко*, М. Тушар*, Т. Дянкова**
(*Национальный институт химии в Словении, Любляна;
**Санкт-Петербургский государственный университет технологии и дизайна)

Использование программных продуктов для моделирования и оптимизации производственных процессов дало возможность создать эффективную технологию прогнозирования свойств полимерных материалов с помощью нейросетей. Нейросетевые методы обработки данных приобретают особое значение при разработке процессов, в которых критерии оптимизации, определяемые экспериментально, могут иметь ограниченный набор данных. Так, на начальном этапе разработки новой технологии колористической отделки волокнистых материалов систематизация базы данных для математического моделирования с применением линейной неравновесной термодинамики позволяет учесть взаимодействие транспортируемых компонентов и энергий в процессе крашения субстрата.

Развитие теории термодинамики необратимых процессов (ТНП) позволило связать кинетику с термодинамической теорией неравновесных состояний в гетерогенных (жидкость - твердое) системах в процессах отделки волокнистых материалов.

В ТНП полное изменение энтропии dS определяется как сумма изменения энтропии deS  равновесных процессов обмена энергией и веществом с окружающей средой и изменения энтропии diS необратимых процессов внутри системы:

В зависимости от направления и величины потоков энергии deS  принимает значение большее, меньшее или равное нулю. Величина diS всегда больше нуля.

В ТНП интенсивность переноса вещества или энергии характеризуется потоком Ia. В случае непрерывных систем поток характеризуется величиной а, перенесенной за время t через единицу площади S поверхности, перпендикулярной направлению потока, т.е.

В случае прерывных систем поток определяется скоростью переноса:

Для химических реакций понятие потока совпадает с понятием скорости реакции υ:

где ξ- полнота протекания реакции:

dC1, dC2, dCn - изменение концентрации компонентов за время dt; k1, k2, kn - стехиометрические коэффициенты со знаком плюс для образующихся компонентов и со знаком минус для расходуемых.

Кинетическая часть ТНП сводится к установлению факторов X, определяющих потоки I, и зависимостей I = f(X).

Простейшим примером связи между фактором и потоком может служить уравнение Фурье для теплопроводности в непрерывной системе или закон Фика для диффузии:

к и D - коэффициенты соответственно диффузии и теплопроводности; Т- температура; Ck - концентрация диффундирующего вещества к.

В этих примерах в роли обобщенных сил X выступают градиенты температуры и концентрации, взятые с обратным знаком.

Для прерывных систем силы выражаются не градиентами, а конечными разностями величин. Например, вместо grad T используют ΔТ, вместо grad Ck- ΔСk. Сродство, или движущая сила химического процесса массопереноса Δμ в каждый момент, рассчитывается по формуле

где Δμi - мгновенный химический потенциал компонентов реакции; ni - число молей i-го компонента.

Выбор обобщенных сил и потоков, им соответствующих, может быть произвольным, т.е. можно выбрать множество величин а и множество рассчитанных потоков Ia, но для описания потоков достаточна система независимых потоков, их число обычно невелико. Кроме того, неоднозначность потоков связана и со свободой в выборе системы отсчета. Например, диффузию красителя можно рассматривать относительно растворителя, а можно - относительно волокна. В первый момент времени, когда в волокно вместе с красителем проникает и растворитель, эти потоки будут различаться. Изучение потоков, не слишком удаленных от состояния равновесия, показало, что при любом выборе сил и потоков они связаны друг с другом нелинейными соотношениями, т. е. причиной потока является не одна сила, а все независимые силы, действующие в системе. Это положение ТНП выражается следующей системой уравнений:

где L - феноменологический коэффициент. Все феноменологические коэффициенты являются постоянными только при стационарном режиме процесса в условиях термодинамического равновесия.

Уравнение означает, например, что поток красителя может быть вызван не только градиентом концентрации красителя, но также градиентами концентраций текстильно-вспомогательных веществ, градиентом температуры. С другой стороны, градиенты концентрации могут быть причиной теплового потока.

Система уравнений записывается так, чтобы диагональные коэффициенты L11 , L22, ... Lnn выражали прямые эффекты - диффузию, теплопроводность - и были связаны соответственно с обычными коэффициентами D и к. Например, к grad T или Dgrad Ck..

Недиагональные коэффициенты для ij выражают эффекты сопряжения разнородных потоков, Lij может принимать нулевое значение.

Величины Ii и Xi . можно подобрать таким образом, что скорость возникновения энтропии в системе θ = diS / dt выразится формулой θ = -ΣIiXi, где суммирование ведется по всем процессам массо- и теплопереноса.
Величины в системе уравнений, имеющие одинаковые индексы, называются попарно сопряженными термодинамическими потоками и силами.

Подставив в последнюю формулу значения потоков I из системы уравнений (путем сложения всех уравнений системы потоков, помноженных соответственно на силы X1, X2, ... Xn), получим:

Таким образом, задача оптимизации технологических параметров процесса отделки текстильного материала сводится к нахождению максимальной скорости изменения энтропии 0max внутри замкнутой системы. В этом случае скорость изменения энтропии внутри системы отражает процессы и массо-, и теплопереноса, связывая кинетические и термодинамические параметры (факторы оптимизации) отдельных операций.

В лаборатории хемометрии Национального института химии в Любляне (Словения) были разработаны программы для нейросетевого анализа и моделирования [1, 2]. В 1993 г. была опубликована книга Ю. Зупана и И. Гайстейгера “Нейронные сети для химиков”. В 1995 г. книга была переведена на японский язык, в 1998 - на китайский.

В основе всех нейросетевых методов лежат идеи, отражающие те или иные аспекты обработки информации в человеческом мозгу. Искусственные нейронные сети состоят из определённого количества искусственных нейронов, являющихся упрощённой математической моделью биологических нейронов и связей между ними. Эти связи соответствуют синаптическим контактам между аксонами и дендритами биологических нейронов (рис.1).

Аксон - это отросток нейрона, приводящий нервный импульс от клетки к другим нейронам (рис.2). Дендриты - это отростки нейрона, воспринимающего нервный импульс от других нейронов.

Нервный импульс, или сигнал при прохождении синапса, изменяется линейно, т.е. сила сигнала умножается на некоторое число, которое называется весом синапса (w) или весом соответствующего входа нейрона. Если сигнал, посылаемый нейроном, равен s, вес синапса равен w, то сигнал, поступающий к принимающему нейрону после прохождения синапсиса, p = w·s. Согласно математической модели Мак-Каллока и Питтса, нейрон - это несложный автомат, преобразующий входные сигналы в выходной сигнал (рис.3). Сигналы силы х1, х2 ..., хn, поступая на синапсы, преобразуются линейным образом, т.е. к телу нейрона поступают сигналы силы w1x1, w2x2, ..., wnxn (здесь wi - вес соответствующих синапсов). Для удобства к нейрону добавляют еще один вход (и еще один вес и), считая, что на этот вход всегда подается сигнал силы 1. Нейрон суммирует эти сигналы, затем применяет к сумме некоторую фиксированную функцию p и выдает на выходе сигнал силы y = p(w1x1 + w2x2 + ... + wnxn + u). Правила формирования выходного сигнала у выглядели особенно просто: если w1x1 + w2x2 + ... + wnxn + u > T, то у = 1, иначе у = 0.

Искусственные нейронные сети, подобно биологическим, являются вычислительной системой с огромным числом параллельно функционирующих простых процессоров с множеством связей. Несмотря на то что при построении таких сетей обычно делается ряд допущений и значительных упрощений, отличающих их от биологических аналогов, искусственные нейронные сети демонстрируют ряд свойств, присущих мозгу, - это обучение на основе опыта, обобщение, извлечение существенных данных из избыточной информации.

Поведение нейронных сетей может изменяться в зависимости от состояния окружающей их среды. После анализа входных сигналов (возможно, вместе с требуемыми выходными сигналами) они самонастраиваются и “обучаются”, чтобы обеспечить правильную реакцию. Обученная сеть может быть устойчивой к некоторым отклонениям входных данных, что позволяет ей правильно “видеть” образ, содержащий различные помехи и искажения.

Сегодня существует большое число различных конфигураций нейронных сетей с различными принципами функционирования, которые ориентированы на решение самых разных задач. Существуют алгоритмы обучения с учителем, используемые в так называемых сетях обратного распространения (Back Propagation) и алгоритмы обучения без учителя, которые используются в сетях прямого распространения (Counter Propagation), и их комбинация.

Сети встречного распространения созданы Хехт-Нильсоном (HNC-Hecht-Nielsen Neurocomputer and University of California, San Diego, CA). Возможности сети встречного распространения превосходят возможности однослойных сетей. Время же обучения по сравнению с обратным распространением может уменьшаться в 100 раз. Сети встречного распространения используются в тех приложениях, где долгая обучающаяся процедура невозможна. Во встречном распространении объединены два хорошо известных алгоритма: самоорганизующаяся карта Кохоннена и звезда Гроссберга. Применение нейросетевых моделей позволяет успешно решать проблемы в химии, связанные с классификацией, предсказанием свойств химических соединений и моделированием.

Описание общей методики подготовки нейросетевых моделей для проведения анализа структура - активность/свойство предполагает, в первую очередь, составление базы данных, содержащей структуру химических соединений и известные значения тех свойств, которые предполагается прогнозировать с помощью обученной нейросети. Эта база делится на две части: обучающую выборку, по которой производится обучение нейросети, и контрольную выборку, используемую для контроля прогнозирующей способности обученной нейросети. Затем следует расчёт дескрипторов для всех химических соединений. Дескрипторами могут быть числа, описывающие химическую структуру соединений: фрагментые (подструктурные), топологические, геометрические, физико-химические и квантохимические индексы. Дескрипторы могут характеризовать пространственную структуру химических соединений. Достаточно полный набор дескрипторов, используемых в современных исследованиях, описан в книге Тодескини и Консонни [6]. Для построения модели нейронной сети число нейронов входного слоя обычно устанавливается равным числу дескрипторов. Во входной слой добавляется один псевдонейрон смещения с постоянным уровнем выходного сигнала. Уровень выходного сигнала каждого из нейронов устанавливается равным числовому значению соответствующего дескриптора после его нормализации и масштабирования. Выходной слой содержит число нейронов, соответствующее числу прогнозируемых свойств. В качестве прогнозируемого значения каждого из свойств берётся значение выходного сигнала соответствующего выходного нейрона. Нейроны скрытого слоя участвуют в промежуточных вычислениях. Их число подбирается исходя из критерия наилучшей прогнозирующей способности нейросети. Псевдонейроны смещения выполняют служебные функции и имеют постоянный выходной сигнал, равный единице.

В процессе обучения нейросети выбирается число, соответствующее количеству раз обучения, так называемое число эпох обучения (number of epochs). На основании выявленной разницы между экспериментальными значениями дескрипторов и полученными в результате обучения по определённым алгоритмам производится подстройка весов связей между нейронами с целью уменьшения этой разницы. Таким образом, в процессе обучения происходит постепенное уменьшение ошибок прогнозирования свойств химических соединений, входящих в обучающую выборку.

Общие рекомендации по построению искусственных нейронных сетей, используемых для анализа зависимостей структура - свойство, отражены в работах Зупана, Нович и Врачко [7-11]. Принципы валидации или признания законной силы нейронных моделей апробированы для предсказания токсичности химических соединений [12]. Описание построения нейросетевых моделей в программе МАТЛАБ приведено в работе Кузмановского и Нович [13].

Искусственные нейронные сети широко применяются для предсказания свойств химических соединений, для классификации органических соединений по активности по отношению к определённым условиям. Использование нейросетевых моделей в анализе ИК-спектров химических соединений приведено в работах [14-16]. Заслуживает внимания использование нейронных сетей для анализа данных, полученных посредством различных методов в аналитической химии [17-22], в моделировании процессов [20].

Разработаны программы, используемые для анализа результатов жидкостной хроматографии. Большое число работ посвящено исследованию и предсказанию мутагенности и канцерогенности органических соединений. Показана возможность применения нейросетевых моделей для классификации веществ и их распределения по группам. Этот метод может быть применён также при исследовании сходства продуктов, материалов, изделий.

Особый интерес представляет решение прикладных задач с использованием методов нейросетевого моделирования, в частности, для оптимизации рецептур красильных композиций.

  • Нейронные сети являются универсальным инструментом, позволяющим исследовать зависимости между строением органических соединений и широким спектром их физико-химических свойств. Потенциал нейросетевого моделирования ещё не исчерпан, о чём свидетельствует возрастающее число публикаций о их применении.
  • Нейросетевые модели могут решать задачи как классификации (при дискретном наборе значений моделируемого свойства), так и регрессии (при непрерывных значениях моделируемого свойства).
  • Причина популярности нейросетевых моделей в прикладных исследованиях заключается в их наглядности и отсутствии необходимости в глубоком знании математической статистики для их эффективного исследования.
Библиографический список
(1) Зупан Ю, Гайстейгер Й. Neural Networks for Chemists. - National Institute of Chemistry, Slovenia), 1993.
(2) Gasteiger J. Computer-Chemie-Centrum and Institute for Organic. - Chemistry University of Erlangen-Nurnberg, Germany).
(3) Hecht-Nielsen R. Counterpropagation networks // Proceedings of the IEEE First International Conference on Neural Networks. Eds. M. Caudill a. C. Butler. V.2. - San Diego, CA: SOS Printing, 1987. - Р.19-32.
(4) Hecht-NielsenR. // Appl. Optics. 1987. № 26 (23). - Р.4979-84.
(5) Hecht-Nielsen R. // Neural Networks. 1988. № 1. - Р.131-39.
(6) TodeschiniR., Consonni V. Handbook of Molecular Descriptors. - Weinheim: Wiley-VCH, 2000.
(7) Majcen N., Zupan J. // Anal. chem. (Wash.). [Print ed.]. 1995. V.67. - Р.2154-2161.
(8) Gasteiger J. Neural Networks with counter-propagation learning strategy used for modelling. Chemometr. intell. lab. syst.. [Print ed.]. 1995. V.27. - Р.175-187.
(9) Zupan J. Counter-propagation learning strategy in neural networks and its application in chemistry. V: Collier H. (ur.). Further advances in chemical information (Special publication, № 142). - Cambridge: Royal Soc. Chem., 1994. - S.92-108.
(10) Novic M., Vracko M. Artificial neural networks in molecular structures - property studies. V: Leardi R. (ur.). Nature-inspired methods in chemometrics: genetic algorithms and artificial neural networks (Data handling in science and technology, 23). - Amsterdam [etc.]: Elsevier, 2003. - Р.231-256.
(11) VrackoM. // Current computer-aided drug design. [Print ed.]. 2005. V.1. № 1. - Р.73-78.
(12) Vracko M. // SAR QSAR environ. res., 2006. V.17. № 3. - Р.265-284.
(13) Kuzmanovski I., Novic M. // Chemometr. intell. lab. syst.. [Print ed.], 2008. V.90. № 1. - S.84-91.
(14) Novic M., Zupan J. // Vestn. Slov. kem. drus. (Documenta chemica Yugoslavica). 1992. let. 39. № 2. - S.195-212. [COBISS.SI-ID 32664576].
(15) Gasteiger J., Li Xinzhi, Simon V. е.а. // J. mol. struct.. [Print ed.]. 1993. V.292. - S.141-160. [COBISS.SI-ID 842266].
(16) Novic M., Zupan J. // J. chem. inf. comput. sci. 1995. V.35. - S.454-466.
(17) Brodnjak-Voncina D., Dobcnik D. е.а. // Chemometr. intell. lab. syst. [Print ed.], 1999. № 47. - S.79-88. [COBISS.SI-ID 4318742] c.
(18) Heyden Y.V., VankeerberghenP. е.а. // Talanta (Oxford). [Print ed.]. 2000. V.51. - S.455-466. [COBISS.SI-ID 2130458].
(19) Zupan J., Novic M., Ruisanchez I. // Chemometr. intell. lab. syst. [Print ed.]. 1997. V.38. - S.1-23.
(20) Novic M. Kohonen and counter-propagation neural networks applied for mapping and interpretation of IR spectra. V: Livingstone D. (ur.). Artificial neural networks : methods and applications. Humana Press, 2007.
(21) Lozano J., Novic M. е.а. // Chemometr. intell. lab. syst. [Print ed.]. 1995. V.28. - S.61-72.
Использование нейронных сетей в газовой хроматографии представлено в работе
(22) Pompe M., Razinger M. е.а. // Anal. chim. acta. [Print ed.]. 1997. V.348. - S.215-221.
О журнале        Новости        Редколлегия        Авторам        Библиотека        Архив издания        Контакты
Copyright © 2018 "Химические волокна"
Design by Sergey Dorodnikov
 
+7 (916) 900-66-85
 
141009, Россия, Московская обл.
г. Мытищи, ул. Колонцова, 5