CATALISIS 2
(2013) 35-51.
Propuesta de un algoritmo detallado para el
desarrollo de un programa de visualización molecular. Parte I: Sistemas
saturados
Proposal of a detailed algorithm for the development of a
molecular visualization program. Part I: Saturated systems
IvÁn MachÍn1,*, Ricardo FernÁndez2, Alexander
Peraza2, Fernando Ruette2
1 Departamento de
Termodinámica y Fenómenos de transporte, Universidad Simón Bolívar. A. P.
89000, Caracas 1080, Venezuela.
E-mail: machin_ivan@outlook.com
2 Laboratorio de
Química Computacional, Instituto Venezolano de Investigaciones Científicas. A. P.
20632, Caracas 1020-A, Venezuela.
RESUMEN
Los estudios de
Química Analítica de los componentes del SARA de crudos pesados generan un
conjunto de grupos funcionales y unidades moleculares básicas que conforman un
Informe Estructural. El trabajo del químico es juntar todas estas piezas de
manera lógica, acorde con la experiencia y la intuición química. El presente
trabajo es la propuesta de una metodología para la generación de todas las posibles
estructuras moleculares que se pueden generar a partir de un Informe
Estructural para el componente saturado del SARA de crudos pesados, así como la
generación de las coordenadas cartesianas de todos los átomos que conforman su
estructura molecular. La metodología está organizada en forma de un conjunto
detallado de reglas y protocolos que conforman un algoritmo fácil de codificar
en cualquier lenguaje de computación.
Palabras clave: Reconstrucción Molecular, Crudos Pesados, SARA.
ABSTRACT
Studies
of analytical chemistry of SARA components from heavy crudes generate a set of
functional groups and basic molecular units that make up a structural report.
The work of the chemist is to gather all these pieces in a logical manner,
commensurate with experience and chemical intuition. This paper is a proposed
methodology for the generation of possible molecular structures that can be obtained
from a structural report of SARA saturated heavy oil components as well as the
generation of the Cartesian coordinates of all atoms for each molecular
structure. The methodology is organized in the form of a detailed set of rules
and protocols that make an easy algorithm to code in any computer language.
Keywords: Molecular
Reconstruction, Heavy Oil, SARA.
INTRODUCCIÓN
Los crudos pesados venezolanos provenientes de la faja bituminosa del Orinoco, y sus respectivos residuos son muy difíciles de procesar, y requieren del desarrollo de nuevas tecnologías. Existe el consenso que un conocimiento de la estructura molecular de estos sistemas, pueden ayudar a crear procesos óptimos, así como la síntesis de nuevos catalizadores mucho más específicos.
Actualmente se están usando técnicas de resonancia magnética nuclear de protones (RMN), osmometría de presión de vapor (OPV) y análisis elemental como herramientas de la química analítica para establecer la estructura molecular de los crudos pesados, extrapesados y sus residuos (CP/XP/R). La técnica de RMN de protones permite establecer los parámetros moleculares (PM) de los CP/XP/R [1-3]. La interpretación de estos parámetros moleculares por un especialista en RMN permite proponer las unidades estructurales (UE) y la cantidad de éstas generando un informe estructural (IE). Al ensamblarlas en el orden lógico (cumpliendo las leyes de la química), se generan las estructuras moleculares modelos de los CP/XP/R. Las UEs típicas están listadas en la Tabla 1.
Existe un número muy grande de maneras de organizar un conjunto dado de
UEs proveniente de un IE debido a la enorme
complejidad de los sistemas moleculares de CP/XP/R. El ensamblaje manual de
estas estructuras moleculares complejas puede ser tedioso, requiere mucha
experticia técnica y está propenso a errores humanos. Además, solo se proponen
pocas estructuras, por lo cual es posible que por prejuicio humano se estén
excluyendo modelos que representarían mejor al sistema. Por éste motivo, se
hace necesario un programa computacional que sea capaz de generar todas las
posibles estructuras derivadas de un IE para luego, usando criterios de
selección más objetivos, elegir los mejores modelos moleculares.
En éste estudio las UE, presentes en un IE, son ensambladas progresivamente siguiendo las reglas químicas para generar las estructuras moleculares correctas desde el punto de vista químico. El algoritmo que se propone tiene la gran ventaja de engranar las UEs y generar las coordenadas de los átomos de las moléculas construidas, con las cuales es posible usar los recursos de la química computacional, disponibles hoy en día, para poder calcular propiedades fisicoquímicas y reactividad. El algoritmo puede ser aplicado iterativamente para proponer un conjunto grande de moléculas y así poder seleccionar los mejores modelos basados en criterios más objetivos provenientes del uso de programas de química computacional. Además, la aplicación de éste algoritmo a cada componente del SARA, permitirá proponer mezclas de compuestos que pudieran representar las propiedades macroscópicas de los CP/XP/R como las densidades, curva de destilación y solubilidad.
Tabla 1. Lista de las UEs
típicas presentes en los CP/XP/R. |
|
Nombre |
Estructura molecular |
Cadena
alifática de sustitución terminal (ST) |
-(CH2)n-CH3 |
Unidad
nafténica (Naf) |
|
Unidad
aromática (Ar) |
|
Cadena
alifática link (Link) |
|
Sistema
policondesado saturado (sheet nafténico) |
|
Sistema
policondesado aromático (sheet aromático) |
|
Heteroátomos |
S: Tiofeno (Tiof),
Tioéteres (Tioe) N: Piridina (Piri), O: -COOH
Carboxilos (Carboxi), -CHO aldehídos (Aldehi), -OH hidroxílicos (Hidroxi) |
Análisis SARA y estructura de
los componentes.
El análisis SARA [2] de los CP/XP/R permite separarlos en cuatro fracciones: Saturados, Aromáticos, Resinas, y Asfaltenos. Esta técnica es un estándar para la caracterización de los CP/XP/R con la finalidad de: (a) tener el conocimiento de las cantidades ponderadas de los cuatro tipos de compuestos (que supone una importante información para el refino), y, (b) la preparación de fracciones para realizar un análisis posterior de las mismas (espectrometría de masa para las fracciones vaporizables, RMN del protón o del carbono, etc.).
Los componentes de los CP/XP/R consisten principalmente en estructuras policondensadas tanto nafténicas como aromáticas que tienen diferentes tipos de carbono, según su coordinación a otros carbonos vecinos. Estos se clasifican (sin atender a la cantidad de hidrógenos que tienen estos carbonos, y sin atender si estos carbonos son aromáticos, o, nafténicos) en carbonos no-puentes (np), puentes de segundo orden (p2) y puentes de tercer orden (p3), ver Figura 1.
|
Figura
1. Clasificación de los
distintos tipos de carbonos. Los anillos pueden ser nafténicos
o aromáticos. Los carbonos se clasifican como no-puentes (np)
(en la figura hay 14 carbonos np), puentes de
segundo orden (p2) (en la figura hay 8 carbonos p2) y puentes de tercer orden
(p3) (en la figura hay 2 carbonos p3). |
Los anillos nafténicos condesados cuando están unidos a sistemas policondensados aromáticos, se clasifican en hidroaromáticos (HA), nafténicos (Naf) y no-nafténicos (no-Naf), ver Figura 2. Los HA son anillos que están unidos a un solo anillo aromático. Los no-Naf son anillos que están unidos a dos anillos aromáticos. Los Naf son anillos que están unidos sólo a otros anillos nafténicos (HA o no-Naf).
Los anillos nafténicos y aromáticos se pueden unir para formar tres tipos de estructuras policondensadas, estas son: (a) sistema policondensado nafténico; (b) sistema policondensado aromático; (c) sistema policondensado mixto, constituido por una parte de anillos policondensados nafténicos, y otra parte por anillos policondensados aromáticos. En estos tres casos, llamamos a la estructura policondensada (nafténica, aromática o mixta) como un sheet, o también una isla. Por ejemplo, la estructura de la Figura 3 es un sheet, y conforma un sistema policondensado mixto.
La generación de las posibles combinaciones del conjunto de las UEs a partir de información química analítica para el componente saturado del SARA de un CP/XP/R es el objetivo principal del presente trabajo. Por lo cual se producen de las coordenadas cartesianas de todos los átomos que conforman la estructura molecular. El algoritmo propuesto puede codificado fácilmente en cualquier lenguaje de computación. Este algoritmo es suficientemente general para ser aplicado a cualquier sistema molecular con el objetivo de apoyar el desarrollo futuro de metodologías para construir estructuras moleculares de los otros componentes del SARA (Aromáticos, Resínicos y Asfalténicos).
|
|
Figura 2. Estructura del componente saturado del SARA. |
Figura 3. Clasificación de los distintos tipos de
anillos policondensados nafténicos
unidos a un sistema policondesado aromático. |
METODOLOGIA
Estructura de la fracción saturada del SARA para los crudos pesados y
residuos. estructura del componente saturado del
SARA de los crudos CP/XP/R está constituida por cadenas alifáticas y anillos
saturados, con una o más sustituyentes alquílicos o grupos de heteroátomos,
también pueden existir como estructuras poli condensadas saturadas de tamaño
moderado, igualmente con sustituciones en los carbonos más exteriores de la
estructura [5-6], ver Figura 3. La estructura poli condensada de anillos
saturados se lo denomina un “sheet” (o isla) nafténico.
En éste estudio se supone que la estructura de la molécula promedio del componente saturado del SARA es un sheet constituido únicamente por anillos nafténicos, con una o varias cadenas alifáticas terminales. En esta estructura no se consideran los heteroátomos.
Informe estructural del componente saturado del SARA. La cantidad de cada UEs en la Tabla 1 presentes en los componentes SARA es lo que se define como informe estructural (IE) y es obtenido a partir de los PM derivados de los estudios de RMN.
En la Tabla 2 se muestra el IE
típico para el componente saturado del SARA. En la primera columna se listan,
lo que hemos definido en este trabajo, como los Parámetros Estructurales del
componente saturado del SARA, para diferenciarlos de los Parámetros Moleculares
usados en RMN. La Figura 4 muestra una molécula hipotética típica de un
componente saturado de un SARA que es compatible con el IE de la Tabla 3 y la
usaremos como ejemplo de aplicación de la metodología de este estudio. Esta molécula
consiste de un sheet
que contiene 10 carbonos np (califnp(i=1) = 10, donde i
indica el número del sheet)
que corresponden a los átomos 1, 3, 4, 5, 7, 8, 10, 11, 12, 14. Contiene 4
carbonos tipo p2 (califp2(i=1) = 4; átomos: 2, 6, 9, 13) y 2 carbonos
p3 (califp3(i=1) = 2, átomos 15 y 16). Por otro lado, la molécula de la Figura
4 contiene también un número de sustituciones terminales (ST) alifáticas igual
a tres (NSTA(i=1) = 3). El número de átomos de cada ST se representa con la
variable c(i,j). Por ejemplo, la ST número 1 (j=1) del sheet
1 (i=1) tiene 4 carbonos (c(i=1,j=1) = 4) que
corresponden a los átomos 17, 18, 19, 20.
Tabla 2. Informe estructural típico del componente
saturado del SARA para CP/XP/R . |
|
Parámetro
Estructural |
Definición |
CSARA |
Componente
del SARA CSARA = Saturado, Aromático, Resínico,
Asfalténico. |
Fórmula molecular |
CxHy |
NSH
|
Número de
sheets de
la molécula promedio. |
NNAF(i) |
Número de
anillos nafténicos asociados al sheet i, con i = 1,..., NSH. |
NSTA(i) |
Número de
sustituciones terminales alifáticas asociadas al sheet i. |
c(j,i) |
Número de
átomos de carbono de la cadena alifática terminal j asociada al sheet i, con j = 1, 2,…, NSTA(i). |
Califnp(i), Califp2(i), Califp3(i) |
Número de
átomos de carbono alifáticos no puente, puente de 2do y puente de
3er orden asociados al sheet i,
respectivamente. |
Figura 4. Generación de una molécula compatible con el IE de la Tabla 3. |
Tabla 3. Informe estructural de un componente saturado
hipotético de un SARA. |
|
Parámetro Estructural |
Definición |
CSARA |
Saturado |
Fórmula molecular |
C32H45 |
NSH |
1 |
NNAF(i) |
NNAF(1) = 4 |
NSTA(i) |
NSTA(1) = 3 |
c(j, i) |
c(1, 1) = 4, c(2,
1) = 3, c(3, 1) = 2 |
califnp(i), califp2(i), califp3(i) |
califnp(1) = 10, califp2(1) = 4, califp3(1) = 2 |
Variables de caracterización de los átomos. Para el desarrollo de la presente metodología hemos creado un conjunto de variables que permiten caracterizar a cada uno de los carbonos de la estructura molecular que se quiere construir a partir de los IEs del componente saturado del SARA, ver Tabla 4.
Tabla 4. Definición de las variables de
caracterización de los carbonos de la estructura molecular de los componentes
SARA para CP/XP/R. |
|
Variable |
Definición |
N |
Es el número identificador del átomo
presente en la estructura molecular del componente SARA en estudio. |
NTA |
Número total de átomos. |
NTB |
Número total de enlaces. |
AT(N) |
Es el símbolo químico del átomo número N. Los valores de la variable AT podrían ser: C, H, S, N, O. |
H(N) |
Cantidad de átomos de hidrógeno del átomo
número N. |
x(N),
y(N), z(N) |
Coordenadas cartesianas x, y, z del átomo número N. |
Ocu(N) |
Ocupación. Indica si una coordenada (x, y, z) está ocupada por
un átomo. Los valores de la variable Ocu son: 1 si
hay un átomo y 0 si no hay. |
T(N),
k(N) |
Indican las propiedades del átomo número N. Los valores de la
variables T son: Hidrog = Hidrógeno, AlifC =
Alifático Cíclico, AlifT = Alifático de cadena Terminal, AlifL = Alifático de cadena Link, Carbox
= Acido carboxílico, Aldehi = Aldehídico, Ar =
Aromático. Los valores de k son: np = no-puente, p2 = puente 2do orden, p3 =
puente 3er orden. Si k
= 0, el átomo no es ninguna de estas categorías. |
T2(N),
m(N) |
Indican las propiedades secundarias de los
carbonos no-puente (k(N) = np).
Los valores de la variable T2 son:
0, para los átomos que no son no-puentes, Ar = Aromático, HA = Hidroaromático,
noNaft = no-Nafténico, Naft = Nafténico, Tiof = Tiofénico, Piri = Piridínico. La variable m tiene los siguientes valores: PA, PAb,
LD-A, LD-Ab, LI-A, LI-Ab, cuyo significado se explica en el
texto. Si AT(N) es H, m = 0. |
T3(N),
p(N) |
Indican las propiedades terciarias de los
carbonos ubicados en cadenas tipo ST o Link (T(N) = AlifT o AlifL). Los posibles
valores de la variable T3 son: 0 = No cumple con ninguna función de anclaje
o de link. Origen = anclaje de cadenas de ST, link y grupos
funcionales. Pivote = primer átomo de la cadena alifática. Linkeo = átomo fin de cadena link que se une a un
átomo receptor. Receptor = átomo receptor de cadena link. Fin = átomo de fin de cadena ST. El significado de la variable p se explica en el texto. |
B(N,N’) |
La variable B indica el tipo de enlace entre el átomo numero N y el N’, y sus valores son: 0 = No hay enlace, 1 = Enlace simple, 2 =
Enlace doble, 3 = Enlace triple, 4 = Enlace doble deslocalizado (ejemplo, el
C=C del benceno). |
Obsérvese que la Tabla 4 es suficientemente general para ser aplicada a cualquier sistema molecular, con el objetivo de apoyar el futuro desarrollo de metodologías para construir estructuras moleculares de los otros componentes del SARA (Aromáticos, Resínicos y Asfalténicos). La aplicación de la Tabla 4 a la molécula de la Figura 4 genera la Tabla 5 para los átomos de carbono y la Tabla 6 para los átomos de hidrógeno.
Tabla 5. Caracterización de los átomos de carbono de la estructura de la Figura
4 acorde con las variables definidas en la Tabla 4. |
||||||||||||
N |
H(N) |
x(N) |
y(N) |
z(N) |
T(N) |
k(N) |
T2(N) |
m(N) |
T3(N) |
p(N) |
N’ |
B(N,N’)* |
1 |
1 |
7 |
6 |
0 |
AlifC |
np |
Naf |
PI-Ab |
Origen |
0 |
2 |
1 |
14 |
1 |
|||||||||||
17 |
1 |
|||||||||||
2 |
1 |
7 |
7 |
0 |
AlifC |
p2 |
0 |
0 |
0 |
0 |
3 |
1 |
15 |
1 |
|||||||||||
3 |
2 |
6 |
8 |
0 |
AlifC |
np |
Naf |
PI-Ab |
0 |
0 |
4 |
1 |
4 |
2 |
6 |
9 |
0 |
AlifC |
np |
Naf |
PI-A |
0 |
0 |
5 |
1 |
5 |
1 |
7 |
10 |
0 |
AlifC |
np |
Naf |
PA |
Origen |
0 |
6 |
1 |
21 |
1 |
|||||||||||
6 |
1 |
8 |
9 |
0 |
AlifC |
p2 |
0 |
0 |
0 |
0 |
7 |
1 |
15 |
1 |
|||||||||||
7 |
2 |
9 |
10 |
0 |
AlifC |
np |
Naf |
PA |
0 |
0 |
8 |
1 |
8 |
2 |
10 |
9 |
0 |
AlifC |
np |
Naf |
PD-A |
0 |
0 |
9 |
1 |
9 |
1 |
10 |
8 |
0 |
AlifC |
p2 |
0 |
0 |
0 |
0 |
10 |
1 |
16 |
1 |
|||||||||||
10 |
1 |
11 |
7 |
0 |
AlifC |
np |
Naf |
PD-A |
Origen |
0 |
11 |
1 |
24 |
1 |
|||||||||||
11 |
2 |
11 |
6 |
0 |
AlifC |
np |
Naf |
PD-Ab |
0 |
0 |
12 |
1 |
12 |
2 |
10 |
5 |
0 |
AlifC |
np |
Naf |
PAb |
0 |
0 |
13 |
1 |
13 |
1 |
9 |
6 |
0 |
AlifC |
p2 |
0 |
0 |
0 |
0 |
14 |
1 |
16 |
1 |
|||||||||||
14 |
1 |
8 |
5 |
0 |
AlifC |
np |
Naf |
Pab |
0 |
0 |
--- |
--- |
15 |
1 |
8 |
8 |
0 |
AlifC |
p3 |
0 |
0 |
0 |
0 |
16 |
1 |
16 |
1 |
9 |
7 |
0 |
AlifC |
p3 |
0 |
0 |
0 |
0 |
--- |
--- |
17 |
2 |
6 |
6 |
0 |
AlifT |
0 |
0 |
0 |
Pivote |
1 |
18 |
1 |
18 |
2 |
5 |
6 |
0 |
AlifT |
0 |
0 |
0 |
0 |
1 |
19 |
1 |
19 |
2 |
4 |
6 |
0 |
AlifT |
0 |
0 |
0 |
0 |
1 |
20 |
1 |
20 |
3 |
3 |
6 |
0 |
AlifT |
0 |
0 |
0 |
0 |
1 |
--- |
--- |
21 |
2 |
7 |
11 |
0 |
AlifT |
0 |
0 |
0 |
Pivote |
5 |
22 |
1 |
22 |
2 |
7 |
12 |
0 |
AlifT |
0 |
0 |
0 |
0 |
5 |
23 |
1 |
23 |
3 |
7 |
13 |
0 |
AlifT |
0 |
0 |
0 |
0 |
5 |
--- |
--- |
24 |
2 |
12 |
7 |
0 |
AlifT |
0 |
0 |
0 |
Pivote |
10 |
25 |
1 |
25 |
3 |
13 |
7 |
0 |
AlifT |
0 |
0 |
0 |
0 |
10 |
--- |
--- |
Ocu(N) = 1, AT(N)
= C para todos los átomos. * En B(N,N’) no
se reportan los enlaces repetidos. |
En la Tabla 4, el parámetro T2 indica la naturaleza química del átomo N, y m permite establecer el posicionamiento relativo del átomo np en el anillo donde está localizado. En la Figura 4, el átomo np 11 se clasifica como T2(11) = Naft, m(11) = LD-Ab, y significa que dicho átomo, se ubica en el Lado Derecho del anillo nafténico y en la parte de Abajo de ese lado. El átomo np 10 se clasifica como T2(10) = Naft, m(10) = LD-A, y significa que dicho átomo está en el Lado Derecho del anillo donde está localizado y en la parte de Arriba de ese lado. Los átomos np 7 y 12 se clasifican respectivamente como T2(7) = Naft, m(7) = PA y T2(12) = Naft, m(12) = PAb, y significa que dichos átomos están ubicados en un Pico Arriba y en un Pico Abajo respecto del anillo nafténico que los contienen. Los átomos np 3 y 4 se clasifican respectivamente como T2(3) = T2(4) = Naft, m(3) = LI-Ab, m(4) = LI-A, y significa que dichos átomos están ubicados en el Lado Izquierdo Abajo y Lado Izquierdo Arriba del anillo nafténico que los contiene.
Por otro lado, las variables T3(N) y p(N) dan información de los átomos ubicados en cadenas tipo ST o de Link (ver Tabla 1). Por ejemplo, vamos a estudiar la cadena ST j = 1 que está constituida por los átomos 1, 17, 18, 19 y 20, ver Fig. 4. El átomo N = 1 se clasifica como T(1)=AlifC, k(1) = np, T2(1) = Origen, p(1) = 0. La variable T2(1) = Origen significa que dicho átomo es el origen de la cadena tipo ST, es decir, la cadena ST está anclada sobre el átomo 1. La variable p(1) = 0 significa que el átomo 1 no pertenece a la cadena (es sólo origen de la cadena). El átomo 17 se clasifica como T(17) = AlifT, k(17) = 0, T3(17) = Pivote, p(17) = 1. La variable T3(17) = Pivote significa que el átomo 17 es el nombre que se le da al primer átomo de la cadena ST o Link, y p(17) = 1 indica que el átomo 17 se encuentra ubicado en una ST anclada al átomo 1. El átomo 18 se clasifica como T(18) = AlifT, k(18) = 0, T3(18) = 0, p(18) = 1. La variable T3(18) = 0, indica que el átomo 17 no cumple con ninguna de las siguientes funciones: Origen, Pivote, o Fin. El átomo 20 se clasifica como T(20) = AlifT, k(20) = 0, T3(20) = Fin, p(20) = 1. La variable T3(20) = Fin, indica que el átomo 20 es fin de la cadena ST donde pertenece.
Tabla 6. Caracterización de los átomos de hidrógeno
de la estructura de la Figura 4 acorde con las variables definidas en la
Tabla 4. |
||||||||||
N |
x(N) |
y(N) |
z(N) |
N’ |
|
N |
x(N) |
y(N) |
z(N) |
N’ |
26 |
7 |
6 |
1 |
1 |
|
48 |
9 |
7 |
1 |
16 |
27 |
7 |
7 |
1 |
2 |
|
49 |
6 |
6 |
1 |
17 |
28 |
6 |
8 |
1 |
3 |
|
50 |
6 |
6 |
-1 |
17 |
29 |
6 |
8 |
-1 |
3 |
|
51 |
5 |
6 |
1 |
18 |
30 |
6 |
9 |
1 |
4 |
|
52 |
5 |
6 |
-1 |
18 |
31 |
6 |
9 |
-1 |
4 |
|
53 |
4 |
6 |
1 |
19 |
32 |
7 |
10 |
1 |
5 |
|
54 |
4 |
6 |
-1 |
19 |
33 |
8 |
9 |
1 |
6 |
|
55 |
3 |
6 |
1 |
20 |
34 |
9 |
10 |
1 |
7 |
|
56 |
3 |
6 |
-1 |
20 |
35 |
9 |
10 |
-1 |
7 |
|
57 |
2 |
6 |
0 |
20 |
36 |
10 |
9 |
1 |
8 |
|
58 |
7 |
11 |
1 |
21 |
37 |
10 |
9 |
-1 |
8 |
|
59 |
7 |
11 |
-1 |
21 |
38 |
10 |
8 |
1 |
9 |
|
60 |
7 |
12 |
1 |
22 |
39 |
11 |
7 |
1 |
10 |
|
61 |
7 |
12 |
-1 |
22 |
40 |
11 |
6 |
1 |
11 |
|
62 |
7 |
13 |
1 |
23 |
41 |
11 |
6 |
-1 |
11 |
|
63 |
7 |
13 |
-1 |
23 |
42 |
10 |
5 |
1 |
12 |
|
64 |
7 |
14 |
0 |
23 |
43 |
10 |
5 |
-1 |
12 |
|
65 |
12 |
7 |
1 |
24 |
44 |
9 |
6 |
1 |
13 |
|
66 |
12 |
7 |
-1 |
24 |
45 |
8 |
5 |
1 |
14 |
|
67 |
13 |
7 |
1 |
25 |
46 |
8 |
5 |
-1 |
14 |
|
68 |
13 |
7 |
-1 |
25 |
47 |
8 |
8 |
1 |
15 |
|
69 |
14 |
7 |
0 |
25 |
AT(N) = H, Ocu = B(N,N') = 1,
T(N) = Hidrog,
H(N)
= k(N) = T2(N) = T3(N) = p(N) = 0, para todos los átomos. |
Coordenadas
“vacías” y coordenadas “ocupadas”. El
procedimiento para generar la estructura molecular a partir de un IE, comienza
por definir una grid de puntos en un plano xy donde se colocarán en forma progresiva las UE
verificando en cada paso el cumplimiento del IE.
En el caso del componente saturado, la primera UE que se ubica es un anillo de seis lados. Este anillo es generado de tal manera, que los seis vértices coinciden con seis puntos de la grid, por lo tanto, el anillo presentará necesariamente una deformación respecto a un hexágono de lados iguales. La ventaja de trabajar sobre este plano, es la posibilidad de hacer cálculos sencillos de geometría analítica para ubicar todos los vértices de las UEs que se vayan generando, por lo tanto, se genera primero los sitios geométricos de los átomos de carbono, o de las UEs. Las coordenadas de estos sitios geométricos se denominan “coordenadas vacías” o coordenadas nuevas. Una vez generado el sitio geométrico, donde va la UE, el siguiente paso es establecer las variables de caracterización de cada carbono que constituye la UE generada. Este proceso se define como el llenado del sitio geométrico, por los respectivos átomos de carbono, y las coordenadas de estos sitios ahora se definen como “coordenadas ocupadas”.
Las reglas de construcción de la molécula para el componente saturado del SARA a partir de su IE. La construcción de una molécula depende de la naturaleza del componente SARA, por lo tanto, esta sección resume los algoritmos y procedimientos para generar las coordenadas XYZ para cada una de las diferentes estructuras que se pueden generar a partir de un IE del componente saturado del SARA, y acorde con las suposiciones realizadas en este estudio acerca de éste componente. Por simplicidad, la coordenada es z = 0, a menos que, se diga lo contrario para un caso específico.
Generación del primer anillo saturado (AS1). El primer anillo saturado (AS1) tiene la estructura de un hexágono alargado (no simétrico) emula un anillo seis carbonos del ciclohexano. Los valores de las variables de caracterización de cada átomo del primer anillo están en la Tabla 7. Es importante recalcar que se asume que el sheet constituido por los cuatro anillos nafténicos (ver IE, Tabla 3), es una estructura totalmente planar. Esto se hace con la finalidad de simplificar el proceso de generación del sheet, y obtener una primera aproximación de las coordenadas de cada uno de sus átomos. Posteriormente, este sistema con sus respectivas ST se llevan a un programa de mecánica molecular para su optimización y generación de la estructura correcta en el espacio. Por lo tanto, el objetivo del procedimiento que estamos proponiendo es generar de manera sencilla, las posibles estructuras con una geometría aproximada que se derivan de un IE. Es importante observar que la generación del AS1 implica un valor de NTA = 6.
Tabla 7. Clasificación de los átomos de la estructura
del primer anillo generado acorde con las variables definidas en la Tabla 4. |
|||
N |
X(N) |
Y(N) |
m(N) |
1 |
7 |
7 |
PAb |
2 |
6 |
8 |
LI-Ab |
3 |
6 |
9 |
LI-A |
4 |
7 |
10 |
PA |
5 |
8 |
9 |
LD-A |
6 |
8 |
8 |
LD-Ab |
AT(N)
= C, Ocu(N) = 1, H(N) = 2, T(N) = AlifC, k(N)
=
np y T2(N) = Naft |
Generación del segundo anillo saturado (AS2). El segundo anillo saturado se genera a partir de algún lado (el cual se elige al azar) de la estructura AS1 que contenga dos átomos tipo np, y que la distancia entre estos átomos sea igual a 1 o , ya que esto asegura que sean átomos vecinos. El lado escogido con este criterio se le llama Lado Generador (LG). Obsérvese que estamos trabajando con anillos hexagonales distorsionados (alargados), por lo tanto, la distancia entre los vértices no es la misma. Este tipo de anillo tiene como consecuencia que existan el Caso(1) y el Caso(2) para generar el nuevo anillo (AS2).
Caso (1): La longitud del LG es 1.
Si las coordenadas de los átomos del LG son (x1, y1) y (x2, y2), entonces, se tienen las siguientes posibilidades:
Si, y1 > y2, x1 = x2, entonces, se puede generar un segundo anillo a la Derecha o a la Izquierda del LG con las siguientes coordenadas:
Derecha: (x1, y1); (x2, y2); (x2+1, y2-1); (x2+2, y2); (x1+2, y1); (x1+1, y1+1)
Izquierda: (x1, y1); (x2, y2); (x2-1, y2-1); (x2-2, y2); (x1-2, y1); (x1-1, y1+1)
Caso (2): La longitud del LG es .
Si las coordenadas de los átomos del LG son (x1, y1) y (x2, y2), se tiene las siguientes posibilidades.
(2a) Si, y1 > y2, x1 < x2, entonces, se puede generar un Segundo Anillo por Arriba o por Abajo del LG, ver Figura 5.
Arriba: (x1, y1); (x2, y2); (x2-1, y1); (x2-1, y1+1); (x2, y2+3); (x1, y1+1)
Abajo: (x1, y1); (x2, y2); (x2, y2-1); (x1, y1-3); (x1+1, y2-1); (x1+1, y2)
|
Figura 5. Generación de las coordenadas nuevas del segundo
anillo (AS2) para el Caso(2a) respecto al Lado
Generador LG limitado por lo
puntos 1 y 2 de coordenadas (x1,
y1), (x2, y2) donde y1
> y2, x1 < x2. (a) Generación del
anillo 2 por arriba del LG y de
sus nuevas coordenadas. (b) Generación del anillo 2 por debajo del LG y donde sus coordenadas coinciden
con el anillo 1 (AS1). |
(2b) Si, y1 > y2, x1 > x2, entonces, se puede generar un AS2 por Arriba o por Abajo del LG, ver Figura 6:
Arriba: (x1, y1); (x2, y2); (x2+1, y1); (x2+1, y1+1); (x2, y2+3); (x1, y1+1)
Abajo: (x1, y1); (x2, y2); (x2, y2-1); (x1, y1-3); (x1-1, y2-1); (x1-1, y2)
|
Figura 6. Generación de las coordenadas nuevas del
segundo anillo (AS2) para el Caso(2b) respecto al Lado Generador LG limitado por lo puntos 1 y 2 de
coordenadas (x1, y1), (x2,
y2) donde y1 > y2, x1 > x2.
(a) Generación del anillo 2 por arriba del LG y de sus nuevas coordenadas. (b) Generación del anillo 2 por
debajo del LG y donde sus
coordenadas coinciden con el anillo 1 (AS1). |
El Caso(1) o el Caso(2) generan las coordenadas del lugar geométrico de varios anillos. El anillo correcto es aquel que tiene, al menos, una coordenada no ocupada por un átomo. En otras palabras, el anillo generado es incorrecto, si todas sus coordenadas están ocupadas por átomos. Si el anillo generado es el correcto, entonces, pueden existir en AS2 tanto coordenadas vacías como coordenadas ocupadas. Las coordenadas vacías son llenadas mediante la asignación de los valores de las variables de caracterización de los nuevos átomos que serán localizados en sus sitios geométricos. Por otro lado, las propiedades de los átomos de carbono localizados en las coordenadas ocupadas que residen en los linderos de AS2, deben ser actualizadas, ya que al estar unidos al AS2 cambian su coordinación y sus propiedades, por ejemplo, si eran T = AlifC, k = np, ahora son T = AlifC, k = p2, si eran T = AlifC, k = p2, ahora son T = AlifC, k = p3. A cada nueva coordenada se le asigna N, AT(N) = C, Ocu(N) = 1, T(N) = AlifC, k(N) = np, y se actualiza el NTA. Este proceso de generación de AS se realiza hasta llegar al valor de NNF(i) (ver Tabla 3), una vez finalizado el proceso de generación de AS, entonces, ya se tiene una posible configuración de anillos que generan un sheet nafténico, los cuales vienen determinados por los valores de las variables califnp(i), califp2(i), califp3(i) (ver Tabla 3). Estas variables se comparan con el IE del componente saturado, si no hay coincidencia se vuelve a construir el sheet nafténico, y este proceso culmina hasta que se logra la coincidencia de las variables del sheet generado con el sheet del IE. Es bueno observar que, por ejemplo, la variable califnp(i) (de la estructura generada siguiendo las reglas propuestas) se obtiene sumando todos los átomos que son no-puentes.
Generación de las
sustituciones alifáticas terminales (ST). A continuación se dan las reglas en forma de casos para poder
hacer las ST. La ST sólo se puede hacer sobre átomos T = AlifC, k = np y con H = 2. Este átomo se lo denomina átomo Origen de Cadena, y es
escogido al azar. A partir del Pivote, la cadena crece de manera lineal, ver
Figura 7. Para poder generar la ST sobre el átomo elegido, hay varios casos.
|
Figura 7. Generación de una cadena terminal sobre un átomo con m = PA. La cadena puede crecer hacia arriba del átomo pivote. Los puntos a1, y a2 representan los átomos de la cadena terminal. |
Caso(4): Generación de la ST.
Sea una cadena ST de c(j, i) carbonos, si (x, y) son las coordenadas del átomo Origen de Cadena, se asigna provisionalmente a este átomo Ocu = 0. El primer átomo de la cadena se lo llama átomo Pivote, y sobre este átomo se genera el resto de la cadena en forma lineal. Las coordenadas de los átomos de la cadena se obtienen de la siguiente manera.
(4a) Átomo Origen con m = PA, PAb. La cadena alifática puede crecer a partir del Pivote en forma lineal. Las coordenadas del átomo Pivote (P) son:
Para m = PA: P = (x, y+1)
Para m = PAb: P = (x, y-1)
Las coordenadas del resto de la cadena son (ver la Figura 7 los puntos a1, a2 y Fin de Cadena):
as = P + s·r·(0, 1)
donde r = 1 si m = PA, o, r = -1 si m = PAb, s varía de 1 a n, y n = c(j, i)-1. El parámetro an contiene las coordenadas del átomo de Fin de Cadena.
(4b) Átomo Origen con m = PD-A, PD-Ab, PI-A, PI-Ab. La cadena alifática puede crecer a partir del pivote en forma lineal. Las coordenadas del átomo pivote (P) son:
Para m = LD-A, LD-Ab: P = (x+1, y)
Para m = LI-A, LI-Ab: P = (x-1, y)
Las coordenadas de los átomos de la ST vienen dadas por:
as = P + s·r·(1,0)
donde r = 1 si m = PD-A, PD-Ab, o, r = -1 si m = PI-A, PI-Ab, s varía de 1 a n, y n = c(j, i)-1. El parámetro an contiene las coordenadas del átomo de Fin de Cadena.
El Caso(4) genera las coordenadas de los átomos de la ST. La ST correcta es aquella que tiene, sus coordenadas sin ocupar por ningún átomo (Ocu = 0), adicionalmente, las nuevas coordenadas deben ser tales que, la distancia entre las coordenadas del sitio geométrico del ST con las coordenadas ocupadas por cualquier otro átomo de la estructura, debe ser mayor a una unidad (1). Si esto no se cumple, entonces, se dice que hay un “Tropiezo”. Para que la detección de un Tropiezo funcione adecuadamente, es necesario hacer a la variable Ocu = 0 para el átomo Origen de Cadena, ya que el átomo Pivote y el átomo Origen de Cadena son vecinos. Si la ST cumple con todos los requisitos, se procede hacer lo siguiente. El átomo Origen de Cadena se le asigna nuevamente Ocu = 1. Los átomos de carbono de la ST se les asignan los valores de N, H(N) = 2 (al átomo de Fin de Cadena se le asigna H(N) = 3), Ocu(N) = 1, T(N) = AlifT, T2(N) = 0, m(N) = 0, y se actualiza la NTA.
Generación de los hidrógenos de la estructura molecular. Se procede a colocar los hidrógenos sobre los distintos carbonos que así lo requieran.
Caso(5): Generación de hidrógenos.
Una vez dado el valor H(N) a cada átomo de carbono, se procede asignar las variables de caracterización a cada hidrógeno de la estructura molecular. Existen varias posibilidades.
5a) Hidrógenos sobre átomos de carbono del Tipo T = AlifC, con H = 1.
El hidrógeno se coloca sobre el átomo de carbono y perpendicular al plano xy en la dirección z+. Si las coordenadas del átomo de carbono en cuestión son (x, y), se tiene que las coordenadas del H son: H: (x, y, 1).
5b) Hidrógenos sobre átomos de carbono del Tipo T = AlifC, con H = 2.
Los dos hidrógenos se colocan sobre el átomo de carbono de la siguiente manera. Uno de los hidrógenos se coloca por encima del plano xy en sentido z+, y el otro hidrógeno en sentido z- (ambos hidrógenos están entre sí en un ángulo de 180°). Si las coordenadas del átomo de carbono en cuestión son (x, y), se tiene que las coordenadas de los dos hidrógenos son: H: (x, y, 1), H: (x, y, -1).
5c) Hidrógenos sobre átomos de carbono Tipo T = AlifT, con H = 1.
El hidrógeno se coloca sobre el átomo de carbono y perpendicular al plano xy. Si las coordenadas del átomo de carbono en cuestión son (x,y), se tiene que la coordenada del hidrógeno son: H: (x,y,1).
5d) Hidrógenos sobre átomos de carbono Tipo T = AlifT, con H = 2.
Los dos hidrógenos se colocan sobre el átomo de carbono. Uno de los hidrógenos se coloca por arriba del plano xy en dirección z+, el otro hidrógeno se coloca abajo del plano xy en dirección de z-. Si las coordenadas del átomo de carbono en cuestión son (x, y), se tiene que las coordenadas de los dos hidrógenos son: H: (x, y, 1), H: (x, y, -1).
5e) Hidrógenos sobre átomos de carbono Tipo T = AlifT, con H = 3.
Los tres hidrógenos se colocan sobre el átomo de carbono de la siguiente manera. Dos hidrógenos son colocados según (5d), el tercer hidrógeno se coloca en el plano xy, pero existen varias posibilidades. Si las coordenadas del átomo de carbono en cuestión es (x, y), se tiene que las coordenadas R del tercer hidrógeno, de acuerdo al valor m del átomo de Origen, son:
5e1) Para m = PA, R = (x, y+1, 0).
5e2) Para m = PAb, R = (x, y-1, 0).
5e3) Para m = PD-A, PD-Ab, R = (x+1, y, 0).
5e4) Para m = PI-A, PI-Ab, R = (x-1, y, 0).
Generación de los enlaces entre los átomos de carbono de la estructura molecular. Es necesario recalcar que durante el proceso de generación de los átomos de hidrógeno en la estructura molecular se asigna el enlace entre cada hidrógeno con el carbono donde está unido (se le asignan valores a N, N’, B(N,N’)), mientras que los enlaces entre los carbonos de la estructura se generan posteriormente aplicando las siguientes reglas.
Caso(6): Determinación del tipo de enlace entre los átomos de carbono.
Se procede a calcular la distancia D del átomo de carbono N con el resto de los átomos de carbono de la estructura, si D entre los átomos de carbono N y N’ es 1 o , y además, si no está tabulada la combinación N’-N, entonces, se tiene un enlace no repetido entre el átomo de carbono N con el átomo de carbono N’, y se aplica el siguiente procedimiento para establecer el enlace entre N y N’.Se define el parámetro NCC(N) como el número de enlaces C-C tipo AlifC-AlifC donde está presente el átomo de carbono N tipo AlifC. El parámetro NCC(N) inicialmente es cero antes del proceso de asignación de enlaces. El vínculo entre átomos de carbono se obtiene de la siguiente manera. Si la distancia entre los carbonos N y N’ no es 1 o , entonces, B(N,N’) = 0. Si los átomos de carbono N y N’ están a una distancia de 1 o , se presentan las siguientes posibilidades.
6a) Enlace C-C tipo AlifC-AlifC:
Calcular NCC(N) = NCC(N) + 1, y NCC(N’) = NCC(N’) + 1, y revisar los condicionales siguientes para k(N) = np.
6a1) Si NCC(N) > 2, o, si k(N’) = np y NCC(N’) > 2, entonces, B(N,N’) = 0,
6a2) Si NCC(N) £ 2, o, si k(N’) = np y NCC(N’) £ 2, entonces, B(N,N’) = 1.
La condicional (6a1) chequea que no se generen enlaces sobre carbonos np con una NCC mayor de 2. Obsérvese que si se cumple esta condicional, entonces se le resta una unidad a NCC(N) y a NCC(N’).
6b) Enlace C-C tipo AlifT-AlifT:
Si D = 1, y p(N) = p(N’), entonces, B(N,N’) = 1.
Esta condicional previene la posibilidad que se puedan producir enlaces entre dos ramas vecinas.
6c) Enlace C-C AlifC-AlifT
o enlace C-C AlifT-AlifC:
Se tienen los siguientes condicionales con D =1,
6c1) Si T3(N) = Origen, entonces, B(N,N’) = 1.
6c2) Si T3(N’) = Origen, entonces, B(N,N’) = 1.
Una vez establecido el enlace entre los carbonos N y N’ se actualiza el NTB.
RESULTADOS Y DISCUSIÓN
Los valores mostrados en las Tablas 5 y 6 fueron obtenidos del archivo de texto plano denominado “GMOL.dat” que contiene todas las variables dadas en la Tabla 4. Para demostrar la metodología propuesta en este estudio, se convirtió el archivo GMOL.dat en otro archivo denominado “GMOLMDL.mol”, el cual es escrito con el formato MDL-mol que se usa de manera estándar para almacenar estructuras moleculares, como la mostrada en la Figura 4. Esta conversión se hace a través de un programa en FORTRAN-77, listado en la Tabla 8.
Tabla 8. Listado del programa en FORTRAN-77 usado
para convertir las variables de caracterización de las Tablas 5 y 6 en un
formato MDL-mol. |
c************************************************************************
subroutine GMOLCONV(NTA,NTB,AT,X,Y,Z,B) c c Este programa convierte
las variables de caracterización de los átomos c de una molécula en un
archivo MDL-mol. c c
Variables
character AT(999)*2 dimension X(999),Y(999),Z(999) integer B(999,999) c c Definición de parámetros auxiliares parameter(N1=0,N2=0,N3=0,N4=0,N5=0,N6=0,N7=0,N8=0,N9=0,N10=0,N11=0,
N12=0) c c escribir en archivo
GMOLMDL.mol open(3,file='GMOLMDL.mol') c linea
1: un titulo write(3,60) 60 format('Molecula en formato MOL') c lineas
2 y 3 blancas write(3,62) 62 format(' ') write(3,64) 64 format(' ') c linea
4: 11 campos de tres caracteres cada uno, los primeros dos son NTA y NTB write(3,66)
NTA,NTB,N3,N4,N5,N6,N7,N8,N9,N10,N11 66 format(11(I3)) c linea
5 en adelante de los atomos do 70 N=1,NTA write(3,68) X(N),Y(N),Z(N),AT(N),N1,N2,N3,N4,N5,N6, 1 N7,N8,N9,N10,N11,N12 68
format(3(F10.4),1x,A2,12(I3)) 70 continue c Linea
de los enlaces do 90 N=1,NTA do 80
NP=1,NTA if(B(N,NP).eq.0) go to 80 write(3,85) N,NP,B(N,NP),N1,N2,N3,N4 85 format(7(I3)) 80 continue 90 continue c return end c********************************************************************* |
La visualización de la molécula de Figura 4 se hace a través del archivo GMOLMDL.mol mediante un programa libre llamado “Jmol” [7]. La molécula de la Figura 4 se puede ver en la Figura 8, cuyas coordenadas son consecuencia directa de las reglas propuestas en este estudio, y de cómo se han generado los distintos sitios geométricos de cada una de las UE. En particular, la forma en cómo están unidos los hidrógenos a los átomos de carbono, es consecuencia del conjunto de reglas para la incorporación del hidrógeno a la estructura molecular. La Figura 8 es una aproximación a la verdadera estructura del componente saturado asociado al IE de la Tabla 3. El siguiente paso es el uso de la herramienta de optimización que posee el programa Jmol para obtener una estructura optimizada del saturado, como se muestra en la Figura 9. Además, se espera que esa molécula sea correcta desde el punto de vista químico, para el saturado asociado al IE de la Tabla 3.
CONCLUSIONES Y
RECOMENDACIONES
En este estudio se propone una metodología que permite convertir un informe estructural de un componente saturado del SARA derivado de estudios de química analítica y transformarlo en un conjunto de estructuras moleculares compatibles con dicho informe. Esto reduce los tiempos para la generación de propuestas de estructuras moleculares, y evita errores o prejuicios. También el algoritmo propuesto en este estudio genera las estructuras moleculares con las coordenadas de los átomos, lo cual permite la aplicación directa de los programas de química computacional para el cálculo y predicción de sus propiedades fisicoquímicas y reactividad.
Una recomendación que se deriva de este trabajo, es aprovechar al máximo el uso de las herramientas de la química computacional para tratar de crear una simbiosis entre éstas y la intuición química. Por lo tanto, es necesario impulsar el desarrollo de programas que puedan, como en este caso, convertir las reglas intuitivas de la química, en algoritmos para el desarrollo de programas versátiles, que ayuden a la interacción eficiente entre los químicos experimentalistas con los programas de la química computacional. Ésta interacción es necesaria fortalecerla ya que permitiría desarrollar investigaciones a nivel molecular de materiales que, actualmente, son la base de la red tecnológica que soporta nuestra sociedad.
REFERENCIAS
1. |
R. B. Williams.
Characterization of Hydrocarbons in Petroleum by Nuclear Magnetic Resonance
Spectrometry. ASTM Spec. Tech.
Publ., 224 (1958) 168-94. |
2. |
E. M. Dickinson. Fuel 59 (1980) 290-294. |
3. |
L. Michon,
D. Martin, J. P. Planche, B. Hanquet.
Fuel 76 (1996)
10-15. |
4. |
L. Carbognani, A. Méndez, V. Sánchez. Acta Cient. Venez. 50, Suplemento Nº
1 (1999) 11-17. |
5. |
K. Peters, M. Moldowan. “The Biomarker Guide”, Prentice Hall Inc. (1993). |
6. |
O. Delgado. Tesis doctoral: "Mejoramiento de crudos pesados
usando aditivos e condiciones de inyección de vapor",
86-87, enero 2004. |
7. |
ProgramaJmol, versión 13.0.18, sourceforge.net/projects/jmol |