CATALISIS 2 (2013) 35-51.

Propuesta de un algoritmo detallado para el desarrollo de un programa de visualización molecular. Parte I: Sistemas saturados

 

Proposal of a detailed algorithm for the development of a molecular visualization program. Part I: Saturated systems

 

IvÁn MachÍn1,*, Ricardo FernÁndez2, Alexander Peraza2, Fernando Ruette2

 

1 Departamento de Termodinámica y Fenómenos de transporte, Universidad Simón Bolívar. A. P. 89000, Caracas 1080, Venezuela.

E-mail: machin_ivan@outlook.com  

2 Laboratorio de Química Computacional, Instituto Venezolano de Investigaciones Científicas. A. P. 20632, Caracas 1020-A, Venezuela.

 

 

RESUMEN

 

               Los estudios de Química Analítica de los componentes del SARA de crudos pesados generan un conjunto de grupos funcionales y unidades moleculares básicas que conforman un Informe Estructural. El trabajo del químico es juntar todas estas piezas de manera lógica, acorde con la experiencia y la intuición química. El presente trabajo es la propuesta de una metodología para la generación de todas las posibles estructuras moleculares que se pueden generar a partir de un Informe Estructural para el componente saturado del SARA de crudos pesados, así como la generación de las coordenadas cartesianas de todos los átomos que conforman su estructura molecular. La metodología está organizada en forma de un conjunto detallado de reglas y protocolos que conforman un algoritmo fácil de codificar en cualquier lenguaje de computación.

 

Palabras clave: Reconstrucción Molecular, Crudos Pesados, SARA.

 

 

ABSTRACT

 

               Studies of analytical chemistry of SARA components from heavy crudes generate a set of functional groups and basic molecular units that make up a structural report. The work of the chemist is to gather all these pieces in a logical manner, commensurate with experience and chemical intuition. This paper is a proposed methodology for the generation of possible molecular structures that can be obtained from a structural report of SARA saturated heavy oil components as well as the generation of the Cartesian coordinates of all atoms for each molecular structure. The methodology is organized in the form of a detailed set of rules and protocols that make an easy algorithm to code in any computer language.

 

Keywords: Molecular Reconstruction, Heavy Oil, SARA.

 

 © Sociedad Venezolana de Catálisis. Todos los derechos reservados. Para permiso, envíe un correo electrónico a: revista.catalisis@gmail.com

 

INTRODUCCIÓN

 

Los crudos pesados venezolanos provenientes de la faja bituminosa del Orinoco, y sus respectivos residuos son muy difíciles de procesar, y requieren del desarrollo de nuevas tecnologías. Existe el consenso que un conocimiento de la estructura molecular de estos sistemas, pueden ayudar a crear procesos óptimos, así como la síntesis de nuevos catalizadores mucho más específicos.

Actualmente se están usando técnicas de resonancia magnética nuclear de protones (RMN), osmometría de presión de vapor (OPV) y análisis elemental como herramientas de la química analítica para establecer la estructura molecular de los crudos pesados,  extrapesados y sus residuos  (CP/XP/R).   La técnica de  RMN  de protones permite establecer los parámetros moleculares (PM) de los CP/XP/R [1-3].   La interpretación de estos parámetros moleculares por un especialista en RMN permite proponer las unidades estructurales (UE) y la cantidad de éstas generando un informe estructural (IE). Al ensamblarlas en el orden lógico (cumpliendo las leyes de la química), se generan las estructuras moleculares modelos de los CP/XP/R. Las UEs típicas están listadas en la  Tabla 1.

Existe un número muy grande de maneras de organizar un conjunto dado de UEs proveniente de un IE debido a la enorme complejidad de los sistemas moleculares de CP/XP/R. El ensamblaje manual de estas estructuras moleculares complejas puede ser tedioso, requiere mucha experticia técnica y está propenso a errores humanos. Además, solo se proponen pocas estructuras, por lo cual es posible que por prejuicio humano se estén excluyendo modelos que representarían mejor al sistema.  Por éste motivo, se hace necesario un programa computacional que sea capaz de generar todas las posibles estructuras derivadas de un IE para luego, usando criterios de selección más objetivos, elegir los mejores modelos moleculares.

            En éste estudio las UE, presentes en un IE, son ensambladas progresivamente siguiendo las reglas químicas para generar las estructuras moleculares correctas desde el punto de vista químico. El algoritmo que se propone tiene la gran ventaja de engranar las UEs y generar las coordenadas de los átomos de las moléculas construidas, con las cuales es posible usar los recursos de la química computacional, disponibles hoy en día, para poder calcular propiedades fisicoquímicas y reactividad. El algoritmo puede ser aplicado iterativamente para proponer un conjunto grande de moléculas y así poder seleccionar los mejores modelos basados en criterios más objetivos provenientes del uso de programas de química computacional. Además, la aplicación de éste algoritmo a cada componente del SARA, permitirá proponer mezclas de compuestos que pudieran representar las propiedades macroscópicas de los CP/XP/R como las densidades, curva de destilación y solubilidad.

 

Tabla 1. Lista de las UEs típicas presentes en los CP/XP/R.

 

Nombre

Estructura molecular

Cadena alifática de sustitución terminal (ST)

-(CH2)n-CH3

Unidad nafténica (Naf)

Unidad aromática (Ar)

Cadena alifática link (Link)

Sistema policondesado saturado (sheet nafténico)

Sistema policondesado aromático (sheet aromático)

Heteroátomos

 

S: Tiofeno (Tiof), Tioéteres (Tioe)

N: Piridina (Piri), O: -COOH Carboxilos (Carboxi), -CHO aldehídos (Aldehi), -OH hidroxílicos (Hidroxi)

Análisis SARA y estructura de los componentes.

 

            El análisis SARA [2] de los CP/XP/R permite separarlos en cuatro fracciones: Saturados, Aromáticos, Resinas, y Asfaltenos. Esta técnica es un estándar para la caracterización de los CP/XP/R con la finalidad de: (a) tener el conocimiento de las cantidades ponderadas de los cuatro tipos de compuestos (que supone una importante información para el refino), y, (b) la preparación de fracciones para realizar un análisis posterior de las mismas (espectrometría de masa para las fracciones vaporizables, RMN del protón o del carbono, etc.).

Los componentes de los CP/XP/R consisten principalmente en estructuras policondensadas tanto nafténicas como aromáticas que  tienen diferentes tipos de carbono, según su coordinación a otros carbonos vecinos. Estos se clasifican (sin atender a la cantidad de hidrógenos que tienen estos carbonos, y sin atender si estos carbonos son aromáticos, o, nafténicos) en carbonos no-puentes (np), puentes de segundo orden (p2) y puentes de tercer orden (p3), ver Figura 1.

 

 

 

 

 

 

Figura 1. Clasificación de los distintos tipos de carbonos. Los anillos pueden ser nafténicos o aromáticos. Los carbonos se clasifican como no-puentes (np) (en la figura hay 14 carbonos np), puentes de segundo orden (p2) (en la figura hay 8 carbonos p2) y puentes de tercer orden (p3) (en la figura hay 2 carbonos p3).

    

        Los anillos nafténicos condesados cuando están unidos a sistemas policondensados aromáticos, se clasifican en hidroaromáticos (HA), nafténicos (Naf) y no-nafténicos (no-Naf), ver Figura 2. Los HA son anillos que están unidos a un solo anillo aromático. Los no-Naf son anillos que están unidos a dos anillos aromáticos. Los Naf son anillos que están unidos sólo a otros anillos nafténicos (HA o no-Naf).

Los anillos nafténicos y aromáticos se pueden unir para formar tres tipos de estructuras policondensadas, estas son: (a) sistema policondensado nafténico; (b) sistema policondensado aromático; (c) sistema policondensado mixto, constituido por una parte de anillos policondensados nafténicos, y otra parte por anillos policondensados aromáticos. En estos tres casos, llamamos a la estructura policondensada (nafténica, aromática o mixta) como un sheet, o también una isla. Por ejemplo, la estructura de la Figura 3 es un sheet, y conforma un sistema policondensado mixto.

            La generación de las posibles combinaciones del conjunto de las UEs a partir de información química analítica para el componente saturado del SARA de un CP/XP/R es el objetivo principal del presente trabajo. Por lo cual se producen de las coordenadas cartesianas de todos los átomos que conforman la estructura molecular. El algoritmo propuesto puede codificado fácilmente en cualquier lenguaje de computación. Este algoritmo es suficientemente general para ser aplicado a cualquier sistema molecular con el objetivo de apoyar el desarrollo futuro de metodologías para construir estructuras moleculares de los otros componentes del SARA (Aromáticos, Resínicos y Asfalténicos).

 

Figura 2. Estructura del componente saturado del SARA.

Figura 3. Clasificación de los distintos tipos de anillos policondensados nafténicos unidos a un sistema policondesado aromático.

 

METODOLOGIA

 

Estructura de la fracción saturada del SARA para los crudos pesados y residuos. estructura del componente saturado del SARA de los crudos CP/XP/R está constituida por cadenas alifáticas y anillos saturados, con una o más sustituyentes alquílicos o grupos de heteroátomos, también pueden existir como estructuras poli condensadas saturadas de tamaño moderado, igualmente con sustituciones en los carbonos más exteriores de la estructura [5-6], ver Figura 3. La estructura poli condensada de anillos saturados se lo denomina un “sheet” (o isla) nafténico.

            En éste estudio se supone que la estructura de la molécula promedio del componente saturado del SARA es un sheet constituido únicamente por anillos nafténicos, con una o varias cadenas alifáticas terminales. En esta estructura no se consideran los heteroátomos.

 

Informe estructural del componente saturado del SARA. La cantidad de cada UEs en la Tabla 1 presentes en los componentes SARA es lo que se define como informe estructural (IE) y es obtenido a partir de los PM derivados de los estudios de RMN.

            En la Tabla 2 se muestra el IE típico para el componente saturado del SARA. En la primera columna se listan, lo que hemos definido en este trabajo, como los Parámetros Estructurales del componente saturado del SARA, para diferenciarlos de los Parámetros Moleculares usados en RMN. La Figura 4 muestra una molécula hipotética típica de un componente saturado de un SARA que es compatible con el IE de la Tabla 3 y la usaremos como ejemplo de aplicación de la metodología de este estudio. Esta molécula consiste de un sheet que contiene 10 carbonos np (califnp(i=1) = 10, donde i indica el número del sheet) que corresponden a los átomos 1, 3, 4, 5, 7, 8, 10, 11, 12, 14. Contiene 4 carbonos tipo p2 (califp2(i=1) = 4; átomos: 2, 6, 9, 13) y 2 carbonos p3 (califp3(i=1) = 2, átomos 15 y 16). Por otro lado, la molécula de la Figura 4 contiene también un número de sustituciones terminales (ST) alifáticas igual a tres (NSTA(i=1) = 3). El número de átomos de cada ST se representa con la variable c(i,j). Por ejemplo, la ST número 1 (j=1) del sheet 1 (i=1) tiene 4 carbonos (c(i=1,j=1) = 4) que corresponden a los átomos 17, 18, 19, 20.

 

Tabla 2. Informe estructural típico del componente saturado del SARA para CP/XP/R

.

Parámetro Estructural

Definición

CSARA

Componente del SARA

CSARA = Saturado, Aromático, Resínico, Asfalténico.

 

Fórmula molecular

CxHy

 

NSH

Número de sheets de la molécula promedio.

 

NNAF(i)

Número de anillos nafténicos asociados al sheet i, con

i = 1,..., NSH.

 

NSTA(i)

Número de sustituciones terminales alifáticas asociadas al sheet i.

 

c(j,i)

 

Número de átomos de carbono de la cadena alifática terminal j asociada al sheet i, con j = 1, 2,…, NSTA(i).

 

Califnp(i), Califp2(i), Califp3(i)

Número de átomos de carbono alifáticos no puente, puente de 2do y puente de 3er orden asociados al sheet i, respectivamente.

 

 

 

Figura 4. Generación de una molécula compatible con el IE de la Tabla 3.

 

 

Tabla 3. Informe estructural de un componente saturado hipotético de un SARA.

 

Parámetro Estructural

Definición

CSARA

Saturado

Fórmula molecular

C32H45

NSH

1

NNAF(i)

NNAF(1) = 4

NSTA(i)

NSTA(1) = 3

c(j, i)

c(1, 1) = 4, c(2, 1) = 3, c(3, 1) = 2

califnp(i), califp2(i), califp3(i)

califnp(1) = 10, califp2(1) = 4, califp3(1) = 2

 

Variables de caracterización de los átomos. Para el desarrollo de la presente metodología hemos creado un conjunto de variables que permiten caracterizar a cada uno de los carbonos de la estructura molecular que se quiere construir a partir de los IEs del componente saturado del SARA, ver Tabla 4.

 

Tabla 4. Definición de las variables de caracterización de los carbonos de la estructura molecular de los componentes SARA para CP/XP/R.

 

Variable

Definición

N

Es el número identificador del átomo presente en la estructura molecular del componente SARA en estudio.

 

NTA

Número total de átomos.

 

NTB

Número total de enlaces.

 

AT(N)

Es el símbolo químico del átomo número N. Los valores de la variable AT podrían ser: C, H, S, N, O.

 

H(N)

Cantidad de átomos de hidrógeno del átomo número N.

 

x(N), y(N), z(N)

Coordenadas cartesianas x, y, z del átomo número N.

 

Ocu(N)

Ocupación. Indica si una coordenada (x, y, z) está ocupada por un átomo.

Los valores de la variable Ocu son: 1 si hay un átomo y 0 si no hay.

 

T(N), k(N)

Indican las propiedades del átomo número N. Los valores de la variables T son: Hidrog = Hidrógeno, AlifC = Alifático Cíclico,

AlifT = Alifático de cadena Terminal, AlifL = Alifático de cadena Link, Carbox = Acido carboxílico, Aldehi = Aldehídico, Ar = Aromático. Los valores de k son: np = no-puente, p2 = puente 2do orden, p3 = puente 3er orden. Si k = 0, el átomo no es ninguna de estas categorías.

 

T2(N), m(N)

Indican las propiedades secundarias de los carbonos no-puente (k(N) = np). Los valores de la variable T2 son: 0, para los átomos que no son no-puentes,

Ar = Aromático, HA = Hidroaromático, noNaft = no-Nafténico,

Naft = Nafténico, Tiof = Tiofénico, Piri = Piridínico.

La variable m tiene los siguientes valores: PA, PAb, LD-A, LD-Ab, LI-A,

LI-Ab, cuyo significado se explica en el texto. Si AT(N) es H, m = 0.

 

T3(N), p(N)

Indican las propiedades terciarias de los carbonos ubicados en cadenas tipo ST o Link (T(N) = AlifT o AlifL). Los posibles valores de la variable T3 son:

0 = No cumple con ninguna función de anclaje o de link.

Origen = anclaje de cadenas de ST, link y grupos funcionales.

Pivote = primer átomo de la cadena alifática.

Linkeo = átomo fin de cadena link que se une a un átomo receptor.

Receptor = átomo receptor de cadena link.

Fin = átomo de fin de cadena ST.

El significado de la variable p se explica en el texto.

 

B(N,N’)

La variable B indica el tipo de enlace entre el átomo numero N y el N’, y sus valores son:

0 = No hay enlace, 1 = Enlace simple, 2 = Enlace doble, 3 = Enlace triple,

4 = Enlace doble deslocalizado (ejemplo, el C=C del benceno).

 

Obsérvese que la Tabla 4 es suficientemente general para ser aplicada a cualquier sistema molecular, con el objetivo de apoyar el futuro desarrollo de metodologías para construir estructuras moleculares de los otros componentes del SARA (Aromáticos, Resínicos y Asfalténicos). La aplicación de la Tabla 4 a la molécula de la Figura 4 genera la Tabla 5 para los átomos de carbono y la Tabla 6 para los átomos de hidrógeno.

 

Tabla 5. Caracterización de los átomos de carbono de la estructura de la Figura 4 acorde con las variables definidas en la Tabla 4.

 

N

H(N)

x(N)

y(N)

z(N)

T(N)

k(N)

T2(N)

m(N)

T3(N)

p(N)

N’

B(N,N’)*

1

1

7

6

0

AlifC

np

Naf

PI-Ab

Origen

0

2

1

14

1

17

1

2

1

7

7

0

AlifC

p2

0

0

0

0

3

1

15

1

3

2

6

8

0

AlifC

np

Naf

PI-Ab

0

0

4

1

4

2

6

9

0

AlifC

np

Naf

PI-A

0

0

5

1

5

1

7

10

0

AlifC

np

Naf

PA

Origen

0

6

1

21

1

6

1

8

9

0

AlifC

p2

0

0

0

0

7

1

15

1

7

2

9

10

0

AlifC

np

Naf

PA

0

0

8

1

8

2

10

9

0

AlifC

np

Naf

PD-A

0

0

9

1

9

1

10

8

0

AlifC

p2

0

0

0

0

10

1

16

1

10

1

11

7

0

AlifC

np

Naf

PD-A

Origen

0

11

1

24

1

11

2

11

6

0

AlifC

np

Naf

PD-Ab

0

0

12

1

12

2

10

5

0

AlifC

np

Naf

PAb

0

0

13

1

13

1

9

6

0

AlifC

p2

0

0

0

0

14

1

16

1

14

1

8

5

0

AlifC

np

Naf

Pab

0

0

---

---

15

1

8

8

0

AlifC

p3

0

0

0

0

16

1

16

1

9

7

0

AlifC

p3

0

0

0

0

---

---

17

2

6

6

0

AlifT

0

0

0

Pivote

1

18

1

18

2

5

6

0

AlifT

0

0

0

0

1

19

1

19

2

4

6

0

AlifT

0

0

0

0

1

20

1

20

3

3

6

0

AlifT

0

0

0

0

1

---

---

21

2

7

11

0

AlifT

0

0

0

Pivote

5

22

1

22

2

7

12

0

AlifT

0

0

0

0

5

23

1

23

3

7

13

0

AlifT

0

0

0

0

5

---

---

24

2

12

7

0

AlifT

0

0

0

Pivote

10

25

1

25

3

13

7

0

AlifT

0

0

0

0

10

---

---

   Ocu(N) = 1, AT(N) = C para todos los átomos. 

* En B(N,N’) no se reportan los enlaces repetidos.

 

            En la Tabla 4, el parámetro T2 indica la naturaleza química del átomo N, y m permite establecer el posicionamiento relativo del átomo np en el anillo donde está localizado. En la Figura 4, el átomo np 11 se clasifica como T2(11) = Naft, m(11) = LD-Ab, y significa que dicho átomo, se ubica en el Lado Derecho del anillo nafténico y en la parte de Abajo de ese lado. El átomo np 10 se clasifica como T2(10) = Naft, m(10) = LD-A, y significa que dicho átomo está en el Lado Derecho del anillo donde está localizado y en la parte de Arriba de ese lado. Los átomos np 7 y 12 se clasifican respectivamente como T2(7) = Naft, m(7) = PA y T2(12) = Naft, m(12) = PAb, y significa que dichos átomos están ubicados en un Pico Arriba y en un Pico Abajo respecto del anillo nafténico que los contienen. Los átomos np 3 y 4 se clasifican respectivamente como T2(3) = T2(4) = Naft, m(3) = LI-Ab, m(4) = LI-A, y significa que dichos átomos están ubicados en el Lado Izquierdo Abajo y Lado Izquierdo Arriba del anillo nafténico que los contiene.

 

            Por otro lado, las variables T3(N) y p(N) dan información de los átomos ubicados en cadenas tipo ST o de Link (ver Tabla 1). Por ejemplo, vamos a estudiar la cadena ST j = 1 que está constituida por los átomos 1, 17, 18, 19 y 20, ver Fig. 4. El átomo N = 1 se clasifica como T(1)=AlifC, k(1) = np, T2(1) = Origen, p(1) = 0. La variable T2(1) = Origen significa que dicho átomo es el origen de la cadena tipo ST, es decir, la cadena ST está anclada sobre el átomo 1. La variable p(1) = 0 significa que el átomo 1 no pertenece a la cadena (es sólo origen de la cadena). El átomo 17 se clasifica como T(17) = AlifT, k(17) = 0, T3(17) = Pivote, p(17) = 1. La variable T3(17) = Pivote significa que el átomo 17 es el nombre que se le da al primer átomo de la cadena ST o Link, y p(17) = 1 indica que el átomo 17 se encuentra ubicado en una ST anclada al átomo 1. El átomo 18 se clasifica como T(18) = AlifT, k(18) = 0, T3(18) = 0, p(18) = 1. La variable T3(18) = 0, indica que el átomo 17 no cumple con ninguna de las siguientes funciones: Origen, Pivote, o Fin. El átomo 20 se clasifica como T(20) = AlifT, k(20) = 0, T3(20) = Fin, p(20) = 1. La variable T3(20) = Fin, indica que el átomo 20 es fin de la cadena ST donde pertenece.

 

Tabla 6. Caracterización de los átomos de hidrógeno de la estructura de la Figura 4 acorde con las variables definidas en la Tabla 4.

 

N

x(N)

y(N)

z(N)

N’

 

N

x(N)

y(N)

z(N)

N’

26

7

6

1

1

 

48

9

7

1

16

27

7

7

1

2

 

49

6

6

1

17

28

6

8

1

3

 

50

6

6

-1

17

29

6

8

-1

3

 

51

5

6

1

18

30

6

9

1

4

 

52

5

6

-1

18

31

6

9

-1

4

 

53

4

6

1

19

32

7

10

1

5

 

54

4

6

-1

19

33

8

9

1

6

 

55

3

6

1

20

34

9

10

1

7

 

56

3

6

-1

20

35

9

10

-1

7

 

57

2

6

0

20

36

10

9

1

8

 

58

7

11

1

21

37

10

9

-1

8

 

59

7

11

-1

21

38

10

8

1

9

 

60

7

12

1

22

39

11

7

1

10

 

61

7

12

-1

22

40

11

6

1

11

 

62

7

13

1

23

41

11

6

-1

11

 

63

7

13

-1

23

42

10

5

1

12

 

64

7

14

0

23

43

10

5

-1

12

 

65

12

7

1

24

44

9

6

1

13

 

66

12

7

-1

24

45

8

5

1

14

 

67

13

7

1

25

46

8

5

-1

14

 

68

13

7

-1

25

47

8

8

1

15

 

69

14

7

0

25

AT(N) = H, Ocu = B(N,N') = 1, T(N) = Hidrog,

H(N) =  k(N) = T2(N) = T3(N) = p(N) = 0, para todos los átomos.

 

Coordenadas “vacías” y coordenadas “ocupadas”. El procedimiento para generar la estructura molecular a partir de un IE, comienza por definir una grid de puntos en un plano xy donde se colocarán en forma progresiva las UE verificando en cada paso el cumplimiento del IE.

En el caso del componente saturado, la primera UE que se ubica es un anillo de seis lados. Este anillo es generado de tal manera, que los seis vértices coinciden con seis puntos de la grid, por lo tanto, el anillo presentará necesariamente una deformación respecto a un hexágono de lados iguales. La ventaja de trabajar sobre este plano, es la posibilidad de hacer cálculos sencillos de geometría analítica para ubicar todos los vértices de las UEs que se vayan generando, por lo tanto, se genera primero los sitios geométricos de los átomos de carbono, o de las UEs. Las coordenadas de estos sitios geométricos se denominan “coordenadas vacías” o coordenadas nuevas. Una vez generado el sitio geométrico, donde va la UE, el siguiente paso es establecer las variables de caracterización de cada carbono que constituye la UE generada. Este proceso se define como el llenado del sitio geométrico, por los respectivos átomos de carbono, y las coordenadas de estos sitios ahora se definen como “coordenadas ocupadas”.

Las reglas de construcción de la molécula para el componente saturado del SARA a partir de su IE. La construcción de una molécula depende de la naturaleza del componente SARA, por lo tanto, esta sección resume los algoritmos y procedimientos para generar las coordenadas XYZ para cada una de las diferentes estructuras que se pueden generar a partir de un IE del componente saturado del SARA, y acorde con  las suposiciones realizadas en este estudio acerca de éste componente. Por simplicidad, la coordenada es z = 0, a menos que, se diga lo contrario para un caso específico.

 

Generación del primer anillo saturado (AS1). El primer anillo saturado (AS1) tiene la estructura de un hexágono alargado (no simétrico) emula un anillo seis carbonos del ciclohexano. Los valores de las variables de caracterización de cada átomo del primer anillo están en la Tabla 7. Es importante recalcar que se asume que el sheet constituido por los cuatro anillos nafténicos (ver IE, Tabla 3), es una estructura totalmente planar. Esto se hace con la finalidad de simplificar el proceso de generación del sheet, y obtener una primera aproximación de las coordenadas de cada uno de sus átomos. Posteriormente, este sistema con sus respectivas ST se llevan a un programa de mecánica molecular para su optimización y generación de la estructura correcta en el espacio. Por lo tanto, el objetivo del procedimiento que estamos proponiendo es generar de manera sencilla, las posibles estructuras con una geometría aproximada que se derivan de un IE. Es importante observar que la generación del AS1 implica un valor de NTA = 6.

 

Tabla 7. Clasificación de los átomos de la estructura del primer anillo generado acorde con las variables definidas en la Tabla 4.

 

N

X(N)

Y(N)

m(N)

1

7

7

PAb

2

6

8

LI-Ab

3

6

9

LI-A

4

7

10

PA

5

8

9

LD-A

6

8

8

LD-Ab

AT(N) = C, Ocu(N) = 1, H(N) = 2, T(N) = AlifC,

k(N) = np y T2(N) = Naft

 

Generación del segundo anillo saturado (AS2). El segundo anillo saturado se genera a partir de algún lado (el cual se elige al azar) de la estructura AS1 que contenga dos átomos tipo np, y que la distancia entre estos átomos sea igual a 1 o , ya que esto asegura que sean átomos vecinos. El lado escogido con este criterio se le llama Lado Generador (LG). Obsérvese que estamos trabajando con anillos hexagonales distorsionados (alargados), por lo tanto, la distancia entre los vértices no es la misma. Este tipo de anillo tiene como consecuencia que existan el Caso(1) y el Caso(2) para generar el nuevo anillo (AS2).

 

Caso (1): La longitud del LG es 1.

 

Si las coordenadas de los átomos del LG son (x1, y1) y (x2, y2), entonces, se tienen las siguientes posibilidades:

 

Si, y1 > y2,  x1 = x2, entonces, se puede generar un segundo anillo a la Derecha o a la Izquierda del LG con las siguientes coordenadas:

 

Derecha:   (x1, y1); (x2, y2); (x2+1, y2-1); (x2+2, y2); (x1+2, y1); (x1+1, y1+1)

Izquierda: (x1, y1); (x2, y2); (x2-1, y2-1); (x2-2, y2); (x1-2, y1); (x1-1, y1+1)

 

Caso (2): La longitud del LG es .

 

Si las coordenadas de los átomos del LG son (x1, y1) y (x2, y2), se tiene las siguientes posibilidades.

 

(2a) Si, y1 > y2, x1 < x2, entonces, se puede generar un Segundo Anillo por Arriba o por Abajo del LG, ver Figura 5.

 

Arriba: (x1, y1); (x2, y2); (x2-1, y1); (x2-1, y1+1); (x2, y2+3); (x1, y1+1)

Abajo: (x1, y1); (x2, y2); (x2, y2-1); (x1, y1-3); (x1+1, y2-1); (x1+1, y2)

 

 

 

 

 

 

 

 

 

Figura 5. Generación de las coordenadas nuevas del segundo anillo (AS2) para el Caso(2a) respecto al Lado Generador LG limitado por lo puntos 1 y 2 de coordenadas (x1, y1), (x2, y2) donde y1 > y2, x1 < x2. (a) Generación del anillo 2 por arriba del LG y de sus nuevas coordenadas. (b) Generación del anillo 2 por debajo del LG y donde sus coordenadas coinciden con el anillo 1 (AS1).

 

(2b) Si, y1 > y2,  x1 > x2, entonces, se puede generar un AS2 por Arriba o por Abajo del LG, ver Figura 6:

 

Arriba: (x1, y1); (x2, y2); (x2+1, y1); (x2+1, y1+1); (x2, y2+3); (x1, y1+1)

Abajo: (x1, y1); (x2, y2); (x2, y2-1); (x1, y1-3); (x1-1, y2-1); (x1-1, y2)

 

 

Figura 6. Generación de las coordenadas nuevas del segundo anillo (AS2) para el Caso(2b) respecto al Lado Generador LG limitado por lo puntos 1 y 2 de coordenadas (x1, y1),  (x2, y2) donde y1 > y2, x1 > x2. (a) Generación del anillo 2 por arriba del LG y de sus nuevas coordenadas. (b) Generación del anillo 2 por debajo del LG y donde sus coordenadas coinciden con el anillo 1 (AS1).

           

            El Caso(1) o el Caso(2) generan las coordenadas del lugar geométrico de varios anillos. El anillo correcto es aquel que tiene, al menos, una coordenada no ocupada por un átomo. En otras palabras, el anillo generado es incorrecto, si todas  sus coordenadas están ocupadas por átomos. Si el anillo generado es el correcto, entonces, pueden existir en AS2 tanto coordenadas vacías como coordenadas ocupadas. Las coordenadas vacías son llenadas mediante la asignación de los valores de las variables de caracterización de los nuevos átomos que serán localizados en sus sitios geométricos. Por otro lado, las propiedades de los átomos de carbono localizados en las coordenadas ocupadas que residen en los linderos de AS2, deben ser actualizadas, ya que al estar unidos al AS2 cambian su coordinación y sus propiedades, por ejemplo, si eran T  = AlifC, k  =  np, ahora son T = AlifC, k = p2, si eran T = AlifC, k = p2, ahora son T = AlifC, k = p3. A cada nueva coordenada se le asigna N, AT(N) = C, Ocu(N) = 1, T(N) = AlifC, k(N) = np, y se actualiza el NTA. Este proceso de generación de AS se realiza hasta llegar al valor de NNF(i) (ver Tabla 3), una vez finalizado el proceso de generación de AS, entonces, ya se tiene una posible configuración de anillos que generan un sheet nafténico, los cuales vienen determinados por los valores de las variables califnp(i), califp2(i), califp3(i) (ver Tabla 3). Estas variables se comparan con el IE del componente saturado, si no hay coincidencia se vuelve a construir el sheet nafténico, y este proceso culmina hasta que se logra la coincidencia de las variables del sheet generado con el sheet del IE. Es bueno observar que, por ejemplo, la variable califnp(i) (de la estructura generada siguiendo las reglas propuestas) se obtiene sumando todos los átomos que son no-puentes.

Generación de las sustituciones alifáticas terminales (ST). A continuación se dan las reglas en forma de casos para poder hacer las ST. La ST sólo se puede hacer sobre átomos T = AlifC, k = np y con H = 2. Este átomo se lo denomina átomo Origen de Cadena, y es escogido al azar. A partir del Pivote, la cadena crece de manera lineal, ver Figura 7. Para poder generar la ST sobre el átomo elegido, hay varios casos.

 

 

 

 

 

 

 

Figura 7. Generación de una cadena terminal sobre un átomo con m = PA. La cadena puede crecer hacia arriba del átomo pivote. Los puntos a1, y a2 representan los átomos de la cadena terminal.

 

Caso(4): Generación de la ST.

 

Sea una cadena ST de c(j, i) carbonos, si (x, y) son las coordenadas del átomo Origen de Cadena, se asigna provisionalmente a este átomo Ocu = 0. El primer átomo de la cadena se lo llama átomo Pivote, y sobre este átomo se genera el resto de la cadena en forma lineal. Las coordenadas de los átomos de la cadena se obtienen de la siguiente  manera.

 

(4a) Átomo Origen con m = PA, PAb. La cadena alifática puede crecer a partir del Pivote en forma lineal. Las coordenadas del átomo Pivote (P) son:

 

Para m = PA: P = (x, y+1)

Para m = PAb: P = (x, y-1)

 

Las coordenadas del resto de la cadena son (ver la Figura 7 los puntos a1, a2 y Fin de Cadena):

 

as = P + s·r·(0, 1)

 

donde  r = 1 si m = PA, o, r = -1 si m = PAb, s varía de 1 a n, y n = c(j, i)-1. El parámetro an contiene las coordenadas del átomo de Fin de Cadena.

 

(4b) Átomo Origen con m = PD-A, PD-Ab, PI-A, PI-Ab. La cadena alifática puede crecer a partir del pivote en forma lineal. Las coordenadas del átomo pivote (P) son:

 

Para m = LD-A, LD-Ab: P = (x+1, y)

Para m = LI-A, LI-Ab: P = (x-1, y)

 

Las coordenadas de los átomos de la ST vienen dadas por:

 

as = P + s·r·(1,0)

 

donde r = 1 si m = PD-A, PD-Ab, o, r = -1 si m = PI-A, PI-Ab, s varía de 1 a n, y n = c(j, i)-1. El parámetro an contiene las coordenadas del átomo de Fin de Cadena.

 

            El Caso(4) genera las coordenadas de los átomos de la ST. La ST correcta es aquella que tiene, sus coordenadas sin ocupar por ningún átomo (Ocu = 0), adicionalmente, las nuevas coordenadas deben ser tales que, la distancia entre las coordenadas del sitio geométrico del ST con las coordenadas ocupadas por cualquier otro átomo de la estructura, debe ser mayor a una unidad (1). Si esto no se cumple, entonces, se dice que hay un “Tropiezo”. Para que la detección de un Tropiezo funcione adecuadamente, es necesario hacer a la variable Ocu = 0 para el átomo Origen de Cadena, ya que el átomo Pivote y el átomo Origen de Cadena son vecinos. Si la ST cumple con todos los requisitos, se procede hacer lo siguiente. El átomo Origen de Cadena se le asigna nuevamente Ocu = 1. Los átomos de carbono de la ST se les asignan los valores de N, H(N) = 2 (al átomo de Fin de Cadena se le asigna H(N) = 3), Ocu(N) = 1, T(N) = AlifT, T2(N) = 0, m(N) = 0, y se actualiza la NTA.

 

Generación de los hidrógenos de la estructura molecular. Se procede a colocar los hidrógenos sobre los distintos carbonos que así lo requieran.

 

Caso(5): Generación de hidrógenos.

 

Una vez dado el valor H(N) a cada átomo de carbono, se procede asignar las variables de caracterización a cada hidrógeno de la estructura molecular. Existen varias posibilidades.

 

5a) Hidrógenos sobre átomos de carbono del Tipo T = AlifC, con H = 1.

 

El hidrógeno se coloca sobre el átomo de carbono y perpendicular al plano xy en la dirección z+. Si las coordenadas  del átomo de carbono en cuestión son (x, y), se tiene que las coordenadas del H son: H: (x, y, 1).

 

5b) Hidrógenos sobre átomos de carbono del Tipo T = AlifC, con H = 2.

 

Los dos hidrógenos se colocan sobre el átomo de carbono de la siguiente manera. Uno de los hidrógenos se coloca por encima del plano xy en sentido z+, y el otro hidrógeno en sentido z- (ambos hidrógenos están entre sí en un ángulo de 180°). Si las coordenadas  del átomo de carbono en cuestión son (x, y), se tiene que las coordenadas de los dos hidrógenos son: H: (x, y, 1), H: (x, y, -1).

 

5c) Hidrógenos sobre átomos de carbono Tipo T = AlifT, con H = 1.

 

El hidrógeno se coloca sobre el átomo de carbono y perpendicular al plano xy. Si las coordenadas  del átomo de carbono en cuestión son (x,y), se tiene que la coordenada del hidrógeno son:  H: (x,y,1).

 

5d) Hidrógenos sobre átomos de carbono Tipo T = AlifT, con H = 2.

 

Los dos hidrógenos se colocan sobre el átomo de carbono. Uno de los hidrógenos se coloca por arriba del plano xy en dirección z+, el otro hidrógeno se coloca abajo del plano xy en dirección de z-. Si las coordenadas  del átomo de carbono en cuestión son (x, y), se tiene que las coordenadas de los dos hidrógenos son: H: (x, y, 1), H: (x, y, -1).

 

5e) Hidrógenos sobre átomos de carbono Tipo T = AlifT, con H = 3.

 

Los tres hidrógenos se colocan sobre el átomo de carbono de la siguiente manera. Dos hidrógenos son colocados según (5d), el tercer hidrógeno se coloca en el plano xy, pero existen varias posibilidades. Si las coordenadas del átomo de carbono en cuestión es (x, y), se tiene que las coordenadas R del tercer hidrógeno, de acuerdo al valor m del átomo de Origen, son:

 

5e1) Para m = PA, R = (x, y+1, 0).

5e2) Para m = PAb, R = (x, y-1, 0).

5e3) Para m = PD-A, PD-Ab, R = (x+1, y, 0).

5e4) Para m = PI-A, PI-Ab, R = (x-1, y, 0).

 

Generación de los enlaces entre los átomos de carbono de la estructura molecular. Es necesario recalcar que durante el proceso de generación de los átomos de hidrógeno en la estructura molecular se asigna el enlace entre cada hidrógeno con el carbono donde está unido (se le asignan valores a N, N’, B(N,N’)), mientras que los enlaces entre los carbonos de la estructura se generan posteriormente aplicando las siguientes reglas.

 

Caso(6): Determinación del tipo de enlace entre los átomos de carbono.

 

Se procede a calcular la distancia D del átomo de carbono N con el resto de los átomos de carbono de la estructura, si D entre los átomos de carbono N y N’ es 1 o , y además, si no está tabulada la combinación N’-N, entonces, se tiene un enlace no repetido entre el átomo de carbono N con el átomo de carbono N’, y se aplica el siguiente procedimiento para establecer el enlace entre N y N’.Se define el parámetro NCC(N) como el número de enlaces C-C tipo AlifC-AlifC donde está presente el átomo de carbono N tipo AlifC. El parámetro NCC(N) inicialmente es cero antes del proceso de asignación de enlaces. El vínculo entre átomos de carbono se obtiene de la siguiente manera. Si la distancia entre los carbonos N y N’ no es 1 o , entonces, B(N,N’) = 0. Si los átomos de carbono N y N’ están a una distancia de 1 o , se presentan las siguientes posibilidades.

 

6a) Enlace C-C tipo AlifC-AlifC:

Calcular NCC(N) = NCC(N) + 1, y NCC(N’) = NCC(N’) + 1, y revisar los condicionales siguientes para k(N) = np.

6a1) Si NCC(N) > 2, o, si k(N’) = np y NCC(N’) > 2, entonces, B(N,N’) = 0,

6a2) Si NCC(N) £ 2, o, si k(N’) = np y NCC(N’) £ 2, entonces, B(N,N’) = 1.

 

La condicional (6a1) chequea que no se generen enlaces sobre carbonos np con una NCC mayor de 2. Obsérvese que si se cumple esta condicional, entonces se le resta una unidad a NCC(N) y a NCC(N’).

 

6b) Enlace C-C tipo AlifT-AlifT:

Si D = 1, y p(N) = p(N’), entonces, B(N,N’) = 1.

Esta condicional previene la posibilidad que se puedan producir enlaces entre dos ramas vecinas.

 

6c) Enlace C-C AlifC-AlifT o enlace C-C AlifT-AlifC:

Se tienen los siguientes condicionales con D =1,

6c1) Si T3(N) = Origen, entonces, B(N,N’) = 1.

6c2) Si T3(N’) = Origen, entonces, B(N,N’) = 1.

 

Una vez establecido el enlace entre los carbonos N y N’ se actualiza el NTB.

 

 

RESULTADOS Y DISCUSIÓN

 

            Los valores mostrados en las Tablas 5 y 6 fueron obtenidos del archivo de texto plano denominado “GMOL.dat” que contiene todas las variables dadas en la Tabla 4. Para demostrar la metodología propuesta en este estudio, se convirtió el archivo GMOL.dat en otro archivo denominado “GMOLMDL.mol”, el cual es escrito con el formato MDL-mol que se usa de manera estándar para almacenar estructuras moleculares, como la mostrada en la Figura 4. Esta conversión se hace a través de un programa en FORTRAN-77, listado en la Tabla 8.

 

Tabla 8. Listado del programa en FORTRAN-77 usado para convertir las variables de caracterización de las Tablas 5 y 6 en un formato MDL-mol.

c************************************************************************

       subroutine GMOLCONV(NTA,NTB,AT,X,Y,Z,B)

c

c      Este programa convierte las variables de caracterización de los átomos

c      de una molécula en un archivo MDL-mol.

c   

c      Variables

       character AT(999)*2

       dimension X(999),Y(999),Z(999)

       integer   B(999,999)

c

c      Definición de parámetros auxiliares

       parameter(N1=0,N2=0,N3=0,N4=0,N5=0,N6=0,N7=0,N8=0,N9=0,N10=0,N11=0, N12=0)

c

c     escribir en archivo GMOLMDL.mol           

      open(3,file='GMOLMDL.mol')

c     linea 1: un titulo                           

      write(3,60)

60    format('Molecula en formato MOL')

c     lineas 2 y 3 blancas

      write(3,62)

62    format(' ')      

      write(3,64)

64    format(' ')

c     linea 4: 11 campos de tres caracteres cada uno, los primeros dos son NTA y NTB

      write(3,66) NTA,NTB,N3,N4,N5,N6,N7,N8,N9,N10,N11

66    format(11(I3))

c     linea 5 en adelante de los atomos

do 70 N=1,NTA

      write(3,68) X(N),Y(N),Z(N),AT(N),N1,N2,N3,N4,N5,N6,

     1            N7,N8,N9,N10,N11,N12

68    format(3(F10.4),1x,A2,12(I3))

70    continue

c     Linea de los enlaces

      do 90 N=1,NTA

      do 80 NP=1,NTA

      if(B(N,NP).eq.0) go to 80

      write(3,85) N,NP,B(N,NP),N1,N2,N3,N4

85    format(7(I3))               

80    continue

90    continue

c                           

      return

      end  

c*********************************************************************

La visualización de la molécula de Figura 4 se hace a través del archivo GMOLMDL.mol mediante un programa libre llamado “Jmol[7]. La molécula de la Figura 4 se puede ver en la Figura 8, cuyas coordenadas son consecuencia directa de las reglas propuestas en este estudio, y de cómo se han generado los distintos sitios geométricos de cada una de las UE. En particular, la forma en cómo están unidos los hidrógenos a los átomos de carbono, es consecuencia del conjunto de reglas para la incorporación del hidrógeno a la estructura molecular. La Figura 8 es una aproximación a la verdadera estructura del componente saturado asociado al IE de la Tabla 3. El siguiente paso es el uso de la herramienta de optimización que posee el programa Jmol para obtener una estructura optimizada del saturado, como se muestra en la Figura 9. Además, se espera que esa molécula sea correcta desde el punto de vista químico, para el saturado asociado al IE de la Tabla 3.

 

 

 

CONCLUSIONES Y RECOMENDACIONES

 

            En este estudio se propone una metodología que permite convertir un informe estructural de un componente saturado del SARA derivado de estudios de química analítica y transformarlo en un conjunto de estructuras moleculares compatibles con dicho informe. Esto reduce los tiempos para la generación de propuestas de estructuras moleculares, y evita errores o prejuicios. También el algoritmo propuesto en este estudio genera las estructuras moleculares con las coordenadas de los átomos, lo cual permite la aplicación directa de los programas de química computacional para el cálculo y predicción de sus propiedades fisicoquímicas y reactividad.

 

            Una recomendación que se deriva de este trabajo, es aprovechar al máximo el uso de las herramientas de la química computacional para tratar de crear una simbiosis entre éstas y la intuición química. Por lo tanto, es necesario impulsar el desarrollo de programas que puedan, como en este caso, convertir las reglas intuitivas de la química, en algoritmos para el desarrollo de programas versátiles, que ayuden a la interacción eficiente entre los químicos experimentalistas con los programas de la química computacional. Ésta interacción es necesaria fortalecerla ya que permitiría desarrollar investigaciones a nivel molecular de materiales que, actualmente, son la base de la red tecnológica que soporta nuestra sociedad.

 

 

REFERENCIAS

 

1.

R. B. Williams. Characterization of Hydrocarbons in Petroleum by Nuclear Magnetic Resonance Spectrometry. ASTM Spec. Tech. Publ., 224 (1958) 168-94.

2.

E. M. Dickinson. Fuel 59 (1980) 290-294.

3.

L. Michon, D. Martin, J. P. Planche, B. Hanquet. Fuel 76  (1996) 10-15.

4.

L. Carbognani, A. Méndez, V. Sánchez. Acta Cient. Venez. 50, Suplemento Nº 1 (1999) 11-17.

5.

K. Peters, M. Moldowan. “The Biomarker Guide”, Prentice Hall Inc. (1993).

6.

O. Delgado. Tesis doctoral: "Mejoramiento de crudos pesados usando aditivos e condiciones de inyección de vapor", 86-87, enero 2004.

7.

ProgramaJmol, versión 13.0.18, sourceforge.net/projects/jmol