ESPECIAL / 3ER FORO CELERINET ENERO-JUNIO 2013 51
Referencias Datos del Autor:
Francisco Javier Almaguer Martínez
[1] G. Zipf, Selective Studies and the Principle of Relative Frequency
in Language, Cambridge, Mass., USA: Harvard University Dirección del autor: Manuel Benitez No. 2008 Col. Topo
Press, 1932. Chico, C.P. 64260, Monterrey, Nuevo León, México. Email:
[email protected]
[2] Benjamin Fine, Gerhard Rosenberger, Number theory. An
Introduction via the distribution of primes, Boston, USA, Homero de la Fuente García
Birkhauser, 2007.
[3] Alexander Saichev, Yannick Malevergne, Didier Sornette,
Theory of Zipf’s law and beyond, Springer, USA, 2009.
[4] De la F. Homero, F-Javier, Almaguer, Jonas Velasco "Simulación
de fluctuaciones financieras de largo alcance y transiciones de
fase orden-desorden.” Congreso Internacional de Investigación,
celaya.cademia.journals.com, Vol 4. No. 3., Noviembre, 2012.
[5] Wolfgan Paul, Jörg Baschnagel, Stochastic Processes, From
Physics to Finance, Germany, Springer, 1999.
Procesos aleatorios de Riemann y Weierstrass
POR: FRANCISCO ALMAGUER Y HOMERO DE LA FUENTE
52 CELERINET ENERO-JUNIO 2013 ESPECIAL / 3ER FORO
Un algoritmo
para resolver el
problema binivel
con parámetros
en el objetivo del
nivel inferior
Aarón Arévalo Franco
UANL-FCFM
Universidad Autónoma de Nuevo León
Facultad de Ciencias Físico Matemáticas
San Nicolás de los Garza, Nuevo León, México
Resumen:
En este trabajo presentamos una reformulación del
problema binivel con parámetros en el objetivo del nivel
inferior haciendo uso de una aproximación externa de
la función de reacción. Esto nos permitirá presentar el
problema de dos niveles en uno de un solo nivel, con el
fin de adaptarlo a un algoritmo reportado en la literatura
basado en el método Branch and Bound.
Palabras claves: Programación Binivel, Branch and
Bound
ESPECIAL / 3ER FORO CELERINET ENERO-JUNIO 2013 53
Introducción es la variable vectorial continua y puede incluir variables
discretas. Sabiendo que este problema es difícil de
Los problemas de Programación Binivel están resolver, se propone un algoritmo de aproximación que
motivados por sus aplicaciones (en el mundo real). nos conduce a una solución global.
Tales problemas surgen en los juegos de Stackelberg
que tratan la economía de mercado [1], en donde los Muchos autores han trabajado en las diferentes
distintos tomadores de decisión tratan de comprender formulaciones de los problemas de Programación
mejor las decisiones en el mercado con respecto a sus Binivel. En [2] se propuso un algoritmo basado en el
propios objetivos generalmente diferentes; sin embargo, método Branch and Bound cuando el parámetro aparece
a menudo son capaces de realizar sus decisiones de en el lado derecho de las restricciones del seguidor. En
forma independiente, pero se ven obligados a actuar de [3] se propuso un algoritmo para resolver el problema
acuerdo a una cierta jerarquía. de Programación Lineal Binivel (BLPP) utilizando el
Método Simplex con variables adicionales en el conjunto
En este trabajo consideramos el caso más simple de de base y la teoría de subgradientes. En [4] se obtuvieron
tal situación donde solo hay dos tomadores de decisión, límites superiores para las funciones objetivo en ambos
a eso se debe el nombre de binivel o dos niveles, caso niveles. Así se generó una secuencia no decreciente
particular del problema de Programación Multinivel. A de límites inferiores de la función objetivo en el nivel
los actores del caso binivel se les llama comúnmente superior, que, bajo ciertas condiciones, converge a la
líder y seguidor, respectivamente. El líder es el que solución del BLPP general para funciones continuamente
puede manejar el mercado de forma independiente, diferenciables.
mientras que el seguidor tiene que actuar de una manera
dependiente a la decisión del líder. En [5] se presentan varias alternativas para resolver
el MIBLPP con las condiciones de integralidad. En [6]
Es obvio que, si un tomador de decisiones asume se resolvió el MIBLPP con el algoritmo Branch and
una posición independiente, y por tanto para observar Bound. El análisis de sensibilidad para MIBLPP también
y utilizar las reacciones del dependiente tomador de fue considerado en [7].
decisiones a las del líder, tratará de hacer una ventaja
de esto. Especificación del Problema: El problema de
Programación Binivel con parámetros en el objetivo del
Los Problemas de Programación Binivel son más nivel inferior está dado como sigue:
generales que los juegos de Stackelberg en el sentido de
que ambos conjuntos factibles pueden depender sobre la (1)
decisión de otro tomador de decisiones.
en donde a, b, x, y, c, ĉ, d, ∈, Rn, G, es una matriz de
En términos matemáticos, el conjunto de variables dimensión r × n, d ∈ Rr , A es una matriz n × n. El líder
es particionado en dos variables vectoriales, x y y; en resuelve su objetivo sujeto a un conjunto de restricciones
donde y en Rn es la variable del líder y x en Rn es la en los cuales se encuentra otro problema de optimización:
variable del seguidor. Aplicado y como parámetro, el problema del seguidor. Para cada señal que le envía
el seguidor resuelve un problema de optimización el líder al seguidor, i. e, selecciona algún fijo y que es
paramétrico, y los valores x=x(y) están determinados por su variable de decisión y el seguidor replica mandando
el seguidor conociendo de antemano la elección y del una respuesta al líder x(y). Por lo tanto el líder minimiza
líder. El líder tiene que determinar la mejor elección de y F(x(y),y).
conociendo la reacción (óptima) x = x(y) del seguidor a la
decisión del líder. Tenemos un líder (nivel superior) que En cada señal que manda el líder y el seguidor le replica,
elige primero su decisión con el objetivo de minimizar se puede expresar en una función comúnmente llamada
una cierta función f(x(y); y), y un seguidor (en el nivel función de reacción o función de valor óptimo. Esta
inferior) que responde óptimamente a esta decisión. función está dada como sigue:
Nuestro principal objetivo es proponer un algoritmo (2)
eficiente para resolver el Problema de Programación
Binivel Entero Mixto (MIBLPP por sus siglas en inglés)
en el caso particular cuando el parámetro aparece en la
función objetivo del nivel inferior. El término entero
mixto significa que el problema tiene ambas variables,
continuas y discretas. Por otra parte, en nuestro caso, x
Un algoritmo para resolver el problema binivel con parámetros en el
objetivo del nivel inferior POR: AARÓN ARÉVALO FRANCO
54 CELERINET ENERO-JUNIO 2013 ESPECIAL / 3ER FORO
Ahora, reformularemos el problema (1) de tal forma simples generalizados cuyos vértices pertenecen a S, en
que podamos aplicar el algoritmo presentado en [8]. Para donde d = dimC.
ello usamos el resultado descrito en [9], en el cual, un Corolario 1. Sea {Ci|i∈I} una colección arbitraria de
problema de dos niveles puede ser reformulado en un conjuntos convexos en Rn, y sea C el casco convexo de la
problema de un solo nivel de la siguiente manera: unión de la colección. Entonces cada punto de C puede
ser expresado como una combinación convexa de n+1
(3) o menos puntos afinamente independientes, cada uno
perteneciendo a alguno de los Ci.
Geometría del problema: El problema que surge ahora Teorema 2. La intersección de una colección arbitraria
es que en (3) la función de reacción no está dada en una de conjuntos convexos es convexa.
forma explícita; es por ello que se analizará para conocer
sus características geométricas. En [10] se demuestra El casco convexo conv S es un conjunto convexo
que la función de reacción es lineal a trozos, convexa por el Teorema 2, el único más pequeño que contiene S.
y no diferenciable (ver Figura 1). Algunos artículos
han trabajado este tipo de problemas con cálculo Los detalles y las demostraciones de los Teoremas
sub-diferencial que se basan sobre la restricción de 1 y 2 y del Corolario 1 pueden ser encontrados en [12].
cualificación no suave de Mangasarian-Fromowitz [11]. Ahora, describimos el algoritmo propuesto como sigue:
En este trabajo resaltamos el hecho de que es convexa, y
sobre esto, aplicamos el resultado de [8]. Paso 0. Inicialización. Sea la lista inicial de problemas
incluyendo solamente la Aproximación del Problema
Un Algoritmo de Aproximación. Las bases para Entero (APE) construida del siguiente modo:
desarrollar un buen algoritmo están dadas en los
siguientes teoremas bien conocidos, importantes para Consideramos el problema (3):
guardar la convexidad en cada nivel de aproximación.
Ahora, consideramos el politopo Y compuesto como
Definición 1. La intersección de todos los conjuntos un casco convexo de las estrategias del líder en el nivel
convexos que contienen un subconjunto dado S en Rn es superior: Y = { y | Gy = d, y ≥ 0} y seleccionamos n+1
llamado el casco convexo de S y se denota por conv S. puntos afinamente independientes y i tales que Y ⊂ conv
{y1,...,ym+1} ⊂ {y : |ϕ(y)| < ∞}. Aquí n = n − rango(G), y
Teorema 1. Teorema de Carathéodory. Sea S cualquier y2 −y1, y3−y1,…,y n+1 − y1 , forman un sistema linealmente
conjunto de puntos en Rn, y sea C = conv S. Entonces y ∈ C independiente. Denotamos este conjunto de vértices
si y solo si y puede ser expresada como una combinación como V = {y1,...,yn+1}. También consideramos un valor
convexa de n+1 (no necesariamente distintos) puntos en de tolerancia ɛ > 0. Entonces, resolvemos el problema
S. De hecho C es la unión de todos los d-dimensionales de Programación Lineal del nivel inferior (5) en cada
vértice, i.e., encontrar Ҩ(y1),…, Ҩ(yn+1).
Ahora bien, construimos la primera aproximación de
la función de valor óptimo como sigue:
(4)
definido sobre (5)
Fig 1. Representación de φ en 1 dimensión.
Un algoritmo para resolver el problema binivel con parámetros en el
objetivo del nivel inferior POR: AARÓN ARÉVALO FRANCO
ESPECIAL / 3ER FORO CELERINET ENERO-JUNIO 2013 55
con λi ≥ 0, i = 1,...,m+1 y: Paso 4. Subdivisión. Hacer una subdivisión del conjunto
Y correspondiente a este problema. Por construcción,
(6) el problema (7) corresponde a un conjunto de n+1
puntos afinamente independientes, los cuales sin pérdida
En (4) tenemos una expresión con la variable λ, que de generalidad asumimos sean los puntos y1,...,y n+1.
nos conduce a la variable y usando (5) y (6). Ahora, ya Añadiendo el punto y jR a este conjunto, estos vienen a
que la función Ҩ es convexa, <c,x> ≤ Ҩ(y) ≤ Φ(y), la ser afinamente independientes. Excluyendo un elemento
condición <c,x> ≤ Ҩ(y) puede ser remplazada en (3) con del conjunto resultante, la independencia afina puede ser
la siguiente desigualdad explícita: <c,x> ≤ Φ(y). obtenida eventualmente (esto está garantizado si algún
elemento correcto es eliminado).
Con esto obtenemos un nuevo problema de
optimización que puede ser resuelto con el Método Cuando uno hace uso de esta aproximación, a lo más
Simplex Clásico. La Aproximación del problema entero n+1 nuevos conjuntos afinamente independientes surgen,
es descrita como sigue: cada uno correspondiendo a nuevas aproximaciones
lineales de la función objetivo del nivel inferior sobre el
sea t = 1, y zt = +∞, en donde zt es el valor objetivo casco convexo de esos puntos. Si un tal simplex T es un
incumbente. Ponemos este problema dentro de la lista. subconjunto de alguna región de estabilidad: T ⊂ R(Bi),
Por definición, este problema corresponde al poliedro los puntos factibles (x, y) del problema (7) son también
convexo Y. Ir al Paso 1. factibles para el problema (3).
Paso 1. Terminación. Detener el algoritmo si la El objetivo de este paso es encontrar esas simples
lista de problemas es vacía. O si la condición: subdivisiones subsecuentes del conjunto Y. Estos
||(xs, ys)−(x s−1, y s−1)|| < ɛ; es válida, seleccionamos problemas son entonces añadidos a la lista de problemas.
el punto (xs; ys) como una solución aproximada del Para calcular la nueva aproximación de la función de
problema de Programación Entera (3); de otra forma, valor óptimo del nivel inferior procederemos como
seleccionar arbitrariamente y remover un problema de sigue: Primero calcular Ҩ(yjR). Entonces construir un
la lista. Ir al paso 2. conjunto de puntos afinamente independientes como se
describió anteriormente, i.e., eliminar uno de los puntos,
Paso 2. Resolver el problema tomado de la lista usando digamos yl, y calcular
métodos comunes para Programación Entera como
Branch and Bound para resolver la restricción de (8)
integralidad. Denotamos al conjunto de las soluciones
óptimas básicas como S = {(x1R; y1R),...} y zR como la definido sobre
función de valor objetivo. Si el problema no tiene
soluciones factibles, o si esta función de valor óptimo (9)
es mayor que zt, entonces cortamos esta rama. Asignar
zt+1 = zt, t = t+1 y vamos al Paso 1. De otra forma vamos con λi ≥ 0 i = 1,...,m +1 y
al Paso 3. (10)
Paso 3. Si las componentes y de todas las soluciones para l∈{1,...,n+1}. Así construimos a lo más n+1 nuevos
pertenecientes a S son vértices de V, entonces guardamos problemas:
las soluciones, asignamos zt+1 = zR, t = t + 1 y vamos al
Paso 1 (para tales valores de y, el punto (x, y) es factible (11)
para el problema (6)). De otra manera, considerando y los añadimos a la lista de problemas. Vamos al Paso 1.
la solución (xjR; yjR) de S tal que la componente yjR es
diferente de todos los vértices de V, añadimos yjR a V,
asignamos zt+1 = zt , t = t+1 y vamos al Paso 4.
Un algoritmo para resolver el problema binivel con parámetros en el
objetivo del nivel inferior POR: AARÓN ARÉVALO FRANCO
56 CELERINET ENERO-JUNIO 2013 ESPECIAL / 3ER FORO
Referencias Datos del Autor:
[1] Stackelberg, H.v. Marktform und Gleichgewicht. Vienna, Dr. Aarón Arévalo Franco
Austria: Julius Springer. 1934. English translation: The Theory
of the Market Economy. Oxford: Oxford University Press. 1952. Cursó su Lic. En Matemáticas en la Facultad de Ciencias
Físico Matemáticas de la Universidad Autónoma de Nuevo
[2] Dempe, S., Kalashnikov, V. and Ríos-Mercado, R.Z. “Discrete León. Cursó el doctorado en Ingeniería Física Industrial
bilevel programming: Application to a natural gas cash-out en el Posgrado de la misma institución. Además realizó una
problem”. European Journal of Operational Research. Vol. 166, estancia en la Technische Universität Bergakademie Freiberg
No. 2, pp. 469-488. 2005. en Alemania, misma en la cual realizó su Posdoctorado.
Actualmente se desempeña como Profesor Investigador en el
[3] Dempe, S. “Asimple algorithm for the linear bilevel programming Posgrado en Ciencias con Orientación en Matemáticas de la
problem”. Optimization. Vol. 18, No. 3, pp. 373 – 385. 1987. Facultad de Físico Matemáticas en la UANL. Sus líneas de
investigación son la Programación Binivel y la teoría de la
[4] Bard, J. “An algorithm for solving the general bilevel Complementariedad.
programming problem”. Mathematics of Operations Research.
Vol. 8, No. 2, pp. 260-282. Dirección del autor: Centro de Investigación en Ciencias
Físico Matemáticas de la UANL. Av. Pedro de Alba y M.L.
[5] Dempe, S. and Kalashnikov, V. Discrete Bilevel Programming Barragán S/N. Cd. Universitaria,. San Nicolás de los Garza,
with Linear Lower Level Problems. Preprint, TU Bergakademie Nuevo León, México.
Freiberg. 2005.
Email: [email protected]
[6] Wen, U.P. and Yang, Y.H. “Algorithms for solving the mixed
integer two level linear programming problem”. Computers and
Operations Research. Vol. 17, No. 2, pp. 133 – 142. 1990.
[7] Wendell, R.E. “A preview of a tolerance approach to sensitivity
analysis in linear programming”. Discrete Mathematics. Vol. 38,
pp. 121— 124. 1982.
[8] Kalashnykova, N., Kalashnykov, V., Dempe, S. and Arévalo
Franco A. “Application of a Heuristic Algorithm to Mixed-
Integer Bi-level Programming Problems”. ICIC International.
Volume 7, Number 4, pp. 1819–1829. 2011.
[9] Ye, J.J. and Zhu, D.L. “Optimality conditions for bilevel
programming problems”. Optimization. Vol. 33, pp. 9 – 27. 1995.
[10] Dempe, S. and Schreier,H. Operations Research –
Deterministische Modelle und Methoden. Teubner Verlag.
Wiesbaden. 2006.
[11] Dempe, S. and Zemkoho, A.B. A Bilevel Approach to Optimal
Toll Setting in Capacitated Networks, Preprint, TU Bergakademie
Freiberg. 2008.
[12] Rockafellar, R.T. Convex Analysis. Princeton, New Jersey:
Princeton University Press. 1970.
[13] Dempe, S. Foundations of Bilevel Programming. Dordrecht/
London/Boston: Kluwer Academic Publishers. 2002.
[14] Grygarová, L. “Qualitative Untersuchung des I.
Optimierungsproblems in mehrparametrischer Programmierung”.
Applications of Mathematics, Vol. 15, No. 4, pp. 276 – 295. 1970.
Un algoritmo para resolver el problema binivel con parámetros en el
objetivo del nivel inferior POR: AARÓN ARÉVALO FRANCO
ESPECIAL / 3ER FORO CELERINET ENERO-JUNIO 2013 57
Un modelo para
enviar, recibir y
distribuir
ayuda en especie
después de haber ocurrido
un desastre natural
José Fernando Camacho Vallejo
Edna Lizet González Rodríguez
UANL-FCFM
Universidad Autónoma de Nuevo León
Facultad de Ciencias Físico Matemáticas
San Nicolás de los Garza, Nuevo León, México
Resumen:
En este trabajo se propone un modelo de programación
binivel en logística humanitaria para optimizar el
envío, recepción y distribución de la ayuda en especie
en el caso en que haya ocurrido de desastre natural con
consecuencias catastróficas. Cuando ocurre un sismo o
un tsunami en un país, y si resulta seriamente afectado,
habrá organismos sin fines de lucro y algunos otros
países que inmediatamente tratarán de enviar productos
para ayudar; sean alimentos, agua, medicamentos, entre
otros. Es claro que quienes brinden ayuda buscarán
minimizar los costos de realizar los envíos a alguna
de las zonas de acopio; dichos envíos pueden ser por
medio aéreo, terrestre o marítimo. En cambio, el país
afectado buscará distribuir la ayuda de forma eficiente,
esto es, enviando los productos solicitados a las zonas
afectadas en el menor tiempo posible. Este problema es
importante debido a que últimamente se han presentado
desastres naturales de magnitudes grandes. Además, se
propone una reformulación del modelo reduciéndolo a
un problema de optimización no lineal de un solo nivel.
Palabras claves: programación binivel, logística
humanitaria, equilibrio de Stackelberg
58 CELERINET ENERO-JUNIO 2013 ESPECIAL / 3ER FORO
Introducción Este trabajo está enfocado específicamente en
analizar una situación en particular relacionada con la
En los últimos años se han presentado varios desastres etapa de Respuesta; dicho problema es el de distribuir
naturales con consecuencias catastróficas para la eficientemente la ayuda hacia las zonas afectadas. Es
población afectada. Entre ellos podemos mencionar los natural pensar que las demandas de las zonas afectadas
terremotos en Haití y en Chile en 2010, donde dichos varían constantemente e inclusive hay nodos y aristas de
países se vieron sumamente afectados y requirieron de la red que desaparecen. En [5] propusieron un algoritmo
la ayuda oportuna de todo el mundo. Otro ejemplo es el de tres etapas: primero agrupaban las zonas afectadas con
tsunami ocurrido en la costa de Japón en 2011, donde base en las características de la demanda y la prioridad,
gran parte de la región afectada fue devastada. Estos después identificaban el centro de gravedad de cada
hechos propiciaron que muchos países y organismos agrupamiento para hacer la entrega de la ayuda y por
internacionales enviaran ayuda que consistía desde último, el ruteo de vehículos para realizar la distribución.
dinero, voluntarios y productos. Como continuación del trabajo recién descrito, en [6] se
agregó un caso de estudio de un terremoto en Taiwán.
Los productos enviados más comunes son
medicamentos, comida enlatada, agua potable, pañales, También en el 2012 en [7] consideran el problema
entre otros. Es evidente la urgente necesidad de recibir donde existen centros de acopio que se encargan de
esos productos para poder distribuirlos en las regiones recibir la ayudar externa y plantean una función multi-
afectadas y evitar que se incrementen las muertes por objetivo donde intentan minimizar el costo de operar un
hambruna o por enfermedades. Es por esto que la eficiente centro de acopio, minimizar el costo de distribución y
distribución de dichos artículos es necesaria, este hecho maximizar la demanda cubierta. Los autores reformulan
ya ha sido notado por otros autores, por ejemplo, en [1] el problema como un problema de programación lineal
enlistan algunos trabajos realizados sobre distribución de mixto-entero, lo resuelven por etapas usando una
ayuda y su transportación casual. Además, es evidente la heurística y comparan los resultados con los obtenidos
importancia de la rapidez y eficiencia que tiene que tener mediante el algoritmo NSGA-II.
la cadena de suministro involucrada en estas situaciones,
en [2] y [3] se presentan trabajos enfatizando este hecho. Algo que también es de interés es proveer sistemas
que traten de brindar ayuda en la toma de decisiones
La rama que se encarga de estudiar estos de una situación de emergencia. Bajo este enfoque, en
problemas es la Logística Humanitaria, la cual se [8] desarrollaron un modelo de programación lineal
enfoca en modelar problemas relacionados con el en una cadena de suministro para una situación de
almacenamiento y distribución de productos requeridos emergencia. En esos modelos ya se tenía la demanda
por la población afectada debido a la ocurrencia de fija para cada zona afectada y el centro de acopio que
un desastre natural; o bien, un desastre provocado por iba a abastecer a dicha zona. El problema se reducía a
el hombre. Estas situaciones las podemos analizar de determinar el número de camiones asignados para cada
dos formas, proactivas y reactivas. Proactivas para ruta, considerando que no había limitantes en el número
estudiar el problema de interés antes de que ocurra un de camiones disponibles.
desastre y reactivas para el caso cuando ya ocurrió y
hay que decidir las acciones que deberán realizarse. En También en [9] proveen de dos enfoques para tomar
[4] presentan una extensa revisión de literatura sobre decisiones eficientes relacionadas al acopio de la ayuda
los problemas relacionados con Logística Humanitaria; en especie y a su distribución. Uno de los modelos era
además hacen una división de las etapas relacionadas un modelo de asignación en el que se minimiza el tiempo
con estos desastres: la etapa de Mitigación donde se de terminar de ayudar en una zona afectada la vez; en el
analizan las acciones que se deben tomar para disminuir otro modelo de colaboración distribuida se podía atender
la probabilidad de ocurrencia de un desastre o bien, varias áreas afectadas al mismo tiempo.
reducir el impacto en caso de que ocurra. La etapa de
Preparación se refiere a planear las actividades a seguir En los modelos anteriores se considera una demanda
en caso de un desastre. La etapa de Respuesta es cuando conocida, ya sea obtenida mediante un pronóstico o de
ya ocurrió un desastre y se deben realizar acciones para alguna otra manera. Pero como no sabemos la magnitud
evitar que se incrementen las consecuencias desastrosas. del desastre o el tiempo en que ocurre es razonable
Por último, la etapa de Recuperación es aquella en considerar la demanda de la zona afectada como
que se llevan a cabo las acciones que devuelvan a la estocástica.
normalidad a la zona afectada, ya sea a corto o mediano
plazo. También encontramos el trabajo [10] donde se
busca tener un inventario de productos requeridos para
Un modelo para enviar, recibir y distribuir ayuda en especie después de
haber ocurrido un desastre natural POR: JOSÉ CAMACHO Y EDNA GONZÁLEZ
ESPECIAL / 3ER FORO CELERINET ENERO-JUNIO 2013 59
después distribuirlos. Ellos proponen un algoritmo analizan un juego líder-seguidor donde se pretende
heurístico basado en el método L-shaped, el cual es proteger instalaciones para prevenir la re-asignación de
capaz de resolver problemas de gran escala y lo validan los clientes en caso de un ataque. El líder busca minimizar
mediante un caso de estudio de la ocurrencia de un la suma de los costos incurridos para instalar, proteger
huracán en el área de la costa del Golfo de los Estados y utilizar esa instalación. El seguidor busca destruir las
Unidos. instalaciones desprotegidas para afectar la capacidad
de abastecimiento de las plantas no restantes. Para
En [11] en el 2012 proponen un modelo jerárquico resolver el problema proponen un algoritmo basado en
donde primero se busca restablecer los caminos dañados búsqueda tabú. También, en [14] formulan el problema
por el desastre para después distribuir de mejor manera de protección de instalaciones como un programa bi-
la ayuda solicitada. Es importante señalar que los nivel lineal mixto entero, el cual analiza el tiempo de
autores hacen énfasis en la importancia de coordinar recuperación de un sistema después de un incidente
la distribución de ayuda con el restablecimiento de los considerando que pueden ocurrir varios incidentes más a
caminos. Para mostrar la validez de su modelo analizan través del tiempo. Ninguno de estos tres trabajos analiza
un caso de estudio basado en el terremoto de Haití. A una situación perteneciente a la etapa de Respuesta.
pesar de que estos modelos mencionan que consideran
jerarquías, ninguno de ellos pertenece al área de Un trabajo que pertenece a la etapa de Respuesta
programación multi-nivel. igual que el problema que estamos analizando es el
[15] en el que consideran el problema bi-nivel en donde
En cambio, el modelo que nosotros proponemos en ocurrió un terremoto que afectó la red de carreteras de
el presente trabajo es programación bi-nivel, la cual es la zona, entonces el líder trata de maximizar el flujo de
un caso particular de programación multi-nivel en el cual vehículos que entran a la zona afectada para proveer
solo se consideran dos niveles de decisión. El problema ayuda, mientras que los seguidores son los usuarios que
considerado está enfocado en la eficiente distribución de buscan viajar por la ruta no afectada que minimice su
la ayuda en especie recibida en los centros de acopio. tiempo de viaje. Esta situación genera tráfico, lo cual
Dicha ayuda deberá distribuirse a las zonas afectadas de impacta en las labores de ayuda y recuperación, por lo
forma rápida y eficaz pero considerando que los países u que un organismo gubernamental debe de regular el uso
organismos internacionales tratan de ayudar de tal forma de los caminos existentes.
que les sea menos costoso el envío.
Nuestro problema de interés podría verse como el
Muchas situaciones reales involucran tomadores de siguiente problema bi-nivel: cuando ocurre una catástrofe
decisiones en dos niveles los cuales están relacionados devastadora en alguna zona del mundo, muchos países y
por una jerarquía prestablecida. El hecho de que exista organismos internacionales envían ayuda al país afectado.
esta jerarquía implica que el problema sea considerado El nivel superior, el país afectado (líder) debe elegir el
dentro de la categoría de optimización multi-objetivo. medio de transporte y la forma de distribuir rápidamente
El área que engloba a ese tipo de problemas se llama los productos de ayuda. Se considera que existen varios
Programación Bi-nivel. puntos (centros de acopio) a donde puede llegar la ayuda
y los lugares afectados que requieren ayuda demandarán
Después de una extensa revisión de literatura nos algunos productos de manera prioritaria. Por último, en
dimos cuenta que en el área de logística humanitaria el nivel inferior, se asume que los países u organismos
hay muy pocos trabajos modelados como problemas de internacionales (seguidores) que envían ayuda deciden
programación bi-nivel. Por ejemplo, desde el punto de libremente a cual centro de acopio enviarlo de tal forma
vista de analizar desastres ocasionados por el hombre, que se minimice el costo del envío. Este problema es
en [12] consideran el problema de la amenaza terrorista innovador porque se considera por vez primera a la parte
como un problema bi-nivel. En el nivel superior el que brinda ayuda no solamente al país afectado. No es
terrorista busca maximizar el daño ocasionado atacando descabellado considerar que quienes envían ayuda están
al mínimo número de líneas de un sistema de energía interesados en reducir los costos de sus acciones, lo que
mientras que en el nivel inferior se intenta minimizar nos motiva a considerar el nivel inferior del problema
las cargas derramadas ocasionadas por el ataque. El propuesto.
problema bi-nivel propuesto resulta ser no-lineal mixto
entero y lo reducen a un problema lineal mixto entero de La organización del trabajo es la siguiente: la
un solo nivel utilizando las condiciones de optimalidad segunda sección presenta la descripción del modelo. La
de Karush-Khun-Tucker y algunas restricciones válidas tercera sección describe la reformulación matemática
para evitar la no-linealidad. Recientemente en [13] del modelo. La cuarta sección muestra el trabajo futuro y
por último las referencias.
Un modelo para enviar, recibir y distribuir ayuda en especie después de
haber ocurrido un desastre natural POR: JOSÉ CAMACHO Y EDNA GONZÁLEZ
60 CELERINET ENERO-JUNIO 2013 ESPECIAL / 3ER FORO
Modelo matemático de programación bi-nivel (4)
El modelo puede describirse como sigue: sean (5)
i ∈ I los países u organismos internacionales que ayuden
al país afectado; j ∈ J son lugares específicos en donde (6)
se puede recibir la ayuda en especie dentro del país
afectado (centros de acopio); k ∈ K son los lugares (7)
con necesidad urgente para recibir ayuda; l ∈ L denota
un producto específico (agua potable, medicamentos, (8)
comida enlatada, ropa, papel, entre otros); y por último, El problema binivel está definido por (1)-(8). En
sea m ∈ M el medio de transporte utilizado para enviar (1) se presenta la función objetivo del nivel superior y
o distribuir los productos (terrestre, aéreo o marítimo). se aprecia que el líder quiere minimizar el tiempo total
de respuesta para distribuir la ayuda, esto es, el tiempo
Definamos t1 como el tiempo que tarda en llegar necesitado para enviar desde el organismo de ayuda i
ijlm hacia el centro de acopio j y de ahí hacia la zona afectada
un cargamento del producto l por el medio de transporte k. En (2) se tiene una restricción de espacio disponible
en cada centro de acopio j; en (3) se tiene que satisfacer
m desde el organismo de ayuda i hacia el centro de la demanda necesitada para cada producto l en cada zona
afectada k y la restricción (4) restringe a que el número
acopio j; de manera similar sea t2 el tiempo que tarda de embarques de cada producto tiene que ser no negativo.
jklm
en distribuirse un cargamento del producto l por el La restricción (5) es la que convierte este problema
en uno binivel. Esta restricción implica que las variables
medio de transporte m desde el centro de acopio j hacia xijlm deben ser la solución óptima del problema (5)-(8).
A (5) se le conoce como la función objetivo del nivel
la zona afectada k. También se tendrá un volumen vl que inferior e indica que se quiere minimizar el costo de
ocupa un cargamento del producto l y en cada centro enviar la ayuda de parte del organismo de ayuda i hacia
el centro de acopio j. La ecuación (6) dice que se debe
de acopio j se cuenta con una capacidad de espacio de enviar solamente lo requerido para cada centro de
acopio j de cada producto l. La expresión (7) asegura
limitada Vj . En cada zona afectada k se cuenta con una que un país u organismo de ayuda i no puede enviar más
demanda conocida Dkl de cada artículo l, así como en de una cantidad disponible del producto l y (8) señala
cada país u organismo de ayuda i se tiene un máximo la no negatividad para los embarques de cada producto
desde el organismo de ayuda i hacia el centro de acopio j.
de ayuda disponible Hil de cada producto l. Por último,
sea cijm el costo de enviar un cargamento por el medio Durante este trabajo asumimos que se conocen tanto
de transporte m desde el organismo de ayuda i hacia el las zonas afectadas, la ubicación de los centros de acopio
y los organismos que están disponibles para ayudar; así
centro de acopio j. como un organismo central que coordina a dichos países
u organismos de ayuda para no enviar ayuda innecesaria.
Las variables de decisión para nuestro problema Además, consideramos que no hay restricciones en
son: cuanto al número de vehículos disponibles por cualquier
medio para la distribución de la ayuda.
xijlm= cantidad de cargamentos del producto l enviados
por el medio de transporte m desde el país u organismo
de ayuda i hacia el centro de acopio j.
yjklm= cantidad de cargamentos del producto l distribuida
por el medio de transporte m desde el centro de acopio j
hacia la zona afectada k.
Entonces tenemos que el modelo resultante es como
sigue:
(1)
(2)
(3)
Un modelo para enviar, recibir y distribuir ayuda en especie después de
haber ocurrido un desastre natural POR: JOSÉ CAMACHO Y EDNA GONZÁLEZ
ESPECIAL / 3ER FORO CELERINET ENERO-JUNIO 2013 61
El esquema del modelo es: El líder (país afectado) Figura 1. Diagrama del problema
decide cómo distribuir la ayuda desde los centros de
acopio hacia los lugares necesitados, esto es, fija las (13)
yjklm. Debido a esto, se conjunta una demanda conocida (14)
de cada producto l que el país afectado está solicitando (15)
en cada centro de acopio j. Basado en esa demanda, (16)
una organización humanitaria trata de coordinar a (17)
los demás países u organismos de ayuda que quieran (18)
participar enviando los embarques de ayuda de tal (19)
forma que minimicen el costo de envío y se cumplan (20)
con las condiciones de demanda. Esto es, se deciden las (21)
xijlm. Ahora con las yjklm y xijlm el líder evalúa su función (22)
objetivo para minimizar el tiempo de distribución que
requiere para enviar a las zonas afectadas k.
El diagrama se presenta en la Figura 1.
Reformulación del modelo
En esta sección reformularemos el problema binivel
en un problema de programación no lineal de un solo
nivel. Es fácil verse que si en el problema binivel (1)-
(8) se fijan las variables y ,jklm entonces el problema del
nivel inferior (5)-(8) se convierte simplemente en un
problema de transporte. Entonces, este problema del
nivel inferior puede ser remplazado por las condiciones
de optimalidad del problema primal y dual. Definamos
a αjl , ∀j∈J, l∈L y a βil , ∀i∈I,l∈L como las variables
duales correspondientes a las restricciones (6) y (7)
respectivamente.
El problema dual asociado al nivel inferior está
formado por:
(9)
(10)
(11)
(12)
Siguiendo con la teoría existente sobre reducciones
de problema de programación binivel procedemos a
utilizar la igualdad de las funciones objetivo de ambos
niveles para tener el problema de programación no lineal
de un solo nivel:
Un modelo para enviar, recibir y distribuir ayuda en especie después de
haber ocurrido un desastre natural POR: JOSÉ CAMACHO Y EDNA GONZÁLEZ
62 CELERINET ENERO-JUNIO 2013 ESPECIAL / 3ER FORO
La restricción (13) es la función objetivo del
problema no lineal de un solo nivel. Las restricciones
(14)-(17), (20) y (21) nos brindan la factibilidad primal.
Las restricciones (18) y (22) nos aseguran la factibilidad
dual. Por último, la restricción (19) nos garantiza que
se obtenga el óptimo del problema del nivel inferior;
sin embargo, también nos hace perder la linealidad del
modelo.
Otra forma es quitar la ecuación (19) y considerar
las restricciones de holgura complementaria
(23)
(24)
Pero evidentemente podemos apreciar que estas
ecuaciones de complementariedad también nos hacen
perder linealidad.
Trabajo Futuro
Esta investigación está actualmente en proceso y se están
consiguiendo los datos reales del terremoto ocurrido en
Chile en 2010 para llevar a cabo un caso de estudio sobre
ese acontecimiento. Además al modelo se le pueden
agregar las restricciones de balanceo de la ayuda recibida
en los centros de acopio para que no se saturen mientras
que otros tengan mucho espacio disponible.
También podemos identificar que este problema cae
dentro de la categoría de los modelos de programación
binivel con el parámetro en el lado derecho únicamente.
Para este tipo de problema ya se han desarrollado
algunos algoritmos especiales para resolverlos por lo que
analizaron su implementación para solucionar nuestras
instancias.
Otra posible extensión de este trabajo es que
podemos considerar la eliminación de arcos de la
red y después su incorporación a la misma. Esto,
simulando la destrucción de algún camino y después su
restablecimiento para la utilización.
Un modelo para enviar, recibir y distribuir ayuda en especie después de
haber ocurrido un desastre natural POR: JOSÉ CAMACHO Y EDNA GONZÁLEZ
ESPECIAL / 3ER FORO CELERINET ENERO-JUNIO 2013 63
Referencias Datos del Autor:
[1] Caunhye, A.M., Nie, X., and Pokharel, S., "Optimization Models José Fernando Camacho Vallejo
in Emergency Logistics: A Literature Review". Socio-Economic
Planning Science. Vol. 46, pp. 4-13. 2012. El Dr. Camacho tiene Licenciatura en Matemáticas por la
Facultad de Ciencias Físico-Matemáticas de la Universidad
[2] Wang, Q. and Rong, L. "Agile Knowledge Supply Chain for Autónoma de Nuevo León, Maestría en Ciencias en Ingeniería
Emergency Decision-Making Support". Proceedings of the 7th con especialidad en Ingeniería Industrial por Arizona State
International Conference on Computational Science, Part IV. pp. University y Doctorado en Ciencias de la Ingeniería con
178-185. 2007. especialidad en Ingeniería Industrial otorgado por el ITESM
campus Monterrey. Actualmente se encuentra laborando
[3] Ji, G. and Zhu, C., "A Study on Emergency Supply Chain and como profesor-investigador exclusivo y de tiempo completo
Risk Based on Urgent Relief Service in Disasters". Systems en CICFIM y es coordinador del Posgrado en Ciencias con
Engineering Procedia. Vol. 5, pp. 313-325. 2012. Orientación en Matemáticas de la FCFM en la UANL. Las
líneas de investigación de interés son resolución de problemas
[4] Altay, N. and Green, W.G. "Interfaces with other Disciplines OR/ de investigación de operaciones, en particular sobre teoría y
MS Research in Disaster Operations Management". European aplicaciones de programación binivel, diseño de métodos
Journal of Operational Research. Vol. 175, pp. 475-493. 2006. numéricos y técnicas heurísticas para resolver problemas de
programación binivel.
[5] Sheu, J.B. and Chen, Y.H. "A Novel Model for Quick Response
to Disaster Relief Distribution". Proceedings of the Eastern Asia Dirección del autor: Ciudad Universitaria, S/N, C.P. 66451,
Society for Transportation Studies. Vol. 5, pp. 2454-2462. 2005. San Nicolás de los Garza, Nuevo León, México.
[6] Sheu, J.B. "An Emergency Logistics Distribution Approach Email: [email protected]
for Quick Response to Urgent Relief Demand in Disasters".
Transportation Research Part E. Vol. 43, pp.687-709. 2007. Edna Lizet González Rodríguez
[7] Rath, S. and Gutjahr, W.J. "A Math-Heuristic for the Warehouse Tiene Licenciatura en Ciencias Computacionales por la Facultad
Location-Routing Problem in Disaster Relief". Computers & de Ciencias Físico Matemáticas de la Universidad Autónoma
Operations Research. In Press. de Nuevo León. Actualmente se encuentra estudiando la
Maestría en ciencias con orientación en matemáticas en la
[8] Rathi, A.K., Church, R.L. and Solanski, R.S. "Allocating Facultad de Físico Matemáticas de la Universidad Autónoma
Resources to Support a Multicommodity Flow with Time de Nuevo León.
Windows". Logistics and Transportation Review. Vol. 28, pp.
167-188. 1993. Dirección del autor: Ciudad Universitaria, S/N, C.P. 66451,
San Nicolás de los Garza, Nuevo León, México.
[9] Wex, F., Schryen, G. and Neumann, D. "Intelligent Decision
Support for Centralized Coordination during Emergency Email: [email protected]
Response". Proceedings of the 8th International ISCRAM
Conference. 2011.
[10] Rawls, C.G. and Turnquist, M.A. "Pre-positioning of Emergency
Supplies for Disaster Response". Transportations Research Part
B. Vol. 44, pp. 521-534. 2010.
[11] Liberatore, F., Ortuño, M.T., Tirado, G. and Scaparra, M.P. "A
Hierarchical Compromise Model for the Joint Optimization of
Recovery Operations and Distribution of Emergency Goods in
Humanitarian Logistics". Computers & Operations Research. In
Press. 2012.
[12] Arroyo, J.M. and Galiana, F.D. "One the Solution of the Bi-level
Programming Formulation of the Terrorist Threat Problem".
IEEE Transactions on Power System. Vol. 20, No. 2. May 2005.
[13] Aksen, D. and Aras, N. "A Bi-level Fixed Charge Location Model
for Facilities under Imminent Attack". Computers & Operations
Research. Vol. 39, pp. 1364-1381. 2012.
[14] Losada, Ch., Scaparra, M.P. and O’Hanley, J.R.. "Optimizing
System Resilience: A Facility Protection Model with Recovery
Time". European Journal of Operational Research. Vol. 217, pp.
519-530. 2012.
[15] Feng, C.M. and Wen, C.C. "A Bi-level Programming Model for
Allocating Private and Emergency Vehicle Flows in Seismic
Disaster Areas". Proceedings of the Eastern Asia Society for
Transportation Studies. Vol. 5, pp. 1408-1423. 2005.
Un modelo para enviar, recibir y distribuir ayuda en especie después de
haber ocurrido un desastre natural POR: JOSÉ CAMACHO Y EDNA GONZÁLEZ
64 CELERINET ENERO-JUNIO 2013 ESPECIAL / 3ER FORO
Métodos y modelado
matemático
para el análisis de
procesos complejos
en las organizaciones
Héctor Raymundo Flores Cantú
UANL-FCFM
Universidad Autónoma de Nuevo León
Facultad de Ciencias Físico Matemáticas
San Nicolás de los Garza, Nuevo León, México
Resumen:
Existen diversas ramas de la matemática que pueden
ser aplicadas en la solución de problemáticas reales. Sin
embargo, suelen verse como una colección independiente
de herramientas y es difícil visualizar una estructura
unificada. En este trabajo se presentará una propuesta
para esta estructura con el objetivo de facilitar la tarea
de detección de oportunidades para el uso de métodos
matemáticos en el análisis de procesos complejos,
especialmente relacionado con empresas o industrias.
Esta discusión permitirá ofrecer una metodología para
explorar las posibilidades de uso de matemáticas en las
problemáticas de las organizaciones. Este documento
es producto del trabajo colaborativo del autor con
consultores y modeladores de la empresa aleph5, quienes
han trabajado directamente en decenas de proyectos que
involucran modelos y métodos matemáticos en las más
diversas industrias.
Palabras claves:
Matemática Aplicada, Modelado Matemático, Análisis
de Procesos Complejos
ESPECIAL / 3ER FORO CELERINET ENERO-JUNIO 2013 65
Introducción Análisis de procesos complejos
La matemática es la disciplina que procura la Antes que nada, debo aclarar que al hablar de complejidad
comunicación perfecta. Los objetos matemáticos no nos referimos a la definición matemática, sino a la
están diseñados con este objetivo. Esta característica definición popular. Así, al hablar de un proceso complejo
la convierte en una herramienta útil en el análisis y nos referimos a un proceso difícil de entender; pero
tratamiento de todo tipo de problemas complejos, tanto profundizaremos en lo que esto significa a continuación.
en el ámbito científico como en las organizaciones
(empresas o industrias). La palabra analizar se usa indiscriminadamente en
muchos contextos, sin embargo este vocablo tiene un
Durante la primera década del siglo XXI hemos significado muy preciso; se refiere en términos generales
visto un desarrollo importante de las aplicaciones de a la descomposición de un todo en partes para facilitar
esta disciplina en las industrias y un incremento en el su estudio. La dificultad de analizar consiste en que
reconocimiento de las organizaciones y gobiernos en no existe una forma única o correcta de realizar esta
su importancia. Ver por ejemplo la referencia [1] para descomposición y dos expertos distintos pueden sugerir
entender la importancia de la matemática en Europa enfoques diferentes pero complementarios para esta
desde el punto de vista de Alemania. Esto, a pesar de tarea.
que desde los 80’s y antes, comienza a generarse una
vinculación entre empresas y academia en algunas En el caso particular de aquellos procesos
instituciones aisladas como lo registra Friedman en la susceptibles a ser tratados con métodos matemáticos,
referencia [2]. la experiencia nos muestra que su complejidad puede
analizarse estudiando las siguientes cuatro características
El presente trabajo, es un resumen de algunas ideas de los mismos.
relacionadas con la dificultad de aplicar la matemática
en la generación de valor y el análisis de procesos 1. Existen muchos factores interconectados
reales complejos. Representa el resultado de un trabajo
colaborativo entre el autor y expertos de la empresa 2. Hay varios objetivos en conflicto
aleph5 quienes tienen más de 25 años de experiencia en
el uso de modelos matemáticos en proyectos aplicados. 3. El entorno del proceso es dinámico
Esto con el objetivo de responder de una forma lo más
estructurada y simple posible a la pregunta que muchas 4. Siempre existe un grado de incertidumbre
organizaciones se hacen respecto a la posibilidad
de utilizar métodos o modelos matemáticos para el La razón por la que la matemática sirve de apoyo en
tratamiento de sus problemáticas. este tipo de procesos, es justo por su tratamiento de estos
cuatro tipos de complejidades.
Los proyectos aplicados donde se han usado estos
métodos con éxito, no son fáciles de encontrar en la Factores interconectados: Cuando un proceso
literatura; principalmente debido a la usual negativa o situación presenta un funcionamiento que no es el
de las empresas por publicar resultados de enfoques esperado, es posible que cualquier observador pueda
y análisis que pudiesen beneficiar a su competencia. detectarlo; sin embargo, tomar medidas para corregirlo
Usualmente solo es posible referenciar trabajos requiere de conocimiento profundo del proceso. Esto
realizados a organizaciones no lucrativas como es sucede por la existencia de muchos factores inherentes al
el caso de la referencia [3] donde parte del equipo de proceso que se relacionan de formas difíciles de prever.
aleph5 colaboró en la automatización del suministro de Esta complejidad se manifiesta cuando al ajustar uno de
agua en la ciudad de Jacksonville, Florida. los factores, se genera un efecto inesperado o no deseado
en el resto de ellos.
Lo que sí podemos adelantar es que existen diversas
formas en que esta disciplina puede utilizarse para la Una de las mejores analogías es la de una
generación de valor y en especial para el análisis de telaraña, donde al intentar ajustar una parte de ella, se
procesos complejos. Para iniciar la discusión, haremos generan repercusiones en toda la red de formas difíciles
justamente un análisis de lo que se entiende en las de predecir. Esto significa que en un proceso complejo,
organizaciones como un proceso “complejo”. resulta imposible aislar solo una parte del mismo para
realizar ajustes.
Métodos y modelado matemático para el análisis de procesos complejos
en las organizaciones POR: Héctor Flores Cantú
66 CELERINET ENERO-JUNIO 2013 ESPECIAL / 3ER FORO
Un enfoque correcto hacia esta complejidad consiste en un sistema de soporte a la toma de decisiones o DSS
en el diseño de un modelo matemático del proceso por sus siglas en inglés (Decision Support Systems).
que incluya todos los factores relevantes. Al modelar
matemáticamente siempre debemos sacrificar algunos Entorno dinámico: En todo tipo de problemáticas
aspectos de la situación y es aquí donde la experiencia reales, la toma de decisiones está inmersa en un entorno
del modelador adquiere suma importancia. siempre cambiante. Las decisiones no solo deben
considerar los factores indicados, sino que es necesario
Uno de los errores más comunes consiste en considerar que todos ellos están en continuo cambio.
menospreciar la importancia de construir un modelo Está dinámica puede hacer que una buena decisión hoy,
flexible que refleje las necesidades, aspectos importantes no sea tan buena en el futuro y nos obliga a procurar
particulares del proceso y que facilite su uso. En muchos un tiempo relativamente rápido de respuesta en todo
casos los modelos genéricos existentes en software análisis realizado.
prediseñado no generan el valor esperado o requieren de
mucho trabajo y entendimiento profundo para su ajuste Muchos responsables de procesos reconocen este
particular. aspecto como el más difícil de tratar. En ocasiones
es posible realizar análisis cualitativos utilizando
Lo más recomendable es dedicar un esfuerzo serio herramientas computacionales simples como hojas
a construir un modelo matemático específico para el de cálculo en algunas horas o días, pero los cambios
proceso que busca analizarse y apoyarse en expertos siempre presentes en las condiciones reducen la validez
en el área de modelado. De esta forma, el diseño de un de los mismos, siendo difíciles y tediosos de realizar.
modelo adecuado es trabajo conjunto de expertos en el
proceso real y en modelado matemático. Este esfuerzo Aunque los modelos matemáticos y los algoritmos
rendirá frutos valiosos al momento de usar el modelo en aceleran los análisis, no sirven por si mismos para tratar
la práctica. los cambios continuos. Un enfoque para enfrentar esta
dificultad, consiste en diseñar diferentes modelos del
Objetivos en conflicto: Sin importar la situación, mismo proceso para cada escala diferente de tiempo.
nunca existe un objetivo único que nos permita evaluar Esto representa una separación de la toma de decisiones
el funcionamiento de un proceso. Si nos enfocamos en distintos niveles. Mencionaremos al menos cuatro
en reducir costos, afectamos la calidad o el servicio, si niveles en los que se enfoca la toma de decisiones
queremos mejorar la calidad, aumentaremos los tiempos mediante el uso de modelos matemáticos.
de proceso, etc. En prácticamente todos los procesos
complejos reales, existen varios objetivos o indicadores 1. Nivel estratégico: En este nivel se toman
en conflicto. decisiones sobre los objetivos del negocio o del
proceso. Esto requiere un conocimiento real del
Esta situación requiere de un enfoque de toma entorno y del proceso mismo que puede adquirirse
de decisiones basado en un balance de objetivos. Un mediante análisis de datos. Los objetivos son a
mito popular es que los métodos matemáticos pueden largo plazo y las decisiones recaen el las áreas
automatizar la toma de decisiones. Esto solo sucede directivas.
en casos muy específicos (por ejemplo en el control
automático). Sin embargo, aún en estos casos, el 2. Nivel de planeación: Entendemos por planeación,
control debe ser diseñado por un experto que haya a las decisiones relativas a la distribución de
considerado previamente las decisiones que representan recursos a las distintas áreas para que estén
el comportamiento que se espera. En la mayoría de los disponibles en el momento y lugar adecuados,
casos, los modelos y algoritmos se utilizan para apoyar la posibilitando así el logro de los objetivos
toma de decisiones filtrando opciones malas y entregando estratégicos. Estas decisiones se toman de forma
al tomador de decisiones solamente un conjunto pequeño periódica (semanal o mensual) dependiendo del
de buenas opciones entre las que se debe elegir una. En tipo de proceso.
casi todos los casos, incluso se requiere de un proceso
cíclico antes de llegar a una decisión final. 3. Nivel de programación: La programación se
refiere a la asignación de tareas, responsables
Las áreas de optimización y en particular y recursos específicos que lleven a cabo el
optimización multi-objetivo (así como optimización plan del nivel anterior. En este nivel se incluye
multinivel) ofrecen alternativas adecuadas para el también el tiempo como un recurso. En resumen,
tratamiento de esta complejidad; es decir, para el balance la planeación determina de manera detallada
de indicadores. Estas herramientas suelen ser incluidas la forma en que se ejecutarán las actividades
Métodos y modelado matemático para el análisis de procesos complejos
en las organizaciones POR: Héctor Flores Cantú
ESPECIAL / 3ER FORO CELERINET ENERO-JUNIO 2013 67
necesarias para la obtención de los resultados Técnicas de modelado matemático
esperados. Un programa suele diseñarse con una
frecuencia diaria o a lo más semanal. Suele ser Existe una diversidad de técnicas de modelado
una mala idea (o pérdida de tiempo) el realizar apropiadas para cada tipo de situación que se requiere
programaciones a más de un mes de resolución, analizar. Sistemas matriciales, ecuaciones diferenciales o
esto debido a la enorme incertidumbre existente. algebraicas, autómatas celulares, simulaciones, sistemas
de reglas, sistemas dinámicos, redes neuronales, etc.
4. Nivel de ejecución: El nivel más dinámico de Cada tipo de modelo resulta adecuado dependiendo de
toma de decisiones trata con la detección del los factores específicos involucrados en el proceso y
cumplimiento de los programas y el tratamiento podemos utilizar los cuatro niveles de toma de decisiones
de desviaciones. Las cosas no siempre ocurren de antes discutidos para sugerir los tipos de modelos que
acuerdo a lo programado y es necesario tener la podrían ser de utilidad.
capacidad de reaccionar ante estos imprevistos,
sea mediante acciones específicas o mediante La tabla 1 representa solo una tendencia y se refiere
la emisión de mensajes que permitirán a los a que frecuentemente ese tipo de modelos resultan más
responsables reasignar recursos o redefinir tareas. apropiados para el nivel indicado. Es posible que algunas
En este nivel, las decisiones son en tiempo técnicas de modelado hayan sido aplicadas de forma más
real y en algunos procesos pueden incluso amplia en ciertos casos. Al lector interesado en temas de
automatizarse. modelado matemático se le sugiere iniciar con literatura
como las referencias [4,5].
Incertidumbre: En algunos procesos, existe mucha Tabla 1.Técnicas de modelado de acuerdo al nivel de
información incierta ya sea debido a la falta de ella o a toma de decisiones
los errores inherentes. El manejo de la incertidumbre en
los procesos debe ser uno de los primeros aspectos que Nivel de Técnica de modelado
debe discutirse ya que existen formas muy variadas de toma de decisiones matemático
tratar con ella. En algunos procesos se considera que los
datos que recibimos son de calidad suficiente y podemos, Estratégico Visuales/Estadísticos
de manera segura, ignorar la incertidumbre. En casos Planeación Sistemas matriciales
pueden diseñarse procesos adicionales para este manejo, Programación Simulaciones Sistemas
como es el caso del proceso de inventarios que tiene el Ejecución
objetivo específico de absorber la incertidumbre en la de reglas
demanda.
Técnicas de visualización
Siempre es posible realizar simulaciones o
aplicar métodos estocásticos, sin embargo debemos En los últimos años, el desarrollo informático ha traído
ser cuidadosos porque estos enfoques tienden a crear una riqueza en técnicas y métodos para la visualización
una complejidad muy alta en los modelos y pueden de datos mediante el desarrollo de la computación
volverlos imprácticos. En cualquier caso, conviene gráfica y el manejo de información multimedia. Un
realizar un análisis de riesgos para entrar de manera más buen diseño de visualización permite condensar la
informada en la etapa de modelado ante la posibilidad información importante facilitando así el proceso de
de incertidumbre; esto, porque no todo lo que ignoramos toma de decisiones. Ver por ejemplo la referencia [6] así
tiene el mismo impacto en lo que nos interesa. como otros libros del mismo autor.
Métodos matemáticos más utilizados Optimización matemática
Cada tipo de problemática requiere del uso particular de Con optimización nos referimos a todos los tipos de
uno o varios métodos matemáticos. Es difícil establecer ella (lineal, cuadrática, entera, convexa, no-lineal,
de manera definitiva los métodos adecuados para cada combinatoria, estocástica, bi-nivel, multicriterio,
problema, esto siempre cambia de acuerdo a la situación. etc.). En la literatura, el estudio de los algoritmos
Sin embargo, podemos detectar ciertas tendencias en correspondientes recibe el nombre de programación
cuanto a los métodos que suelen generar un valor mayor matemática en lugar de optimización matemática, lo
de acuerdo al tipo de problemática a la que enfrentamos. que puede causar algunas confusiones. Así por ejemplo,
Métodos y modelado matemático para el análisis de procesos complejos
en las organizaciones POR: Héctor Flores Cantú
68 CELERINET ENERO-JUNIO 2013 ESPECIAL / 3ER FORO
la programación lineal se refiere a los algoritmos para de ejecución dentro de un sistema de monitoreo y control.
resolver problemas de optimización basados en modelos Análisis y minería de datos
lineales. Dos referencias muy recomendables para El diseño de modelos adecuados requiere de un
optimización son [7,8]. conocimiento profundo de los procesos involucrados.
En general, este conocimiento puede provenir de la
El tipo de algoritmos se basa completamente en el experiencia de los expertos, pero en casi todos los casos
tipo de modelo matemático que se haya diseñado para los modelos se alimentan al parcialmente de relaciones
el proceso. Por mencionar un ejemplo, los modelos de descubiertas a partir de su comportamiento histórico.
sistemas matriciales se abordan con programación lineal Esto por medio de análisis estadísticos o de patrones
(en ocasiones binaria, entera o cuadrática), mientras encontrados mediante métodos de minería de datos.
los modelos de ecuaciones algebraicas o diferenciales
pueden usar programación convexa y no-lineal. El propósito del análisis de datos es extraer de los
datos históricos (existentes o producto de un diseño de
Así, la optimización se usa frecuentemente en los experimentos); información útil para la creación de los
niveles de planeación y programación, permitiendo el modelos que apoyarán la toma de decisiones.
tratamiento de modelos con decenas o cientos de miles
(en ciertos casos incluso millones) de variables de forma Aunque el análisis de datos se refiere por definición
simultánea. Existen muchos algoritmos comerciales al análisis de lo que ya sucedió, el realizar estos análisis
[Gurobi y Cplex entre otros] que tratan este tipo de de forma correcta permite tener una mejor visión de lo
modelos aunque su uso no es nada sencillo, requiriendo que podemos esperar en el futuro. Una introducción a
un entendimiento profundo del comportamiento del este tema es la referencia [10].
modelo matemático construido y al menos buenas Problemas y métodos matemáticos
nociones de las bases teóricas del algoritmo utilizado. La Figura 1 muestra un resumen de la forma en que
los métodos matemáticos suelen ser aplicados en el
Heurísticos tratamiento de problemáticas reales de acuerdo al nivel
de toma de decisiones correspondiente.
Los heurísticos son en esencia algoritmos muy similares
a los de optimización, pero son usados cuando la Conclusiones y agradecimientos
estructura de los modelos no es apropiada para esos El uso de métodos y modelos matemáticos en problemas
últimos. A diferencia de la optimización, los heurísticos de organizaciones en este inicio de siglo XXI resulta
no garantizan una solución matemática al problema de muy similar el uso de las computadoras en los años 80’s.
optimización. Aún con esta deficiencia, los heurísticos Con muchas expectativas, promesas pero nada simple de
pueden ofrecer soluciones útiles en diferentes situaciones implementar correctamente y con muchas decepciones.
cuando no existe algoritmo matemático conocido o si la
estructura matemática del modelo obtenido no es simple. Fig. 1 Tipos de problemas y métodos matemáticos.
A diferencia de los algoritmos de programación lineal,
entera o cuadrática, hay pocos heurísticos comerciales
recomendables, debido a que realmente deben ser
creados ad-hoc. Solo en ciertos casos (como en las redes
neuronales) es posible encontrar software comercial con
heurísticos implementados. Una buena introducción
a algoritmos heurísticos (y su implementación) es la
referencia [9].
Sistemas expertos
De forma muy simplista, podemos decir que los sistemas
expertos buscan emular un sistema de decisiones
automatizado basado en el conocimiento organizado de
expertos humanos. Estos sistemas requieren siempre de
una etapa considerable de diseño y entrenamiento, así
como una colaboración muy cercana con los expertos
en el proceso (sin mencionar su interés en colaborar
activamente en el desarrollo). Se utilizan cuando se
requiere automatizar decisiones en particular en el nivel
Métodos y modelado matemático para el análisis de procesos complejos
en las organizaciones POR: Héctor Flores Cantú
ESPECIAL / 3ER FORO CELERINET ENERO-JUNIO 2013 69
La matemática es una disciplina muy sofisticada
y con una diversidad de métodos al grado que en la
actualidad no existe una sola persona capaz de dominar
todos sus aspectos. Como consecuencia de esto, su
aplicación en el análisis de problemáticas complejas
requiere mucha experiencia y en particular trabajo
colaborativo entre directivos, expertos en el proceso,
matemáticos modeladores, expertos en los algoritmos
adecuados y en tecnologías de información. A cambio
de tener en cuenta estas dificultades, una organización
puede verse muy recompensada, debido a la capacidad
de generación de valor que puede generar un modelo
matemático adecuado para el proceso incluido en un
sistema de toma de decisiones bien diseñado.
Agradezco en particular al equipo de modeladores,
consultores y desarrolladores de la empresa aleph5 (ver
referencia [11]) por compartir mucha de su experiencia
en el enfoque de proyectos aplicados en diversas
empresas, así como por aportar con ideas y sugerencias
para los puntos aquí tratados.
Referencias Datos del Autor:
[1] Greuel, G.M., Remmert, R. und Rupprecht, G. Mathematik – Héctor Raymundo Flores Cantú
Motor der Wirtschaft. Springer. 2008.
El autor es matemático egresado de la Universidad de
[2] Friedman, A. y Littman, W. Industrial Mathematics: A Course in Guanajuato y el Centro de Investigación en Matemáticas,
Solving Real-World Problems. Society for Industrial and Applied CIMAT. Realizó estudios de Maestría en Matemáticas
Mathematics. 1987. Industriales y Doctorado en Optimización en la Universidad
de Kaiserslautern, Alemania y el Instituto Fraunhofer para
[3] Barnett, M., Lee, T. and Jentgen, L. Real-time Automation Matemáticas Industriales y Económicas. Es profesor de
of Water Supply and Distribution for the City of Jacksonville. la UANL en el Posgrado en Ciencias con orientación en
Florida, USA. EICA 9-3. 2004. Matemáticas. Su área de especialidad es la colaboración en
proyectos aplicados relacionados con modelado matemático,
[4] Edward, D. Guide to Mathematical Modelling. Industrial Press. optimización, así como análisis y minería de datos.
2007.
Dirección del autor: Playa Olas Altas No. 3433 Col. Primavera,
[5] Morrison, F. The Art of Modeling Dynamic Systems: Forcasting C.P. 64830, Monterrey, Nuevo León, México.
for Chaos, Randomness and Determinism. Dover Publications.
2008. Email: [email protected]
[6] Tufte, E. R. The Visual Display of Quantitative Information.
Graphics Pr. 2001.
[7] Schrijver, A. Theory of Linear and Integer Programming. Wiley.
1998.
[8] Schrijver, A. Combinatorial Optimization. Springer. 2003.
[9] Skiena, S. S. The Algorithm Design Manual. Springer. 2010.
[10] Berthold, M. R. Borgelt, C. Hoppner, F. and Klawonn, F. Guide
to Intelligent Data Analysis: How to Intelligently Make Sense of
Real Dat. Springer. 2011.
[11] aleph 5. http://www.aleph5.com 2013.
Métodos y modelado matemático para el análisis de procesos complejos
en las organizaciones POR: Héctor Flores Cantú
70 CELERINET ENERO-JUNIO 2013 ESPECIAL / 3ER FORO
Seguridad
en Voz sobre
Redes de Datos
Juan Carlos Flores García
UANL-FCFM
Universidad Autónoma de Nuevo León
Facultad de Ciencias Físico Matemáticas
San Nicolás de los Garza, Nuevo León, México
Resumen:
En la actualidad, las facilidades tecnológicas en el área
de las telecomunicaciones cada vez están al alcance
de las personas y demanda de datos realizada por los
usuarios a través de las redes sociales, videos, audio,
etc. Actualmente, muchos dispositivos electrónicos
cuentan con conectividad hacia el Internet y pueden ser
usados como otra alternativa de conectividad de voz
con alta movilidad y con un bajo costo. Hablaré de sus
características, operación y componentes.
Palabras claves:
voice security, data network and convergence
ESPECIAL / 3ER FORO CELERINET ENERO-JUNIO 2013 71
Introducción Figura 1. Señal análoga
A finales de la década de los 70’s cuando las redes Figura 2. Transmisión PCM
informáticas empiezan a tomar gran importancia para
la administración de los recursos de las empresas, se Figura 3. Recepción PCM
empiezan a diseñar redes de datos de baja velocidad Seguridad en Voz sobre Redes de Datos
transportadas sobre las redes telefónicas existentes,
utilizando módems (modulador de modulador) para POR: Juan Carlos Flores García
transmitir los datos. Estas líneas telefónicas eran de
baja calidad y transportaban señales análogas de ahí la
necesidad de este equipo.
Actualmente, las redes de datos son utilizadas para
transmitir voz, sonido e imágenes gracias a las tecnologías
de punta y medios de alta calidad, convergiendo así
ambas redes.
Información Básica
La voz es una señal análoga cuyo comportamiento genera
diversos estados y está expuesta a múltiples alteraciones
de la información conocidos como ruidos que interfieren
en la misma como lo muestra la Figura 1.
Por otra parte, la señal digital está compuesta por
dos estados (0,1), de esta forma está menos expuesta a la
alteración de la señal por ruidos, obteniendo una mejor
calidad de la información; sin embargo, se requiere de
contar con una tecnología de punta y medios de alta
calidad que puedan transportar señales digitales a muy
alta velocidad.
Para poder transportar una señal analógica por medios
digitales se requiere de su conversión. Para llevar a
cabo esta función se utiliza la técnica de Modulación
de Pulsos Codificados (PCM), que convierte una señal
análoga a una señal digital [1] Figura 2.
Se recupera con el proceso inverso, de digital a analógico
[1] como se muestra en la Figura 3.
En este proceso se pierde parte de la información,
la cual no es detectada por el oído humano. Las redes
telefónicas se transforman de analógicas a digitales, así
como las redes de transporte de información.
Las redes pueden transportar cualquier información,
voz datos y video, que este en señales digitales.
Redes IP
Las redes de datos utilizan una nueva plataforma basada
en protocolo de Internet (IP).
El Internet, una red de redes, en la cual los paquetes
de datos viajan a todo lo largo y ancho del mundo
dando una nueva alternativa de comunicar todo tipo de
información a cualquier lugar que exista conectividad.
72 CELERINET ENERO-JUNIO 2013 ESPECIAL / 3ER FORO
Figura 4. Modelo TCP/IP Esta red está basada en el modelo de referencia TCP/IP
como se muestra en la Figura 4.
Figura 5. Formato UDP
Este modelo estaba diseñado para transportar
Figura 6. Formato TCP paquetes de datos sobre medios de calidad pobre, así que
Seguridad en Voz sobre Redes de Datos se tenía que asegurar que los datos llegarán a su destino,
POR: Juan Carlos Flores García por lo que la base de este modelo está en la capa de TCP,
cuyo protocolo se encarga de controlar la transferencia
de información.
Por otro lado, para encontrar a los usuarios de la
red, solo se requiere contar con una dirección lógica
IP (Protocolo de Internet). Así que si hablamos de
transmitir una señal de voz por una red de datos tenemos
que considerar varios factores.
La transmisión de voz está basada en una
plataforma de conmutación de circuitos; esto significa
que el abonado fuente y el abonado destino tienen que
estar interconectados para que se pueda llevar a cabo
la comunicación y además que la información debe de
enviarse en secuencia o de forma continua. Por lo tanto,
el manejar una señal de voz en forma digital sobre una
red de paquetes de datos se tiene que tratar de diferente
manera para asegurar su comunicación efectiva.
La convergencia de diferentes tipos de señales
de información por la misma red de paquetes de datos
conlleva a crear nuevos protocolos según el tipo de señal.
Dentro del modelo TCP/IP se encuentra el protocolo
UDP [2], Figura 5, que debido a sus características de
ser un protocolo ligero en el manejo de los paquetes y,
a que su formato o trama es más pequeña que el de TCP
[3] Figura 6, es adecuado para manejar cualquier tipo
de información que requiera de minimizar el tiempo de
tránsito o retardo de la señal, la cual es muy importante
para la comunicación de voz. Para que esta comunicación
sea efectiva no debe de haber un retardo mayor de 150
mseg.
Estándares H
Los estándares H se diseñaron para la transmisión de
señales análogas sobre redes de paquetes de datos.
Dentro de estos estándares se encuentran protocolos
cuyas funciones son mantener y asegurar que los
paquetes de datos de voz o señal análogas en tiempo real
tengan cierta prioridad al ser transmitido por redes de
datos.
Dentro de estos protocolos tenemos:
RTP
RTCP
RSVP
ESPECIAL / 3ER FORO CELERINET ENERO-JUNIO 2013 73
El protocolo RTP [4] proporciona confiabilidad a análogas sobre redes de datos, el cual es una mejora de
la información analógica que requiera de ser transmitida H323.
en tiempo real como lo muestra la Figura 7.
Este protocolo, como su nombre lo dice, establece
El protocolo RTCP [4] ayuda a controlar la la comunicación por medio de sesiones entre agentes
información y se enfoca a ver la parte de la recepción o usuarios y servidores haciendo más eficiente la
destino, el formato es mostrado en la Figura 8. comunicación de voz sobre redes de datos, Figura 12.
El protocolo RSVP se encarga de asegurar una Conclusión
conexión, así se emulara un circuito entre la fuente y el
destino; ver Figura 9. El utilizar estas nuevas tecnologías de punta y los
medios de comunicación de alta calidad, le permiten al
Así el protocolo H323 establece una relación de usuario una mejora continua en costos y calidad de sus
protocolos como lo muestra la Figura 10 y su modelo comunicaciones, siendo estos cada vez más comunes en
estructural en la Figura 11. nuestra vida diaria ya que por ejemplo, podemos estar
en cualquier parte del mundo y hacer llamadas por un
Estándar SIP dispositivo inteligente como si fueran llamadas locales
e incluso enviar documentos o fotografías en cuestión
El estándar SIP [5] (Protocolo de Iniciación de Sesión) de minutos.
es otro protocolo que se utiliza para transmitir señales
Figura 7. Formato RTP Figura 11. Modelo estructural H323
Figura 8. Formato RTCP
Figura 9. Formato RSVP. Figura 12. Arquitectura SIP
Figura 10. Protocolo H323
Seguridad en Voz sobre Redes de Datos
POR: Juan Carlos Flores García
74 CELERINET ENERO-JUNIO 2013 ESPECIAL / 3ER FORO
Referencias Datos del Autor:
[1] Scientific American, April. 1998. M.C. Juan Carlos Flores García
[2] Postel, J. User Datagram Protocol. RFC 768 (Standard). http:// Es Ingeniero en Electrónica y Comunicaciones en la
www.ietf.org/rfc/rfc768.txt. 1980. Universidad Autónoma de Nuevo León; realizó sus estudios
de Posgrado con la Maestría en Ciencias de la Ingeniería
[3] Postel, J. Transmission Control Protocol. RFC 793 (Standard), con especialidad en Telecomunicaciones, en FIME-UANL,
URL http://www.ietf.org/rfc/rfc793.txt, updated by RFCs 1122, Profesor Tiempo Completo, Facultad de Ingeniería Mecánica
3168. 1981. y Eléctrica, UANL; colabora como docente de Posgrado de
la Facultad de Ciencias Físico Matemáticas; cuenta con perfil
[4] Schulzrinne, H., Casner, S., Frederick, R., and Jacobson, V. RTP: PROMEP.
A Transport Protocol for Real-Time Applications. RFC 3550
(Standard), URL http://www.ietf.org/rfc/rfc3550.txt, updated by Email: [email protected]
RFC 5506. 2003.
[5] Rosenberg, J., Schulzrinne, H., Camarillo, G., Johnston, A.,
Peterson, J., Sparks, R., Handley, M., and Schooler, E. SIP:
Session Initiation Protocol. RFC 3261(Proposed Standard),
URL http://www.ietf.org/rfc/rfc3261.txt, updated by RFCs 3265,
3853, 4320, 4916, 5393. 2002.
Seguridad en Voz sobre Redes de Datos
POR: Juan Carlos Flores García
ESPECIAL / 3ER FORO CELERINET ENERO-JUNIO 2013 75
Síntesis y
caracterización
de películas
delgadas
semiconductoras
Manuel García Méndez
UANL-FCFM
Universidad Autónoma de Nuevo León
Facultad de Ciencias Físico Matemáticas
CIIDIT
San Nicolás de los Garza, Nuevo León, México
Santos Morales Rodríguez
FIME de la UAdeC
Unidad Monclova
Resumen:
En este trabajo se presentan los resultados de una
investigación que consistió en el depósito y crecimiento
de películas delgadas de nitruro de aluminio (AlN)
empleando la técnica de erosión iónica reactiva
por corriente directa (DC). Se describe el análisis
experimental de las propiedades estructurales de las
películas.
Palabras claves:
erosión iónica reactiva, películas delgadas de AlN
76 CELERINET ENERO-JUNIO 2013 ESPECIAL / 3ER FORO
Introducción (ion beam assisted deposition) [16,17] y erosión iónica
reactiva por magnetrón (ionic-reactive magnetron
Hoy día, la Ciencia de Superficies y Películas Delgadas sputtering).
ha alcanzado un alto grado de especialización. La
combinación de las propiedades de diversos materiales De las técnicas mencionadas, la erosión iónica
crecidos en película delgada ha permitido el desarrollo reactiva se puede emplear para crecer películas delgadas
de una gran variedad de dispositivos semiconductores. de AlN con un crecimiento controlado altamente
En este trabajo nos enfocaremos en el nitruro de direccional (a lo largo del eje c), cumpliendo con los
aluminio (AlN), material perteneciente al grupo de requerimientos de área larga de depósito (del orden de
los nitruros, denominados compuestos III-V. Estos cm2) y temperatura baja del sustrato (de temperatura
materiales tienen un gran potencial en aplicaciones ambiente a 200°C como máximo). Una temperatura
tecnológicas como dispositivos funcionales en campos baja es un requerimiento importante: una temperatura
tales como la fotónica (dispositivos optoelectrónicos), alta sería totalmente incompatible con el proceso de
tribología (recubrimientos resistentes al desgaste y a fabricación de dispositivos [1].
sustancias hostiles) y microelectrónica (heteroestructuras
semiconductoras y electrodos transparentes) [1,2]. La estructura cristalina es una de las propiedades
más importantes de un material, ya que es el punto de
Por otra parte, durante el proceso de síntesis y crecimiento partida para explicar todas las demás. Por tal motivo, en
de AlN en película delgada, es posible incorporarle este trabajo se llevó a cabo un análisis de las propiedades
oxígeno. El material que surge al combinar un metal con estructurales de las muestras utilizando difracción de
oxígeno y nitrógeno (MeNxOy; Me: metal, en este casoAl), rayos X y espectroscopia UV, para obtener información
se le denomina oxinitruro. Cuando se incorpora oxígeno acerca de los parámetros de red, espesor y homogeneidad.
durante el crecimiento de la película de AlN, se induce
la producción de enlaces iónicos metal-oxígeno dentro Experimental
de la matriz de enlaces covalentes metal-nitrógeno. De
esta manera, la colocación de átomos de oxígeno en la Síntesis de las películas
estructura cristalina del AlN produce modificaciones
significativas en sus propiedades eléctricas y ópticas, El equipo experimental para el depósito y crecimiento de
modificándose por consiguiente la conductividad térmica películas delgadas está ubicado en las instalaciones del
y propiedades piezoeléctricas del material resultante Laboratorio de Películas Delgadas del CICFIM de
[3,4]. Los oxinitruros de aluminio, al ser tan versátiles, la FCFM-UANL y está conformado por una cámara de
se pueden aplicar como recubrimientos protectores, pirex conectada a un sistema de alto vacío. El alto vacío,
recubrimientos ópticos, electrónicos y bio-electrónicos, que se produce con un sistema de bomba mecánica y
por su respuesta espectral en el UV (absorción), muy turbomolecular, puede alcanzar valores de ≈1x10-6 Torr.
similar a la piel humana [5-7] . Asímismo, el AlN oxidado
crecido en película delgada puede ser un material que Dentro de la cámara, la distancia entre el magnetrón
reemplace a las películas convencionales de Si3N4 o de (donde se coloca el blanco) y porta sustratos se mantiene
SiO2 en celdas solares tipo-p [2,8-10]. fija en 5 cm. El porta sustratos lleva integrado un
calefactor (hasta 600°C) conectado a un medidor de
Dado el potencial de aplicaciones del AlN (ya sea temperatura. Justo arriba del magnetrón está posicionado
puro u oxidado), aunado a que el proceso de oxidación un obturador manual que puede impedir o permitir a
del AlN policristalino es un mecanismo que aún no se voluntad del operador la llegada de partículas al sustrato.
comprende del todo, sobretodo en la modificación de El magnetrón está conectado a una fuente externa que
las propiedades de la película, es importante realizar un suministra el voltaje (Volts) y provee mediciones de
estudio detallado que involucre tanto la síntesis de este la corriente sobre el blanco (Amperes) y la potencia
tipo de sistemas, como el análisis de sus propiedades (Watts). Por medio de una válvula se inyectan los gases
utilizando técnicas experimentales y cálculos teóricos. dentro de la cámara (gases de alta pureza de Ar, N2 y O2,
99.999%). El flujo de cada gas se controla con rotámetros
Para la fabricación de las películas de AlN existen individuales.
varias técnicas y/o procedimientos disponibles, entre
algunas de ellas se encuentran el depósito por vapor Un disco de aluminio (1" de diámetro, 1/8" de
químico (CVD: Chemical Vapor Deposition)[11-13], espesor, 99.99 % de pureza) se utilizó como blanco.
epitaxia de haces moleculares (MBE: Molecular Beam Las películas se depositaron en sustratos portaobjetos
Epitaxy) [14,15], depósito asistido por haz de iones de vidrio sometidos previamente a limpieza ultrasónica
en un baño de acetona. Previo al depósito se efectúa
Síntesis y caracterización de películas delgadas semiconductoras
POR: MANUEL GARCÍA Y SANTOS MORALES
ESPECIAL / 3ER FORO CELERINET ENERO-JUNIO 2013 77
vacío a una presión base de ≈10-6 Torr con el calefactor + (2)
activado a 100°C, para efectos de limpieza de la cámara
(degasificar). Posteriormente, se introduce el gas argón Entonces se introducen al programa los planos (h
y se aplica el voltaje de descarga para generar el plasma k l) con su respectivo ángulo θ, extraídos directamente
(Ar+) durante 20 min a una presión de trabajo de 10 de cada difractograma. Con estos datos se procede
mTorr (20 sccm de flujo) para limpieza del blanco. a calcular los parámetros de red a y c utilizando un
Toda esta parte del proceso se realizó con el obturador análisis de correlación múltiple de optimización por
colocado entre blanco-sustrato. mínimos cuadrados. En el procedimiento, cada plano es
un parámetro que se mantiene constante y los parámetros
Al término del procedimiento de limpieza cámara- de red son los que se ajustan según el procedimiento
blanco, se inicia el proceso de depósito. Para el mencionado. Con este procedimiento, el análisis se
crecimiento de películas de AlN se introduce en la vuelve más cuantitativo y no se limita solamente a
cámara una mezcla de Ar y N2 como gases reactivos. comparar difractogramas con el estándar de la base de
Para el crecimiento de películas de AlNO se introduce datos.
una mezcla de Ar y N2 y O2. Las muestras se depositaron
utilizando flujos de 20 sccm para Ar, 1 sccm para N2 En las películas, se puede observar que la reflexión
y 1 sccm para O2. La temperatura se aplicó durante el (002) presenta mayor intensidad (o número de cuentas)
proceso de depósito. en la S2. En este caso, la temperatura aplicada de 100 C°
incrementó el ordenamiento cristalino del sistema. En la
Se fabricaron cuatro muestras, de las cuales dos
corresponden a AlN (15 min de depósito, etiquetadas S1 y Tabla 1. Parámetros experimentales de depósito de las
S2) y dos a AlNO (10 min de depósito, etiquetadas S3 y S4). muestras
Caracterización de las películas (Película) °C @ tiempo V P Espesor
(Volts) (Watts) (nm)
Las propiedades estructurales de las películas se
analizaron con un equipo de difracción de rayos S1 (AIN) TA @15min 360 120 980
X Philips X´Pert de ánodo de cobre, radiación
Kα, λ=1.54 Å. Se tomaron mediciones de alta resolución S2 (AIN) 100°C @15 min 360 130 970
theta/2theta (geometría Bragg-Brentano) con un tamaño
de paso de 0.005°. La homogeneidad y espesor óptico S3 (AINO) TA @ 10 min 360 190 820
de las películas se evaluaron por medio de curvas de
transmitancia obtenidas con un espectrómetro UV- S4 (AINO) 120° C @ 10 min 360 185 940
Visible marca Perkin Elmer 350.
Figura 1. Difractogramas obtenidos de las películas
Resultados y discusión depositadas sobre sustratos de vidrio
En la Tabla 1 se incluyen las condiciones experimentales
de crecimiento con las cuales se obtuvieron las películas.
En la columna de la extrema derecha de cada tabla
también se incluye el espesor óptico, calculado de las
curvas de transmitancia UV-Visible. En la Figura 1 se
presentan los difractogramas de rayos X.
Comprobando que las películas cristalizaron en una
estructura tipo würzita, los difractogramas se procesaron
con un programa de software para obtener los parámetros
de red a y c correspondientes a cada muestra, partiendo
de la base de datos JCPDS (archivo pdf # 00-025-1133,
c=4.97 Å, a=3.11 Å) [18].
Utilizando la fórmula de Bragg:
(1)
y la fórmula para la distancia entre planos (para una red
hexagonal):
Síntesis y caracterización de películas delgadas semiconductoras
POR: MANUEL GARCÍA Y SANTOS MORALES
78 CELERINET ENERO-JUNIO 2013 ESPECIAL / 3ER FORO
S3 y S4, la intensidad de la reflexión (002) y el tamaño de a formar configuraciones octaedrales que tienden a
grano son similares en ambos casos, lo cual demuestra posicionarse en el plano basal {001}, por ser el de menor
que la temperatura aplicada a S4 no tuvo efecto para energía [9,10]. Este efecto más notorio para las películas
mejorar su cristalinidad. crecidas con flujo de oxígeno. Por ejemplo, para la S4,
la temperatura aplicada (120° C) puede promover un
De todas las muestras, la S2 fue la que presentó ingreso por difusión más efectivo para el oxígeno; por
mayor grado de cristalinidad (evaluando intensidad eso en este caso, la temperatura no contribuyó a mejorar
y tamaño de grano), indicando que un rango de la calidad cristalina de la película. En la S3, el oxígeno
temperaturas, desde temperatura ambiente a ≈ 100° provocó en las películas una baja calidad cristalina, aún
C, es la que se debe suministrar al sistema para lograr en ausencia de temperaturas altas.
crecimiento cristalino altamente orientado.
En la Tabla 2 se incluyen los datos obtenidos de
En cuanto al oxígeno y sus productos de reacción, calcular los parámetros de red de cada muestra. Se
la presencia de compuestos de alúmina (γ-Al2O3: JCPDS incluye también el cálculo de tamaño de grano L por la
# 29-63) o espinel (γ-AlON: JCPDS 10-425 y 18-52) fórmula de Debye- Scherrer [22].
no fue detectada en los difractogramas, con especial
énfasis en las muestras S3 y S4 mismas que fueron De los datos de la tabla 2 se puede observar que
crecidas con flujo de oxígeno. Sin embargo, en términos los parámetros de red calculados presentan algunas
termodinámicos, el aluminio elemental presenta una diferencias con respecto al estándar de JCPDS (a=3.11
reacción energéticamente más favorable con el oxígeno Å y c=4.97 Å), sobretodo el valor de c. En las muestras
que con el nitrógeno: es más favorable formar Al2O3 S3 y S4, que fueron depositadas con flujo de oxígeno,
en una reacción de fase gaseosa de Al + (3/2)O2, que el valor de c tiende a alejarse más del valor reportado
AlN de Al + (1/2)N, ya que ΔG( Al2O3 )= - 1480 KJ/ en el estándar, lo que concuerda también con la baja
mol, mientras que ΔG(AlN)= - 253 KJ/mol [3,5,19]. Por intensidad de la reflexión (002) detectada en estas
lo tanto, la existencia de las fases de Al2O3 ó AlON en muestras, denotando el defecto de apilamiento en la
las películas no puede ser descartada. Sin embargo, la dirección [0001].
presencia de estas fases puede estar en proporciones muy
pequeñas, tales que escapan a la capacidad de detección La calidad de una película delgada se puede evaluar
de la técnica de rayos X. con espectroscopia UV-Visible, realizando mediciones
de transmitancia vs longitud de onda (T vs λ) [23]. Con
La muestras crecidas sin oxígeno (sin descartar las curvas T vs λ se obtiene el espesor y el coeficiente de
trazas residuales) S1 y S2 presentan una mayor calidad absorción. Las curvas de T vs λ se incluyen en la Figura
cristalina que S3, S4. Para estas tres últimas muestras, 2.
el oxígeno introducido en la cámara puede inducir la
oxidación del blanco (denominado “envenenamiento Cuando el espesor de la película es uniforme, los
del blanco”), formando una película superficial de óxido efectos de interferencia entre el sustrato y la película
de aluminio amorfo AlOx. Esta capa de óxido puede dan lugar a la aparición de oscilaciones. El número
formar una barrera electrostática que puede afectar la de oscilaciones está relacionado con el espesor de la
efectividad del proceso de erosión iónica, al disminuir película. La aparición de oscilaciones indica que el
la energía cinética de las partículas que inciden en el espesor de la película delgada es uniforme. En caso
sustrato. Esta disminución en la energía cinética afectará contrario, esto es si el espesor no fuera uniforme, los
la calidad cristalina de la película. efectos de interferencia se anularían y la curva luciría
El oxígeno también interactúa con la red de AlN, Tabla 2. Parámetros de red obtenidos de las mediciones de
cuando a través de un mecanismo de difusión, sustituye difracción de rayos X
a un átomo de nitrógeno del enlace más débil Al-N0,
paralelo a la dirección [0001] [3,20,19]. El radio iónico ac c/a L
del oxígeno (r0=0.140 nm) es casi diez veces mayor que
el radio iónico del nitrógeno (r0=0.01-.02 nm) [21], por lo S1 3.11 4.99 1.60 21
que al sustituir al nitrógeno, perturbará el ordenamiento S2 3.11 4.98 1.60 23
cristalino de la red, induciendo defectos puntuales. S3 3.13 5.0 1.59 21
De esta manera, los defectos puntuales afectarán el S4 3.14 5.0 1.59 20
apilamiento del arreglo hexagonal en la dirección “c”.
En este aspecto, se ha reportado que el oxígeno tiende
Síntesis y caracterización de películas delgadas semiconductoras
POR: MANUEL GARCÍA Y SANTOS MORALES
ESPECIAL / 3ER FORO CELERINET ENERO-JUNIO 2013 79
Figura 2. Curvas de transmisión óptica T vs λ Figura 3. Imagen de FESEM de una sección transversal
correspondiente a la S2. Se puede observar una interfaz
bien definida y una película de espesor homogéneo.
como una envolvente [24]. A partir de las oscilaciones las muestras depositadas con flujo de Ar+N2+ O2 (S3,
en una curva T vs λ, el espesor se puede obtener de la S4, S8), donde las fases de AlOx inducen defectos de
siguiente fórmula [24,25]: apilamiento en la dirección c. En estas muestras, los
difractogramas mostraron una intensidad baja de la
t= 1 (3) reflexión (002), aunado a un menor tamaño de grano L y
2n 1 1 una modificación más notoria de sus parámetros de red
λ2 λ1 con respecto a la red de AlN hexagonal.
donde: t es el espesor de la película, n=n(λ) es el índice De esta manera, los resultados que proveen las
de refracción y λ1 y λ2 son las longitudes de onda entre los técnicas de rayos X, y espectroscopía UV-Visible, con
dos máximos o mínimos más cercanos. la imagen de FESEM son mutuamente consistentes y
complementarios en el análisis de las muestras, donde
De la figura, se puede observar que todas las curvas se corrobora la calidad de las películas.
presentan oscilaciones, lo cual es un indicador de la
homogeneidad de los depósitos: el espesor es uniforme, Conclusiones
independientemente del tipo de crecimiento cristalino de
cada película. Se fabricó un conjunto de películas delgadas de AlN y
AlN oxidado por la técnica de erosión iónica reactiva
En la Figura 3 se presenta una imagen de FESEM DC.
en sección transversal, correspondiente a la S2. De la
imagen, se puede corroborar la presencia de una interfaz Todas las películas presentaron un crecimiento
película/sustrato muy bien definida, con la película de preferencial en la dirección [0002], perpendicular al
espesor homogéneo que corrobora lo obtenido por medio sustrato. Los análisis por rayos X mostraron que las
de las mediciones UV-Visible. películas están conformadas por una fase mayoritaria
de AlN hexagonal. Las muestras con mayor calidad
Con la evidencia que arrojan los análisis realizados cristalina se depositaron sin flujo de oxígeno. En las
hasta ahora y comparando con información de la muestras depositadas con flujo de oxígeno, las películas
literatura, se puede establecer que durante el proceso de presentan una alteración de sus parámetros de red
depósito, el oxígeno se enlaza con el aluminio disponible respecto a la celda hexagonal. El oxígeno induce en
formando fases de AlOx. En las muestras depositadas estas películas un defecto de apilamiento en la dirección
con flujo de Ar+N2, hay trazas de oxígeno residual que c. Independientemente del contenido de oxígeno, las
modificaron en alguna medida los parámetros de red, películas poseen un espesor homogéneo.
pero no afectaron la calidad cristalina de la película en
la dirección c. El efecto del oxígeno es mas notorio en Agradecimientos
Este proyecto fue financiado por PAICyT UANL.
Síntesis y caracterización de películas delgadas semiconductoras
POR: MANUEL GARCÍA Y SANTOS MORALES
80 CELERINET ENERO-JUNIO 2013 ESPECIAL / 3ER FORO
Referencias of structure and morphology of the AlN nano-pillar crystal films
prepared by halide chemical vapor deposition under atmospheric
[1] Moreira, M.A., Doi, I., Souza, J.F. and Diniz, J.A. "Electrical pressure". Journal of Physical and Chemistry of Solids. Vol. 67,
characterization and morphological properties of AlN films No. 4, pp. 665-668. April 2006. ISSN 0022-3697.
prepared by dc reactive magnetron sputtering". Microelectronic
Engineering. Vol. 88, No. 5, pp. 802-806. May 2011. ISSN [14] Brown, P.D.; Fay, M.; Bock, N., Marlafeka, M.; Cheng, T.S.;
0167-9317. Novikov, S.V.; Davis, C.S.; Campion, R.P., Foxon, C.T. (2002).
Structural characterisation of Al grown on group III-nitride
[2] Morkoç, H. Handbook of Nitride Semiconductors and Devices, layers and sapphire by molecular beam epitaxy. Journal of
Vol. 1: Materials Properties, Physics and Growth. Weinheim Crystal Growth, Vol. 234, No. 2-3, (January 2002), pp. 384-390,
Wiley-VCH. 2008. ISBN 978-3-527-40837-5, Weinheim, ISSN 0022-0248
Germany.
[15] Iwata, S.; Nanjo, Y.; Okuno, T.; Kurai, S.; Taguchi, T. (2007).
[3] Brien, V. and Pigeat, P. "Correlation between the oxygen content Growth and optical properties of AlN homoepitaxial layers
and the morphology of AlN films grown by r.f. magnetron grown by ammonia-source molecular beam epitaxy. Journal of
sputtering". Journal of Crystal Growth. Vol. 310, No. 16, pp. Crystal Growth, Vol. 301-302, (April 2007), pp. 461-464, ISSN
3890-3895. August 2008. ISSN 0022-0248. 0022-0248
[4] Jang, K., Jung, S., Lee, J., Lee, K., Kim, J., Son, H. and Yi, [16] Lal, K.; Meikap, A.K. ; Chattopadhyay, S.K.; Chatterjee, S.K.;
J. "Optical and electrical properties of negatively charged Ghosh, P.; Ghosh, M.; Baba, K.; Hatada, R. (2003). Frequency
aluminium oxynitride films". Thin Solid Films, Vol. 517, No. 1, dependent conductivity of aluminium nitride films prepared by
pp. 444-446. November 2008. ISSN 0040-6090. ion beam-assisted deposition. Thin Solid Films, Vol. 434, No.
1-2, (June 2003), pp. 264-270, ISSN 0040-6090
[5] Borges, J., Maz, F. and Marques, L. "AlNxOy thin films deposited
by DC reactive magnetron sputtering". Applied Surface Science. [17] Matsumoto, T.; Kiuchi, M. (2006). Zinc-blende aluminum
Vol. 252, No. 257, No. 5, pp. 1478-1483. December 2010. ISSN nitride formation using low-energy ion beam assisted deposition.
0169-4332. Nuclear Instruments and Methods in Physics Research, Vol. 242,
No. 1-2, (January 2006), pp. 424-426, ISSN 0168-583X
[6] Erlat, A.G., Henry, B.M., Ingram, J.J., Mountain, D.B.,
McGuigan, A., Howson, R.P., Grovenor, C.R.M., Briggs, G.A.D. [18] Powder Diffraction File, JCPDS International Centre for
and Tsukahara, T. "Characterization of aluminium oxynitride Diffraction Data, ICDD, Newtown Square, PA, 1998. (www.
gas barrier films". Thin Solid Films. Vol. 388, No. 1-2. June icdd.com)
2001. pp. 78-86, ISSN 0040-6090.
[19] Brien, V.; Pigeat, P. (2007). Microstructures diagram of magnetron
[7] Xiao, W. and Jiang X. "Optical and mechanical properties sputtered AlN deposits: Amorphous and nanostructured films.
of nanocrystalline aluminum oxynitride films prepared by Journal of Crystal Growth, Vol. 299, No. 1, (February 2007), pp.
electron cyclotron resonance plasma enhanced chemical vapor 189-194, ISSN 0022-0248
deposition". Journal of Crystal Growth. Vol. 263, No. 1-3, pp.
165-171. March 2004. ISSN 0022-0248. [20] Jose, F ; Ramaseshan, R. ; Dash, S. ; Tyagi, A.K. ; Raj, B.
(2010). Response of magnetron sputtered AlN films to controlled
[8] Chaudhuri, J., Nyakiti, L., Lee, R.G., Gu, Z., Edgar, J.H. and atmosphere annealing. Journal of Physics D: Applied Physics,
Wen, J.G. "Thermal oxidation of single crystalline aluminium Vol. 43, No. 7, (February 2010), pp. 075304-10, ISSN 0022-3727
nitride". Materials Characterization. Vol. 58, No. 8-9, pp. 672-
679. August 2007. ISSN 1044-5803. [21] Callister Jr, W.D. (2006). Materials Science & Engineering: an
introduction. 6th edition (2006) Wiley & Sons. New York. ISBN
[9] Chiu, K.H., Chen, J.H., Chen, H.R. and Huang, R.S. "Deposition 0471135763
and characterization of reactive magnetron sputtered aluminum
nitride thin films for film bulk acoustic wave resonator". Thin [22] A. L. Patterson, “The Scherrer Formula for X-ray Particle Size
Solid Films. Vol. 515, No. 11, pp. 4819-4825. April 2007. ISSN Determination”, Physical Review B 56 (1939): 978-982.
0040-6090.
[23] Guo, Q.X.; Tanaka, T.; Nishio, M.; Ogawa, H. (2006). Growth
[10] Jang, K., Lee, K., Kim, J., Hwang, S., Lee, J., Dhungel, S.K., properties of AlN films on sapphire substrates by reactive
Jung, S. and Yi, J. "Effect of rapid thermal annealing of sputtered sputtering. Vacuum, Vol. 80, No. 7, (May 2006), pp. 716-718.
aluminium nitride film in an oxygen ambient". Mat Sci Semicon ISSN 0042-207X
Proc. Vol. 9, No. 6, pp. 1137-1141. December 2006. ISSN 1369-
8001. [24] Swanepoel, R. (1983). Determination of the thickness and optical
constants of amorphous silicon. Journal of Physics E: Scientific
[11] Uchida, H., Yamashita, M., Hanaki, S. and Fujimoto, T. Instruments, Vol. 16, No. 12, (May 1983), pp. 1214-1222. ISSN
"Structural and chemical characteristics of (Ti,Al)N films 0022-3735
prepared by ion mixing and vapor deposition". Vacuum. Vol. 80,
No. 11-12, pp. 1356-1361. September 2006. ISSN 0042-207X. [25] Zong, F.; Ma, H.; Du, W.; Ma, J.; Zhang, X.; Xiao, H.; Ji, F.;
Xue, Ch. (2006). Optical band gap of zinc nitride films prepared
[12] Sato, A., Azumada, K., Atsumori, T. and Hara, K. on quartz substrates from a zinc nitride target by reactive rf
"Characterization of AlN:Mn thin film phosphors prepared by magnetron sputtering. Applied Surface Science, Vol. 252, No. 22,
metalorganic chemical vapor deposition". Journal of Crystal (September 2006), pp. 7983-7986.ISSN 0169-4332
Growth. Vol. 298, pp. 379-382. January 2007. ISSN 0022-0248.
[13] Takahashi, N., Matsumoto, Y. and Nakamura, T. "Investigations
Síntesis y caracterización de películas delgadas semiconductoras
POR: MANUEL GARCÍA Y SANTOS MORALES
ESPECIAL / 3ER FORO CELERINET ENERO-JUNIO 2013 81
Datos de los Autores:
Manuel García Méndez
Licenciado en Física por la FCFM de la UANL. Maestría
y Doctorado en Física de Materiales, programa conjunto
CICESE-UNAM, Ensenada, México. Estancia Posdoctoral en
la Universidad de Manchester, Inglaterra. Profesor Investigador
de la FCFM desde el 2001. Premio de Investigación 2002 en el
área de Ciencias Exactas. Miembro del SNI, nivel I. Sus líneas
de investigación se enfocan a la caracterización y crecimiento
de materiales nanoestructurados en película delgada.
Santos Morales Rodríguez
Ingeniero en Comunicaciones y Electrónica por la Escuela
Superior de Ingeniería Mecánica y Eléctrica del Instituto
Politécnico Nacional. Maestría en Ingeniería Eléctrica por la
Facultad de Ingeniería Mecánica y Eléctrica de la Universidad
Autónoma de Coahuila. Doctorado en Ciencias, Posgrado
en Ing. Física Industrial de la FCFM-UANL, abril del 2009.
Maestro del área de electrónica analógica y digital, coordinador
de la carrera de Ingeniería Electrónica Industrial y jefe del
depto. de Investigación y Posgrado en la FIME de la U. A.
de C.; medalla al mérito universitario Miguel Ramos Arizpe
otorgada por la U. A. de C.
Síntesis y caracterización de películas delgadas semiconductoras
POR: MANUEL GARCÍA Y SANTOS MORALES
82 CELERINET ENERO-JUNIO 2013 ESPECIAL / 3ER FORO
Modelo
estocástico
para la traducción
de proteínas
Omar González Amezcua
Alberto López Olivares
UANL-FCFM
Universidad Autónoma de Nuevo León
Facultad de Ciencias Físico Matemáticas
San Nicolás de los Garza, Nuevo León, México
Resumen:
Se propone un marco teórico que permite modelar y
estudiar la traducción de proteínas por parte del complejo
molecular denominado polisoma. El modelo es muy
general y no incluye detalles específicos de la compleja
bioquímica realizada por el sistema. Partiendo de una
ecuación estocástica para la función de probabilidad del
número de ribosomas a un tiempo dado, se calcula su
densidad como función de la longitud de la cadena de
ARNm. Se analiza además la dependencia en cadenas
con secuencias de codones iguales y diferentes. Se
estudian los efectos que se generan en la densidad de
ribosomas, cuando las distintas frecuencias de reacción
muestran dependencia armónica y gausiana en el
tiempo. Los resultados muestran efectos que pueden ser
importantes para lograr una traducción con velocidades
diferenciadas, lo cual eliminaría efectos de tráfico en la
difusión de ribosomas.
Palabras claves:
ribosoma, ARNA, traducción de proteínas, modelos
estocásticos, cadenas de Markov
ESPECIAL / 3ER FORO CELERINET ENERO-JUNIO 2013 83
Introducción colección de muchos cuerpos: moléculas de agua, iones
cargados, distintos tipos de proteínas, moléculas de
Los sistemas celulares son altamente complejos y aminoácidos, etc; permite utilizar las herramientas de la
realizan una gran cantidad de funciones de forma física de sistemas estocásticos y dinámicos para modelar
coordinada y eficiente. Uno de estos mecanismos es y comprender diversos procesos que el sistema realiza.
la construcción de proteínas específicas a partir de la
información genética almacenada en la molécula de Para el sistema de traducción de proteínas se ha
ADN [1]. De forma esquemática todo el proceso de determinado que el número de ribosomas en la cadena
traducción es llevado a cabo en varias etapas, que son: de ARNm es una función que varía en el tiempo y en la
una etapa inicial en la que se copia la molécula de ADN, posición a lo largo de la cadena [1,4]. Este hecho permite
que contiene la información para producir la proteína, estudiar el sistema desde una perspectiva probabilística,
a una molécula llamada ARN mensajero (ARNm). Una donde el cálculo de la distribución de los ribosomas
etapa de acoplamiento, a la cadena de ARNm, de dos a lo largo de la cadena de ARNm, el flujo neto de
moléculas altamente especializadas que conforman ribosomas en la cadena, y las velocidades de difusión de
el agregado llamado ribosoma [1], al conjunto de ribosomas, son piezas clave en el modelado del proceso
ribosomas sobre la cadena de ARNm se le conoce con de traducción. Estas cantidades pueden ser calculadas
el nombre de polisoma. Finalmente se tiene una etapa analíticamente por medio de un modelo estocástico
de difusión del ribosoma sobre la cadena de ARNm. para los sistemas fuera del equilibrio termodinámico.
Así, el ribosoma lee (en forma de codones o tripletes) Otra pieza importante del sistema de traducción es el
la información contenida en la secuencias del ARNm acoplamiento de moléculas de degradación en cualquier
y la traduce en el ensamblado especifico de diferentes etapa del proceso, las cuales interrumpen el proceso
aminoácidos, los cuales en ultima instancian formaran de traducción (ver Figura 1). Así, un modelo teórico
la proteína. Este proceso es altamente complejo y se del proceso de traducción permitiría, en principio,
encuentra sujeto a todo un conjunto de interacciones caracterizar estos parámetros y nos brindaría de un
específicas y locales que se coordinan para generar el marco de trabajo para abordar problemas más complejos,
ensamble final de la proteína [2]. los cuales comprenden la interacción de procesos que se
llevan a cabo a diferentes escalas; característica principal
Durante los últimas décadas diferentes técnicas de de los procesos celulares implicados en el proceso de
biología molecular han permitido manipular el proceso de traducción.
traducción a escala microscópica [3], incorporando por Marco teórico
ejemplo, secuencias especificas en la cadena de ADN las Se considera un ensamble de cadenas de ARNm, el cual
cuales expresan proteínas con nuevas propiedades; se ha se encuentra en una solución de moléculas de ribosomas
podido así generar: insulina humana, cultivos resistentes y de factores de degradación a una densidad en bulto
a parásitos, etc. Estos resultados muestran los grandes que permanece constante [4,10, 11]. Se establece que la
avances que se han logrado en la manipulación y control
del proceso de traducción y expresión de genes, así como Figura 1. Representación esquemática del proceso de
de la clonación de secuencias de ADN. Pero es sólo en traducción por parte del complejo ribosoma-cadena de
fechas recientes que se ha empezado a estudiar el proceso ARNm. Se indican las diferentes frecuencias de reacción
desde una perspectiva analítica y teórica, tratando de
generar modelos matemáticos cuantitativos que permitan que se usan para estudiar la dinámica del sistema.
controlar o conocer parámetros individuales del proceso
de traducción [2,4, 10 -13]. Para establecer estos modelos
se puede partir de una visón microscópica tratando de
establecer todas las interacciones presentes en el sistema
a escala atómica, esto ha resultado muy complicado
de establecer y ha tenido resultados parciales sólo con
el uso de sistemas de super-cómputo. Sin embargo
podemos adoptar una escala de campo medio, donde la
estructura atómica y molecular del sistema es eliminada,
al tomar en cuenta solo potenciales de interacción
promediados y despreciar cualquier correlación entre
los distintos elementos del sistema. Este punto de vista,
sumado al hecho de que el sistema es en realidad una
Modelo estocástico para la traducciónde proteínas
POR: OMAR GONZÁLEZ Y ALBERTO LÓPEZ
84 CELERINET ENERO-JUNIO 2013 ESPECIAL / 3ER FORO
transcripción inicia a una frecuencia wEn, cuando una la segunda ecuación establece un límite superior en
molécula de Ribosoma se une a la cadena de ARNm, y donde el sistema llega a una situación de equilibrio
puede ser interrumpida espontáneamente con una tasa estacionario, si las condiciones del medio permaneces
wTe, los factores de degradación actúan a una frecuencia sin cambio, y los parámetros L, v y las frecuencias de
wde, (ver Figura 1). Las constantes anteriores se suponen reacción son constantes. La solución a esta ecuación
dependientes de tiempo, lo cual permite modelar una diferencial depende de la forma funcional de las
cadena de ARNm no uniforme (dependiente de la variables wEn(t) y wTe(t), que se analizan en los tres casos
secuencia). La densidad de moléculas de ribosoma se siguientes.
asume pequeña, con la intención de evitar que entren en
contacto entre sí. La dinámica del proceso de traducción Casos de estudio
se puede modelar como un proceso de Markov [4, 14],
en forma de una ecuación maestra, de la forma: Caso A: Frecuencias de acoplamiento independientes
del tiempo wEn(t)= wEn y wTe(t) = wTe Es decir una
situación ideal que modela reacciones bioquímicas entre
las diferentes moléculas que llevan a cabo la traducción,
poco sensibles a la interacción con el medio, a los
cambios de densidad, a las distintas configuraciones
geométricas y a sus posibles correlaciones. Para este
caso la solución a la ecuación (2) es:
donde Pn(t) es la probabilidad de que un número n de (3)
ribosomas se encuentre sobre la cadena al tiempo t. Los
dos primeros términos del lado derecho de la ecuación, La gráfica de la Figura 3 (línea negra) muestra como
representan la probabilidad de generar un estado n el numero de ribosomas se incrementa de forma continua
partiendo de un estado anterior n-1 y un estado posterior en el tiempo hasta alcanzar un valor constante de 22.5
n+1 ver Figura 1, el último termino es la probabilidad de para t=tL.. Los valores usados para evaluar los distintos
no sufrir cambio. A esta ecuación diferencial de primer parámetros libres de las ecuaciones son: la longitud de
orden se le imponen las condiciones de frontera las cadenas de ARNm es variable en un rango de 10 a
2000 codones, el tiempo estimado que toma el proceso
(1) de traducción es de entre dos a cinco minutos [5], así
el tiempo estimado para frecuencia de degradación
donde L es la longitud de la cadena de ARNm y tL=L/v wde = 0.286; por otra parte la velocidad v es fuertemente
es el tiempo total estimado del proceso de traducción, dependiente de las condiciones ambientales del medio,
el cual depende de la longitud de la cadena de ARNm con un valor estimado de v = 600 codones/min [6]. La
y de su velocidad v promedio. Este parámetro v no se frecuencia de termino total del proceso de traducción
encuentra bien definido para el sistema, y para efectos de es aproximadamente estimada en wTe = 0.24 min- 1 [7],
simplificar el modelo se entiende solamente como una mientras que la frecuencia de pegado es estimada en
velocidad media del todo el proceso [13]. Un análisis wTe= 10 rb/min [8, 9]. Estos valores se usaron para
más riguroso de la dinámica del sistema podría; por generar todas las gráficas del presente trabajo, como
ejemplo, establecer una velocidad dependiente de la valores de referencia constantes.
etapa de traducción en la cadena de ARNm. Utilizando la
ecuación maestra y la condición de normalización sobre Caso B: Se asume una dependencia armónica para las
Pn(t) es posible calcular el valor de expectación para el frecuencias de acoplamiento de la forma:
número total de ribosomas en la cadena M(t)=<n(t)>, el
cual evoluciona en el tiempo de acuerdo con:
(2)
(4)
Modelo estocástico para la traducciónde proteínas
POR: OMAR GONZÁLEZ Y ALBERTO LÓPEZ
ESPECIAL / 3ER FORO CELERINET ENERO-JUNIO 2013 85
Es decir la frecuencia de avance del ribosoma
depende del lugar que ocupa en la cadena de ARNm.
De esta forma se intenta modelar un avance dependiente
del la secuencia de traducción, se sabe que esta
secuencia es aleatoria en cadenas pequeñas [10, 12] y
está determinada por los tripletes que se encuentran en
la cadena de ARNm, los cuales determinan el tipo de
aminoácido que se agrega a la proteína. Para el sistema
se asume una secuencia armónica que depende del valor
k elegido, la Figura 2 muestra wEn(t) para los valores de
la frecuencias k=1.0 (línea continua roja) y k=4.0 (línea
discontinua roja) a una amplitud fija a=4.0. Con esto se
tiene una cadena de ARNm de secuencias ordenadas (el
caso de secuencias aleatorias se está estudiando). La
solución general es entonces:
(5) Figura 2. Dependencia funcional de wEn(t) para los dos
casos estudiados. Líneas rojas caso B, ecuación (4), y
líneas azules caso C, ecuación (6)
Para t<tL y una expresión para t > tL evaluando la
ecuación (5) para el tiempo t=tL. La Figura 3 muestra
como el caso k=1.0 genera un valor de M(t) mayor que
el caso de frecuencias constantes, mientras que para el
valor k=4 se genera un valor con pequeñas oscilaciones
alrededor del caso con frecuencia constantes. Notamos
entonces que modular la frecuencia de oscilación de la
función wEn(t) tiene un efecto importante sobre el cálculo
de M(t) cuando se elige un periodo de oscilación grande
y un efecto que se aproxima al valor con wEn constante
cuando el periodo de wEn(t) es pequeño. Por tanto un
valor de k pequeño indicaría, más que un efecto local y
específico de la cadena de ARNm, un efecto global de
todas las interacciones que se presentan sobre la cadena.
Caso C: Se asume una dependencia para las frecuencias
de acoplamiento en forma de campana gausiana de la
forma:
(6)
Es decir, en los primeros pasos de la traducción Figura 3. Valor de expectación M(t) para número total de
tenemos una alta frecuencia de reacción que disminuye a ribosomas en la cadena de ARNm en función del tiempo.
medida que la traducción avanza. Esto dado que el inicio Línea negra es para el caso A, de frecuencias constantes.
del proceso de traducción es la etapa crítica del sistema,
ya que requiere de la sincronización y acoplamientos de Líneas rojas el caso B de frecuencias armónicas, con
una diversidad de procesos moleculares que deben de amplitud fija a=4.0. Líneas azules el caso C, de frecuencias
en forma de “campana”.
Modelo estocástico para la traducciónde proteínas
POR: OMAR GONZÁLEZ Y ALBERTO LÓPEZ
86 CELERINET ENERO-JUNIO 2013 ESPECIAL / 3ER FORO
trabajar de forma secuencial y coordinada, lo cual genera medido experimentalmente, lo cual permitiría discernir
una alta susceptibilidad de fracaso. Con la intención el tipo de interacción a utilizar en la definición de las
de compensar este efecto se induce una frecuencia de frecuencias de reacción.
reacción alta wEn para tiempos pequeños. Mientras que,
cuando la traducción ya ha iniciado y la nueva proteína Distribución para de <M>
está siendo sintetizada, el proceso es más estable, por lo
que en este caso se propone una tasa de frecuencia wEn El valor de M(t) calculado en las expresiones anteriores
menor. Estas dos tendencias están representadas por la depende de la edad y de la longitud de la cadena de
ecuación (6) para wEn(t), e ilustradas en la Figura 2 para ARNm. Con la intención de eliminar su dependencia
el caso con b=0.5 (línea azul continua) y b=1.0 (línea temporal, promediamos sobre una población de cadenas
azul discontinua). La solución a la ecuación diferencial de ARNm, las cuales se encuentran en diferentes
(2) con las funciones (6) es: etapas del proceso de traducción, mediante la siguiente
expresión:
(7) (8)
Nuevamente válida para t<tL, y una expresión para donde ϕ(t) es la densidad de probabilidad de cadenas de
t > tL evaluando la ecuación (7) para el tiempo t=tL. La ARNm a una edad determinada (función de peso), y es
Figura 3 muestra la evaluación de M(t) para el valor de dada por:
la constante b=0.5 (línea azul constante) y b=1.0 (línea
azul discontinua). Su valor es creciente y menor que el (9)
de los dos casos anteriormente analizados para el todo
valor de t. La figura muestra además que los valores con wde la frecuencia de degradación de cadenas de
estacionarios para los tres casos analizados de M(t=tL) ARNm, la cual se asume constante, ver Figura 1.
son diferentes entre sí (con un rango de diferencia entre Utilizando esta definición para los casos estudiados
el menor y el mayor de aproximadamente 31.0), con la anteriormente, obtenemos la función de distribución de
excepción del caso A y el caso B para una modulación ribosomas sobre la cadena de ARNm. Para el caso A la
de k=4.0. Estos valores generan una tasa constante de integral (8) es fácilmente calculada:
producción de proteínas, que en principio puede ser
(10)
La Figura 4 muestra que <M>/L decae suavemente
conforme la longitud de la cadena aumenta (línea negra).
Para el caso B, ecuación (5), obtenemos una expresión
más complicada y con mayor dependencia funcional de
sus parámetros:
(11)
Figura 4. Densidad media de ribosomas calculada a
partir de la ecuación (8) para los tres casos analizados.
La notación usada es la misma a la de la figura 3. Para
el caso C, la escala de valores en L pequeños se ajustó
para efectos de poder comparar con las demás gráficas.
Modelo estocástico para la traducciónde proteínas
POR: OMAR GONZÁLEZ Y ALBERTO LÓPEZ
ESPECIAL / 3ER FORO CELERINET ENERO-JUNIO 2013 87
Si en esta expresión tomamos los parámetros k=0 y de tráfico en la difusión de la molécula del ribosoma,
a=0, recuperamos la ecuación (10). La Figura 4, muestra disponibilidad de moléculas para la producción de
la gráfica para el caso con constantes k=1.0 (línea roja la proteína, etc. El modelo ha permitido así el cálculo
continua) y k=4.0 (línea roja discontinua) las cuales no de valores promedio de cantidades que pueden ser
difieren mucho de la aproximación con wEn constante importantes en el proceso de traducción; sin embargo,
(caso A: línea negra). El caso con k=4.0 muestra que la inclusión de frecuencias cambiantes en el tiempo
se puede llegar a tener una traducción modulada por el requiere de un análisis fino de las escalas de interacción
lugar que ocupa el ribosoma en la cadena del ARNm, y de los tiempos diferenciados del proceso, hecho que
este mecanismo puede ser importante para evitar efectos experimentalmente no se ha estudiado en detalle. El
de tráfico (contacto) entre los diferentes ribosomas presente estudio es entonces un punto de partida para
presentes en la cadena de ARNm. Finalmente para el análisis más específicos y completo del proceso de
caso C tenemos: traducción.
(12) En el desarrollo de este trabajo han colaborado los
miembros del Cuerpo Académico Sistemas Complejos:
Nuevamente la Figura 4 muestra la gráfica para los Teoría y Simulación, en particular han sido muy
mismos parámetros estudiados en la Figura 2, b=0.5 productivas las discusiones con Héctor R. Flores Cantú
(línea azul continua) y b=1.0 (línea azul discontinua). y F. Javier Almaguer Martínez. El trabajo conto con
Sin embargo, para este caso la situación parece poco el apoyo del Programa de Fortalecimiento de Cuerpos
realista ya que para distancias pequeñas se tiene un valor Académicos SEP-PROMEP 2012-2013.
<M> muy grande (divergente, no mostrado en la figura
para efectos de claridad) que decae a un valor cercano
a cero en el caso de k=1.0 Por lo que es difícil esperar
que se generen valores estacionarios y de equilibrio de
producción de proteínas con esta dependencia funcional
de las frecuencias de reacción.
Conclusiones
Utilizando un modelo matemático simplificado
para estudiar la dinámica de traducción proteínas
por parte del complejo formado por Ribosomas y
cadenas de ARNm, se ha caracterizado la difusión del
ribosoma sobre la cadena de RNAm para casos en los
que las frecuencias de reacción son constantes [10-
13] y dependientes del tiempo. Se determinó que para
el caso de una dependencia en forma de campana, el
sistema es inestable y genera una difusión asintótica para
tiempos pequeños y tiempos grandes, lo cual es poco
probable que esté presente en el sistema de traducción.
Se podrían eliminar estas divergencias si se propone un
reescalamiento y se desplaza el origen de coordenadas
en las ecuación (6).
El caso de una dependencia armónica para las
frecuencias de reacción wde(t), muestra una dinámica
que puede ser modulada por medio de la frecuencia k de
oscilación, esto introduce un parámetro externo que es
controlado de manera autoconsistente por el complejo.
Este acoplamiento puede representar, por ejemplo, el
efecto de una cadena que no es homogénea, efectos
Modelo estocástico para la traducciónde proteínas
POR: OMAR GONZÁLEZ Y ALBERTO LÓPEZ
88 CELERINET ENERO-JUNIO 2013 ESPECIAL / 3ER FORO
Referencias Datos de los Autores:
[1] Ehrenberg, M. “Structure and fuction of the ribosome”, Kungl. Omar González Amezcua
Vetenskaps-akademien. http://www.nobelprize.org/nobel_ Es profesor de Tiempo Completo en la Facultad de Ciencias
Físico Matemáticas en la UANL. Sus líneas de investigación se
prizes/chemistry/laureates/2009/advanced-chemistryprize2009. desarrollan en tópicos relacionados con Sistemas Complejos y
Materia Condensada Blanda, por ejemplo: teoría y simulación de
pdf 2009. sistema multicompontes (polímeros, moléculas y membranas),
teoría de coloides, estudio de sistemas biocomplejos.
[2] Phillps, R. and Quake, S. R. “The biological frontier of physics”.
Phys. Today. Pp. 38. May 2006. Email: [email protected]
[3] Strick, T., Rancois, J., Vincent, A. and Bensimon, D. “The Alberto Olivares López
manipulation of single biomolecules”. Phys. Today. Pp. 46.
Es egresado de la Facultad de Ciencias Físico Matemáticas
October 2001. de la UANL, en la generación 2011 y actualmente se está
preparando para ingresar a un programa de posgrado.
[4] Valleriani, A., Ignatova, Z., Nagar, A. and Lipowsky, R.
“Turnover of Messenger RNA: Polysome statistics beyond the Dirección de los autores: Facultad de Ciencias Físico
Matemáticas, CICFIM, Cd. Universitaria, Av. Universidad
steady state”. Europhys. Lette. Vol. 89. Pp. 58003. 2010. S/N, San Nicolás de los Garza, C.P 66451, Monterrey, Nuevo
León, México.
[5] Berenstein, J. A., Khodursky, A. B., Lin, P., Lin-Chao, S. and
Cohen S. N. Proc. Natl. Acad. Sci. Vol. 99. Pp. 9697. 2002.
[6] Bremer H. and Dennis P. P. “Escherichia coli and salmonella
typhimurium: Cellular and Molecular Biology”. Edited by
Neidhardt F. C. American Society for microbiology. Pp. 1559.
1987.
[7] Kurland G. O. Annu. Rev. Genet. Vol. 26. Pp. 29. 1992.
[8] Jacques N. and Dreyfus M. Mol. Biol. Vol. 4. Pp. 1062. 1990.
[9] Zhang D. and Ignatova Z. PloS ONE. Vol. 4. Pp. e5036. 2009.
[10] Mollazadeh-Beidokhti, L., Deseigne, J., Lacoste, D.,
Mohammad-Rafiee, F. and Schiessel, H. “Stochastic model for
nucleosome sliding in the presence of DNA ligands”. Phys. Rev.
E. Vol. 79. Pp. d31922. 2008.
[11] Mollazadeh-Beidoknit, L., Mohammad-Rafiee, F. and Shiessel,
H. “Active Nucleosome Displacement: A Theoretical Approach”.
Biophy, J. Vol. 96. Pp. 4387. 2009.
[12] Chou, T. “Ribosome recycling, diffusion, and mRNA loop
formation in translational regulation”. Biophy. J. Vol. 85. Pp.
755. 2003.
[13] Valleriani, A., Zhang, G., Nagar, A., Ignatova, Z. and Lipowsky,
R. “Length-dependent translation of Messenger RNA by
ribosome”. Phys. Rev. E. Vol. 83. Pp. 042903. 2011.
[14] Edward, A., Codling, M. J. and Benhamou, P. & S. “Random
walk in biology”. J. R. Soc. Interface. Vol. 5. Pp. 813. 2008.
Modelo estocástico para la traducciónde proteínas
POR: OMAR GONZÁLEZ Y ALBERTO LÓPEZ
ESPECIAL / 3ER FORO CELERINET ENERO-JUNIO 2013 89
Nanoestructuras
de carbono con
diferentes grupos
funcionales
Oxana Vasilievna Kharissova
UANL-FCFM
Universidad Autónoma de Nuevo León
Facultad de Ciencias Físico Matemáticas
San Nicolás de los Garza, Nuevo León, México
Resumen:
El carbono es uno de los elementos más interesantes en
la Tabla Periódica. Algunas de sus formas alotrópicas
se conocen desde hace miles de años (diamante 3D y
grafito 2D) y otras fueron descubiertas de entre 10 y 20
años atrás (fullerenos 0D y nanotubos 1D). Su nueva
forma alotrópica, el grafeno 2D, fue descubierta en
Inglaterra por Geim & Novoselov en 2004 y actualmente
es una estrella supernova en el horizonte de la ciencia
de materiales y de la física de materia condensada.
El grafeno representa una nueva clase de materiales
con espesor de solo un átomo. En el presente artículo,
daremos una explicación de estas estructuras.
Palabras claves:
grafeno, funcionalización
90 CELERINET ENERO-JUNIO 2013 ESPECIAL / 3ER FORO
Introducción Grafeno
Cuando la nanotecnología comenzó a desarrollarse El grafeno [1] representa una nueva clase de materiales
intensamente como un área independientemente en la con espesor de solo un átomo. Su estructura corresponde
frontera de la física, química, ciencias de los materiales, a una capa de átomos de carbono [2] como en grafito,
biología, medicina y otras campos de la ciencia desde conectados en una rejilla hexagonal tridimensional;
hace dos décadas, tales términos como nanopartícula, o sea, un plano que consiste de celdas hexagonales
nanopolvo, nanotubo, nanoplato, nanofibra se (Figura 1). La distancia entre los átomos más cercanos
hicieron muy comunes. Por ejemplo, al hacer una de carbono a0 es 0,142 nm (Figura 2). El grafeno ideal
búsqueda sencilla con el uso de SciFinder o Scopus consiste exclusivamente de celdas hexagonales; si hay
resultan miles de artículos con palabras clave tales como celdas penta- o heptagonales, aparecen varios tipos de
nanotubo o nanopartícula. defectos.
Ya tenemos una clasificación de las nanoparticulas, También, se conocen varios derivados de grafeno:
la cual está basada en dimensionalidad y se aplica para C62H20; el grafeno con uno o dos ad-átomos de carbono
nanopartículas a base de carbono (Tabla 1). C63H20 y C64H20, así como el grafeno con el grupo funcional
CO3 y hexa-peri-hexabenzocoroneno (HBC, “super-
Tabla 1.Nanoestructuras clásicas a base de carbono benceno”, Figura 3a). El último contiene 42 átomos
de carbono; existen además sus derivados con grupos
Nombre Dimensión funcionales (Figura 3b,c) y oligómeros (Figura 4).
Nanotubo
Fullerenos 1D a)
Grafeno 0D
Nanodiamantes 2D
3D
Figura 1. a) Estructura de grafeno b) c)
Figura 3. a) Hexa-peri-hexabenzocoroneno, b y c – sus
derivados simétricos y asimétricos, respectivamente
Figura 2. Celda hexagonal del grafeno. e1 y e2 son Figura 4. HBC oligómeros
vectores de translación; el rombo 1234 es celda elemental
Nanoestructuras de carbono con diferentes grupos funcionales
POR: Oxana Vasilievna Kharissova
ESPECIAL / 3ER FORO CELERINET ENERO-JUNIO 2013 91
Figura 6. Grupos superficiales a base de oxígeno
sobre el grafito
Figura 5. Grafenos grandes a) b)
c)
Fue reportada también una serie de grafenos
grandes con 90, 96, 132, 150 y 222 átomos de carbono Figura 7. Complejos de a,b) ruthenio y
(Figura 5). c) paladio con grafeno
El método principal de la obtención de grafeno es Figura 8. Modelo estructural del GO
la exfoliación mecánica de capas de grafito que permite
recibir, a final de cuentas, muestras de alta calidad en un Figura 9. Formación y exfoliación del GO
soporte de SiO2. Otras técnicas incluyen CVD/pyrólisis
como un método simple, económico y reproducible,
tratamiento ultrasónico del grafito en benceno y los
métodos químicos. Los últimos consisten, por ejemplo,
del tratamiento de grafito con una mezcla de HCl y
H2SO4, formando los grupos carboxílicos en las puntas
de capas (Figura 6) que posteriormente se transforman
a cloruros bajo la acción de SOCl2 y capas de grafeno
por la acción de octadecilamina en solventes orgánicos.
El ácido níotrico también puede ser utilizado como un
agente de exfoliación e intercalación.
Se han reportado también los metalocomplejos de
grafeno, por ejemplo los de rutenio [Ru(bpy)2(N-1/2HSB)]
(PF6)2 y [ Ru(bpy)2(N-HSB)](PF6)2 (Figura 7a,b) y
paladio [ Pd (η3-C3H5) (tetra-peri - (tert-butil-benzo)
- di-peri-(pirimidino)-coroneno)] [PF6] (Figura 7c).
La oxidación del grafito produce el óxido de grafito
(GO, Figura 8-9), que es dispersable en agua como
plateletas individuales. Después de depositarlas sobre los
sustratos Si/SiO2, su reducción química produce láminas
de grafeno.
El grafeno se obtiene también por ablación láser por
pulsos en alto vacío (~10-5 Pa) o en helio (~10 Pa). Se han
estudiado reacciones entre el grafeno y tales sustancias
Nanoestructuras de carbono con diferentes grupos funcionales
POR: Oxana Vasilievna Kharissova
92 CELERINET ENERO-JUNIO 2013 ESPECIAL / 3ER FORO
como moléculas inorgánicas simples (H2, O2, O3, CO2, tridimensional altamente simétrica de estas moléculas.
H2O, etc.), metales (Pb, Pd y cúmulos de Pt13 ó Au13) En concreto, la más pequeña y representativa de ellas,
ácido sulfúrico y compuestos con grupos arílicos, etc. el fullereno C60, posee una geometría idéntica a la de un
balón de fútbol. Las sorprendentes propiedades de estos
Entre otras aplicaciones encontradas para el compuestos les han valido a sus descubridores, Harold
grafeno, se reporta su uso en la preparación de Kroto, Richard E. Smalley y Robert F. Curl la obtención
nanotubos de carbono, nanocúmulos-compósitos Ni–C del premio Nobel de química de 1996. Las aplicaciones
ó Fe–C, así como los nanotubos de C-BN. A base del potenciales de estas moléculas pueden suponer una
grafeno se conocen nanocompósitos y películas finas auténtica revolución en el mundo de la ciencia.
(papel del óxido de grafeno), partes de transistores,
nanodispositivos, celdas solares, sensores químicos y Los fullerenos se obtuvieron por primera vez de
almacenamientos de hidrógeno. forma casual al irradiar una superficie de grafito con un
Fullerenos láser. Cuando el vapor resultante se mezcló mediante
Pocas veces a lo largo de la historia actual de la química, una corriente de helio, se formó un residuo cristalizado
una investigación ha dado lugar de forma inesperada cuyo estudio reveló la existencia de moléculas formadas
al descubrimiento de una familia de moléculas tan por sesenta átomos de carbono. Como se dedujo en
excepcional como es la de los fullerenos [3,4], que un principio, estas moléculas tenían una geometría
constituye una nueva forma alotrópica (estructura en semejante a la de la cúpula geodésica diseñada por
la que se puede encontrar una especie) del carbono, el arquitecto Buckminster Fuller, con motivo de la
además de grafito y diamante, y posee unas propiedades exposición universal de 1967. Por ello, se conoce a esta
excepcionales. Particularmente destaca la geometría familia de moléculas como fullerenos.
C60 C70 C76 C84 Generalmente, los fullerenos se preparan mediante
vaporización de grafito y posterior extracción con
C240 C540 disolventes orgánicos. Para separar en las diferentes
moléculas de fullereno (C60, C70, C76, C78, C82, C84, etc.,
Figura 10. Algunos fullerenos Figura 10) se emplearon técnicas cromatográficas.
De todos los fullerenos, el ya mencionado C60 es
Figura 11. Estructura de C60 el más representativo. En la naturaleza se presenta
como un sólido negro de densidad 1,68 g/cm3. Las
moléculas de fullereno permanecen unidas por débiles
fuerzas intermoleculares, por lo que poseen libertad de
movimiento. A consecuencia de ello, el cristal es plástico
a temperatura ambiente.
La estructura del C60 es similar a la de una pelota
de fútbol (de ahí el nombre de futbolanos o buckybolas
como también se les conoce); es decir, tiene forma de un
icosaedro truncado con 60 vértices, en cada uno de los
cuales se encuentra un carbono. Tiene 32 caras, de las
cuales 12 son pentágonos y las 20 restantes son hexágonos
(Figura 11); además, cada pentágono está rodeado
de cinco hexágonos, de forma que dos pentágonos no
pueden ser adyacentes entre sí, pero los seis enlaces de
cada hexágono están fusionados alternadamente a tres
pentágonos y tres hexágonos.
Los fullerenos son solubles en ciertos disolventes
orgánicos e insolubles en disolventes polares o con enlaces
de hidrógeno (agua). Estas propiedades de solubilidad
condicionan decisivamente la química de los fullerenos,
que es muy rica y variada y se basa fundamentalmente en
reacciones de adición (incorporación de átomos o grupos
de átomos a la estructura). Así, los fullerenos pueden
Nanoestructuras de carbono con diferentes grupos funcionales
POR: Oxana Vasilievna Kharissova
ESPECIAL / 3ER FORO CELERINET ENERO-JUNIO 2013 93
adicionar hidrógeno, halógenos, oxígeno, metales, Figura 12. Obtención de N- etilfulleropirrolidina
radicales. Asímismo, se pueden ciclar y polimerizar, así
como formar complejos huésped-anfitrión con metales Figura 13. Fulleropirrolidinas de C70
de transición. Por otra parte, pueden verificar reacciones
de transferencia electrónica. Existen muchos derivados Figura 14. Primeros nanotubos de carbono
de fullerenos, en particular los pyrrolidino[3’,4’:1,2] descubiertos en 1952
[60]fullerenes (en inglés), más comunes como
fulleropirrolidinas (Figuras 12 y 13) que tienen muchas
aplicaciones útiles en medicina, obtención de materiales,
celdas solares, etc.
La ciencia de los materiales ha mostrado, desde su
descubrimiento, un gran interés por las posibilidades
de los fullerenos, dadas sus múltiples propiedades y
la alta procesabilidad que presentan. Siguiendo estas
líneas se han obtenido polímeros electroactivos (dando
reacciones de transferencia electrónica) y polímeros
con propiedades de limitadores ópticos (trascendental
en el campo de los láseres para evitar el deterioro de
los materiales). Se espera asímismo obtener materiales
muy adecuados para el recubrimiento de superficies,
dispositivos fotoconductores y creación de nuevas redes
moleculares. El campo de la biomedicina también se
ha visto beneficiado por la aparición de los fullerenos.
Destaca sin duda el estudio de las propiedades de ciertos
derivados organometálicos de los fullerenos solubles
en agua, que han mostrado una actividad significativa
contra los virus de inmunodeficiencia que provocan la
enfermedad del SIDA, VIH-1 y VIH-2. También se baraja
actualmente la posibilidad de incorporar fullereno en los
procesos de fototerapia, que permitirían la destrucción
de sistemas biológicos dañinos para los seres humanos.
Nanotubos
Actualmente, es prácticamente desconocido que en el año
1952 Radushkevich et al publicaron [5] en la revista Russ.
J. Phys. Chem. las imágenes claras de tubos de carbono
con el diámetro de 50 nm (Figura 14). Posteriormente,
los resultados de Oberlin et al mostraron claramente las
fibras vacías de carbono del tipo monocapa (single-
wall) con diámetros a nanoescala obtenidas vía la
técnica de crecimiento desde la fase vapor. Ya en 2003,
Dresselhaus et al confirmó estos datos como nanotubo
de monocapa, según la terminología moderna. En 1982
se presentaron resultados de caracterización química y
estructural de las nanopartículas de carbono, producidas
vía disproporcionación termocatalítica del monóxido de
carbono. Así fueron las investigaciones olvidadas acerca
de los primeros pasos de estudio del nanomundo de
carbono.
A partir del descubrimiento formal de los CNTs
en 1991, se ha reportado un gran número de sus
Nanoestructuras de carbono con diferentes grupos funcionales
POR: Oxana Vasilievna Kharissova
94 CELERINET ENERO-JUNIO 2013 ESPECIAL / 3ER FORO
aplicaciones en pantallas de color, transistores y variedad de estructuras quirales. Dependiendo de su
computadoras moleculares. Estas aplicaciones son diámetro y ángulo quiral de ordenamiento de anillos de
altamente dependientes de las propiedades de los CNTs, grafeno en las paredes (capas), los CNTs han demostrado
las cuales dependen de arreglo atómico y estructura, las propiedades inusuales electrónicas, magnéticas,
por ejemplo el ángulo quiral, diámetro o presencia de térmicas y mecánicas. En general, las propiedades de
defectos. Recientemente, se han desarrollado nuevas los nanotubos dependen principalmente de los siguientes
estrategias para modificar propiedades físicas y químicas factores:
de los CNTs vía la modificación superficial con especies
orgánicas, inorgánicas y biológicas. • el número de capas concéntricas que posee
Estudios estructurales de nanotubos de carbono • la manera en que es enrollado
continúan ser importantes debido a una variedad de
aplicaciones de estos nanomateriales. Se sabe que su • el diámetro del nanotubo
geometría y mayor parte de propiedades dependen del
diámetro y ángulo quiral. Estos dos parámetros resultan Propiedades Electrónicas:
completamente definidos por dos índices de Hamada
(n,m). Existen dos tipos de nanotubos cuyas formas • Transportan bien la corriente eléctrica
principales se presentan en la Figura 15.
• Pueden actuar con característica metálica,
semiconductora o también superconductora
• Nanotubos de monocapa {single-walled Propiedades Mecánicas:
nanotubes (SWNT’s)} y
• Uno de los materiales más duros conocidos
• Nanotubos de multi-capa {multiwalled nanotubes
(MWNT’s)}. • Presenta una altísima resistencia mecánica
Un nanotubo de carbono [6,7] puede ser examinado • Alta flexibilidad
como una hoja de grafito, enrollado a nanoescala en una
forma tubular (SWNT) o con los tubos adicionales de Propiedades Elásticas:
grafeno, los cuales se encuentran alrededor del SWNT
(o sea MWNT). Ya que la hoja de grafeno puede ser • Por su geometría, podría esperarse que los
enrollada variando grados de envoltura a lo largo de su nanotubos sean duros en la dirección del eje, pero
longitud, los nanotubos de carbono pueden tener una por el contrario son flexibles a deformaciones
perpendiculares al eje.
• La curvatura causa aumento de la energía: los
nanotubos son menos estables que el grafito,
y cuanto menor es el diámetro menor es la
estabilidad.
• Para grandes deformaciones radiales, los
nanotubos pueden ser inestables. Esto ocurre
principalmente para nanotubos de gran diámetro.
Propiedades Térmicas:
• Presenta alta conductividad térmica en la
dirección del eje del nanotubo.
Figura 15. Clasificación de los nanotubos de carbono: De las propiedades únicas de los CNTs siguen sus
sillón, zigzag y helicoidal o quiral insertado arriba y abajo muchas aplicaciones. Son sistemas ligeros, huecos y
porosos que tienen alta resistencia mecánica, y por tanto,
interesantes para el reforzamiento estructural de materiales
y formación de compósitos de bajo peso, alta resistencia
a la tracción y enorme elasticidad. Electrónicamente,
Nanoestructuras de carbono con diferentes grupos funcionales
POR: Oxana Vasilievna Kharissova
ESPECIAL / 3ER FORO CELERINET ENERO-JUNIO 2013 95
se ha comprobado que los nanotubos se comportan Figura 16. Esquema del compósito: las líneas azules son
como hilos cuánticos ideales monodimensionales con nanotubos, los cilindros grises son las fibras
comportamiento aislante, semiconductor o metálico
dependiendo de los parámetros geométricos de los tubos.
Otra más de sus interesantes propiedades es su alta
capacidad de emisión de electrones. En este campo, su
interés radica en que sean capaces de emitir electrones a
0.11 eV de energía mientras que los mejores emisores de
electrones utilizados en la actualidad emiten en un rango
entre 0.6 y 0.3 eV. Además del estrecho rango de emisión
de energía, los CNTs presentan otras ventajas respecto a
los cristales líquidos utilizados en las pantallas planas
como: amplio ángulo de visión, capacidad de trabajar en
condiciones extremas de temperatura y brillo suficiente
para poder ver las imágenes a la luz del sol.
Otra de sus aplicaciones como emisores de
electrones es su utilización en la fabricación de fuentes
de electrones para microscopios electrónicos. En el
campo de la energía, los CNTs pueden ser usados para
la preparación de electrodos para supercondensadores y
baterías de litio, para el almacenamiento de hidrógeno
y como soporte de catalizadores de platino en pilas de
combustible. En aplicaciones biomédicas están siendo
utilizados en sistemas de reconocimiento molecular,
como biosensores y para la fabricación de músculos
artificiales. Otra de las aplicaciones de los CNTs es para
la producción de materiales de alto valor añadido, con
propiedades estructurales y funcionales mejoradas. Hace
poco tiempo fue reportada la creación de la lámpara más
pequeña en el mundo (su longitud es de 1.4 nm y espesor
de 13 nm) a base de un nanotubo de carbono, con los
topes del cual se conectan los electrodos de paladio y
oro. El nanotubo está insertado en una base de silicio;
toda la construcción se encuentra en vacío. Al pasar la
corriente, el nanotubo se calienta y comienza a emitir
fotones que se pueden ver directamente sin microscopio,
ya que los seres humanos son capaces de distinguir
cuantos separados de luz.
Una aplicación muy interesante es la obtención
de nuevos materiales-compósitos para los aviones al
coserlos con uso de nanotubos de carbono. La función
de nanotubos es conectar entre si varias capas del
compósito (Figura 16). El material obtenido es mucho
más duro a comparación con sus análogos, obtenidos sin
uso de nanotubos. El tamaño de nanotubos es pequeño
que las fibras del compósito, por eso la estructura sigue
siendo dura, y la matriz en total es más estable debido a
la presencia de nanotubos.
Trabajando con los CNTs, hay que saber que son
tóxicos. Su toxicidad se puede disminuir funcionalizando
los CNTs con varios grupos orgánicos [8].
Nanoestructuras de carbono con diferentes grupos funcionales
POR: Oxana Vasilievna Kharissova
96 CELERINET ENERO-JUNIO 2013 ESPECIAL / 3ER FORO
Referencias Datos del Autor:
[1] Geim, A.K and Novoselov, K.S.. The rise of graphene. Nature Oxana Vasilievna Kharissova
materials. Vol. 6, Nu. 3, pp. 183-191. 2007.
Graduada en la Universidad Estatal de Moscú, Rusia en 1994
[2] Gogotsi, Y. (Edit.). Carbon Nanomaterials. CRC Press. P. 344. (Maestría en Crecimiento de Cristales) y en la FIME-UANL
2006. en 2001 (Doctorado en Materiales). Actualmente trabaja
en la Facultad de Ciencias Físico Matemáticas de la UANL
[3] Langa, F. and Nierengarten, J.F. (Edits). Fullerenes: Principles como Profesora Investigadora. Tiene SNI II y cuenta con 62
and Applications. Royal Society of Chemistry. P.300. 2007. artículos en revistas indexadas, 3 libros, 15 capítulos de libros,
4 patentes y tiene 184 citas.
[4] Petrukhina, M.A. and Scott, L.T. Fragments of Fullerenes and
Carbon Nanotubes: Designed Synthesis, Unusual Reactions, and Dirección del autor: FCFM-UANL, Ciudad Universitaria, San
Coordination Chemistry. Wiley. P.440. 2011. Nicolás de los Garza, N.L. 66450, México.
[5] Radushkevich, L.V. and Lukianovich, V.M. "About carbon Email: [email protected]
structure, formed by thermal decomposition of carbon monoxide
at iron contact". Zhurn. Fiz. Khim. (Traducción al Inglés como
Russ. J. Phys. Chem.), Vol. XXVI, Nu.1, pp.88-95. 1952.
[6] Mishra, A.K. Carbon Nanotubes: Synthesis and Properties
(Nanotechnology Science and Technology). Nova Science.
P.413. 2013.
[7] Tanaka, K. and Iijima, S. Carbon Nanotubes and Graphene,
Second Edition. Elsevier Science. P.432. 2013.
[8] Kharisov, B.I., Kharissova, O.V., Leija Gitierrez, H. and Ortiz
Méndez, U. "Recent advances on the soluble carbon nanotubes".
Ind. Eng. Chem. Res. Vol. 48, Nu. 2, pp.572-590. 2009.
Nanoestructuras de carbono con diferentes grupos funcionales
POR: Oxana Vasilievna Kharissova
ESPECIAL / 3ER FORO CELERINET ENERO-JUNIO 2013 97
Fenómenos
físicos de las
nanopartículas
de oro
Carlos Luna Criado
Diana Castañeda Rodríguez
Rafael Alberto Rosas Torres
Blanca Patricia Sánchez Juárez
UANL-FCFM
Facultad de Ciencias Físico Matemáticas
Raquel Mendoza Reséndez
UANL-FIME
Facultad de Ingeniería Mecánica y Eléctrica
Universidad Autónoma de Nuevo León
San Nicolás de los Garza, Nuevo León, México
Resumen:
El oro ha sido uno de los materiales más preciados
por el hombre desde la antigüedad por sus excelentes
propiedades, entre las que destaca su hermoso color
y brillo, su maleabilidad y su estabilidad química. En
las últimas décadas, el interés por este material se ha
incrementado al encontrar que el oro en forma de nano-
partículas presenta fenómenos físicos nuevos que incre-
mentan su potencial tecnológico. En esta contribución
presentamos una breve descripción de algunos de estos
fenómenos, los cuales son objeto de estudio del cuerpo
académico Física de los sistemas de baja dimensionali-
dad y sus aplicaciones de la FCFM de la UANL.
Palabras claves:
oro, nanoestructuras, nanomateriales
98 CELERINET ENERO-JUNIO 2013 ESPECIAL / 3ER FORO
Introducción tamaño y forma del material. De este modo, el estudio
de esta nueva fenomenología resulta fundamental
Aunque el oro es uno de los materiales más conocidos para el entendimiento de los efectos colectivos,
y utilizados desde la antigüedad, no ha dejado de atraer superficiales y de confinamiento responsables de las
fuertemente la atención de la comunidad científica propiedades y fenómenos únicos de los sistemas de baja
debido a sus excelentes propiedades. El oro es un dimensionalidad, y que podría explotarse en el diseño de
metal de transición que tiende a aparecer en su estado nuevos dispositivos y tecnologías así como el desarrollo
metálico (tiene potenciales de reducción estándar altos de nuevas técnicas terapéuticas y de diagnóstico [4].
y positivos [1], siendo en este estado poco reactivo,
por lo cual presenta una gran estabilidad química y una En este trabajo presentamos una breve descripción
notable resistencia a la corrosión. Además, el oro es el de algunos fenómenos físicos asociados a las
metal más dúctil y maleable. Estas propiedades, junto al nanoestructuras de oro, mostrando algunos resultados
característico color amarillo brillante que presenta en su obtenidos por nuestro grupo de investigación. Todas las
estado masivo han hecho que el oro pertenezca, junto a figuras presentadas son originales y no se han publicado
la plata, el platino y el rodio, al grupo los metales más previamente.
preciado en los trabajos de joyería. Por otro lado es un
excelente conductor de electricidad y calor. Resonancia de plasmones superficiales
La baja reactividad del oro lo convierte en el metal En los metales existe una gran cantidad de electrones
más inocuo para la salud humana. De hecho, aunque (digamos del orden del número deAvogadro, ≈1023) que no
poco utilizado, se emplea en su estado metálico como se encuentran ligados a un determinado núcleo atómico, de
un colorante alimentario en alta gastronomía (Codex modo que se pueden mover libremente dentro del material
Alimentarius E-175), y en particular, como un añadido formando un plasma. Con la aplicación de campos
decorativo de algunas bebidas alcohólicas (tales como eléctricos, estos electrones fluyen a través del material
la bebida polaca Goldwasser de Danzig o algunos vinos dando lugar al fenómeno de la conducción eléctrica.
como el Centvum Vitis). Por otro lado, su uso terapéutico Cuando se hace incidir radiación electromagnética
anti-inflamatorio en dolencias como la artritis reumatoide (i.e. campos electromagnéticos oscilantes) sobre los
parece muy prometedor [2,3]. No obstante, cabe señalar metales, se pueden inducir excitaciones colectivas de
que algunas de sus sales, tales como el cloruro de oro, sí los electrones libres, denominadas plasmones. Estas
presentan toxicidad. ondulaciones electrónicas se pueden propagar en la
interfase de un metal y un material dieléctrico dando
Recientemente, el interés por este material en forma lugar a un plasmón superficial. Cuando la frecuencia
de partículas de tamaño nanométrico se ha visto renovado de la radiación incidente coincide con la frecuencia
y fortalecido debido a los comportamientos físicos resonante de la oscilación colectiva de los electrones de
que exhiben estos sistemas, que son muy diferentes conducción, se produce un fenómeno de absorción. En
a los observados en el oro a escala macroscópica el caso de metales con baja dimensionalidad (películas
y los cuales presentan nuevas dependencias con el delgadas y metales nanométricos), la resonancia del
plasmón (que llamaremos resonancia del plasmón
Figura 1. A) Espectro ultravioleta-visible de una superficial localizado, LSPR según sus siglas en
suspensión coloidal de nanopartículas de oro. La imagen inglés Localized Surface Plasmon Resonance) presenta
interior es una fotografía de la muestra estudiada donde una frecuencia característica fuertemente dependiente
del tamaño y forma del material debido a efectos de
se evidencia la presencia de partículas mediante el confinamiento [4]. En el caso de las nanoestructuras de
efecto Tyndall. B) Imagen de microscopía electrónica de los metales nobles como el oro y la plata, la banda de
extinción LSPR cae dentro del espectro visible, de modo
transmisión de la misma muestra. que estas nanoestructuras presentan colores diferentes
a los observados en sus análogos macroscópicos y que
pueden variar según el tamaño de partícula.
A modo de ejemplo ilustrativo, en la Figura 1A
se muestra el espectro ultravioleta-visible de una
suspensión coloidal de nanopartículas de oro. En
la imagen interior se muestra una fotografía de este
coloide donde se aprecia su color rosáceo, el cual es
Fenómenos físicos de las nanopartículas de oro
POR: luna et al
̂ (( ) ) ( () ) = 0 (1()5)
ESPECIAL / 3ER FORO ̂ ( )⁄ ( ) = Kl (2()6) 99
CELERINET ENERO-JUNIO 2013
̂ ( () ) (3)
() = (7)
muy diferente del color dorado del oro en bulto. En esta () () ( )⁄ (4)
fotografía se puede observar que la suspensión presenta
el efecto Tyndall al hacerla incidir un haz láser. En la ̂ () () = 0 (8) (8)
Figura 1B se muestra una micrografía de microscopía
electrónica de transmisión (MET) de la misma muestra, saiseonĉdiaodaσsl ay(lasKcl)arlagsasdlie(bnrseisd)addeelsa sduepecr=afircg0iae fyroncto(e5rrra)ieynntê
donde se evidencia la uniformidad, la morfología
esférica y el pequeño tamaño de las partículas presentes el v̂e2cELtao+sr ekuc2nEu(itaa=criio0o)nneosyr(m1)a-(l(a42)Hds)ice+hpaku2seHudpe=enr0fdi=ceiseKa.cloplar(6d)and(9o)
en la suspensión (su diámetro promedio es de 6 ± 2 nm).
lugar a ecuaciones de ondas que describen a la radiación
Aunque la naturaleza de este fenómeno debe eleĉtromagn(ética) en un( m)edio mate=rial. D(e7)este
describirse en el contexto de la mecánica cuántica,
donde se tratan a los plasmones como cuasi-partículas, modo, los ca∑mpo(s eléctr)ico(y magn)ético de una onda (10)
los procesos de absorción, dispersión y extinción ecdoleencôtpnroedrmamaλigtin)v(éi∑qtdiuaceda)(sepelléapcntraroipcy()aamg(ɛa|oy)ne|onpceruromnm|emáa|tbeiicd)l=aiiod0(acddoenmtelraom(g8nni)gnéitatiudcdoa (11)
derivados de los plasmones superficiales pueden
describirse cuantitativamente empleando el modelo µ son solu(cio)nes de (las e)cuaciones de onda: (1) (12)
teórico que Mie desarrolló en 1908 [5], basado en la () () (1)
teoría electromagnética clásica. En la siguiente sección 2E + k2E = 0⁄ y 2H + k2H = 0 (2) (9()9)
describiremos brevemente este modelo. ⁄ (2)
Teoría de Mie de la dispersión y absorción de la donde ( ) es el número de o(n3d)as de
luz por partículas pequeñas ltfaoromonnatedruaaneenv(((naetlrloe()(rm))∑lceaed)r)ip(coa((aren((tnoíc))))cuaula)e1s(mt(yió()e)pnt((áo. lrEi((cnt))aa⁄⁄nm)yt))ou,cehlnoms≈em√d((ei44ϵ(od3)).i)oEesnn,
μ (10) (13)
Cuando se hace incidir luz sobre una partícula metálica, su la
campo electromagnético induce una excitación colectiva el
en los electrones de valencia de la partícula, por lo que
la partícula a su vez irradiará radiación electromagnética bqruuescsaemeennct(ueepn∑rte)rsaen(i(ntam)nedrosau),n((ta|adn)it|soco(ɛn|ction)m|uio)daµd. cambiarán (11)
dando lugar a un proceso de dispersión. Por otro lado, En el caso
en el proceso de transferencia de energía de la luz a la pp̂̂arrotbícluemla(((sa cseo)))npu(medo)erfn((olroegs())íoa)lveesrf(éarnica)alí,==ticl00aasmeecnutea((c55ciuo)) ynaess (14)
partícula, parte de la energía se disipa en forma de calor. de
A este proceso se le denomina absorción. Para describir del (12)
teóricamente este problema físico, consideremos las
ecuaciones de Maxwell: ys[sd5oeoc]dlss.uceipcê̂̂̂iAorienoinxmdpnetoaiesenrsrmtceaifirfsóui((.((=cndeDa(renco(eσepn))ea))s/esncx)pttud)mar,eesoyrsp(dsiauxeoob(()nels((=ausdotcoera2icsso))eti())naósprent0)toase/ro(úsσ.rple(íatrabiism,pm)p,uae)aed==r==rdliaaaseKKpuvsecnlleuraazmslicppóauaon((((lrdra7766tíe(r))))cMσulldaaiilseass) (13)
eecsloéfmécrt̂̂pricilceaajosmɛpee=n(tn((álpal2(isc)(pal))aa)rdtc(íecuu()arllaa)d(sd((iemobe(e(tr))á0)e)l)ixccpaor(s(nepsaaurr)n)saea==poc00pdoeenrrmdnieút((sim88vc))riedirbaoidsr (15) (14)
() () (1) (1) el fenómeno(de a)bso(rc)ión), q(ue) se e(ncu)entra inmersa en
⁄ (2) (2)
() ( )⁄ (3) (3) un medio con permitividad ɛm≈n2m y en la cual incide
() () (1) uλ=naks/oinenm22nEEd, dal++aoeskklmes22ceEEt=crc==onimo00pn/anegsmnyyéeytfiixccaa=cp22eHH2lsanσ++rad0kki/sc,22oHHσ.nab==fsrey00cuσeexnt csiea pωue=d2eπn/((99))
() () (4) (4) calcular mediante las siguientes series:
(2)
⁄
saiseoncdîaodaρsl ( ly(os)Jel l)elacstrodneen(ssliidba)rdeesso de carga y co(3rr)iente ∑( )( ) (10)
a de con=du0cción. (5) ∑( )( ) (10) (10)
∑( | |)
() () ( )⁄ (4) ∑( ()) (| ||) | |) (1(51)1)
Las condiciones de contorno asociadas a estas (| (11) (11)
ecuaĉiones so(n: ) () = Kl (6)
(12)
̂ (( )) ( ( ) ) ==0 (57)(5) (12) (12)
̂ (( )) (( )) donde : ( ) () () ( )
==K0l (86)(6) (( )) (( )) (( )) (( ))
̂ () () ( ) () () ( ) (13) ((1133))
= (7)(7)
̂ 2E + k2(E = )0 y (2H)+ k2H = 0= 0 (8) (9) ( ) () () ( ) (14)
(( )) (( )) (( )) (( )) (14)
( ) () () ( )
∑( )( ) Fensóimenednoosmf=ísnicp/onsmdye xla=s 22nanrr00o//pa.. rtíPcOuRl:alsudnea oro
(10) siendo m = np/nm y x= et al
2E + k2E = 0 y 2H + k2H = 0 (9)
100 CELERINET ENERO-JUNIO 2013 ( ) () ( )))ES(((PEC)))IAL / 3ER FORO (13)
( ( ) ) (( )) (( (13)
( ) () () ( ) (14)
(14)
( ) () () ( )
A 3.0 ( ( ) ) (( )) (( )) (( )) (14)
( ) () () ( )
2.5
2.01014 1 nm 50 nm siendo m = np/nm y x = 2r0/.
1.5 2 nm 60 nm siendo m = np/nm y x = 2r0/.
1.0 5 nm 70 nm
0.5x 10 nm 80 nm
20 nm 90 nm
B 0.0 (m2) 30 nm 100 nm BesseLl,aqs ufeunscoinonsoesluψcijoyneξsj (x) son las funciones Ricatti-
2.5 40 nm de la ecuación diferencial:
2.0 () (15()15)
abs () (15)
1.5 y que se pueden definir como:
1.0 dis (m2) x 1014 1 nm 50 nm () √ () (16) (16)
2 nm 60 nm
5 nm 70 nm ( () ) √ √ [ ( )( ) ( )] (17(1)6(1)7)
10 nm 80 nm
20 nm 90 nm
30 nm 100 nm
40 nm
0.5 () √ () (16)
dseognudnedJo(αoyr)dYenα ,sr√oenspleacs[tifvuanmc(ieon)ntees. de Bess(el)d]e primer y(17)
0.0
Las( f)u(nc)io√nes [con( (p)ri)mas, ψj(´ ()y )ξ]j´, indican(17()18)
C5 derivadas de las funciones con respecto al argumento en
4ext (m2) x 1014 1nm 50 nm paréntesis(y)se pueden (exp)resar del m( o)do siguiente: (18)
2nm 60 nm
3 5 nm 70 nm ( () ) (( )) (( )) (18) (18(1) 9)
10 nm 80 nm
2 20 nm 90 nm
30 nm 100 nm
40 nm
1 () () () (19) (19)
0 () () () (19)
300 400 500 600 700 800 900 1000 Estas ecuaciones nos permiten estimar las
(nm) dependencias de σabs, σdis y σext en función del material de
la partícula y su diámetro, el medio en el que se encuentra
Figura 2. Valores calculados (a partir de la teoría de y la longitud de onda de la radiación incidente. En la
Mie) de las secciones eficacesσabs, σdis y σext de Figura 2 presentamos los valores estimados de σabs, σdis
nanopartículas de oro de diversos tamaños (1-100 nm) y σext en función de la longitud de onda de la radiación
dispersadas en agua en función de la longitud de onda de incidente para nanopartículas de oro de diversos tamaños
la radiación incidente (1-100 nm) dispersadas en agua (nm=1.33).
Es importante destacar que la banda de absorción
debida al fenómeno de LSPR puede verse modificada
significativamente si la nanopartícula es dopada con
otro metal. También puede modificarse recubriendo las
partículas iniciales con otro metal noble, confiriendo a la
partícula una estructura tipo corazón-coraza. También la
modificación de la forma de las nanopartículas da lugar a
importantes variaciones en la banda de extinción LSPR,
de hecho una morfología anisotrópica suele dar lugar a
la aparición de varias bandas de extinción [6]. También
es muy susceptible a la variación de las propiedades
Fenómenos físicos de las nanopartículas de oro
POR: luna et al