El profesional de la información


Junio 1999

Ordenadores biologicos

Por Ana Teresa García Martínez

Resumen: La investigación en ingeniería informática nos ofrece una nueva tecnología revolucionaría que afecta a la esencia misma del hardware y software, tal y como lo conocemos hoy día: el ordenador electrónico. Estas máquinas nos transportan a nuevas formas de configuración de la mano de componentes bioquímicos que condicionan el modelo de datos así como las características de la arquitectura que lo sustenta. No obstante también presenta algunas similitudes con el ordenador convencional en cuanto a operaciones sobre los datos se refiere. Aunque bien es cierto que el campo de aplicación de esta tecnología está dirigido fundamentalmente a la resolución de problemas combinatorios de complejidad exponencial.

Palabras clave: Ordenadores biologicos, Informática ADN, Codificación de información, Arquitectura ADN, Tecnología molecular.

Title: Biological Computers

Abstract: Research in computer engineering offers us a new technology that affects the essence of hardware and software, as we now know it, that is to say the electronic computer. These machines are leading us to new forms of configuration through the use of biochemical components, which condition the data models as well as the architectural characteristics that support them. However they also have similarities with the traditional computers in terms of data operations, although is true that the scope of this technology is directed to resolving combinatory problems of exponential complexity.

Keywords: Biological computing, DNA computer, Information representation, DNA Architecture, Molecular technology.

Ana Teresa García MartínezEl avance tecnológico no se resiste a quedarse entre chips o circuitos de cobre, conductores eléctricos, diferencias de tensión, codificación binaria, etc., sino que avanza a campos tan insospechados como el que afecta a la esencia de la vida, el ADN; por lo que a disciplinas tan íntimamente ligadas con la informática, como la física y las matemáticas, se añade la química y la biología, aportando un nuevo modelo de informática que condiciona las características y el aspecto físico de aquello que conocemos como hardware, y también lo que a la naturaleza del software se refiere.

Adleman, un conocido matemático por sus trabajos en criptografía y seguridad de ordenadores, demostró en 1994 la capacidad del ADN para ser una herramienta informática, construyendo el primer ordenador ADN con el fin de resolver un problema matemático que, aunque no era complicado, cualquier ordenador de tecnología actual no lo hubiera abordado en tan poco tiempo. Este prototipo debe consolidarse para que pueda aplicarse de forma práctica y real una vez superada la fase de experimentación.

Unos meses después Lipton, otro científico en este campo, aplicó el modelo de Adleman para resolver tareas informáticas más difíciles y complicadas; demostrando que la técnica era útil solucionando problemas que no era posible hacerlo utilizando ordenadores convencionales, como fue el desarrollo de un procedimiento para deducir el sistema de encriptación de datos usados por algunas de las agencias de seguridad más sofisticadas del mundo.

Descubierto el poder de la informática ADN, es necesario profundizar en su investigación, ya que sólo ciertos problemas matemáticos se ajustan al modelo y pueden resolverse usando ADN. Por tanto, aunque la informática ADN no llegue a ser universal, es indiscutible que algunas de sus aplicaciones pueden resultar muy útiles para nuestra sociedad.

Codificación natural

Los ordenadores ADN usan base 4 para representar los datos (adenina, tiamina, guanina y citosina), mientras que los ordenadores electrónicos usan base 2 en la forma de ceros y unos. Las bases de nitrógeno de ADN (A, T, G y C) son parte de los bloques básicos de construcción de la vida; usando estas cuatro letras, el ADN almacena la información que es manipulada por los organismos vivos casi exactamente de la misma manera que los ordenadores trabajan a través de cadenas de ceros y unos.

La habilidad del emparejamiento de moléculas de ADN es lo que permite que se usen como modelo de datos abstracto en el laboratorio. Cada porción de datos se puede sintetizar mediante una única serie de ADN. El ADN forma una doble hélice —dos hebras de material: cada una envuelve a la otra—, que se debe principalmente a la atracción de los elementos individuales de cada hebra con los homólogos de su vecino. Los vínculos entre hebras están formados por cuatro aminoácidos (A, T, G y C). Cada aminoácido enlazará favorablemente sólo con uno de los otros. Los pares fuertes son A-T y G-C. El resto de enlaces son demasiado débiles para mantenerlos durante mucho tiempo (figura 1).

Características

Los ordenadores moleculares resuelven problemas complejos rápidamente, es decir, pueden analizar un gran número de posibles soluciones de una forma eficiente, como solventar problemas del modelo hamiltoniano (consistente en detectar cuál es el camino más óptimo entre los múltiples existentes) en unas semanas, ya que en estos casos incrementando el número de posibles soluciones se aumenta linealmente el tiempo para encontrar las soluciones, en lugar de incrementarse exponencialmente como ocurriría en los ordenadores electrónicos. En el campo bibliotecario se podría encontrar una homologación hamiltoniana al intentar obtener el recorrido más rápido a seguir en la colocación de los libros en los estantes en función de la organización de la biblioteca por el sistema de clasificación CDU.

Ésta es la característica general más destacable que nos ofrece esta nueva concepción de ordenadores, a la que contribuyen el resto de cualidades como el procesamiento paralelo, puesto que los ordenadores ADN son masivamente paralelos. A diferencia de los ordenadores convencionales más rápidos, se obtiene una mayor velocidad de ejecución, llegando incluso a ser 100.000 veces más rápidos que los tradicionales. La razón es que las reacciones químicas ocurren muy rápido y en paralelo, así que las moléculas de ADN sintetizadas con una estructura química, que representa información numérica, jugarán con una gran cantidad de números tal como procede en una reacción.

Para llevar a cabo los cálculos los ordenadores ADN, que representan la información en términos de las unidades químicas de ADN, requieren sintetizar series específicas de ADN y permitirles reaccionar en una probeta; a diferencia de los convencionales, que realizan los cálculos mediante un programa que maneja la información, representada físicamente, reflejándose en el flujo de electrones a través de los circuitos lógicos.

También contribuye a la configuración de este modelo la capacidad de procesamiento, y es que estos ordenadores son increíblemente ligeros, ya que aproximadamente con 1/2 Kg de ADN se obtiene más poder de procesamiento que con cualquiera de los ordenadores actuales.

De esta composición se deduce que la colección de moléculas aporta al diseño del nuevo ordenador las características internas de húmedo y fluido en cuanto afecta a la unidad de procesamiento y memoria, por lo que debe prestarse atención al PH, la temperatura y las concentraciones de sal, como condiciones químicas que influirán en una óptima ejecución de los procesos.

Gráfico del problema del camino hamiltoniano, con 7 variables y 12 conexiones, con capacidad de ampliar a 70 y 1000 respectivamente

Limitaciones

Su aplicación está limitada a ciertos tipos de problemas, puesto que los ordenadores ADN sólo resuelven problemas combinatorios. No hay procesadores de texto o posibilidades de juegos para los ordenadores ADN, y además son lentos en ciertos casos, ya que los problemas simples se resuelven más rápidamente en un ordenador electrónico.

Los ordenadores ADN son mucho más rápidos para los grandes problemas más complejos. Por ejemplo buscar en la memoria de un ordenador ADN puede ser lento porque encontrar una secuencia le puede llevar entre 17 minutos y tres horas, mientras que buscar en el disco duro de un ordenador supondría 15 milisegundos.

Por otra parte en el tratamiento de las respuestas complejas nos encontramos que puede llevar más tiempo clasificar la respuesta al problema que encontrar la solución, es decir, que puede llevar mucho tiempo hacer las operaciones que actualmente están en experimentación, tales como unión, vertido y separación de secuencias ADN.

Por último se contempla el concepto de fiabilidad, que es muy baja en este tipo de ordenadores puesto que el ADN cambia de forma natural y aleatoriamente, se puede deteriorar, y además las manipulaciones de ADN tienen tendencia a error. Por todo ello es por lo que el ordenador ADN puede disolverse conforme pase el tiempo. Sin embargo los ordenadores convencionales tienen muy pocos problemas de fiabilidad porque los electrones no cambian.

Comparación con el ordenador electrónico

A pesar de ser una creación revolucionaria y totalmente novedosa en cuanto a los componentes que integra para su funcionamiento, el ordenador molecular muestra semejanzas con el electrónico en algunos de los procesos informáticos.

Por ejemplo en cuanto a la transformación de los datos, tanto los ordenadores biológicos como los electrónicos utilizan la lógica booleana (y, o, no). El comando lógico “i” se lleva a cabo separando hebras de ADN de acuerdo a sus series, y el comando “o” se hace juntando soluciones ADN que contengan series específicas.

Por lo que respecta a la manipulación de los datos, los ordenadores electrónicos y los biológicos almacenan información en cadenas que se manipulan para realizar los procesos. Se pueden concentrar vastas cantidades de información en probetas; la información se puede codificar en series ADN y almacenarla, y para recuperar los datos solamente es necesario buscar una pequeña parte de ella —p. ej., una palabra clave— añadiendo una hebra ADN diseñada tal que su serie coincida con la palabra clave donde quiera que aparezca en el ADN.

En lo que a computación se refiere, todos los ordenadores manipulan los datos por adición y sustracción. Un ordenador biológico tiene capacidad de resolver satisfactoriamente un problema con 70 variables y 1.000 conexiones y-o. En el caso del problema hamiltoniano las variables serían las ciudades, y las conexiones serían las posibles rutas a seguir.

Aplicaciones

Hasta el momento este modelo tan reciente ha encontrado aplicación en los campos de la biología, la química, la medicina, como también en el de la informática en cuanto a seguridad de la información se refiere, como muestran los buenos resultados obtenidos en los sistemas de encriptación.

No obstante también puede establecerse una cierta relación con otra línea de investigación reciente, la nanotecnología, que, basada en la computación cuántica, predominó sobre la computación biológica como primera línea de investigación para miniaturización, aunque no necesariamente hay que desvincularlas sino que podrían ser complementarias, de cara a la implantación de estos mecanismos en el cuerpo humano para llevar a cabo determinadas funciones.

Por otra parte la similitud entre las operaciones biológicas y matemáticas, junto a las características del ADN de estabilidad y predecibilidad en las reacciones, proporcionan la base para la codificación de la información en sistemas matemáticos. Por tanto, una vez codificada la información matemática, se podrían resolver problemas combinatorios de complejidad exponencial gracias a la capacidad de los ordenadores ADN de ser masivamente paralelos, contemplando así la posibilidad de trabajar problemas intratables, es decir aquellos en los que el lapso de tiempo para el cálculo crece exponencialmente con el tamaño de tales casos. Ese crecimiento exponencial implica la imposibilidad de resolver un problema en un tiempo razonable con un ordenador convencional.

«A pesar de que aún no se ha indagado la posible aplicación documental, lo primero que deberíamos hacer sería examinar si en esta disciplina existe la posibilidad de hallar problemas NP, es decir intratables, en cualquiera de las facetas o niveles de la gestión de información»

A pesar de que aún no se ha indagado la posible aplicación documental, lo primero que deberíamos hacer sería examinar si en esta disciplina existe la posibilidad de hallar problemas NP, es decir intratables, en cualquiera de las facetas o niveles de la gestión de información.

No obstante tenemos que tener en cuenta otras técnicas que se han aplicado satisfactoriamente al campo documental, en concreto a la recuperación de información, que muestran cierta semejanza con la informática ADN, como son las redes neuronales, que también basan su funcionamiento, además de en el aprendizaje y autoorganización, en el paralelismo, realizando una gran cantidad de cálculos simultáneamente, y necesitando como entrada al sistema un valor numérico para poderlo manipular; por lo que en el campo de la indización automática tendríamos como valores numéricos los valores de discriminación sobre los que se realizarían las operaciones para clasificar los documentos.

En este sentido la informática molecular difiere de la anterior en el procedimiento para llevar a cabo las operaciones y, además, para que sea rentable necesitaría ser una operación que aumentara exponencialmente el tiempo de resolución conforme se incrementen las variables a considerar en la resolución del caso.

Por lo tanto cuando el volumen de información aumentara de forma que, para la resolución de un problema, como puede ser la clasificación de documentación o indización de información, se incrementara exponencialmente el tiempo, sería susceptible de aplicarse esta innovadora tecnología. Así como también podría ser idónea para la evaluación de la recuperación de información, en la que se considerasen multitud de resultados a un mismo planteamiento de búsqueda o recuperación, a los que se llegase por diferentes métodos o procedimientos, y en su caso valorar cuál sería el más pertinente.

Teniendo en cuenta la reciente aparición de esta tecnología, sólo podemos limitarnos a hacer conjeturas respecto a las posibles aplicaciones que pueda tener en un futuro y, sobre todo, en lo que afecta a la recuperación de información, campo al que suelen llegar las aportaciones cuando ya han alcanzado cierto grado de madurez en otros ámbitos.

Bibliografía

A History of DNA Computers. http://www3.hmc.edu/~cgerbin/bio.html

Adleman, L. “Molecular computation of solutions to combinational problems”. En: Science, 1994, n. 266.
http://www.hks.net/~cactus/doc/science/
molecule_comp.html

Amos, M. DNA computation. 1997.
http://www.csc.liv.ac.uk/~ctag/archive/th/
amos-thesis.html

Biological computer. http://www.physics.wisc.edu:80/~shalizi/
notebooks/bio-computers.html

Boneh, D. DNA computing.
http://Theory.Stanford.EDU/~dabo/pubs.html

Boneh, D. [et al]. On the computational power of DNA.
http://www.cs.princenton.edu/~dabo/papers/
biocircuit.ps.z

Dassen, R. A bibliography of molecular computation and splicing systems. http://www.wi.leidenuniv.nl/~jdassen/dna.html

Dimacs: Center for discrete mathematics and theoretical computer science.
http://www.dimacs.rutgers.edu/

Friedman, Y. DNA computers. 1996. http://dna2z.com/dnacpu/dna.html

Ismeb: International Society for Molecular Electronics and BioComputing. Hot topics. DNA based molecular computing. http://www.cs.wayne.edu/~kjz/ismebc/
HotTopics.html

Moya Anegón, F. de y Herrero Solana, V. “La indización automática: tesauros, sistemas expertos y redes neuronales”. En: Congreso internacional sobre sistemas de información histórica, Vitoria-Gasteiz, noviembre de 1997. “Nanotecnología: la ciencia de lo diminuto”. En: Jumping, marzo 1999, n. 27.

Richard, J., Lipton y Eric, B. (eds.). Baum DNA based computers: proceedings of a Dimacs workshop. American mathematic society, 1995.

Rothermund, P. A DNA and restriction enzyme implementation of Turing machines. http://www.ugcs.caltech.edu/~pwkr/oett.html

Rothermund, P. Paul’s list of DNA computation resources. http://www.ugcs.caltech.edu/~pwkr/dna_comp.html

What are the advantages and disadvantages of a DNA computer over the traditional electronic computer? http://www3.hmc.edu/~abarber/bio/adv_disa.html

What are the similarities and differences between DNA computers and traditional electronic computers? http://www3.hmc.edu/~abarber/bio/
sim-diff.html

Ana Teresa García Martínez. Facultad de Biblioteconomía y Documentación de la Universidad de Extremadura.

atmar ARROBA alcazaba.unex.es

Enlace del artículo:
http://www.elprofesionaldelainformacion.com/contenidos/1999/junio/ordenadores_biologicos.html