VII.-Capítulo 2 Métodos para el estudio de la expresión de genes Pessino, Silvina C.; Martelotto, Luciano G. 1 Introducción La capacidad de secuenciar genomas completos desarrollada en la última década ha impulsado a la investigación científica en la dirección de definir la función de cada uno de los genes identificados. Para contribuir con ese objetivo se han diseñado técnicas que permiten estudiar la expresión génica global en un determinado tejido y en un momento particular del desarrollo, posibilitando la identificación inicial y el agrupamiento en clases funcionales de secuencias nuevas con una actividad asociada. Los procedimientos para esta evaluación han progresado desde los métodos desarrollados para el análisis de genes únicos específicos (como el Northern slot y dot blotting, la RT-PCR semicuantitativa y cuantitativa y los ensayos de protección de nucleasas) hacia otros enfocados en la identificación de múltiples transcriptos que difieren en su representación entre las diversas muestras experimentales (como la hibridación substractiva, el display diferencial, el ADNc-AFLP ®, la secuenciación de etiquetas expresadas o EST, el análisis serial de la expresión de genes o SAGE y la hibridación de microarreglos). La organización de las secuencias dentro de grupos funcionales basada en los datos de expresión y de homología proporciona un marco básico para conducir nuevos estudios dirigidos a definir la actividad precisa de cada producto génico. 2 Hibridación substractiva Los métodos de hibridación substractiva fueron creados a principios de la década que comenzó en 1980 con el propósito de construir bibliotecas de ADNc para obtener sondas de genes expresados diferencialmente. Fueron los primeros que se utilizaron de manera amplia con el propósito de identificar genes regulados positiva o negativamente en una escala global. Sus ventajas incluyen la habilidad de aislar genes de función relacionada sin tener conocimientos previos de su secuencia o identidad y el uso de técnicas comunes de biología molecular que no requieren equipos especializados de detección y análisis. El procedimiento general consiste en la hibridación de ADNc provenientes de una muestra prueba (tester) con un exceso de ARNm proveniente de una muestra control (driver). Los transcriptos expresados en ambas muestras (tester y driver) forman moléculas de ARNm/ADNc híbridas, mientras que las secuencias de ADNc que están presentes únicamente en la muestra tester permanecen como hebras simples. Las moléculas de hebras simples y dobles se separan usando cromatografía en hidroxilapatita. Los ADNc expresados diferencialmente pueden entonces ser recuperados y clonados o usados directamente como sondas para analizar una biblioteca. Dos limitaciones importantes del protocolo original son: i) el requerimiento de grandes cantidades de ARNm y ii) la tendencia a una menor eficiencia en la identificación de transcriptos poco abundantes. La hibridación substractiva es aplicable sólo a comparaciones de pares de muestras y debe ser realizada por duplicado con el tester y el driver invertidos para detectar tanto aumentos como disminuciones en los niveles de expresión. Además no genera una medida cuantitativa y aunque es eficiente en la identificación de genes que están completamente ausentes en el driver no revela fácilmente a aquellos que están presentes en ambas muestras en distinta proporción. A fin de mejorar el protocolo original se realizaron modificaciones que incluyen la producción de ADNc con marcas de biotina u oligo(dT)30-látex de manera de refinar la separación de las moléculas de cadena simple y doble. También se incorporó la amplificación de ADNc selectos por PCR para disminuir la cantidad inicial de mARN requerido y aumentar la eficiencia de clonado de los transcriptos seleccionados. En la actualidad se utiliza más comúnmente un protocolo ingenioso conocido como hibridación substractiva de supresión (SSH) que fue diseñado para favorecer la detección de Biotecnología y Mejoramiento Vegetal 229 transcriptos raros expresados diferencialmente. Este incluye una normalización en la representación de los transcriptos diferenciales basada en la inhibición de la amplificación de aquellos que son más abundantes, eliminando también la necesidad de separar moléculas de cadena doble y simple (Fig.1). 3 Display diferencial y RAP-PCR Las técnicas conocidas en general como «huellas digitales genéticas de ARN» (ARN fingerprinting) incluyen al display diferencial (DD) y al fingerprinting de ARN con una PCR cebada arbitrariamente (RAP-PCR). Ambos métodos están basados en una amplificación por PCR de subgrupos al azar de transcriptos a partir de dos o más muestras. La primera etapa de ambos procedimientos es común y consiste en generar ADNc haciendo una transcripción reversa de una fracción de las moléculas de ARNm de una muestra. En el display diferencial esto se logra utilizando como cebador de la transcripción reversa a un poliT anclado con una o más bases adicionales al extremo 3´ del ARN mensajero (por ejemplo (T)12AC). Estos oligonucleótidos se fijan al ARN mensajero a través de la unión de las bases adicionales, impidiendo que el poliT «resbale» sobre distintas zonas del poli A. El único grupo de ARNm que es transcripto en forma reversa es el integrado por las moléculas que llevan las bases complementarias a las bases adicionales del poliT en el extremo del mensajero adyacente al poliA. En contraste, la RAP-PCR utiliza oligonucleótidos de secuencia arbitraria para la transcripción reversa. Estos cebadores tienen normalmente 10 bases de largo y se unen a sus secuencias com- Figura 1: Esquema general que describe el procedimiento de hibridización substractiva de supresión (SSH). El ADNc prueba (tester) se divide en dos porciones iguales que se ligan a dos adaptadores diferentes y son hibridizadas por separado con un exceso de ADNc de la muestra control (driver), lo que conduce a la formación de los productos de tipo a, b, c y d que se indican en la figura. Luego ambas muestras se mezclan y se rehibridizan en presencia de un exceso adicional del driver desnaturalizado, lo que origina los productos a, b, c, d y e. Los extremos de las hebras dobles se rellenan y los fragmentos se amplifican por PCR utilizando cebadores complementarios a los adaptadores. El enriquecimiento en las moléculas e se logra durante la amplificación por PCR ya que: i) a y c pueden unir un solo cebador por lo que se amplifican linealmente; ii) la amplificación de b está suprimida debido a la complementariedad de unas terminaciones largas repetidas invertidas presentes en la secuencia del adaptador que promueven la formación de estructuras secundarias internas en las hebras simples; iii) d no contiene sitios de unión a los adaptadores. Los productos de PCR resultantes provendrán de transcriptos presentes esencialmente en el tester y ausentes en el driver y además su representación estará normalizada ya que los fragmentos diferenciales abundantes tendrán mayores posibilidades de formar moléculas de tipo b. Este esquema fue adaptado de Diatchenko et al. 1996. 230 PESSINO, Silvina C.; MARTELOTTO, Luciano G. plementarias permitiendo formar una hebra en los distintos tratamientos experimentade ADNc desde este sitio. En este caso el les representan potenciales transcriptos de subgrupo de ARNms que sufre transcripción ARNm de expresión diferencial. Típicamenreversa estará integrado por aquellas molé- te, las bandas son evaluadas sólo si amplificulas que presenten la secuencia complemen- can en forma consistente en reacciones de taria a la del cebador orientada en el senti- PCR duplicadas para cada muestra (Fig. 2). do adecuado. La fase final del display diferencial consisLuego de haberse realizado la síntesis de te en la identificación de la secuencia del la primer hebra del ADNc, se amplifican seg- transcripto representado por el producto de mentos de los transcriptos usando pares múl- PCR y la confirmación de que este realmente tiples de cebadores de PCR. Tanto para el se expresa en forma contrastante. Estas etadisplay diferencial como para la RAP-PCR, el pas se logran localizando físicamente y cebador superior es un oligonucleótido arbi- escindiendo la sección del gel de trario de 10 pares de bases. El cebador infe- poliacrilamida que contiene al producto de rior es el mismo oligonucleótido poliT anclado (para el caso del display diferencial) o el decámero arbitrario (para el caso de RAP-PCR) que se usaron alternativamente para hacer la transcripción reversa. Se ha estimado que los productos de PCR de 240 combinaciones particulares de pares de cebadores de display diferencial (por ejemplo todas las combinaciones de 20 oligonucleótidos arbitrarios y 12 oligonucleótidos anclados) representan estadísticamente a todos los ARNm originalmente presentes en la muestra. Los productos de PCR pueden ser marcados por incorporación de un nucleótido radiactivo o de una molécula que pueda ser detectada a través de su interacción con un anticuerpo conjugado a un sistema de detección (por ejemplo digoxigenina). También puede usarse un cebador unido a un fluoróforo u optarse por no marcar los fragmentos amplificados y usar luego una tinción con nitrato de plata para revelar los geles. La visualización de los productos de PCR se logra Figura 2: Representación gráfica del método de display diferencial. luego de la electroforesis en geles de Las muestras de ARN son transcriptas en forma reversa usando poliacrilamida seguida de la apropia- como cebador un oligonucleótido poliT de secuencia 5´T(T)nTXY da generación y detección de imáge- 3´ (donde 10 Í n Í 12) que se fija en forma estable al extremo 3´de transcriptos a través de la unión de las bases adicionales de nes, que son evaluadas comparando los secuencia arbitraria X e Y. Una vez sintetizada la primer hebra del la intensidad relativa de las bandas ADNc, ésta se usa como molde para una reacción de PCR que producidas a partir de diferentes utiliza como cebadores el mismo poliT anclado y un decámero de secuencia arbitraria. Distintas combinaciones de poliTs y decámeros muestras experimentales. Los fragmentos que están presen- generan numerosos perfiles de amplificación a partir de diversas subpoblaciones de ARN mensajeros. El patrón de bandas de las tes en una muestra y ausentes en la muestras experimentales se compara en busca de diferencias de otra o aquellos que están presentes tipo presencia-ausencia o alteraciones en la intensidad de las con diferentes intensidades relativas bandas. Biotecnología y Mejoramiento Vegetal 231 interés. En la mayoría de los casos debe realizarse un alineamiento de las imágenes de los fragmentos de amplificación con el gel de poliacrilamida seco. En los casos en que se utiliza tinción con nitrato de plata no es necesario realizar este paso, por lo cual la recuperación de la banda es mucho más eficiente. Los productos de PCR son purificados del gel y reamplificados. Se han utilizado varias estrategias para confirmar la expresión diferencial de los transcriptos, que incluyen el uso de los fragmentos como sondas de Northern, la siembra de los fragmentos en membranas para someterlos a análisis de Northern inverso y el clonado y secuenciación de los productos para diseñar cebadores específicos que permitan realizar PCR semicuantitativas. Independientemente de cuál sea la táctica usada para confirmar la expresión diferencial, las secuencias de los fragmentos de los genes expresados diferencialmente se requieren siempre para comenzar a entender la función del gen. El aislamiento de la secuencia completa de los genes involucrados puede lograrse usando los clones diferenciales en estudios de bibliotecas de ADNc o realizando experimentos de 5´RACE. Dos ventajas importantes de los métodos de fingerprinting de ARN con respecto a los de hibridización substractiva son la capacidad de comparar muestras experimentales múltiples en forma simultánea y la de identificar genes que están regulados tanto positiva como negativamente en una muestra respecto de las otras. Sin embargo, los métodos de fingerprinting de ARN comparten con el SSH la limitación de que no son cuantitativos. Además suelen aparecer numerosos falsos positivos, es decir, fragmentos de genes que parecen estar diferencialmente expresados pero son artefactos de PCR. Otro problema es que estas técnicas deben aplicarse en general a muestras provenientes del mismo individuo sometido a distintas condiciones o sobre individuos genéticamente idénticos (por ejemplo, isolíneas). Cuando se comparan los perfiles de ARNm de individuos diferentes genéticamente, pueden aparecer falsos positivos que son resultado de una amplificación diferencial debida a una variación en la secuencia de los transcriptos más que a 232 diferencias en su representación. Ese problema puede ser evitado utilizando estrategias de análisis de segregantes en grupo (BSA) aplicadas al estudio de perfiles de ARN. Finalmente, la investigación de todos los genes que potencialmente se expresan en forma diferencial requiere el uso de equipamiento de última generación y una inversión extensiva de tiempo y trabajo para detectar y confirmar la expresión diferencial de cada uno de los genes individuales. 4 Polimorfismos en la longitud de los fragmentos de ADNc amplificados (ADNc-AFLP®) La tecnología de AFLPÒ , generalmente utilizada para producir huellas genéticas de ADN genómico, puede ser aplicada también a preparaciones de ADNc de doble hebra para obtener un perfil del transcriptoma. Los patrones obtenidos por esta técnica son una herramienta confiable y eficiente para la identificación de los ARNm expresados diferencialmente. La técnica de ADNc-AFLPÒ detecta fragmentos de restricción de ADN por medio de amplificación por PCR. Comprende las siguientes etapas: i) generación de ADNc, ii) restricción del ADNc con dos endonucleasas específicas, preferiblemente una que reconoce sitios de 6 bases y otra que reconoce sitios de 4 bases, iii) ligación de adaptadores de cadena doble a los extremos de los fragmentos de restricción, iv) amplificación de un subgrupo de los fragmentos de restricción usando dos cebadores complementarios al adaptador que llevan bases selectivas adicionales en el extremo 3´ v) electroforesis de los fragmentos de restricción amplificados en geles de poliacrilamida, vi) visualización de las huellas digitales genéticas mediante el uso de autorradiografías, fosfoimágenes y otros métodos (Fig. 3, ver pág.7). Las mayores ventaja del uso de la tecnología de ADNc-AFLPÒ son: i) no se requiere información previa de secuencia; ii) se puede estudiar una fracción muy grande de todos los genes expresados, iii) es una técnica muy sensible que permite la detección de transcriptos de baja abundancia, iv) los fragmentos son extraídos fácilmente de los geles PESSINO, Silvina C.; MARTELOTTO, Luciano G. y las secuencias correspondientes pueden determinarse sin necesidad de clonados previos. alterar la actividad de los diferentes dominios de la proteína que codifica. 5 Etiquetas de secuencia expresadas («Expressed sequence tags, EST») 6 Análisis serial de la expresión de genes Los avances tecnológicos que facilitan la secuenciación masiva condujeron a principios de los años 90 a idear el concepto de las bibliotecas de etiquetas de secuencia expresadas (bibliotecas de ESTs). Las secuencias EST son generadas tomando clones al azar de una biblioteca de ADNc y realizando una sola reacción de secuenciación que abarca 300-500 pb del clon. Las diferencias en la expresión de genes pueden ser identificadas considerando el número de veces en que aparece representada una secuencia en particular. Sin embargo, las secuencias EST a menudo se generan a partir de bibliotecas de ADNc que han sido normalizadas para ecualizar la abundancia de clones que corresponden a los diferentes transcriptos. Los EST secuenciados a partir de estas últimas pueden ser comparados para identificar transcriptos que se expresan en una biblioteca y están completamente ausentes en otra, pero si se pretende obtener datos cuantitativos exactos que describan abundancia relativa se debe recurrir indefectiblemente a bibliotecas de ADNc no normalizadas. La posibilidad de detectar diferencias en la expresión de genes a través de la comparación de la abundancia de secuencias en las bases de datos de EST se incrementa con el crecimiento de estas bases. La combinación de la información generada por los EST (nivel y localización espacio/ temporal de la expresión génica) y la de los proyectos de secuenciación de genomas (secuencias completas de los genes y sus promotores) permite realizar asociaciones de expresión y homología estructural que en muchos casos facilitan la inferencia de la posible función de los genes identificados. Por supuesto, esto constituye una instancia inicial en la identificación de la función de cada gen. Para determinar su actividad precisa deben hacerse estudios particulares en general dirigidos a bloquear o aumentar su expresión por ingeniería genética y a modificar estructuralmente la molécula de manera de El análisis serial de la expresión de genes (SAGE) consiste esencialmente en una versión acelerada de la secuenciación de EST. Está basada en el concepto de que una etiqueta corta de unas pocas bases es suficiente para identificar inequívocamente a un transcripto, siempre y cuando esté ubicada en una posición definida dentro de la secuencia del mensajero. Una etiqueta SAGE consiste típicamente en 9 bases de secuencia ubicadas por debajo del último sitio de reconocimiento de una endonucleasa específica en el transcripto blanco. Múltiples etiquetas SAGE se ligan juntas en un vector de clonado de manera que una reacción de secuencia de 300 a 500 pb genera las secuencias de 20 a 30 etiquetas al mismo tiempo (Fig. 4, ver pág.7). Como cada etiqueta SAGE representa un único transcripto de ARNm, es posible obtener una visión general de todos los genes expresados en la muestra original. Las diferencias en la expresión de genes entre muestras experimentales pueden entonces ser identificadas comparando la abundancia relativa de etiquetas SAGE específicas en diferentes bibliotecas. Los genes o las secuencias EST representados por las etiquetas SAGE son localizados en las bases de datos detectando aquellos transcriptos que tengan la etiqueta SAGE en la posición adecuada. Una limitación del SAGE es la identificación de los genes representados por las secuencias de etiquetas. Este proceso está en primer lugar restringido a secuencias que estén accesibles en las bases de datos. Sin embargo, esta limitación se tornará menos problemática a medida que se generen más secuencias EST y que a las secuencias existentes se les asignen asociaciones y función. Otra limitación potencial es la identificación errónea de las etiquetas. Esto puede resultar de errores de secuenciación y de la identificación fallida de la región que corresponde al SAGE en la base de datos de secuencia. Además, ciertos transcriptos pueden estar ausentes en la muestra, dependiendo de cuál sea la enzima específica usada para generar la biblioteca de SAGE. Otros ARNm por el contrario Biotecnología y Mejoramiento Vegetal 233 pueden estar representados por múltiples etiquetas SAGE a causa de la existencia de polimorfismos en un sólo nucleótido o el procesamiento alternativo de los transcriptos. Se espera que muchos de esos problemas afecten a una porción relativamente pequeña de los genes representados, pero no deberían ser dejados de lado en la interpretación de los resultados. Por otra parte, dos ventajas importantes del SAGE sobre la hibridación substractiva y el display diferencial es que los datos obtenidos son cuantitativos y acumulativos. Si se genera la suficiente cantidad de información de secuencia se obtienen perfiles exactos de la expresión de los transcriptos, que describen la abundancia de todos los genes expresados en una célula o tejido. Existe una base de datos pública de expresión génica que ha sido creada para el almacenamiento y análisis de secuencias de SAGE cuyo poder continuará creciendo a medida que se contribuya con más información. Otra característica de los datos de SAGE es que pueden complementar datos de ESTs generados a partir de bibliotecas de ADNc normalizadas o substraídas. Los EST brindan información de secuencia mientras que el SAGE provee datos cuantitativos describiendo la abundancia de los transcriptos. Finalmente, a pesar de que el SAGE requiere capacidad de secuenciación de última generación, la cantidad de datos que aporta puede ser 20 veces mayor que el que posibilita la misma cantidad de secuenciación EST. 7 Hibridación de microarreglos o micromatrices La evaluación de la expresión de genes usando la tecnología de micromatrices ha demostrado ser un procedimiento muy efectivo para una variedad de aplicaciones. Los tres tipos generales de micromatrices incluyen: i) «chips» de oligonucleótidos, construídos realizando la reacción de síntesis de cebadores cortos directamente sobre una matriz de vidrio, ii) arreglos de oligonucleótidos, construídos depositando oligonucleótidos sobre placas de vidrio o membranas de nylon, iii) arreglos de ADNc, obtenidos depositando insertos amplificados por PCR a partir de una biblioteca sobre placas 234 de vidrio o membranas de nylon. Uno de los aspectos más importantes de la experimentación con micromatrices es la selección de los fragmentos de ADN que contendrá. Aún cuando el número de genes representado suele ser grande (3000 a 10000), pueden faltar algunos que sean importantes para una cuestión experimental particular. La selección de la biblioteca más adecuada para una aplicación en particular y la elección de los clones son factores críticos que determinan el éxito de estos experimentos. En algunas situaciones, puede ser más efectivo enfocar los experimentos en un grupo pequeño de genes seleccionados por criterios más específicos como, por ejemplo, perfiles de distribución de tejidos, clasificación funcional o cambio de expresión conocidos. Se pueden adquirir clones de fuentes comerciales u otras fuentes y/o clonar secuencias específicas usando técnicas estándar de biología molecular. Después de que los clones han sido seleccionados deben ser ensamblados y organizados para generar el arreglo de ADNc junto con los controles apropiados. Típicamente, el largo de los insertos será mayor a 500 bases, pero esto depende de los clones seleccionados. Los productos de PCR son purificados y luego depositados (o «impresos») en lugares precisos sobre una placa de vidrio o una membrana de nylon. Los instrumentos usados para la producción de micromatrices han mejorado en los últimos años. Las opciones varían desde la construcción de un arreglo por raspado hasta la compra del sistema completo. Independientemente de cuál sea el origen de los clones, es esencial saber con seguridad la secuencia de cada sonda que está siendo ubicada sobre la matriz para asegurar una interpretación exacta de los datos resultantes. Por la tanto, puede ser necesario secuenciar por duplicado todos o una porción de los fragmentos organizados (Fig. 5, ver pág.8). El ARNm que representa las muestras experimentales se prepara para la hibridación con las micromatrices de ADNc por transcripción reversa y marcado con nucleótidos fluorescentes (Cye3 y Cye5 dUTP) o radiactivos ([ 33 P] dCTP). Las moléculas PESSINO, Silvina C.; MARTELOTTO, Luciano G. Figura 3: Generación de una huella digital de ARN por la técnica de ADNc-AFLP. El RNA mensajero se transcribe en forma reversa utilizando un poliT como cebador. Las hebras de ADNc se digieren con dos enzimas de restricción, una de corte raro y otra de corte frecuente. Se ligan adaptadores complementarios a ambos extremos y se preamplifican por PCR los fragmentos utilizando cebadores que reconocen la secuencia de los adaptadores. Los fragmentos que contienen adaptadores diferentes en los extremos son amplificados preferentemente a causa de que en general tienen un tamaño intermedio. Luego se realiza una segunda amplificación utilizando cebadores anclados con una o dos bases adicionales en el extremo 3´que amplifican una subpoblación de fragmentos. El cebador correspondiente al adaptador para la enzima de corte raro está marcado radiactivamente. La combinación de diferentes cebadores anclados genera perfiles provenientes de distintos subgrupos de ARNms. Figura 4: Procedimiento general para la obtención de etiquetas de secuencia SAGE. El ARN mensajero es transcripto en forma reversa utilizando un poliT biotinilado como cebador. Luego es digerido con una enzima de restricción ancla que reconoce sitios de 4 bases frecuentes en la secuencia de los mensajeros. Es probable que la mayoría de los mensajeros sean digeridos por esta enzima en algún sector de su secuencia. Los extremos 3´de las moléculas son recuperados por unión a esferas de estreptavidina. La muestra se divide en dos partes iguales que se ligan alternativamente a dos adaptadores diferentes (A y B). A continuación son digeridas con una segunda enzima de restricción (enzima de etiquetado) que reconoce un sitio dentro de la secuencia del adaptador pero corta al transcripto unos 20 pares de base más abajo generando un extremo romo. Ambas muestras se mezclan, se ligan y amplifican con dos oligonucleótidos A y B complementarios a los respectivos adaptadores. Los amplicones se digieren nuevamente con la enzima ancla y los fragmentos se ligan como concatémeros y se clonan. Este diagrama fue adaptado a partir del presentado por Velculescu et al. 1995. Biotecnología y Mejoramiento Vegetal 235 Figura 5: Expresión de genes controlada a través del uso de microarreglos de ADNc. Los clones amplificados por PCR se imprimen sobre un soporte sólido. Las muestras a analizar se marcan con diferentes fluoróforos y se hibridizan con la matriz. Un detector permite medir por separado la emisión de cada fluoróforo. La intensidad de la señal de hibridización será proporcional al contenido de cada molécula particular de ARN en la muestra. Los patrones de emisión de ambas muestras son comparados para detectar expresión diferencial. 236 PESSINO, Silvina C.; MARTELOTTO, Luciano G. fluorescentes generalmente se usan para marcar sondas con las que se hibridarán placas de vidrio, mientras que las radiactivas se incorporan a sondas que se usarán sobre membranas de nylon. Los fluoróforos Cye3 y Cye5 presentan diferentes espectros de emisión, por lo tanto dos muestras experimentales pueden ser marcadas alternativamente con cada uno de ellos, hibridadas juntas en una reacción única competitiva y luego evaluadas en forma separada con un detector de fluorescencia. Por el contrario, las muestras radiactivas deben ser hibridadas individualmente en reacciones seriales y pueden ser detectadas usando un sistema de fosfoimágenes. Independientemente del diseño experimental, el análisis de micromatrices se basa en la premisa de que la intensidad de la señal de hibridación resultante para una secuencia es proporcional a la cantidad de ARNm que corresponde a esa secuencia en la muestra original. La expresión relativa de cada secuencia representada en el microarreglo es evaluada comparando las señales de intensidad de hibridación generadas por las diferentes muestras experimentales. Cada experimento de micromatrices genera una gran cantidad de datos y es crítico realizar un procesamiento apropiado de los mismos. El análisis de la información obtenida puede ser dividido en tres componentes: i) identificación y cuantificación de las intensidades de hibridación; ii) visualización de los datos; iii) técnicas de agrupamiento. El primer componente incluye la identificación exacta de los puntos de la imagen, la normalización según el fondo, la cuantificación de las intensidades de hibridación y la salida de los datos en una forma utilizable. La visualización de los datos incluye su clasificación y presentación en una forma lógica y su organización en diferentes formatos para apuntar a la resolución de cuestiones múltiples. Finalmente, los algoritmos de agrupamiento permiten identificar conjuntos de genes con patrones de expresión similar a través de distintas muestras experimentales. En base a la presunción de que la expresión de los genes con funciones relacionadas están regulada en forma coordinada, el agrupamiento de datos de microarreglos se convierte en un método poderoso para asignar posibles clasificaciones funcionales a genes nuevos. 8 Conclusión Los métodos descriptos en este capítulo son tecnologías eficaces que expanden los estudios de expresión desde los genes únicos hasta el nivel genómico. Ninguno de estos procedimientos per se es óptimo para todas las aplicaciones y la mejor estrategia para situaciones específicas puede ser crear combinaciones de varios de ellos. El continuo refinamiento de las técnicas genómicas y de la bioinformática relacionada proporcionará a los investigadores nuevas herramientas para estudiar la expresión de la información hereditaria y lograr un mejor entendimiento sobre el control genético de los procesos fisiológicos. 9 Lecuras Recomendadas ADAMS, M. D.; J. M. KELLEY, J. D. GOCAYNE, M. DUBNICK, M. H. POLY-MEROPOULOS, H. XIAO, C. R. MERRIL, A. WU, B. OLDE, R. F. MORENO. 1991. Complementary DNA sequencing: expressed se-quence tags and human genome project. Science (Wash DC) 252:1651–1666. DAVIS, M. M.; D. I. COHEN, E. A. NIELSEN, M. STEINMETZ, W. E. PAUL, L. HOOD. 1984. Cell-typespecific ADNc probes and the murine 1 region: the localization and orientation of Ad. Proc. Natl. Acad. Sci. USA 81:2194–2198. DIATCHENKO, L.; Y.-F. C. LAU, A. P. CAMPBELL, A. CHENCHIK, F. MOQA-DAM, B. HUANG, S. LUKYANOV, K. PUKYANOV, N. GURSKAYA, E. D. SVERDLOV, P. D. SIEBERT. 1996. Suppression subtractive hybridization: A method for generating differentially regulated or tissue-specific ADNc probes and libraries. Proc. Natl. Acad. Sci. USA 93:6025–6030. GURSKAYA, N. G.; L. DIATCHENKO, A. CHENCHIK, P. D. SIEBERT, G. L. KHASPEKOV, K. A. LUKYANOV, L. L. VAGNER, O. D. ERMOLAEVA, S. A. LUKYANOV, E. D. SVERDLOV. 1996. Equalizing ADNc subtraction based on selective suppression of polymerase chain reaction: cloning of Jurkat cell transcripts induced by phytohemaglutinin and phorbol 12-myristate 13-acetate. Anal. Biochem. 240:90–97. LIANG, P.; A. B. PARDEE. 1992. Differential display of eukaryotic messenger ARN by means of the polymerase chain reaction. Science (Wash DC) 257:967–971. MOODY D. E. 2001. Genomics techniques: an overview of methods for the study of gene expression. J. Anim. Sci. 79 (E. Suppl.): E128-E135. Biotecnología y Mejoramiento Vegetal 237 OKUBO, K.; N. HORI, R. MATOBA, T. NIYAMA, A. FUKUSHIMA, Y. KOJIMA, K. MATSUBARA. 1992. Large scale ADNc sequencing for analysis of quantitative and qualitative aspects of gene expression. Nat. Genet. 2:173– 179. SARGENT, T. D.; I. B. DAWID. 1983. Differential Gene expression in the gastrula of Xenopus laevis. Science (Wash DC) 222: 135-139. SCHENA, M.; D. SHALON, R. W. DAVIS, P. O. BROWN. 1995. Quantitative monitoring of gene expression patterns with a complementary DNA microarray. Science (Wash DC) 270:467–470. VELCULESCU, V. E.; L. ZHANG, B. VOGELSTEIN, K. W. KINZLER. 1995. Serial analysis of gene expression. Science (Wash DC)270:484–487. WELSH, J.; K. CHADA, S. S. DALAL, R. CHENG, D. RALPH, M. McCLELLAND. 1992. Arbitrarily primed PCR fingerprinting of ARN. Nucl. Acids Res. 20:4965–4970. 238 PESSINO, Silvina C.; MARTELOTTO, Luciano G.