TP Bioinformática Autores: Máximo Rivarola, Ana Julia Distéfano, Paula Fernández, Norma Paniego, Sergio González Tutorial bases de datos 1) Uso de Entrez a) Utilizando Entrez, encuentra cuantos genes humanos tienen un dominio WAP Tipear human [orgn] AND WAP domain (23 entradas) b) Acotar la búsqueda para encontrar cuantas proteínas con este tipo de dominio están localizadas en el cromosoma 20. Usar el buscador en la página principal de Entrez y tipear: 20 [chromosome] or [chr] AND human [organism] or [orgn] and WAP domain. Hay 16 entradas clasificadas como genes. 2) Estamos trabajando con el cDNA AF217525. Utiliza Entrez para obtener la secuencia FASTA y encontrar la siguiente información: a) ¿Cuál gen está codificado por este cDNA? DSCAM gene, mol de adhesión en Síndrome de Down b) ¿Cuántos aminoácidos tiene la traducción? 2012 aa AF217525_1 c) ¿Cuáles son los IDs de cada posible gen o unigen y confirmar si el gen fue manual o automáticamente curado (NM o XM)? NM001389, NM indica que fue curado manualmente. d) ¿Qué dominios Pfam contiene la proteína? Para ver el dominio en Entrez clickear en el link del dominio conservado bajo la proteína refseq (pfam07679) e) Utilizando NCBI, ejecute un Blast con la secuencia RefSeq NM001389 contra la base de datos human + mouse ¿Por qué no se obtiene 100% de identidad? ¿Cambia el resultado si se aplica el low complexity filter? La secuencia NM001389 presenta una identidad del 99% porque presenta un gap en el alineamiento. En parámetros de BLAST, destildar “mask look table only” y probar con y sin filtro.