Uso y Manejo Básico de Bases de datos en STATA 12

Anuncio
Uso y Manejo Básico de Bases de datos en STATA 12
Carrera: Economía Aplicada
Asignatura: Econometría 1
Profesor: Carlos Narváez Silva
Inicialmente la interfaz del programa STATA
presenta las siguientes opciones para trabajar
1
2
4
3
5
Las opciones presentadas en 1 son muy similares a la barra de opciones de un
Word aunque con ciertas características especiales.
File: permiten abrir/ guardar archivos
Edit: Copiar/Guardar
Data: Permite un mayor control en las variables utilizadas, esto es: reconocer su
etiqueta, cambiar nombres, crear matrices de variables, etc.
Graphics: Creación de gráficos
Statistics: Opciones para análisis de datos, estadísticos descriptivos, regresiones,
pruebas estadísticas, etc.
User, Window, Help: Opciones de apoyo del programa Stata
El espacio dentro de la interfaz de Stata que corresponde a Command (2) guardará
por defecto todos los comandos usados
El espacio dentro de la interfaz de Stata que corresponde a STATA (3), que es el
espacio más grande de la pantalla presentará todos los resultados de nuestro
trabajo
El espacio dentro de la interfaz de Stata que corresponde a Variables (4),
presentará todas las variables a usar, es decir, al momento de abrir la base de datos
ésta se abrirá en este espacio con el nombre de cada una de sus variables
El espacio dentro de la interfaz de Stata que corresponde a Command (5)
corresponde el área donde se introducen los comandos para analizar la base de
datos, por ejemplo:
“tab x”, siendo x una variable de nuestra base de datos
Indica, entre otros estadígrafos, la frecuencia y el porcentaje de las observaciones
que caracterizan a la variable “X”.
Para abrir una base de datos
Abrir una base de datos es igual a abrir cualquier archivo en Word, o Excel. Solo
se presiona en la carpetita señalada por la flecha y se busca en sus documentos el
archivo de la base de datos deseado.
*Las bases de datos serán proporcionadas en el Blog de la clase o enviadas a un
correo del Aula en formato SPSS, para pasarlo a archivo “.dta” que es el tipo de
archivo que reconoce el STATA se hará uso del Stat-Transfer.
Para abrir un Do-file
Un Do-File es una opción que el Stata nos presenta en el cual se permite guardar
toda la secuencia que se ha trabajado, es un registro de los comandos usados al
momento de modificar o analizar la base de datos.
Al momento de dar click
en la pestaña señalada por
la flecha se abrirá una
ventana nueva, de ésta
ventana se puede abrir
desde “File” el archivo
“.do”
que
representa
nuestro do-file.
El
do-
file
puede
ser
ejecutado con la pestaña
“Execute” presentada con
la flecha. Esto correrá toda
la secuencia guardada
Ejemplo de Uso
Utilizando “label list” como comando, se puede obtener el valor asignado por el
digitador de datos a la variable en cuestión, aquí el digitador utilizó el valor 1 para
representar el área de residencia Urbana. Utilizó 2 para representar el área de
residencia Rural
Una vez abierto el STATA y su base de datos, en este caso “Población” Según la
EMNV 2005, se pueden obtener datos específicos de la misma, si se quiere obtener
el porcentaje y frecuencia de mujeres y hombres capturados por la encuesta se
utiliza el comando “tab”
Ej:
tab s2p3
ENTER
Si se quiere saber el área de residencia se
utiliza el mismo proceso
Ej: tab i05
ENTER
Se puede apreciar que la mayoría de
los encuestados son mujeres (50.6%) y
que los encuestados en su mayoría
son rurales.
Esto
nos da un total de 36,612 de
encuestados.
De esta manera se pueden obtener datos aún más específicos. Si le queremos decir
al software que nos proporcione a el número de mujeres que se encuentran en el
área rural se procede de la siguiente manera
Este comando nos dice que tabulemos la pregunta referente a sexo si ésta es mujer
y se encuentra en el área rural: 9,380 mujeres habitan en zonas rurales.
Para conocer otros estadígrafos sobre una
variable, se utiliza el comando “sum” el cual nos da el número de observaciones, la
media, la desviación estándar, el mínimo y el máximo de la variable.
. sum precio
Variable
Obs
Mean
precio
5024
50.58632
Std. Dev.
59.09051
Min
Max
.8064
226.8
Como podemos observar aquí se aplicó el comando “sum” a la variable “precio” el
cual nos indica que contamos con 5,024 observaciones en la variable; la media del
precio es de 50.59 córdobas. Por otro lado la desviación estándar es de 59.09 y que
el precio mínimo es de 0.80 córdobas y el precio máximo es de 226.8 córdobas.
Los comandos “gen” como “replace” son comandos importantes a la hora de
manejo de base de datos, esto es debido a que el comando “gen” nos permite
generar una variable dentro de la base de datos, mientras que el comando
“replace” nos ayuda a remplazar datos en una variable ya existente. Tras haber
explicado esto es necesario un ejemplo para tener un mayor entendimiento por lo
que se les presenta un ejemplo.
Por ejemplo, queremos generar una variable que se llame “rural” en el cual
queremos indicar que cuando sea “1” la variable indique a todas las personas que
residen en el área rural mientras que si toma valor igual a 0 es que residen en una
área urbana.
. gen rural=0
.
. replace rural=1 if i06==2
(19325 real changes made)
. tab rural
rural
Freq.
Percent
Cum.
0
1
17,287
19,325
47.22
52.78
47.22
100.00
Total
36,612
100.00
Como se puede ver en la imagen primero se generó una variable que sea igual a 0
con el comando “gen”. Luego se utiliza el comando “replace” para editar la
variable rural que se ha creado y que ésta tome uno (1) cuando la pregunta “i06”,
la cual hace referencia al área de residencia, es igual a dos (2) debido a que este es
el código para el área rural asignado por el digidator de datos en la pregunta.
Después de esto utilizamos el comando “tab” para observar cu{ntas personas se
encuentran en el área rural y debido a que anteriormente se le había asignado al
número “1” como las personas que habitan en el {rea rural podemos decir que
19,325 personas pertenecen a esta y 17,287 son del área urbana.
Descargar