Advertisement
kukis03

Muestra Piloto

Jan 9th, 2024
19
0
Never
Not a member of Pastebin yet? Sign Up, it unlocks many cool features!
text 1.45 KB | None | 0 0
  1. #LLIMPIEZA DE DATOS
  2.  
  3. #Archivo modificado: 4 primeras filas eliminadas para la lectura de datos
  4.  
  5. directorio_companias_1_=read_excel("D:/Descargas/DATABASES/directorio_companias (1).xlsx")
  6.  
  7. #Quitar todas las entradas cuyo representante no esté presente.
  8.  
  9. directorionoNA=directorio_companias_1_[complete.cases(directorio_companias_1_$REPRESENTANTE),]
  10.  
  11. #Conservar solo aquellas compañías cuya situación legal sea activa:
  12.  
  13. directorio1=directorionoNA[directorionoNA$`SITUACIÓN LEGAL`=="ACTIVA",]
  14.  
  15. #Conservar solo aquellas compañías situadas en Ecuador (No sé si haya que considerarlas de todas maneras)
  16.  
  17. directorio1=directorio1[directorio1$PAÍS=="ECUADOR",]
  18.  
  19. #Conservar solo aquellas que estén situadas en Ecuador continental (No Galápagos) (puede cambiar)
  20.  
  21. directorio1=directorio1[directorio1$REGIÓN!="GALÁPAGOS",]
  22.  
  23. #Para agilizar el trabajo de R, se selecciona solo las columnas: RUC, NOMBRE, REGIÓN y REPRESENTANTE.
  24.  
  25. directorio1=directorio1[,c(3,4,9,18)]
  26.  
  27. #MUESTRA PILOTO
  28.  
  29. #Seleccionar 100 elementos al azar:
  30.  
  31. set.seed(1709)
  32. mpiloto=directorio1[sample(nrow(directorio1), 100), ]
  33.  
  34. #Clasificar por región:
  35.  
  36. msierra=mpiloto[mpiloto$REGIÓN=="SIERRA",]
  37. mcosta=mpiloto[mpiloto$REGIÓN=="COSTA",]
  38. moriente=mpiloto[mpiloto$REGIÓN=="ORIENTE",]
  39.  
  40. #Contando hombres y mujeres por muestra:
  41.  
  42. #Sierra: 35 hombres, 16 mujeres
  43.  
  44. pmujsierra=16/51
  45.  
  46. #Costa: 35 hombres, 10 mujeres
  47.  
  48. pmujcosta=10/45
  49.  
  50. #Oriente: 2 hombres, 2 mujeres
  51.  
  52. poriente=2/4
  53.  
Advertisement
Add Comment
Please, Sign In to add comment
Advertisement