Alguna vegada se sent parlar del CIS, de les dades cuinades, etc. Però, voleu fer els vostres propis anàlisis amb les dades del CIS? Em vaig proposar fer-ho, i per això vaig decidir fer-ho amb les eines que disposava.
El primer que necessitem per fer les anàlisis, és tindre les dades, les podem abaixar de la pàgina web del CIS. Haurem de fer clic en la icona de ZIP que diu Fichero de datos. Una vegada els abaixem (ens demana omplir un formulari, però no cal omplir-lo amb dades reals, ens hem abaixat les dades de juny del 2017) vegem dos arxius que estan en format SPSS que és, possiblement, el paquet estadístic més complet i famós que hi ha, però té un problema, no és lliure i la llicència no està a l'abast de la gent d'apeu. Els arxius en aquest cas són DA3179, l'arxiu de dades, i ES3179, l'arxiu de sintaxis que diu que és cada camp. Per tant, veurem si podem convertir-lo/obrir-lo amb una utilitat externa. Buscant en la xarxa, vaig trobar pspp, que és un intèrpret lliure més o menys compatible amb SPSS, però això implicava que debia aprendre a utilitzar-lo, i jo tinc ja coneixements bàsics d'R. Cercant un poc, intente llençar l'intèrpret i convertir-lo com a format de dades que R podré importar (sintaxis i dades tot en una), un arxiu .sav.
Simplement, afegirem a l'arxiu de sintaxi (ES3179) la línia següent al final de tot (l'última línia sol ser FREQUENCIES VARIABLES ALL.)
SAVE OUTFILE='prova.sav'
I executem el pspp per convertir-lo des d'un terminal:
Si ens fixem donarà un error, que farà fallar el procés (almenys a mi me l'ha donat):
ES3179:1188.23-1188.25: error: FREQUENCIES: Error de sintaxi a `ALL': s'espera
`='.
Com ja he dit adés, no tinc ni idea de la sintaxis de SPSS, i per estalviar temps, vaig intentar la primera opció, amb èxit, comentar la línia, posant un caràcter sostingut (#) davant de l'última línia (FREQUENCIES VARIABLES ALL)., quedant així les tres últimes línies :
EXECUTE.
#FREQUENCIES VARIABLES ALL.
SAVE OUTFILE='prova.sav'
Ara el llancem (spss ES3179) i no hi haurà problema. Podrem importar les dades amb R. Jo per a R, utilitze el R Studio. Totalment gratuït, amb l'R Studio, podrem fer, File->Import Dataset-> SPSS i seleccionem l'arxiu prova.sav crea:
A partir d'ahí ja podem fer l'anàlisi de dades utilitzant la sintaxi de R, ja que ens crearà un dataset, per defecte prova corresponent amb el nom de l'arxiu. ;irant què és cada pregunta en en l'arxiu cues3179.pdf per exemple si volem recuperar totes les dades pertanyents al País Valencià (CCAA==10):
subset(prova, CCAA==10)
si volem saber la situació en l'eix esquerra dreta (Pregunta 34A) dels votants de Compromís-Podemos-EU (pregunta 35A):
summary(subset(prova, CCAA==10 & P35A=="6")$P34)
> summary(subset(prova, CCAA==10 & P35A=="6")$P34)
Min. 1st Qu. Median Mean 3rd Qu. Max.
1.000 2.000 3.000 5.341 4.000 98.000
>
El problema d'estos resultats (no és fiable) és que el les indeterminacions (No sap no contesta, etc. són 98, 99, etc, i fan pujar molt les mitges.
Per als curiosos, ací podeu veure un estudi que vaig fer, sobre les preferències dels ciutadans, sobre la seua problemàtica. El resultat clarament és l'atur, la corrupció i els polítics.
- El llenguatge de programació R: lliure, diponible per a Linux, OSX i Windows
- Sistema Operatiu LliureX
- Eines auxiliars que veurem després
El primer que necessitem per fer les anàlisis, és tindre les dades, les podem abaixar de la pàgina web del CIS. Haurem de fer clic en la icona de ZIP que diu Fichero de datos. Una vegada els abaixem (ens demana omplir un formulari, però no cal omplir-lo amb dades reals, ens hem abaixat les dades de juny del 2017) vegem dos arxius que estan en format SPSS que és, possiblement, el paquet estadístic més complet i famós que hi ha, però té un problema, no és lliure i la llicència no està a l'abast de la gent d'apeu. Els arxius en aquest cas són DA3179, l'arxiu de dades, i ES3179, l'arxiu de sintaxis que diu que és cada camp. Per tant, veurem si podem convertir-lo/obrir-lo amb una utilitat externa. Buscant en la xarxa, vaig trobar pspp, que és un intèrpret lliure més o menys compatible amb SPSS, però això implicava que debia aprendre a utilitzar-lo, i jo tinc ja coneixements bàsics d'R. Cercant un poc, intente llençar l'intèrpret i convertir-lo com a format de dades que R podré importar (sintaxis i dades tot en una), un arxiu .sav.
Simplement, afegirem a l'arxiu de sintaxi (ES3179) la línia següent al final de tot (l'última línia sol ser FREQUENCIES VARIABLES ALL.)
SAVE OUTFILE='prova.sav'
I executem el pspp per convertir-lo des d'un terminal:
Si ens fixem donarà un error, que farà fallar el procés (almenys a mi me l'ha donat):
ES3179:1188.23-1188.25: error: FREQUENCIES: Error de sintaxi a `ALL': s'espera
`='.
Com ja he dit adés, no tinc ni idea de la sintaxis de SPSS, i per estalviar temps, vaig intentar la primera opció, amb èxit, comentar la línia, posant un caràcter sostingut (#) davant de l'última línia (FREQUENCIES VARIABLES ALL)., quedant així les tres últimes línies :
EXECUTE.
#FREQUENCIES VARIABLES ALL.
SAVE OUTFILE='prova.sav'
Ara el llancem (spss ES3179) i no hi haurà problema. Podrem importar les dades amb R. Jo per a R, utilitze el R Studio. Totalment gratuït, amb l'R Studio, podrem fer, File->Import Dataset-> SPSS i seleccionem l'arxiu prova.sav crea:
A partir d'ahí ja podem fer l'anàlisi de dades utilitzant la sintaxi de R, ja que ens crearà un dataset, per defecte prova corresponent amb el nom de l'arxiu. ;irant què és cada pregunta en en l'arxiu cues3179.pdf per exemple si volem recuperar totes les dades pertanyents al País Valencià (CCAA==10):
subset(prova, CCAA==10)
si volem saber la situació en l'eix esquerra dreta (Pregunta 34A) dels votants de Compromís-Podemos-EU (pregunta 35A):
summary(subset(prova, CCAA==10 & P35A=="6")$P34)
> summary(subset(prova, CCAA==10 & P35A=="6")$P34)
Min. 1st Qu. Median Mean 3rd Qu. Max.
1.000 2.000 3.000 5.341 4.000 98.000
>
El problema d'estos resultats (no és fiable) és que el les indeterminacions (No sap no contesta, etc. són 98, 99, etc, i fan pujar molt les mitges.
Per als curiosos, ací podeu veure un estudi que vaig fer, sobre les preferències dels ciutadans, sobre la seua problemàtica. El resultat clarament és l'atur, la corrupció i els polítics.
Comentaris
Publica un comentari a l'entrada