Passa al contingut principal

Programari Lliure: Com llegir dades del CIS

Alguna vegada se sent parlar del CIS, de les dades cuinades, etc. Però, voleu fer els vostres propis anàlisis amb les dades del CIS? Em vaig proposar fer-ho, i per això vaig decidir fer-ho amb les eines que disposava.
  • El llenguatge de programació R: lliure, diponible per a Linux, OSX i Windows
  • Sistema Operatiu LliureX
  • Eines auxiliars que veurem després

El primer que necessitem per fer les anàlisis, és tindre les dades, les podem abaixar de la pàgina web del CIS. Haurem de fer clic en la icona de ZIP que diu Fichero de datos. Una vegada els abaixem (ens demana omplir un formulari, però no cal omplir-lo amb dades reals, ens hem abaixat les dades de juny del 2017) vegem  dos arxius que estan en format SPSS que és, possiblement, el paquet estadístic més complet i famós que hi ha, però té un problema, no és lliure i la llicència no està a l'abast de la gent d'apeu. Els arxius en aquest cas són DA3179, l'arxiu de dades, i ES3179, l'arxiu de sintaxis que diu que és cada camp. Per tant, veurem si podem convertir-lo/obrir-lo amb una utilitat externa. Buscant en la xarxa, vaig trobar pspp, que és un intèrpret lliure més o menys compatible amb SPSS, però això implicava que debia aprendre a utilitzar-lo, i jo tinc ja coneixements bàsics d'R. Cercant un poc, intente llençar l'intèrpret i convertir-lo com a format de dades que R podré importar (sintaxis i dades tot en una), un arxiu .sav.
 Simplement, afegirem a l'arxiu de sintaxi (ES3179) la línia següent al final de tot (l'última línia sol ser FREQUENCIES VARIABLES ALL.)
SAVE OUTFILE='prova.sav'
I executem el pspp per convertir-lo des d'un terminal:



Si ens fixem donarà un error, que farà fallar el procés (almenys a mi me l'ha donat):
ES3179:1188.23-1188.25: error: FREQUENCIES: Error de sintaxi a `ALL': s'espera
`='.

Com ja he dit adés, no tinc ni idea de la sintaxis de SPSS, i per estalviar temps, vaig intentar la primera opció, amb èxit, comentar la línia, posant un caràcter sostingut (#) davant de l'última línia (FREQUENCIES VARIABLES ALL)., quedant així les tres últimes línies :
EXECUTE.
#FREQUENCIES VARIABLES ALL.
SAVE OUTFILE='prova.sav'

Ara el llancem (spss ES3179) i no hi haurà problema. Podrem importar les dades amb R. Jo per a R, utilitze el R Studio. Totalment gratuït, amb l'R Studio, podrem fer, File->Import Dataset-> SPSS i seleccionem l'arxiu prova.sav crea:


A partir d'ahí ja podem fer l'anàlisi de dades utilitzant la sintaxi de R, ja que ens crearà un dataset, per defecte prova corresponent amb el nom de l'arxiu. ;irant què és cada pregunta en en l'arxiu cues3179.pdf per exemple si volem recuperar totes les dades pertanyents al País Valencià (CCAA==10):

subset(prova, CCAA==10)
 
si volem saber la situació en l'eix esquerra dreta (Pregunta 34A) dels votants de Compromís-Podemos-EU (pregunta 35A):

summary(subset(prova, CCAA==10 & P35A=="6")$P34)

> summary(subset(prova, CCAA==10 & P35A=="6")$P34)
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max.
  1.000   2.000   3.000   5.341   4.000  98.000


 El problema d'estos resultats (no és fiable) és que el les indeterminacions (No sap no contesta, etc. són 98, 99, etc, i fan pujar molt les mitges.

Per als curiosos, ací podeu veure un estudi que vaig fer, sobre les preferències dels ciutadans, sobre la seua problemàtica. El resultat clarament és l'atur, la corrupció i els polítics.

Comentaris

Entrades populars d'aquest blog

Comparativa dels Sistemes Polítics Espanyol, Valencià i d'un partit polític. (II)

El Poder Executiu En l’Estat Espanyol, el poder executiu real bé donat pel President del Govern. Aquest triarà els Vicepresidents, Ministres, etc (directa o indirectament, alguns alts càrrecs els triaran els corresponent Ministres). No hi ha cap limitació al respecte la persona elegida (no ha de ser diputada, ni cap límit de formació, etc.).
Al País Valencià, l’òrgan executiu és el Consell, i, existeix, de manera anàloga, el president del Consell (què és, també, el president del Generalitat, el és conjunt d’institucions d’autogovern). S’elegix de manera anàloga al President del Govern espanyol, però amb la diferència que ha d’ésser elegit entre els diputats de les Corts Valencianes. Aquest procedirà, igual que al govern espanyol, a nomenar el seu gabinet.
Al Bloc Nacionalista Valencià, el poder executiu rau en l’Executiva Nacional. Aquesta, de manera tradicional, és triada al Congrés Nacional des d’un sistema de llista tancada majoritari. Encara que tradicionalment sol haver-hi només…

Anàlisi d'eleccions estatals

Estes eleccions (estatals) han marcat una important fita electoral en la comparació de forces, sobretot en l'eix esquerra dreta. Eixa ha segut l'agenda política, marcada, en la meua opinió, pel PSOE. La campanya ha consistit en la por a VOX i a que torne la dreta ( ja fa molts anys que gasten eixe argument), i esta vegada pareix que VOX ha segut una amenaça suficient per mobilitzar el vot on no s'ha sabut interpretar que tot era una campanya dirigida.
En especial, per a Compromís, ha segut un resultat, què, per ser políticament correcte, no a assolit els objectius: recordem que es plantejava traure'n 5 diputats i tindre grup parlamentari propi. El resultat ha segut el que tots sabem, 1 diputat.

Alguns en Compromís (i fora) atribueixen el resultat al no haver pacte amb Podemos. Però aquest partit, ha perdut un 25% de vots i un 40% dels diputats (difícil de fer els càlculs exactes per tal de destriar les confluències). Per tant, ajuntar-se amb un partit a la baixa (mentr…

TDDs + reutilització d'objectes en Visual Studio 2012

Doncs això, mai m'he mostrat partidari de cap metodologia de programació, ni tan sols de la programació orientada a objectes... però deu ser que em faig major ;) Anem a matar en un post dos pardals d'un tir. Anem a gastar una de les bases de les metodologies àgils (en realitat no té per què, es pot emprar en qualsevol metodologia) i anem a començar a veure com fer codi "multiplataforma".
Anem a gastar Visual Studio 2012. Creem una solució de Portable Class Library (en C#):
Creem una nova classe, Dau:
namespace RollDice
{
    public class Dau
    {

    }
Sense cap mètode. Per què sense cap mètode? Ahí està la gràcia dels TDD (Test Driven Development, Desenvolupament Orientat a Test). Anirem omplint la classe segons fallen els tests.
Ara anem a afegir una nova solució, què serà de test c#:
Ens crearà una classe de test buida, li canviarem el namespace per a que siga el mateix que la classe dau:
[TestClass]
    public class testDau
    {

         [TestMethod]
         public voi…