Passa al contingut principal

Programari Lliure: Com llegir dades del CIS

Alguna vegada se sent parlar del CIS, de les dades cuinades, etc. Però, voleu fer els vostres propis anàlisis amb les dades del CIS? Em vaig proposar fer-ho, i per això vaig decidir fer-ho amb les eines que disposava.
  • El llenguatge de programació R: lliure, diponible per a Linux, OSX i Windows
  • Sistema Operatiu LliureX
  • Eines auxiliars que veurem després

El primer que necessitem per fer les anàlisis, és tindre les dades, les podem abaixar de la pàgina web del CIS. Haurem de fer clic en la icona de ZIP que diu Fichero de datos. Una vegada els abaixem (ens demana omplir un formulari, però no cal omplir-lo amb dades reals, ens hem abaixat les dades de juny del 2017) vegem  dos arxius que estan en format SPSS que és, possiblement, el paquet estadístic més complet i famós que hi ha, però té un problema, no és lliure i la llicència no està a l'abast de la gent d'apeu. Els arxius en aquest cas són DA3179, l'arxiu de dades, i ES3179, l'arxiu de sintaxis que diu que és cada camp. Per tant, veurem si podem convertir-lo/obrir-lo amb una utilitat externa. Buscant en la xarxa, vaig trobar pspp, que és un intèrpret lliure més o menys compatible amb SPSS, però això implicava que debia aprendre a utilitzar-lo, i jo tinc ja coneixements bàsics d'R. Cercant un poc, intente llençar l'intèrpret i convertir-lo com a format de dades que R podré importar (sintaxis i dades tot en una), un arxiu .sav.
 Simplement, afegirem a l'arxiu de sintaxi (ES3179) la línia següent al final de tot (l'última línia sol ser FREQUENCIES VARIABLES ALL.)
SAVE OUTFILE='prova.sav'
I executem el pspp per convertir-lo des d'un terminal:



Si ens fixem donarà un error, que farà fallar el procés (almenys a mi me l'ha donat):
ES3179:1188.23-1188.25: error: FREQUENCIES: Error de sintaxi a `ALL': s'espera
`='.

Com ja he dit adés, no tinc ni idea de la sintaxis de SPSS, i per estalviar temps, vaig intentar la primera opció, amb èxit, comentar la línia, posant un caràcter sostingut (#) davant de l'última línia (FREQUENCIES VARIABLES ALL)., quedant així les tres últimes línies :
EXECUTE.
#FREQUENCIES VARIABLES ALL.
SAVE OUTFILE='prova.sav'

Ara el llancem (spss ES3179) i no hi haurà problema. Podrem importar les dades amb R. Jo per a R, utilitze el R Studio. Totalment gratuït, amb l'R Studio, podrem fer, File->Import Dataset-> SPSS i seleccionem l'arxiu prova.sav crea:


A partir d'ahí ja podem fer l'anàlisi de dades utilitzant la sintaxi de R, ja que ens crearà un dataset, per defecte prova corresponent amb el nom de l'arxiu. ;irant què és cada pregunta en en l'arxiu cues3179.pdf per exemple si volem recuperar totes les dades pertanyents al País Valencià (CCAA==10):

subset(prova, CCAA==10)
 
si volem saber la situació en l'eix esquerra dreta (Pregunta 34A) dels votants de Compromís-Podemos-EU (pregunta 35A):

summary(subset(prova, CCAA==10 & P35A=="6")$P34)

> summary(subset(prova, CCAA==10 & P35A=="6")$P34)
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max.
  1.000   2.000   3.000   5.341   4.000  98.000


 El problema d'estos resultats (no és fiable) és que el les indeterminacions (No sap no contesta, etc. són 98, 99, etc, i fan pujar molt les mitges.

Per als curiosos, ací podeu veure un estudi que vaig fer, sobre les preferències dels ciutadans, sobre la seua problemàtica. El resultat clarament és l'atur, la corrupció i els polítics.

Comentaris

Entrades populars d'aquest blog

TDDs + reutilització d'objectes en Visual Studio 2012

Doncs això, mai m'he mostrat partidari de cap metodologia de programació, ni tan sols de la programació orientada a objectes... però deu ser que em faig major ;) Anem a matar en un post dos pardals d'un tir. Anem a gastar una de les bases de les metodologies àgils (en realitat no té per què, es pot emprar en qualsevol metodologia) i anem a començar a veure com fer codi "multiplataforma". Anem a gastar Visual Studio 2012. Creem una solució de Portable Class Library (en C#): Creem una nova classe, Dau: namespace RollDice {     public class Dau     {     } Sense cap mètode. Per què sense cap mètode? Ahí està la gràcia dels TDD (Test Driven Development, Desenvolupament Orientat a Test). Anirem omplint la classe segons fallen els tests. Ara anem a afegir una nova solució, què serà de test c#: Ens crearà una classe de test buida, li canviarem el namespace per a que siga el mateix que la classe dau: [TestClass]     public class testDau     {          [TestMethod

Reciclant un vell portàtil (i 3)

O també podria titular-se, la primera aplicació en Android. Crec que vaig a deixar d'intentar reciclar este ordinador, no pot amb l'eclipse, he intentat fer esta aplicació i m'ha costat déu i ajuda. Provaré a fer coses que necessiten entorn gràfic en un altre ordinador. Quan comence la part de servidor, si que podré gastar-lo de nou, ja que node.js (Recomanat pel meu amic Jaume) és molt lleuger, i amb la llibreta que duu windows es podrà fer els programes de sobra ;). Bo, la primera aplicació l'he modificada un poc de l'anterior (l'aspecte), i l'he deixat com en la figura. Simplement he posat un botó, i dos textView. No vaig a entrar en detalls de com es fa, de posar noms adients ni res per l'estil, ja que és una aplicació menuda i de prova. l'objectiu serà que en el textView2 (que no es veu, està davall del textView1) aparega un missatge "has apretat el botó" en el moment que apretes el botó. Anirem al fitxer principal en java, en el

Google no és programari lliure

Duc des de ni sé els anys treballant en Linux. De fet, vaig passar de MS-DOS a Linux sense passar per windows 95. Només he gastat windows (ho he de confessar)per a jugar, i farà un any, el windows 8. No m'ha agradat i ara he tornat a Linux. Valga esta confessió personal per explicar el meu dubte existencial. Hi ha molta gent que critica Apple o Microsoft i diu que l'alternativa és Android , i es compra un Samung, per exemple. M'he parat a pensa-ho i pràcticament és el mateix. Android pot ser bastat en Linux i tinga bona part de codi obert, però hi ha una part que no. I el núvol de Google és completament tancat (algú té el codi del buscador o de gmail?). En general (i a no ser que instal·lem alguna rom on tot siga lliure), és un poc més lliure que ios (Darwin, el codi font del kernel d'ios, és de codi obert, el que és tancat és la seua interfície). És a dir que els serveis que proporcionen les tres companyies (buscador, correu, núvol...) són igual de tancats (i estan sig