lunedì 26 gennaio 2015

Barzellette nel 2015

È arrivato il 2015. Il materiale per le ornitoteche lievita in continuazione. Certi cinguettatori continuano a fornire elementi a sostegno di giudizi poco lusinghieri.

In questa ornitoteca troviamo una piccola piccionaia di fenomeni perniciosi e di infima caratura intellettuale e morale1; i piccioni che la popolano fanno sfoggio, impettiti e tronfi, delle loro migliori qualità intellettive: boriosa ottusità, inguaribile ignoranza, cieca stupidità. Ed erano già di certo privi di una briciola di quel qualcosa che viene chiamato onestà intellettuale.

Vediamo quali sono le idee che suggeriscono l'impietoso giudizio su questi personaggi.2


Casus belli

La “vicenda” ruota intorno alla creazione di un sito, OpenTG, fatto «allo scopo di diffondere i risultati del monitoraggio sul pluralismo politico in televisione» (enfasi aggiunta), come spiegato nella descrizione del progetto. Il sito offre

  • «Grafici interattivi per monitorare il pluralismo politico-istituzionale nei telegiornali dei principali gruppi editoriale» (Consulta i dati)
  • «Analisi e approfondimenti sulle presenze di soggetti politici e istituzionali nei palinsesti e nei telegiornali nazionali» (Notizie)
  • «Galleria di grafiche realizzate a partire dai dati del monitoraggio televisivo, dandone una lettura visuale e immediata» (Infografiche)
  • «Documenti della Commissione di Vigilanza Rai e dall’Autorità per le garanzie nelle comunicazioni» (Archivio)

Le enfasi sono tutte aggiunte.

C'è un tale VoceIdealista che fa un pigolio linkando un post su un blog, Il merdone quotidiano (nomen omen), dove un adolescente3 crede di aver smontato l'utilità del sito. VoceIdealista sposa palesemente le idee di questo adolescente.

Se andate a leggere l'articolo dovrebbero cadervi le braccia4. L'adolescente, tra le altre cose, se la prende con le pretese con cui il sito è stato pubblicizzato:

  • «[…]Grazie al M5S da oggi tutti i cittadini possono verificare lo stato dell’informazione in Italia[…]» (enfasi aggiunte)
  • «Nasce OpenTg, uno strumento a disposizione dei cittadini per poter agevolmente consultare i dati relativi alla presenza di forze politiche e istituzioni in tv.[…]» (enfasi aggiunte) (M5S Parlamento)5

Il sito non nasconde il fatto che la base di dati sia quella di AgCom. Ma per l'adolescente del Merdone quotidiano sembra quasi che si tratti di uno scoop sensazionale e lo scrive trionfante: «Peccato che i dati siano consultabili da TUTTI on line sul sito Agcom». L'epifania del giornalista investigativo improvvisato che guarda il mondo con i paraocchi della sua beata ignoranza. Poi aggiunge, a conferma (!) della sua “scoperta”: «Ed infatti i dati riportati sul sito OpenTg hanno come fonte,guarda un pò,Agcom.»6

Questa VoceIdealista (alcuni tweet ci suggeriscono che sia un biologo che ha studiato statistica…) riprende queste “interpretazioni”.

Alla banalizzazione contenuta nel tweet (e nel post del blog merdone) rispondo in modo molto semplice, con un tweet che è una constatazione.

elaborare dati,graficare ecc. dà(se fatto opportunamente)valore aggiunto. i dati grezzi sono muti.

Viste le risposte è evidente che ho sopravvalutato le “capacità” di VoceIdealista7 e del resto della feccia piccionica in ascolto.

Spieghiamo allora a questo biologo idealista che ha studiato statistica e all'adolescente, ovunque egli sia, che esiste una “industria” (in più di un'accezione) che si regge sulla presentazione e trasformazione dei dati: qualcuno li fornisce (grezzi); altri (alcuni saranno anche gli stessi…) li prendono, ci fanno grafici, figure, infografiche, quadretti, sculture, elaborazioni di vario tipo, analisi statistiche, e quanto altro pensano possa portare alla luce qualcosa di interessante, che non è affatto evidente dai dati grezzi8.

Quando l'adolescente (con l'approvazione del biologo) afferma che i dati sono già consultabili da tutti, sta dicendo una verità banale che però è ingannevole: il fatto che tutti possano materialmente accedere ai dati non significa che tutti siano in grado di “leggerli”, di “estrarne un significato” con un qualsivoglia metodo.

Se qualcuno sostiene che un documento come questo sia “parlante” e fruibile da tutti in modo del tutto equivalente a questo, o a un grafico statico fatto a partire da quei dati, non ci lascia alternative a giudizi poco lusinghieri su di lui.

La volgare banalizzazione che fa l'adolescente (e che il biologo VoceIdealista approva) sottolinea la sua crassa ignoranza:

In pratica lo staff […] riprende i dati già fruibili sul sito ufficiale,fa un grafico colorato e,SCONVOLGENTE,lo rende nuovamente fruibile attraverso il sito registrato da…Roberto Fico.9

Se non vi sono cadute le braccia prima, dovrebbero cadervi con questa risposta del biologo che ha studiato statistica:

Ma è una barzelletta?

Un biologo che ha studiato statistica e che afferma che «i dati10 sono muti per chi non li sa leggere»11 dovrebbe far ridere o piangere?12

Il biologo che ha studiato statistica sta dicendo che se visualizzo i dati come l'immagine seguente (è solo una delle 6 pagine che risulterebbero da una stampa di certi dati13)

lui li saprebbe “leggere”; poi li analizzerebbe su gaussiana, perché capisce al volo che da qualche parte una gaussiana ci sta bene — tanto è sempre così: «I dati si analizzano su gaussiana», sennò che analisi è?

Io, che sono un comune mortale, voglio invece proprio dare un'occhiata a questi dati… voglio graficarli, pure se so già cosa sono e come sono stati presi14. Chi sostiene che i grafici siano inutili non è che un ignorante15; affermo l'utilità dei grafici con l'ironia, perché tanto è già chiaro che lontano non si può andare:

infatti i grafici sono inutili,hai ragione. ignorante 2.16

Magari i lettori sono d'accordo con il biologo: infatti è ovvio che quei dati, avendo esattamente lo stesso contenuto “informativo” di qualunque loro rappresentazione, sono tutto ciò di cui abbiamo bisogno; non li sapete “leggere”? Non vi viene in mente di “analizzarli su gaussiana”? Evidentemente siete stupidi e avete bisogno, come me, di graficarli per vedere se viene a galla qualcosa di interessante17; cosa che ho fatto, come potete vedere nell'immagine seguente18, di cui i veri scienziati, e in particolare i biologi che studiano statistica, possono fare a meno.

Quanto sostenuto dal biologo VoceIdealista (e dalle pecorelle alate che fanno il coro da stadio19) è imbecille e in sostanza persino antiscientifico.

Ma tu sei “grillino”, quindi…

È un bastone classico usato da questi idioti, costruito col legno di uno stereotipo distillato giorno dopo giorno da quando il M5S ha cominciaato a farsi strada seriamente nella politica: un “grillino”, cioè uno che ha votato il M5S, deve essere per forza stupido e ignorante e dire fandonie d'ogni tipo, a cominciare dalle tesi complottiste più assurde20; al contrario, chi non ha votato M5S è sicuramente intelligente, e qualunque cosa dica, specie “contro” il M5S, è per forza giusta.21

Io ho votato il M5S22, quindi la mia parola non ha peso per questa marmaglia che giudica le affermazioni in base a chi le fa, a prescindere dal contenuto: sono uno che «non capisce un cazzo» però pretende di sapere e al biologo che ha studiato statistica suscito una gran pietà.

Il biologo sostiene che io abbia detto che «il grafico è l'analisi dei dati»23 (strawman fallacy), quando sto solo sostenendo l'importanza di graficare i dati… magari con la statistica sì (secondo lui), ma con l'italiano forse non ha un ottimo rapporto

Se l'esempio che ho fatto prima con il Cesio-137 non vi ha convinti… allora propongo anche a voi un link, il primo trovato, che spiega l'importanza di graficare; perché di questo si stava parlando: loro (l'adolescente, il biologo e le pecorelle alate) stanno sostenendo che OpenTG sia inutile perché fa “solo” grafici24 a partire da dati AgCom, che sono già disponibili a tutti. Nella pagina linkata potete leggere:

Graficare, o visualizzare, i tuoi dati è importante per ogni analisi dei dati, e dovrebbe sempre essere fatto prima dell'uso di test statistici o della costruzione di modelli. Per illustrare perché la visualizzazione dei dati dovrebbe essere un passo preliminare nel processo dell'analisi dei tuoi dati[…]25

È abbastanza chiaro?

Il biologo invece insiste con affermazioni che fanno rabbrividire (specie se si pensa a quanto abbiamo dedotto, cioè che sia un biologo che ha studiato statistica).

analizzare i dati presuppone eseguire calcoli statistici, non fare geafici con Excel

Parentesi. Anche se spesso e volentieri l'espressione analisi dei dati assume un significato specifico, non bisogna dimenticarsi che la parola analisi non ha un significato così rigido e ristretto. Possiamo ben dire «analizziamo i dati» come Hercule Poirot direbbe «analizziamo i fatti»26. Ma menti elastiche come il quarzo potrebbero trovare queste sfumature un po' troppo cromatiche.

Del resto sappiamo già, sempre per sua bocca, che i dati si analizzano su guassiana… Consideriamo per esempio i conteggi di cui sopra: ci calcoli la media (è un «calcolo statistico»), o ci fai una bella regressione lineare27… ovviamente dopo averli “analizzati su gaussiana”… e puoi dire di averli analizzati. Guai a te se prima di provare questa strada ti passa per la testa di vedere come sono distribuiti i “punti”. Guai. I grafici sono per quelli che non sanno leggere i dati

La parentesi del Male

Il Male è sempre il Male, e quando la bile che gli comprime il cervello aumenta troppo la pressione, gli schizza fuori e si deposita in pigolii arguti e colmi di intelligenti ironie. Fatte da uno con una cultura umanista che è già ignorante come umanista, figuriamoci quando s'atteggia a pseudoscienziato e finge di capire ciò che dovrebbe per poter esprimere un giudizio. Ma si arroga lo stesso il diritto di parlare, perché ha dalla sua il biologo scienziato, la sua auctoritas, sulla quale fa affidamento per gonfiare il petto. E fa eco all'idiozia del biologo in questo modo:

Dunque i dati della realtà (!) vanno interpretati senza disegnini… I grafici, molto importanti per quanto su detto e anche “mostrato” in pratica, seppure senza essere seguiti da alcun altro tipo di elaborazione e analisi, diventano «disegnini». E pensa che idiota che sono: mi aspetto pure che ci sia una «dettagliata didascalia» che magari spieghi cos'è quel grafico…

E per la terza volta

@MaleInItaly1978 @VoceIdealista ignoranti 3. è evidente che nn avete mai avuto a che fare con mole di dati significativa.

È chiaro che se hai due scontrini del latte e vuoi farti un'idea dell'andamento del suo prezzo, non hai bisogno di fare grafici (né regressioni lineari né “analizzarli su gaussiana”). Se ne hai 1000, magari fare un grafico dei prezzi nel tempo è l'unico modo per assaporare subito l'andamento del costo della bevanda. Poi se ti sembra che cresca o decresca in modo lineare, ci butti in mezzo una regressione lineare28… però non puoi dire di aver analizzato veramente i dati finché non li “analizzi su gaussiana”, ci dice il biologo; potete chiamare il biologo e il Male per farvi dare una mano.

Se un grafico è un'analisi

Ripeto per comodità quanto già riportato dalle prime righe di The Importance of Graphing Your Data:

Graficare, o visualizzare, i tuoi dati è importante per ogni analisi dei dati, e dovrebbe sempre essere fatto prima dell'uso di test statistici o della costruzione di modelli[…]

Da questo testo si può evincere che la visualizzazione dei dati, che precede l'uso di «test statistici» o la «costruzione di modelli», può essere considerata parte dell'analisi dei dati stessa, e non un passaggio accessorio che non ha nulla a che fare con essa.

In questo articolo, Using Graphs and Visual Data in Science, si legge (enfasi aggiunte):

[…] Sebbene i dati numerici siano inizialmente compilati in tabelle o database, spesso sono riportati in forma grafica per aiutare gli scienziati a visualizzare e interpretare le variazioni, i pattern, gli andamenti all'interno dei dati. […]

La rappresentazione visiva di dati scientifici è usata da secoli […] ma la presentazione visiva di dati numerici in forma di grafici è uno sviluppo recente. […]

Il grafico di Playfair mostrava un messaggio potente molto succintamente. Il grafico mostra il tempo sull'asse orizzontale (x) e i soldi in sterline inglesi su quello verticale (y). […] Sebbene una tabella dei dati numeri avrebbe mostrato la stessa informazione, non sarebbe balzato all'occhio che qualcosa di importante era avvenuto nel 1753: l'Inghilterra cominciò ad esportare più di quanto importasse[…]. Questa semplice visualizzazione di un ampio insieme di dati numerici rese facile comprenderlo rapidamente.

Grafici e figure divennero velocemente componenti standard della scienza e della comunicazione scientifica […] L'incremento [di immagini nelle riviste scientifiche] è stato attribuito a diverse cause, tra le quali l'uso del computer che rende facile la creazione di grafici, ma anche la produzione di insiemi di dati sempre più grandi e complessi che necessitano della visualizzazione per essere interpretati.

I grafici non sono solo una forma di visualizzazione dei dati, comunque […]. La creazione, l'uso, e la lettura di forme visive di dati è soltanto uno dei tipi di interpretazione e analisi dei dati […], ma è onnipresente in tutti i campi e metodi dell'investigazione scientifica.

In conclusione, un grafico a torta può essere considerato un'analisi… ma forse la “sottigliezza” di queste informazioni è troppo per la mente dei piccioni.

Altri esempi

Visualizzare dati, graficarli, è una pratica standard.

I cialtroni comparsi in questo “filo di pigolii”, ovvero VoceIdealista, MaleInItaly197829, GattoMatto, Cernenko+H e GegnoGrillino30, dovrebbero aver sentito parlare di opendata.

Chi rende disponibili (a uomini e a macchine31) i dati seguendo filosofia e pratiche degli opendata può dare anche la possibilità di visualizzarli32 (tramite grafici fatti pari pari a partire dai dati, senza “analizzarli su gaussiana”, senza regressioni lineari…) in modo che chiunque possa “leggerli”. Se non sono forniti strumenti di visualizzazione online, i dati non sono immediatamente fruibili: difficilmente riescono a “raccontare” qualcosa.

Per esempio l'ISTAT («il più grande produttore di opendata in Italia») permette di visualizzare online i suoi dati (potete sperimentare per esempio con le statistiche della pubblica amministrazione33):

Volendo potete usare il comodo end-point per i dati della Camera: il form sulla pagina web permette di scrivere una query SPARQL, che tutti conoscono. Se non arrivate né al malleolo né all'astragalo del Male e del biologo statistico, potete vedere se c'è qualche “app” o qualche sito che prende questi dati e ci fa dei «disegnini» di vostro gradimento…

A proposito della Pubblica Amministrazione, c'è anche il sito Soldi pubblici (in beta)… Andate in basso e leggete: «Su dati SIOPE». Ora, seguendo lo sragionamento di questi penosi piccioni, questo sito è un totale spreco di tempo e risorse; l'adolescente del Merdone quotidiano (seguito dai belati del biologo) magari scriverebbe qualcosa di simile a questa: cioè capito, cioè, questi prendono dati già disponibili a tutti, cioè sono dati SIOPE, e ci fanno dei grafici colorati e, “sconvolgente”, cioè, no dico, li rendono nuovamente fruibili attraverso il sito registrato da…34

Ecco un grafico colorato fatto dal sito:

Riporto anche alcune delle parole della descrizione del progetto:

soldipubblici.gov.it vuole promuovere e migliorare l’accesso e la comprensione dei cittadini sui dati della spesa della Pubblica Amministrazione, in un’ottica di maggiore trasparenza e partecipazione […]

Le prossime tappe del progetto riguarderanno la possibilità di effettuare direttamente il download dei dati che comunque, già oggi, possono essere liberamente scaricati attraverso la piattaforma SIOPE.

Soldi buttati insomma: c'è già tutto sulla piattaforma SIOPE

E pensate che scempio: all'Hackaton CODE4ITALY@Montecitorio35 «la commissione giudicatrice […] ha determinato i primi tre progetti meritevoli di premio», e questi sono stati:

  • Camera 4 DUMMIES: «Camera4Dummies apre le porte della Camera dei Deputati a tutti, rendendo fruibili i dati riguardanti i nostri rappresentanti politici»
  • SocialCamera: «Open Data più fruibili, Social Network più credibili: Come arricchire gli opendata con fonti esterne per renderli meno noiosi»
  • PaLmaS: «Visualizzazione del processo legislativo»

Tutti progetti che usano dati già disponibili: non fanno “analisi su gaussiana” né regressioni lineari né eseguono calcoli statistici. Insomma non fanno analisi dei dati e si limitano “solo” ad aggregarli e ri-usarli (cioè usano dati già fruibili da tutti).

In pratica è proprio l'idea alla base di OpenTG ed è uno degli «obiettivi principali» dichiarati (il “corsivo” è mio):

uno degli obiettivi principali del progetto è quello di rendere fruibili i dati statistici attualmente disponibili sotto forma di report e comunicazioni dell’Autorità.

Conferme di stupidità, tare nei ragionamenti e difetti di comprensione…

Dovrebbe essere abbastanza per capire perché li ho definiti “ignoranti” nei tweet, dove sono stato abbastanza politically correct. Ma i tweet mostrano come non siano solo ignoranti.

In un altro post, un giorno forse vicino, forse lontano, farò qualche altra considerazione sulla difficoltà di comprensione che questi soggetti hanno esibito; involontarie (cioè non consapevoli) strawman fallacies, una falsa analogia, nonsense, le solite invettive da stormo di piccioni, sono già indizi interessanti. In realtà ho già messo quasi tutto, o comunque si può ricavare risalendo con i tweet padri e figli… Si parla di visualizzare i dati per rendere manifeste alcune peculiarità… sarebbe interessante creare un grafico dei tweet per “vedere” lo spaparanzamento dei nessi nel discorso (non certo per mano mia).

Una noticina finale.

Nell'abstract del documento “Using Statistical Graphics to Understand Your Data” potrebbe esserci la spiegazione dei limiti e dei problemi di questo biologo-piccione in termini di un cambiamento nel “paesaggio culturale” di un'intera classe di studiosi, mutamento che forse si è riflesso nei libri su cui alcuni hanno studiato e quindi è tracimato nella prassi… in un vortice che si autoalimenta, infettando giovani studentelli poco svegli e un po' robottini, rendendoli mezzi ciechi.

Figures and graphs are often used to present the results from statistical analyses. As business graphics become increasingly common, there is an expectation that much (if not most!) numerical data will be presented in graphical form. This is, generally, a good thing […]. But statistical analysts seem to have lost sight of the value of using graphical displays to better understand the data they are analyzing.[…]»

(Enfasi aggiunte.)

Dubito però che il vero problema dei piccioni sia dovuto a questo.


  1. Con le parole di uno dei personaggi, il Male, sul quale avrò modo di scrivere altro (tempo e voglia permettendo): «per il nuovo anno mi son ripromesso d'essere delicato».

  2. Per non tediare troppo i lettori ho dovuto tagliare un bel po' di dettagli che pure meriterebbero il loro glorioso angolino; per ora vanno ad accrescere il cumulo di materiale per future ornitoteche e l'archivio degli elementi di giudizio in sfavore delle persone dietro i personaggi.

  3. Quanto si legge sul blog non permette di supporre un'età mentale e una cultura di un uomo adulto — tranne nel caso in cui sia tra i sette italiani su 10 a non capire la lingua. Mi sembra più probabile quest'ultimo caso, purtroppo. Quando esce fuori che questi brillanti usi dell'intelletto umano e della cultura scientifica e umanistica sono frutto di sedicenti biologi, ingegneri, avvocati, matematici… è in quel momento che vediamo che il tessuto culturale si sta sgretolando.

  4. I miei destinatari immaginari appartengono alla specie Homo sapiens sapiens. Invece i piccioni molto probabilmente sosterranno qualcosa come questa: quello del Merdone quotidiano è un ottimo articolo, intelligente e approfondito, e per fortuna esistono persone tanto intelligenti che vi fanno aprire gli occhi con questi articoli…

  5. Il testo prosegue così: «[…]Curato da Roberto Fico, portavoce del Movimento 5 Stelle, Open TG offrirà a tutti i cittadini la possibilità di verificare, con grafici e dati, lo stato del pluralismo dell’informazione nel Paese. E’ dotato di un ampio archivio e della possibilità di selezionare in base a parametri quali testate giornalistiche, canali, forze politiche e tempi di notizia e parola. Open TG è il primo esperimento del genere in Italia. Il pluralismo è un elemento essenziale, alla base stessa della sopravvivenza di uno Stato democratico. Per questo motivo va tutelato e monitorato, da tutti!»

  6. Il testo è copiato verbatim, ovviamente: «pò» e mancanza di spazi dopo le virgole sono nel testo originale.

  7. Da un tweet che vorrebbe essere sarcastico (almeno così mi è parso) — «@shintakezou_it @MaleInItaly1978 sai com'è, la biologia si studia si fa senza statistica» — possiamo dedurre che questa VoceIdealista si stia vantando di essere un biologo e di aver perciò studiato statistica. Per quello che dice dubito che abbia capito anche a cosa può servire… Perché lo dico sarà più chiaro, spero, in seguito.

  8. Quello che dicono i «dati grezzi» è “nascosto”, cioè i dati grezzi sono muti, come ho detto loro.

  9. Mette poi l'immagine di un “whois” sul dominio; non si capisce bene cosa vorrebbe insinuare ricordando che il sito, ideato da Fico e altri, è registrato — guarda che macchinazione machiavellica! — a Fico stesso… Forse il segreto è nel paragrafo successivo: «Deve averci pensato talmente tanto Roberto Fico (Presidente commissione vigilanza Rai) da non essersi accorto che il SacroBlog (sede del M5S) nel frattempo ospitava pubblicità alla RAI (guadagnandoci..).» Un altro della risma del “o mio dio c'è un flusso di soldi non pubblici che fluisce nelle tasche del signor Grillo e della Casaleggio attraverso il blog!”? Anche peggio: sembra quasi voler insinuare una specie di conflitto di interessi o uno squilibrio nella par condicio sulla base della sua incapacità a distingue tra “RAI che ospita un esponente politico” e “sito che ospita pubblicità commerciale della RAI”. Inoltre la pubblicità sul blog è data da Google (e “calibrata” sul visitatore, in base ai dati disponibili); alcune categorie possono essere escluse (in teoria e posto che il fornitore sia stato categorizzato correttamente), ma dubito che esista un modo per dire “non mettere la pubblicità della RAI” — né vedo alcun motivo ragionevole per farlo, se fosse possibile.

  10. Io avevo scritto «dati grezzi». Già comincia la fiera della semplificazione, reinterpretazione a cazzo di cane e poi, puntuale come un orologio atomico, arriverà l'arte di attribuire affermazioni non fatte all'interlocutore — una fallacia di quelle che abbiamo già più volte visto, l'uomo di paglia, dagli anglosassoni detta strawman fallacy.

  11. Qui sta ovviamente insinuando che io non sappia leggere i dati. Confermo, a meno che non siano 4 numerelli in croce: anche io ho bisogno di qualche «fregnaccia» che li ravvivi, ma non per rendere «tutto più commerciabile», bensì per fruirne… ma dire così è persino riduttivo. Infatti mostrerò nel testo che “graficare” i dati è molto importante, oltre che utile. Questo Marco K. Cernenko+H è un piuacchista — ci si poteva aspettare che scrivesse qualcosa di più intelligente di questo? oh, be', basta cambiare il testo e la stessa immagine descrive perfettamente anche lui… Il suo tweet svela l'accanimento per la salvaguardia delle sciocchezze affermate dall'adolescente nel blog Il merdone quotidiano e ribadite dal biologo. Alla gentaglia non interessa affatto interrogarsi seriamente sull'utilità del sito, investigarne le potenzialità e magari, sospettando di trascurare qualche informazione, guardarsi attorno per vedere cosa dice il mondo sul “fare grafici di dati”. Troppo per le loro connessioni neurali. Il sito per loro è per definizione una specie di imbroglio, una cosa inutile, una stupidaggine, poiché è fatto dal M5S e da questo “pubblicizzato” anche con affermazioni che possono sembrare roboanti (ma non insensate) pretese. Si è ben oltre il pregiudizio, come palesano gli altri tweet.

  12. Forse un «soggetto del genere» deve muovere a compassione… certamente personaggi come lui «suscitano una gran pietà».

  13. Per economia di spazio ho messo in colonna i dati ma, se stampaste il file originale, ammirereste un noioso elenco di coppie di valori, una per riga, per un totale di 4096 righe.

  14. Per essere precisi quelli sono già dati un po' “trasformati” rispetto all'output dello strumento: c'è una intestazione (che è stata rimossa) seguita dai conteggi, 16 per riga (la riga è terminata con un Carriage Return e ha il numero del primo “indirizzo” in prima posizione), per un totale di 4096 “indirizzi” — dalla descrizione mal fatta può sembrare complicato, ma se si dà un'occhiata al contenuto del file, si capisce al volo… A ciascun “indirizzo” corrisponde una certa energia del fotone incidente (la “corrispondenza” si trova usando una sorgente radioattiva di cui sia già noto lo spettro γ). I dati estratti sono un noioso elenco di 4096 righe, ciascuna contenente due numeri: l'“indirizzo” e il conteggio.

  15. Il mondo “moderno” è zeppo di visualizzazioni di dati, di grafici; quale lettore non se ne è accorto? Le “letture grafiche” sono utili e non è affatto necessario, come fa credere quest'orrida voce idealista, ”analizzare i dati su gaussiana” o fare regressioni lineari, anche perché nessuna di queste due cose ha necessariamente senso per tutti i dati del mondo… un dettaglio da poco…

  16. «Ignorante 2» perché 1) il primo «ignorante» affibiato è stato quello al “simpatico” vecchietto, evidentemente da estendere agli altri due e quindi preferire il plurale «ignoranti»; 2) nelle menzioni al già citato tweet c'era pure lui e il senso dell'affermazione «il punto è mostrare un "significato" che non è evidente dal dato grezzo» non è difficile da comprendere.

  17. La scelta del grafico di solito presuppone sapere cosa sono quei dati. Ma questo è praticamente sempre implicito: i dati vengono da “misure” e non sapere cosa sono vorrebbe dire non sapere cosa è stato misurato. Potremmo avere tra le mani dei “dati” senza avere la più pallida idea di che si tratti? Se accadesse, metterei il problema accanto a quelli di decifrazione di codici o lo considererei un indovinello. Se mi fornissero una tabella di due colonne di numeri… intanto proverei a vedere che esce fuori con un grafico di dispersione (uno scatter plot, come dicono gli inglesi).

  18. Questa è l'immagine che avevo in un vecchio archivio (convertita in JPG perché l'originale era IFF): si tratta proprio del plot fatto al volo per buttare un occhio ai dati e controllare che fossero a posto; per questo non mi curai di definire l'ascissa (gli “indirizzi” — a quali energie corrispondevano era ancora da determinare) e l'ordinata (i conteggi). Appare evidente la presenza di una coda a cui non siamo interessati e che va a confondersi con il rumore (altro dato, ottenuto “registrando” l'output senza alcuna sorgente); nelle elaborazioni successive la coda fu perciò tagliata.

  19. Nessuna delle pecorelle ha l'aria di capirci molto dell'argomento; ma quel che dice il signor biologo (o il signor adolescente) incontra i loro gusti e le loro aspettative, per cui deve essere vero e devono dare il loro supporto. Qualcuna di queste pecorelle è stata già citata e compare altrove… a parte questo dettaglio… ve le presento brevemente: • il Male: “costituzionalista” tarantino, funzionario delle nazioni unite, in passato si è mantenuto all'estero insegnado l'italiano e perciò elargisce “analfabeta” a destra e manca, anche se poi sbaglia gli accenti…; • un GattoMatto che non ha molto da dire sul tema, ma parla lo stesso, affermando di me — senza che ci fossimo mai nemmeno incrociati prima su Twitter — ciò che è certo più consono se riferito a lui; • il “simpatico” vecchietto Marco K. Cernenko, già presentato in un'altra nota, e la cui caratteristica principale è quella di dichiararsi parte del branco dei piuacchisti; • GegnoGrillino, uno di quei personaggi (persone dietro un account Twitter) che hanno un solo scopo, che non è, al contrario di quello che si direbbe leggendo i suoi tweet, quello di apparire il più coglione possibile, anche se questo è quello che gli riesce meglio.

  20. Quelle ragionevoli e verosimili, o anche le altre ma epurate degli elementi più stravaganti o antiscientifici, sono riservate a quelli intelligenti che non votano il M5S; però in tal caso non si parla, per ovvi motivi, di complotti.

  21. Per ottenere consensi da alcuni di questi decerebrati potrebbe bastare formulare un'affermazione assurda in modo da far credere che qualcuno del M5S sostenga l'esatto contrario…

  22. In realtà i personaggi coinvolti potrebbe anche non saperlo. L'elemento che glielo fa pensare è che sto “difendendo” qualcosa fatto dal M5S. Poiché tutto quello che fa il M5S è cacca, i Giusti non possono “difenderlo”, nemmeno da critiche imbecilli. Se qualcuno lo fa è perché non è un Giusto, e poiché i non-Giusti sono tutti “grillini”, allora chi “difende” qualcosa fatto dai “grillini”, ovvero “attacca” una critica imbecille mossa contro qualcosa fatto dal M5S, è per forza un loro elettore o attivista. Nel caso specifico è vero: ho votato il M5S e non ho avuto ancora modo di pentirmene; ci sono questi personaggi su Twitter a ricordarmi che i rozzi, volgari, infimi, ignoranti, stupidi e imbecilli ci sono ovunque — cioè, non è di certo la forza politica che si vota a determinare le qualità umane e intellettive delle singole persone.

  23. Quella che il biologo-piccione mi attribuisce non è una mia affermazione, ma comunque non sarebbe del tutto sbagliata: il grafico può essere considerato parte del processo di analisi dei dati. Anche senza gaussiane e regressioni lineari, la visualizzazione dei dati permette di fare un'analisi — non statistica, è ovvio, e nemmeno quantitativa; ma si possono vedere trend, massimi e minimi assoluti (relativamente ai dati che si è scelto di visualizzare) e locali, regolarità o irregolarità… Comunque non posso sostenere questa idea perché sono “grillino”: devo trovare qualcuno che lo affermi e non abbia votato il M5S e che, pur dicendo una cosa simile, sia d'accordo con il fatto che il sito OpenTG sia una boiata pazzesca… Questa è la natura del pensiero libero dei piccioni.

  24. Ammesso che il sito faccia effettivamente solo questo e ammesso che farà sempre e solo questo e non aggiungerà qualche altro tipo di strumento per analizzare i dati. Rileggete e riflettete bene su questa frase in corsivo e dimenticatevi le cazzate scritte dal biologo sul significato ristretto di “analizzare i dati” e riflettete anche sulle capacità della mente umana di scovare relazioni e strutture visivamente (dunque grazie a opportune rappresentazioni grafiche e non su elenchi di numeri).

  25. «Graphing, or visualizing, your data is important to any data analysis, and should always occur before the use of statistical tests or model building. To illustrate why data visualization should be an early step in your data analysis process[…]»

  26. In nessuno dei miei tweet parlo di analisi di dati. Ho usato il versatile verbo «elaborare» nel primo tweet, nel quale faccio un'affermazione generica e non sto affermando che il sito OpenTG faccia tutte le cose esplicitamente o implicitamente («ecc.») presenti nell'elenco (i grafici ci sono, interattivi, il che ci porta pure a dedurre alcuni tipi di elaborazioni). È Rino La Fox ad usare il verbo «analizzare»: «i dati hanno bisogno di essere analizzati». Che è un'affermazione sicuramente giusta in generale. Nel contesto del tema (OpenTG), supponendo che sul sito si trovino “solo” grafici dei dati o di elaborazioni di questi dati (non annoveriamo queste eventuali elaborazioni tra gli strumenti di analisi perché sennò le teste piccioniche di VoceIdealista e GegnoGrillino scoppiano), l'affermazione continua ad avere un senso proprio perché «graficare, o visualizzare, i tuoi dati è importante per ogni analisi dei dati» e dunque, anche se il sito OpenTG non conclude l'“analisi dei dati”, sicuramente l'inizia. (Secondo il biologo “analizzare i dati” «presuppone eseguire calcoli statistici», quindi per tutti i dati sui quali non ha senso eseguirli non sarà mai possibile dire di averli analizzati… a parte questo, è sufficiente che OpenTG calcoli la media di una serie perché finalmente si possa dire che sta facendo “analisi dei dati”, à la VoceIdealistà…)

  27. In uno dei suoi vaneggiamenti mi invita a fare una regressione lineare con un diagramma a torta: «fai una regressione lineare con un diagramma a torta, se ci riesci. Vinci un Nobel!». Altra strawman, che spero di non dover spiegare (non qui, almeno).

  28. Una volta graficati ti puoi accorgere di un prezzo un po' “anomalo”… vai a vedere meglio lo scontrino e ti accorgi che è quello della carne… Allora lo scarti…

  29. Il Male è tutto un programma: una miniera d'oro veramente tanto prolifica. Avrà il suo spazio in particolare per le sue prodi affermazioni sulla lingua e qualche altra cosuccia.

  30. MatmanBlog mette tra i preferiti I dati si analizzano su gaussiana e il tweet dove il gegno ironizza sul fatto che un «grafico a torta» possa essere considerato un'analisi. Un promemoria per non perdere anche questo gegno MatmanBlog.

  31. L'uomo di solito va su una pagina web dove, clicca qui e clicca lì, gli verrà consentito di scaricare un csv, o un “file Excel” (argh!), o un file in qualche altro formato, contenente i dati richiesti — in certi casi gli verrà permesso anche di “graficare” i dati sul sito stesso. Rendere disponibili i dati alle “macchine” di solito significa fornire degli end-point che consentono ad “agenti non umani” (ma programmati da umani, ça va sans dire) di prendere i dati, secondo quello che ci si vuole fare.

  32. L'uomo di solito va su una pagina web dove, clicca qui e clicca lì, gli verrà consentito di scaricare un csv, o un “file Excel” (argh!), o un file in qualche altro formato, contenente i dati richiesti — in certi casi gli verrà permesso anche di “graficare” i dati sul sito stesso. Rendere disponibili i dati alle “macchine” di solito significa fornire degli end-point che consentono ad “agenti non umani” (ma programmati da umani, ça va sans dire) di prendere i dati, secondo quello che ci si vuole fare.

  33. Cfr. Open data in Istat.

  34. Il dominio è gov.it, quindi immaginate un po' a chi risulta ufficialmente registrato. Se vi manca la fantasia o qualche puntatore, provate ad usare un servizio online per saperlo.

  35. Dati.camera.it.

Nessun commento:

Posta un commento

Commentate a vostro rischio e pericolo.