I paranoici dell’algoritmo

October 9th, 2017 by mattia | Filed under riflessioni.

La storia l'avrete sentita tutti ormai. Io l'ho letta così tante volte che ormai non so più nemmeno se è vera o una leggenda metropolitana.
Siamo negli Stati Uniti Americani e un padre va a protestare al supermercato perché ha mandato dei buoni sconto alla figlia adolescente per l'acquisto di biberon, carrozzine e articoli per l'infanzia. È forse un modo per indurre una ragazza a una gravidanza precoce? A una ragazza così giovane! contesta.
Arrivato a casa parla con la figlia e scopre che in realtà è incinta: il supermercato l'aveva scoperto prima di lui grazie a sofisticati algoritmi che hanno dedotto la gravidanza della figlia dagli acquisti che faceva usando la carta fedeltà del negozio.

Questa storiella è spesso utilizzata per metterci in guardia dai pericoli derivanti dalla cessione di dati personali sugli acquisti, per raccontare quanto potenti questi algoritmi possano essere se riescono a sapere così tanto di noi.

L'altro giorno ho letto un'altra storiella che è indicativa di quanto sono potenti questi algoritmi. Al noto fumettista don Alemanno è stata bloccata sul feisbuc la vendita di un albo a fumetti intitolato "pillole di Jenus". Sapete perché? Perché l'algoritmo l'ha scambiato per... delle pillole, quelle mediche, che ovviamente non possono essere vendute su internet.

Pensate a quanto è potente l'algoritmo, confonde un libro per dei medicinali solo perché il titolo contiene la parola "pillole". Manco l'NSA è così precisa. Inquietante!

Oh, stiamo parlando di feisbuc, una delle strutture più potenti del mondo di internet. Lo stesso sito che - insieme a tanti altri - mi sta bombardando da settimane di pubblicità elettorale ceca. Gli algoritmi sono così potenti che nemmeno capiscono che non sono ceco e che il 20-21 ottobre non andrò a votare per il parlamento ceco. Mica è così difficile da intuire: non scrivo quasi mai in ceco sulle reti sociali, uso i programmi e le applicazioni il lingue diverse dal ceco... è così difficile intuire che anche vivendo in Rep. Ceca non sono ceco?
Fosse solo per questo: sul feisbuc scrivo tonnellate di cose da cui si può dedurre che non sono ceco con un'ottima precisione.

Ah, i potentissimi algoritmi di feisbuc. Vedono l'IP ceco e per loro sei catalogato come un potenziale elettore ceco. Figa, che algoritmi precisi. Paura!

La storiellina della ragazza americana incinta è interessante e tutto quanto, ma è un caso. Per un caso in cui l'algoritmo ci prende in modo così preciso ce ne è un altro in cui l'algoritmo fa acqua da tutte le parti come questi che ho descritto qui sopra.
Prima di fare i paranoici dell'algoritmo e descrivere la società del futuro in cui gli algoritmi prenderanno il sopravvento e decideranno tutto al posto nostro iniziate a verificare quanto funzionano veramente adesso questi algoritmi. Con studi seri, non con l'aneddotica.

30 Responses to “I paranoici dell’algoritmo”

  1. kheimon says:

    Questo articolo non rappresenta, a mio avviso, una riflessione seria. Percepisco la riduzione di un problema complesso a una specie di sciachimismo in salsa informatica.

    Niente di più falso.

    Tanto per comiciare, al di là e al di sopra dell’“algoritmo”, c’è il fatto che i dati per essere consegnati in input a qualcosa devono intanto esistere e essere concentrati (se non fisicamente, almeno logicamente). Questa quantità e concentrazione di dati non ha precedenti storici. Una massa abnorme di informazioni è nelle mani di giovanotti molto capaci ma totalmente privi di etica, empatia, intelligenza sociale ed emotiva (questa una descrizione a grandi linee della silicon valley) quando non proprio sociopatici (Elon Musk, Steve Jobs). Anche ammesso che non siano loro stessi a farne cattivo uso, nessuno ci assicura che quei dati non vengano rubati o condivisi con terzi (i quali a loro volta subiscono un furto).

    E a quel punto le possibilità sono infinite. Si possono ricattare persone in posizioni di visibilità, pilotare elezioni, manipolare i mercati finanziari.

    È un problema dannatamente complesso del quale stai malmente salfendo la superficie.

  2. mattia says:

    Percepisco la riduzione di un problema complesso a una specie di sciachimismo in salsa informatica.

    percepisci male.

    Quello che volevo dire è tutt’altro.
    Tutti i dati che diamo a queste persone sono importanti e tutto il resto. Ma l’efficienza con cui gli algoritmi tirano fuori qualcosa di potenzialmente dannoso per noi è *tutto da dimostrare*.
    Ci sono persone che diffondono i propri dati in maniera stupida compromettendo palesemente la propria riservatezza, vero. Ma se uno sta un po’ attento in realtà i dati che fornisce non consentono di dedurre *con adeguata precisione* molti dettagli su di sé.

    Qui ci sono due livelli di incertezza.

    1) la statistica generale
    Molti degli algoritmi possono darti informazioni interessanti su di un grande numero di persone.
    Es. il 95% di coloro che hanno ascoltano musica rap e mangiano cereali a colazione è propenso a votare un candidato di centro.
    Questa è una informazione che puoi dedurre abbastanza facilmente usando queste enormi moli di dati.
    Ed è una informazione che può essere utile quando vuoi vendere pubblicità a un candidato che vuole investire i suoi soldi con pubblicità mirate su persone che è più facile portare dalla propria parte.

    2) Il livello personale
    Cioè pensare che da quello che dalle tue abitudini, dagli amici che hai sul feisbuc, dalle ricerche che fai su internet o dagli acquisti che fai si possa dedurre qualcosa di compromettente su di te.
    In questo caso non hai una marea enorme di dati, bensì una quota striminzita di dati.
    E di necessità è così, perché sei una sola persona, e anche se condividi tutto rimani sempre un punto solo nelle statistiche.
    I tuoi dati sono necessariamente pochi perché sei uno solo.
    A questo punto fare deduzioni affidabili diventa difficile.
    Puoi farlo ma raggiungere gradi di precisione accettabili non è facile.

    A questo punto se tu vuoi trovare qualcosa di compromettente su di *una persona* diventa più facile e preciso pedinarlo, oppure acquisire informazioni “per vie traverse”. Perché così sai che le informazioni sono attendibili, sai che compra pillole di viagra perché te l’ha detto il medico che hai corrotto. Non è che deduci che non gli tira più l’uccello perché compra “pillole” su internet che si rivelano album a fumetti.
    Di fatto quando scendi al livello personale rimane più comoda/efficiente/economica un’investigazione classica rispetto alla deduzione basata sui i dati che rilascia a feisbuc.

    E allora puoi farti tutti i problemi che vuoi sul primo livello, quello generale. Va bene, però non puoi estenderlo al livello personale facendo terrorismo usando qualche aneddoto in cui l’algoritmo ha funzionato bene per caso.

    Piesse: vuoi un esempio pratico? Se ti consegno il mio orologio intelligente con accelerometro e misuratore di battiti cardiaci potresti dedurre che trombo ogni mattina prima di andare al lavoro in incessanti sessioni di consesso amoroso. Oppure che vado in palestra ad allenarmi.
    I paranoici dei dati personali si mettono a delirare se trasferisci i tuoi dati a gugol fit perché possono dedurre quando scopi. Una persona interessata a sapere quando scopi per vedere se hai un’amante molto più semplicemente ti segue e vede se sei andato in palestra o in motel.
    Con pochissimo hai un’informazione accurata e non una fumosa deduzione.

  3. kheimon says:

    Questo livello di elaborazione mi sembra finalmente più utile per arricchire i tuoi lettori di informazioni utili e spunti di riflessione.

    > Ed è una informazione che può essere utile
    > quando vuoi vendere pubblicità a un candidato
    > che vuole investire i suoi soldi con pubblicità
    > mirate su persone che è più facile portare
    > dalla propria parte.

    E non c’è alcuna garanzia che i soggetti in questione (e.g. Facebook) abbiano offerto, offrano od offriranno a tutti i candidati le stesse possibilità di accedere a questo potere di analisi, sebbene dietro compenso. Non mi basta che un sociopatico californiano mi dia la sua parola che il campo di gioco sarà equo, o che Mattia Butta ventili il suo scetticismo sull’efficacia di questi algoritmi, io ed altri siamo convinti che anche un uso rozzo di questo potere di analisi possa truccare il tavolo da gioco e chiediamo maggiori garanzie di trasparenza. Sebbene le lobby influenzino da sempre la politica, un simile potere semplicemente non ha precedenti.

    > A questo punto se tu vuoi trovare qualcosa di
    > compromettente su di *una persona* diventa più
    > facile e preciso pedinarlo, oppure acquisire
    > informazioni “per vie traverse”.

    La tecnologia, specie se facile, aiuta. Per farti un esempio che forse apprezzerai, dubito che Edgar avrebbe spiato Martin Luther King Jr. nascondendosi nell’armadio di ogni albergo e provando a … respirare piano. Più comodo installare cimici, che dici Mattia? E se, mutatis mutandis, avesse avuto a disposizione, nel 2025, un amico sociopatico CEO di un mastodonte dell’informazione, magari si sarebbe fatto fare un dump di tutta la sua storia digitale, il che richiede al massimo uno script di venti righe la cui azione non è tracciabile… Meglio dello sbatti di installare cimici, il quale a sua volta è meglio dello sbatti di nascondersi dietro la tenda della doccia.

  4. mattia says:

    E se, mutatis mutandis, avesse avuto a disposizione, nel 2025, un amico sociopatico CEO di un mastodonte dell’informazione, magari si sarebbe fatto fare un dump di tutta la sua storia digitale, il che richiede al massimo uno script di venti righe la cui azione non è tracciabile…

    Ma quelle sono, appunto, vie traverse.
    Non sono dati che tu hai dato all’AD di un mastodonte dell’informazione di tua spontanea volontà.
    È ovvio che si può fare ed è efficiente. Figurati, se domani ti accusano di aver commesso un omicidio ti sequestrano ogni dispositivo elettronico e tirano fuori tante informazioni su di te.
    Lo può fare legalmente un tribunale o lo può fare illegalmente chi ricorre alle vie traverse.
    Ma questo è un tutt’altro discorso.
    Io parlo di dati che tu hai volontariamente dato a quel mastodonte dell’informazione.
    Poi è ovvio che se tu fai ricerche compromettenti senza usare un po’ di cautela sei un pirla, ma qui siamo nel campo dell’abc di come si usa internet.

    Esempio: anni fa (tanti) vidi un accesso al mio sito da parte di uno che cercava il mio nome dalla mia università. Mi bastò l’IP per scoprire chi era. Si trattava di uno studente italiano in erasmus che stava cercando informazioni su di me per una presentazione. Quando l’ho incontrato in birreria dopo due giorni gli ho chiesto “ehy, ho visto che cercavi info su di me”. Quello è sbiancato “come fai a saperlo?”.
    Così gli ho spiegato che facendo un whois dell’IP che aveva quando si connetteva dalla sua stanza nel dormitorio dell’università usciva il suo nome nell’hostname (un genio il gestore della rete del dormitorio che nel registrare gli studenti rendeva pubblico il nome). E che ovviamente quando accedeva al mio sito vedevo il suo IP.
    Ora, è ovvio che questo ha evidentemente diffuso di sua spontanea volontà una marea di dati compromettenti: cazzo, navigava con il suo nome in chiaro!
    Ma se uno fa ricerche compromettenti senza nemmeno controllare cosa salta fuori facendo il whois del suo IP allora non possiamo farci niente. Qualsiasi misura sarà sempre inutile per gente così.

  5. kheimon says:

    “Io parlo di dati che tu hai volontariamente dato a quel mastodonte dell’informazione.”

    Ma esattamente come Martin Luther King si fidava del fatto che sotto il letto non ci fosse una cimice perché la stanza è “privata”, in misura analoga dovrebbe essere “privata” la mia stanza intangibile.

    Quanto al fatto che gli idioti lo sono in qualsiasi epoca sei enormemente fuori strada! L’idiota del secolo scorso si scopa una in macchina e se qualcuno lo vede da dietro un cespuglio la cosa finisce lì, quello del 2020 si scopa una in casa, fa l’idiozia (analoga) di salvare il video su iCloud e questo viene replicato immediatamente in 15 server sotto 7 legislazioni e governi diversi. La situazione è grave ed è seria.

  6. mattia says:

    Ma esattamente come Martin Luther King si fidava del fatto che sotto il letto non ci fosse una cimice perché la stanza è “privata”, in misura analoga dovrebbe essere “privata” la mia stanza intangibile.

    MLK non aveva dato il permesso alla reception di registrare ciò che avveniva nella sua camera con la promessa che “non si preoccupi, teniamo le registrazioni solo per noi, per offrirle un servizio migliore”.
    Tu parli di dati che MLK non aveva mai dato intenzionalmente ad altri con dati che invece vengono dati intenzionalmente ad aziende private.

    uello del 2020 si scopa una in casa, fa l’idiozia (analoga) di salvare il video su iCloud

    perdonami, ma di uno che salva su icloud i suoi filmini erotici io me ne frego.
    Cinico io? Forse, ma uno così non è salvabile.
    Puoi fare tutte le leggi che vuoi per tutelarlo ma la cazzata la farà sempre.

  7. stephen says:

    la raccolta dei dati personali la stanmo spingendo un po’ oltre il consentito. alla presentazione del nuovo google pixel 2 hanno detto candidamente che il microfono é sempre acceso e che quando entri in un posto ti dice subito la canzone che mettono in filodiffusione. wow.

    é stata recepita addirittura come una feature figa; e io temo che tra iris scanner, riconoscimenti facciale e, in futuro, fotocamera sempre accesa così ti diamo info live su dove stai camminando, microfoni sempre accesi prima o poi ne avranno di dati per farli funzionare questi algoritmi. basta eaggiungere una massa critica e infilarli nel mercato facendo seguire a ruota tutti i produttori.

    tornerò al 3310 al quel punto

  8. mattia says:

    tornerò al 3310 al quel punto

    appunto. Io un telefono che mi dice candidamente che ha il microfono sempre acceso non lo compro.

    ma ciò non significa che devo rinunciare a un uso normale di gugol o feisbuc. Basta conoscere quali dati stai condividendo. È ovvio che se diffondi dati così ti condanni da solo, ma con un po’ di buon senso i dati che diffondi sono troppo vaghi per dedurre qualcosa di preciso.

  9. kheimon says:

    “ma con un po’ di buon senso i dati che diffondi sono troppo vaghi per dedurre qualcosa di preciso.”

    Non capisco se, in questo frangente, prevale più il tuo essere misantropo o troppo sicuro di te.

    Misantropo perché, mi dispiace, ma un essere umano si preoccupa anche di predisporre tutele perché i meno svegli non si facciano del male da soli, con dei limiti ovviamente, e con la consapevolezza che uno che non si cura troppo del proprio IP non è un fesso, è una persona normale, dunque il sysadmin dovrebbe essere licenziato, e comunque uno che fa la cazzata di salvare un video compromettente su iCloud e si fa rubare la password non merita di essere DISTRUTTO come essere umano e contemplare il suicidio.

    Troppo sicuro di te perché può capitarti il giorno del cretino anche a te. E se dovesse capitare io non starei lì a puntare il dito, ma ti manderei un’email di corsa per aiutarti, nel caso, a contenere i danni.

    Il policymaking non è la legge del più forte. Un po’ perché dovremmo aver superato quella fase da tempo, un po’ perché di essere debole un giorno potrebbe toccare a ciascuno di noi.

  10. Peto says:

    Due appunti sul post.
    1) La storia potrebbe anche essere vera ma raccontata male, e non essere legata a un caso troppo fortuito: se il mio sistema traccia come [future] neomamme i clienti che comprano un test di gravidanza, e il giorno dopo ne comprano un altro, e il giorno dopo ancora comprano “Il Giornale della mamma” e robe simili, è un sistema abbastanza ben pensato. Ok, beccherà come tali pure chi presta la tessera alla vicina o chi è ossessionata dal semplice desiderio di essere incinta, ma credo che siano pochi falsi positivi sul totale.
    2) Gli spot sulle elezioni ceche non necessariamente sono dovuti a limitazioni dell’algoritmo, ma potrebbero essere dovuti a limitazioni di chi ha tarato la sua campagna pubblicitaria su “Utenti della Repubblica Ceca”. Come hai detto, non dovrebbe essere difficile stabilire se un utente che si connette da tal Paese sia straniero o meno.

    Un appunto sulla discussione.

    kheimon
    Tanto per comiciare, al di là e al di sopra dell’“algoritmo”, c’è il fatto che i dati per essere consegnati in input a qualcosa devono intanto esistere e essere concentrati

    Vero verissimo, ma qui si parla degli algoritmi.

    esattamente come Martin Luther King si fidava del fatto che sotto il letto non ci fosse una cimice perché la stanza è “privata”, in misura analoga dovrebbe essere “privata” la mia stanza intangibile.

    La tua stanza intangibile è il tuo computer, non il tuo account facebook. La natura del tuo account facebook è precisamente affidare a qualcun altro la raccolta dei tuoi dati.

    Mi pare che si stiano mischiando due argomenti: il fatto che ormai facciamo bukkakke dei nostri dati su dei CEO inginocchiati al centro del web, e il fatto che questi abbiano un efficace spettrometro con cui analizzare la loro singolare doccia. Sul primo punto, siamo consapevoli del fatto che i dati ce li hanno: siamo noi a fornirli. Sul secondo, non è chiaro se lo spettrometro sia di qualità o se sia stato comprato a Porta Portese.

    Ora: ciò che è realmente rilevante nel caso si tema l’azione dei sociopatici è solo il primo punto, dato che qualsiasi (?) “attacco” non fantascientifico basato sulle informazioni personali è per sua natura un attacco di tipo spot, mirato a un singolo individuo. Io, Mark Zuckerberg, voglio pilotare l’elezione amministrativa a Moncenisio e smanetto la lista delle conversazioni del candidato che non mi piace per vedere se è ancora in contatto con la sua fidanzatina del liceo per mandarsi foto zozze. Ciò richiede algoritmi di Data Mining sofisticati? Anche no.

    Supponiamo ora invece che il cattivo Mark abbia instaurato una dittatura e voglia rastrellare tutti e soli quelli che sono stati in vacanza a Moncenisio, dove probabilmente nemmeno c’è il 3G. Può lanciare un’analisi affidabile sui dati di facebook per trovare l’indirizzo di residenza di tutti e soli questi soggetti, o stiamo parlando di fantascienza? Propenderei per la seconda.

  11. mattia says:

    2) Gli spot sulle elezioni ceche non necessariamente sono dovuti a limitazioni dell’algoritmo, ma potrebbero essere dovuti a limitazioni di chi ha tarato la sua campagna pubblicitaria su “Utenti della Repubblica Ceca”.

    ma a quel punto è un fesso chi ha tarato una campagna pubblicitaria così.

  12. shevathas says:

    Allora il limite di quegli algoritmi è che funzionano allo stesso modo della meccanica statistica, ovvero misurando un paio di macrovariabili (pressione, volume, temperatura) riesci benissimo a descrivere il sistema e la sua evoluzione nel tempo.
    Però non hai nessuna informazione precisa sulla singola particella componente, a Mr. Facebook interessa il comportamento complessivo del sistema, della singola particella “se ne sbatte”.

    Il caso del supermercato può essere spiegato tranquillamente: se compri prodotti di determinate categorie merceologiche ti stampano buoni sconto legati a prodotti appartenenti a tali categorie. Ad esempio a me, quando vado a far scorta di crocchette per gatti, stampano puntualmente buoni sconto per questo o quel prodotto di cibo per gatti. Quando ho preso gli assorbenti, in offerta, per la mia lei, il buono sconto, dato automaticamente in cassa, riguardava prodotti di bellezza femminile. Si tratta di un algoritmo alquanto stupido e banale.

  13. kheimon says:

    La discussione verte sugli algoritmi e sulla loro raffinatezza e precisione, vero, ma è proprio questo a essere fuorviante. Intanto perché anche un uso molto rozzo di questi dati, come ho spiegato, può fornire vantaggi competitivi agli amici degli amici, un potere finora mai visto.
    Poi, perché la raccolta di una mole così ridicolmente massiccia di dati concentrati nelle mani di un soggetto irresponsabile (queste organizzazioni sono gestite da bambini, seppur prodigio) che ne dispone a suo piacimento e li manipola con *estrema* disinvoltura, magari condividendoli con terzi, è proprio che lo stato dell’arte della tecnica di analisi è irrilevante una volta che da una miope visione da qui a martedì prossimo si riconosce l’esistenza di una prospettiva decennale. Quei dati non scompariranno mai e la loro quantità può solo crescere. È stupido occuparsi del problema quand’è troppo tardi solo perché Mattia è scettico sugli algoritmi.

  14. mattia says:

    Intanto perché anche un uso molto rozzo di questi dati, come ho spiegato, può fornire vantaggi competitivi agli amici degli amici, un potere finora mai visto.

    Un potere del genere esisteva eccome, e si chiamava televisione. Chi aveva in mano la televisione, in un periodo in cui era l’unica forma di informazione di massa ed era vista praticamente da tutti, aveva un enorme vantaggio competitivo.
    Con la televisione manipolavi le idee delle masse e ti assicuravi il successo nelle elezioni. Se pensi a quello che faceva la DC con la Rai le presunte influenze russe sulle elezioni americane sono ragazzate.

    Adesso ti sembra potente il potere di alcuni su internet, ma ti sembra tale perché si muovono in un mondo, quello di internet, che è frammentato.
    Un mondo in cui dominare facendo i numeri grossi è difficilissimo, proprio perché è frammentato.
    Allora ti servono delle mosse astute per arrivare in modo efficace alle persone su cui puntare.
    Siccome su internet è difficile arrivare a 20 milioni di persone ma puoi permetterti di raggiungerne 100 mila gli algoritmi ti consentirebbero di selezionarle accuratamente. E questo ti spaventa.
    Ma non ti spaventava quando con la televisione raggiungevi direttamente 20 milioni di persone?

  15. mattia says:

    Non capisco se, in questo frangente, prevale più il tuo essere misantropo o troppo sicuro di te

    Sulla misantropia.
    Io definisco più che altro questo aspetto realismo.
    Va benissimo tutelare le persone “che non ci arrivano”. Puoi fare tutte le norme che vuoi per difenderli.
    Però arriva sempre un momento in cui uno fa una sciocchezza e lì non puoi farci niente.
    Come dire: tu puoi creare l’antivirus più potente al mondo, puoi introdurre la pena di morte per i reati informatici, ma se poi un funzionario dispone un bonifico da mezzo milione di euro perché riceve un’email in cui gli si dice “fa’ subito il bonifico e non telefonarmi, ché sono fuori col capo” allora tu devi essere realista: non puoi farci niente.
    Lo stesso vale per i dati personali: puoi introdurre tutte le tutele che vuoi, ma se uno pubblica su di un sito di condivisione di video pubblico un filmato in cui simula un amplesso con una bambola gonfiabile non puoi farci niente.
    C’è sempre un limite minimo in cui una persona diventa responsabile di quello che fa, e non puoi andare lì a fermargli la manina mentre carica dati pubblici.

    Sulla sicurezza di sé.
    Io so bene quali sono le falle del sistema. Ad esempio so che una persona minimamente sveglia può trovare l’indirizzo di casa mia.
    Un lettore di questo blog lo fece sfruttando alcune informazioni disponibili su internet e un po’ di ingegneria sociale (telefonò al mio comune AIRE fingendo di essere il sottoscritto).
    So, ad esempio, che il mio comune di iscrizione AIRE è un dato pubblico e non posso farci niente (è pubblicato su alcuni brevetti).
    Io faccio il possibile per limitare i danni limitando la diffusione di informazioni. Qualcuno può farmi dei danni? Certamente, ma io so di aver fatto il possibile per limitarli.
    L’essere fessi mica lo vedi dal fatto che ti fanno dei danni o meno. Lo vedi da cosa hai fatto per evitare quei danni.

  16. kheimon says:

    > Se pensi a quello che faceva la DC con la Rai
    > le presunte influenze russe sulle elezioni
    > americane sono ragazzate.
    Intanto, il problema delle presunte influenze russe non è tanto quello che è accaduto, ma quello che potrebbe accadere adesso. Se l’editore in questo caso ha effettivamente creato un campo di gioco equo (chi paga ottiene uno spazio), il paradosso è che grazie a questa (non so quanto rilevante) scoperta potrebbe darsi che d’ora in poi l’editore sia obbligato a seguire un codice di comportamento e consegnare questo immenso potere solo all’ortodossia politica. E in un attimo è regime.

    Poi, se da un lato le influenze della DC sulla RAI non sono provabili oltre ogni ragionevole dubbio perché manca la pistola fumante, almeno puoi sapere cosa è stato mandato in onda, che giorno e a che ora. Non serve una commissione d’inchiesta per capire il “cosa”, al più (ed è una parola…) il “perché”.

    Del resto trombette, tromboni e trombettieri ci hanno sbomballato con l’influenza della TV sulle masse per decenni. Qualcuno inizia a farlo anche in merito a questi nuovi media, ma è difficile perché ancora nessuno ci capisce un cazzo a dire il vero. 🙂

  17. mattia says:

    Poi, se da un lato le influenze della DC sulla RAI non sono provabili oltre ogni ragionevole dubbio

    Vabbe’, dai…

  18. ava says:

    l’ algoritmo può essere del tipo:
    se compri i seguenti prodotti : A-B-C
    suggerisco C D E che sono nei carrelli di chi ha comprato ABC

    quindi se compri
    il libro dei nomi dei neonati
    il libro di come allevare il neonato
    il libro come restare magra col neonato

    ti vendo
    calzetti neonato
    carrozzina
    biberon

  19. mattia says:

    quindi se compri
    il libro dei nomi dei neonati
    il libro di come allevare il neonato
    il libro come restare magra col neonato

    ti vendo
    calzetti neonato
    carrozzina
    biberon

    Sì, ma la deduzione era “quindi sei incinta”, che è una deduzione più complessa e sensibile al fallimento.
    Se compri
    il libro dei nomi dei neonati
    il libro di come allevare il neonato
    il libro come restare magra col neonato
    magari non sei incinta, ma solo la sorella di una persona incinta o un’amica un po’ troppo ficcanaso che si permette di fare regali inopportuni.
    Con che precisione sai distinguere i due casi?

  20. kheimon says:

    Vabbè dai cosa? La cogli la differenza o no? Stai qui a fare quell’esempio proprio perché almeno sappiamo cosa sia andato in onda e quando.

  21. mattia says:

    Vabbè dai cosa?

    La pistola fumante per il potere della DC sulla rai non è davvero necessaria, via!

    La cogli la differenza o no? Stai qui a fare quell’esempio proprio perché almeno sappiamo cosa sia andato in onda e quando.

    Ma anche su internet quello che “è andato in onda” lo sappiamo.
    Se una potenza straniera investe in una campagna pubblicitaria per delle elezioni be’… quella campagna pubblicitaria è pubblica per definizione.
    Il caso delle presunte influenze russe nella campagna elettorale americane è una buffonata. I russi avrebbero semplicemente acquisito alcuni archivi email del DNC con informazioni sulla clinton e le avrebbero diffuse per screditarla.
    Che esattamente la stessa cosa che ha fatto chi ha registrato trump dire grab them by the pussy e ha diffuso il fuori onda per screditarlo.
    In entrambi i casi hanno preso materiale acquisito illegalmente e l’hanno diffuso per screditare un candidato.
    Solo che se lo fa una TV americana con il candidato cattivo è ok, se lo fanno i russi per screditare la candidata buona è scandalo e serve una commissione d’inchiesta?
    In ogni caso non c’entra niente con l’uso dei dati personali su internet. Se una potenza straniera fa una campagna pubblicitaria su internet mandando pubblicità elettorale mirata non fa niente di diverso rispetto a tutti i presidenti americani che hanno dato o meno il loro appoggio ai vari candidati italiani nelle varie elezioni.
    Che facciamo, una commisione d’inchiesta anche per obama che appoggia il referendum costituzionale?

  22. kheimon says:

    Ma pubblica cosa, che non sappiamo neanche a quanti utenti è indirizzata, trattandosi quello di segreto industriale???

    A dire il vero, poi, parlavo della commissione d’inchiesta sulle inserzioni russe su Facebook.

    E ho sottolineato come per me non sia tutto sommato un problema; temo piuttosto il fatto che d’ora in poi questo privilegio sarà riservato all’ortodossia politica. Ricordatelo quando lo ius sola e altre fesserie liberal saranno cacciate giù per la gola a tutti via silicon valley. A quel punto ti ricorderai di questa conversazione.

    Quanto alla RAI, siamo d’accordo, è ovvio. Quello che volevo dire è che le ben fondate speculazioni al riguardo si possono almeno basare su cosa è stato mandato in onda e quando, informazione a cui tutti hanno accesso accendendo una TV.

    Tu di Facebook non sai davvero niente eppure potrebbe decidere il prossimo presidente USA. Non hai alcuna visibilità su questo processo, a nessun livello.

  23. mattia says:

    Ma pubblica cosa, che non sappiamo neanche a quanti utenti è indirizzata, trattandosi quello di segreto industriale???

    E tu sai a quante persone sono indirizzate le balle di repubblica.it sullo ius sola?
    Quando un giornale fa una campagna per indirizzare l’opinione pubblica tu sai quanti leggono quell’articolo?
    Hai accesso alle statistiche di repubblica in cui si legge quante persone hanno letto l’articolo di ieri di repubblica in cui raccontano le ultime scoregge orali di camilleri sullo ius sola?
    No. Però non te ne fai cruccio.
    Ora, se quel giornale fosse di proprietà straniera (come accade spesso in altri paesi) quale sarebbe la differenza con un’inserzione a pagamento su feisbuc?
    Hai sempre un investitore straniero che cerca di manipolare l’opinione delle masse: da una parte con delle inserzioni su feisbuc dall’altra facendo l’editore di un giornale. In entrambi i casi non sai quante persone vengono raggiunte.
    L’unica differenza è che il giornale non è mirato sui tuoi dati personali mentre l’inserzione su feisbuc sì. Ma qui vale il discorso di prima sui 20 milioni e i 100 mila.

  24. mamoru says:

    a mecgli algoritmi stanno scassando la minchia col lavoro online (in italiano) e il ritirare soldi infilando la patente in un atm (in giapponese)… inutile dire che entrambe le cose non mi interessino.

    sul discorso big data, IA che tutto vede e prevede voglio stare a vedere cosa succede. perche’ dietro queste cose ci sono sempre eserciti di negri programmatori subottimali che inseriscono un comando nuovo in una toolbar riuscendo a farti crashare mezzo sistema oltre all’applicazione a cui han messo mano…
    su processi industriali governati da qualche parametro prevedibile l’autoapprendimento funziona bene, mentrev su cose come l’ingegneria strutturale o la diagnosi medica e direi financo la guida automatica in situazioni tipo il camion che ti taglia la strada controluce (o quello che ti sorpassa con la doppia riga continua che portano l’IA allo sclero.
    mi sa che siamo ancora un pelo indietro tecnicamente e troppo ottimisti… e gia’ ci parlano di IA che suggeriscono a politici e manager. salvo poi che si scopre che quando l’IA ti dice che i negri vanno in giro a pistolettare la gente negli SU d’A allora saltano su quelli che dicono che i dati sono bias, razzisti e bisogna “ottimizzarli” a mano. bella base per fare scelte.

    sul discorso dati compromettenti siamo sempre li’: chi certifica chi c’e’ fisicamemte dietro il device o l’ip?
    se domani google decide di caricare 2gb di pedoporno nel drive di mattia per affossare w la fisica chi certifica che i file log e l’upload non siano stati adulterati?
    google stessa che ha gli algoritmi per identificare il pedoporno e le risorse per girarlo nelle caselle dei propri utenti?

    sono arrivati a dire che i russi con mezzo milione di usd avrebbero comprato ads su facebook e siano riusciti a manipolare le elezioni usa… no mezzo milione. praticamente uno sputo.
    vogliamo crederci davvero a questi deliri di mr. Zuck?

    ps se dovessero profilarmi per quello che dico su FB siamo a cavallo allora:
    preparatevi all’invasione dei gattini omofobi di breitbart.

  25. ava says:

    ovvio che il mio esempio sia semplificato all’ eccesso… ma se gli acquisti sono in numero sufficiente , e magari coinvolgono articoli più personali come roba di parafarmacia , kit da ospedale e roba del genere non è difficile tirare le conclusioni. La stessa cosa la penseresti tu guardando una conoscente al supermercato col carrello pieno di pannolini

  26. mattia says:

    La stessa cosa la penseresti tu guardando una conoscente al supermercato col carrello pieno di pannolini

    Ma certo… infatti nessuno dice “guarda che algoritmo potente, vede che compri i pannolini e deduce che hai un figlio di pochi mesi”.

    Dicono “guarda che potente algoritmo, compri le calze contenitive e il “latte” di soia e indovina che sei incinta”.
    È a questo livello che dubito seriamente dell’efficacia di questi algortimi.

  27. Peto says:

    2) Gli spot sulle elezioni ceche non necessariamente sono dovuti a limitazioni dell’algoritmo, ma potrebbero essere dovuti a limitazioni di chi ha tarato la sua campagna pubblicitaria su “Utenti della Repubblica Ceca”.

    ma a quel punto è un fesso chi ha tarato una campagna pubblicitaria così.

    Sì, con “limitazioni di chi ha tarato” intendevo precisamente “limitazioni mentali” 😀

    kheimon
    lo stato dell’arte della tecnica di analisi è irrilevante una volta che da una miope visione da qui a martedì prossimo si riconosce l’esistenza di una prospettiva decennale. Quei dati non scompariranno mai e la loro quantità può solo crescere.

    Ok, l’evoluzione di questi sistemi potrebbe portare a risultati che oggi consideriamo irraggiungibili. Però io mi chiedo:
    per quanto il sistema possa essere preciso, le informazioni che condividiamo permetterebbero (teoricamente) di dedurre qualcosa di veramente compromettente?
    Perché se l’annuncio pubblicitario è effettivamente preciso e mirato alla mia persona, cogliendo meglio della mia coscienza ciò che i miei istinti desiderano, sulla base dei like che metto in giro, io lo considero… Un ottimo sistema di annunci! Dove sta il problema?
    Per come la vedo io, ci sono solo due (falsi) problemi:
    1) ciò che esplicitamente scrivi, e questo è un falso problema al pari del caricare le foto mentre fai sesso vestito da Paperino su iCloud: sei fesso tu che l’hai fatto, non sono diabolici loro;
    2) ciò che (vero o meno) possono dichiarare di aver dedotto su di te, ad esempio che ti piacciono i bambini perché hai portato avanti la tale e talatra attività: chi dice però che la loro deduzione sia vera? Al pari del caso descritto da mamoru, quel dato potrebbero averlo inserito loro, o comunque non c’è una garanzia che sia una deduzione corretta, potrebbe essere una deduzione stiracchiata sulla base di correlazioni insignificanti. Basta che la notizia esca, vera o meno? Beh, questo è già possibile senza Data Mining.
    Ripeto quello che secondo me è il dubbio da sciogliere:
    per quanto il sistema possa essere preciso, le informazioni che condividiamo permetterebbero (teoricamente) di dedurre qualcosa di veramente compromettente?
    E, una volta scoperto che dovesse essere così, la gente non smetterebbe all’istante di usare quel social network sistema di profilazione?

    il paradosso è che grazie a questa (non so quanto rilevante) scoperta potrebbe darsi che d’ora in poi l’editore sia obbligato a seguire un codice di comportamento e consegnare questo immenso potere solo all’ortodossia politica.

    Vero. A quel punto facebook (o qualsiasi altro) diventerebbe uno strumento di propaganda del potente di turno (a.k.a. RAI)… Dopo quanto ce ne accorgeremmo? Dopo quanto smetteremmo di usarlo o di prenderlo sul serio? Non sono domande retoriche, sono domande che mi pongo seriamente! 🙂

  28. kheimon says:

    > Dopo quanto ce ne accorgeremmo?

    A giudicare da quanto leggo qui, troppo tardi.

  29. mattia says:

    Vero. A quel punto facebook (o qualsiasi altro) diventerebbe uno strumento di propaganda del potente di turno (a.k.a. RAI)… Dopo quanto ce ne accorgeremmo? Dopo quanto smetteremmo di usarlo o di prenderlo sul serio?

    Io non l’ho mai preso sul serio.

    Il problema penso stia proprio nel modo in cui ci approcciamo al mezzo di comunicazione di turno.
    Una volta c’era il giornale ed era per forza vero perché “oh, è scritto sul giornale”. Poi siamo stati indirizzati dalla TV, ora dalla fuffa che arriva su internet. Domani chissà da che altro…
    Forse che forse il problema siamo noi. Che dovremmo imparare ad analizzare le informazioni, da qualsiasi fonte vengano.
    Se il nostro personale filtro chiamato cervello funziona diventi resistente a qualsiasi cosa.
    Se invece insegui il nuovo mezzo di comunicazione del decennio finisci per passare la vita a rincorrere una nuova tecnologia per metterle dei paletti. Senza mai riuscirci del tutto.

  30. Peto says:

    A leggere le vostre risposte, quasi mi vien voglia di disattivare l’ad blocker per controllare… Quasi. 😀

Leave a Reply


Nota importante per i commenti: i commenti sono moderati, perché ho voglia che lo siano (sostanzialmente non ho voglia di prendermi la responsabilità delle eventuali diffamazioni che scrive il primo che passa). Abito a Praga, quindi se qui è notte io vado a godermi questa magnifica città, non sto chiuso in casa a moderare i commenti: aspettate. E comunque li modero quando mi pare.
Non sono ammessi commenti che possono configurare reati, quindi evitate di rivolgere insulti, a me o ad altri. Si possono esprimere gli stessi concetti anche senza insultare. Non sono ammessi altresì commenti che contengono stupidità.
Se non vedete il vostro messaggio comparire e siete sicuri di non aver insultato nessuno, probabilmente il vostro messaggio è stupido. La qualità media dei commentatori di questo blog è molto alta, prima di commentare rifletti e cerca di capire se ne sei all'altezza. Se non ne sei sicuro lascia perdere.
E alla fine vale sempre il concetto che questa è casa mia e faccio quello che mi pare.
I commenti sono chiusi dopo 30 giorni: se hai qualcosa da dire fallo subito oppure evita di rompere i maroni.