La creatività dell’intelligenza artificiale e i dati non strutturati
Secondo le stime di IDC (International Data Corporation) la quantità dei dati generati a livello mondiale passerà dai 4,4 trilioni di gigabyte nel 2013 fino a 44 trilioni di gigabyte nel 2020 e la gran parte di questi saranno dati non strutturati.
Una crescita sconfinata che aumenterà ogni anno sempre di più, basti pensare a tutti i dispositivi digitali che ci circondano con cui ogni giorno interagiamo o tramite voce o tramite foto o tramite testo.
Ma che differenze ci sono tra i dati strutturati e i quelli non strutturati?
I dati strutturati, classificati come dati quantitativi, sono altamente organizzati e archiviati in modo da renderli relativamente facili da manipolare e ricercare. L’organizzazione, la formattazione e l’archiviazione dei dati, consentirà alle aziende di ottenere approfondimenti e guidare processi decisionali rapidi. (nomi, indirizzi, numeri di carte di credito, date, ecc.)
I dati non strutturati, classificati come dati qualitativi, sono generalmente difficili da raccogliere, archiviare e organizzare in un database tipico, ad esempio Excel, SQL e non possono essere elaborati e analizzati utilizzando gli strumenti tradizionali. (e-mail, file di testo, audio, video, post sui social media, attività mobile / tablet).
Secondo Gartner, i dati non strutturati rappresentano ormai l’80% del patrimonio informativo aziendale e la loro crescita avviene al ritmo del 65% all’anno.
Nell’informatica moderna si compie sempre “un grande errore” ovvero quello di trovare sempre degli standard su cui categorizzare la tipologia dell’informazione del dato.
Così come succede nella vita reale anche per i dati artificiali non è corretto avere una forma fissa e predefinita, volendo citare una celebre frase di Bruce Lee:
“Non avere nessuna forma, sii come l’acqua, libera la tua mente, sii informe, senza limiti come l’acqua. Se metti l’acqua in una tazza, lei diventa una tazza. Se la metti in una bottiglia, lei diventa una bottiglia. Se la metti in una teiera, lei diventa la teiera. Sii acqua, amico mio.”
Questo vale per qualsiasi mente anche per una mente artificiale.
Pensare che i dati vadano strutturati è “il grande errore”, appena i dati si strutturano si perde la possibilità di estrarre cose nuove, per questo motivo bisogna lavorare su dati non strutturati.
La vera conoscenza si ha quando si rinuncia alla strutturazione dei dati, lasciando agli algoritmi il compito di estrapolare valore da dati che non hanno uno standard.
Il ruolo delle macchine nei prossimi anni sarà quello di lavorare “solo sul formato naturale dei dati”, quindi sarà inutile e deleterio forzare gli esperti a trovare formati opportuni per i dati, perché spetterà agli algoritmi generare output dinamici figli della creatività annidata nei dati non strutturati.