Basta un post di successo per spiegare l’importanza … di WordLift 3.0

Come un post può cambiare l’opinione generale dell’intera Europa (in questo caso l’Unicef aveva parlato dell’importanza dei vaccini)

La tecnologia semantica organizza i contenuti secondo strutture ontologiche condivise, identifica: concetti, relazioni e proprietà. Tutti i siti e i Blog generici o tematici, che da anni dominano anche il mondo dell’informazione professionale, non sono supportati da applicazioni che costruiscono archivi strutturati associando metadati in automatico al momento della pubblicazione. Il risultato è un mare di ‘contenuti momentanei’, postati con linguaggi di gestione legacy, organizzati in forme che richiedono l’intervento delle tecniche di ‘conversione’ dei dati e di attività di marketing digitale, per essere diffuse e trovate dall’utente, anche se per un breve arco di tempo.

Nei dieci anni dalla prima diffusione di internet siamo passati da una fase in cui collegavamo i computer, alla successiva in cui abbiamo linkato le pagine, a quella di oggi che ci chiede di collegare i dati. Il web deve essere in grado di riconoscere il significato dei dati e delle parole pubblicate.

Nel settembre del 2014 internet ha superato il miliardo di siti e nell’estate del 2013 già si contavano 100 miliardi di click al giorno, 55 migliaia di miliardi di link tra tutte le pagine web del mondo. Viene da sé che l’importanza primaria è quella di programmare non solo l’organizzazione dei contenuti pubblicati in un sito in temi, canali e layout classici, ma riprogettare gli stessi perché costruiscano dataset arricchiti di metadati, meglio se fatto secondo le specifiche del W3C per permettere l’integrazione con la cloud Linked Open Data.

Inoltre, gli ‘oggetti tecnologici’ che ci permettono di comunicare e svolgere attività on line non sono più meri ‘strumenti’: sono diventati oramai veri e propri ‘dispositivi culturali’. Sono in grado di evidenziare l’essenza della persona, del posto (luoghi, o territori), delle Organizzazioni di cui fanno parte: private o pubbliche.

I dispositivi danno un significato espresso in dati a contesti informali come lo sono i network, che assumono sempre più una struttura in grado di esprimere la dimensione identitaria e culturale sia del gruppo che del singolo. Possiamo affermare che la nostra vita si snodi in una dialettica di sviluppo che ha sullo sfondo una sequenza di contesti ‘digitali’.

L’insieme di questi contesti e delle funzioni cui questi obbediscono, rispecchia la quotidianità delle forme di vita che in essa si sviluppano, e quindi anche delle direzioni delle traiettorie di sviluppo, e dei metodi di comunicazione usati per condividerla.

I siti internet devono tener in debito conto delle potenzialità espressive e delle modalità d’uso dei dispositivi collegati alle reti digitali. Alcuni usi sono già consolidati, e non solo tra i target giovanili e la ‘generazione touch-screen’.

Nel 2011 abbiamo iniziato lo sviluppo di un Editor Semantico, WordLift, oggi fine ottobre 2015 alla terza release. L’applicazione è distribuita come Plug-in in una delle piattaforme di CMS open source più diffuse al mondo: WordPress. Il modulo è già disponibile su Alfresco e in versione sperimentale su Drupal – è in calendario lo sviluppo dei connettori verso altri CMS.

L’Editor Semantico WordLift 3.0 è sviluppato e automatizzato per consentire la costruzione di dataset open secondo gli standard richiesti dal W3C. Il software suggerisce all’utente già in fase di compilazione di un articolo: le entità, i concetti e le relazioni che classificano il contenuto con le chiavi di lettura presenti negli archivi open data: dbpedia, freebase, geonames, i più famosi.

Questo fa si che le informazioni siano accessibili sotto forma di grafo semantico  (i contenuti testuali diventano dei dati e possono essere così letti dalle macchine e collegati con altri dati).

Il prodotto WordLift 3.0 è in grado di recepire “programmi di verticalizzazione” e predisporre la configurazione dell’arricchimento dei contenuti con i dati necessari al riuso, cioè a rispondere alle richieste di servizio provenienti da applicazioni web esterne, applicazioni per mobile e API.

Se, ad esempio, prendiamo in considerazione l’eventualità di realizzare un sito dedicato agli open data di una Istituzione europea ci poniamo come obiettivo quello di sviluppare una verticalizzazione di WordLift 3.0 con un Dominio Informativo ad hoc e l’inserimento di tutti i vocabolari del settore Pubblico disponibili (es. Eurovoc, Core Public Service, Core Business Vocabulary, DCAT, …), e di ontologie già affermate e/o nuovi standard (criteri o indicatori di performance).

Pubblicare i contenuti sul web usando l’editor semantico WordLift 3.0 vuol dire per tutta l’utenza WordPress organizzare il proprio desk e costruire un archivio strutturato dei propri contenuti compatibile con la cloud Linked Open Data senza ostacolare l’eventuale uso di Licenze commerciali per la distribuzione dei contenuti.

 

Il nuovo catalogo nazionale Open Data – seconda parte

Questo secondo articolo sulla progettazione del nuovo catalogo nazionale open data introduce le API supportate dal portale, descrive la treemap che consente di navigare i contenuti del sito e introduce alcune delle novità sulle quali stiamo lavorando in queste settimane. Il primo articolo su dati.gov.it lo trovi qui. 

Dove sono le API?

Nella fase iniziale del progetto abbiamo cercato di consolidare la ri-organizzazione del catalogo e di estendere DKAN secondo quanto necessario dai requisiti del progetto; in particolare si è trattato di estendere il modello di organizzazione dei metadati presente in DKAN aggiungendo le organizzazioni (DKAN è pensato per un singolo ente che pubblica dati mentre nel nostro contesto avevamo l’esigenza di gestire i metadati di tante organizzazioni diverse). Inoltre si è trattato di irrobustire l’harvester di DKAN per poter acquisire la grande mole di dati che era presente nel CKAN della versione precedente del portale (seguono maggiori dettagli nei paragrafi seguenti).

Queste attività hanno fatto si che, nella release di Giugno, non fossero ancora presenti le API. Durante l’estate, sempre in collaborazione con AgID, abbiamo ripreso le attività e ri-attivato le API standard di CKAN a cui molti di voi sono già abituati. Si tratta di interfacce consultabili con richieste HTTP che restituiscono risultati formattati in JSON. Per vedere qualche esempio potete fare un check sulla pagina dedicata agli sviluppatori di dati.gov.it. Sostanzialmente ora trovate disponibili due API:

Nell’esempio sopra chiediamo al sistema di indicarci la lista di tutti i dataset presenti nel portale (limitando, con il parametro limit a 10 il numero dei dataset forniti in risposta). Utilizzando i parametri supportati da questa API limit e offset possiamo scaricare l’intera lista di dataset di dati.gov.it.

Dalla lista dei dataset per accedere ai metadati del singolo dataset possiamo invece usare la chiamata:

Passando, questa volta il parametro id (che abbiamo ottenuto nel JSON di risposta ottenuto con package_list) possiamo acquisire i metadati del singolo dataset.  

Scorrere migliaia di dataset in pochi click con la Treemap e utilizzando le API del sito

La Treemap è una visualizzazione di dati che evidenzia le relazioni tra un elevato numero di oggetti utilizzando una codifica a colori e una serie di rettangoli nidificati di dimensioni diverse.

Una treemap colorata utilizza il colore per raggruppare oggetti appartenenti ad una medesima categoria. Le dimensioni dei rettangoli rappresentano invece i valori che intendiamo rappresentare. Vediamo direttamente la Treemap di dati.gov.it.

Partendo dall’analisi fatta sull’insieme dei dataset del catalogo, e dai nuovi criteri di classificazione, abbiamo cercato una soluzione che consentisse una navigazione immediata e al contempo profonda dei dataset disponibili. Creando una treemap interattiva è stato possibile visualizzare i dataset secondo una gerarchia disposta su più livelli dando all’utente la possibilità di scendere e di salire di livello a piacimento. La treemap visualizza un qualsiasi insieme di dati organizzati gerarchicamente. Nel nostro caso abbiamo utilizzato D3.js che è una libreria JavaScript per la visualizzazione di dati dinamici (D3 è l’acronimo di Data-Driven Documents).

Per fornire alla Treemap i dati nel formato richiesto abbiamo realizzato uno script che a intervalli di tempo regolari esegue le seguenti attività:

  1. Chiama le API di dati.gov.it e scarica l’elenco dei dataset con i dettagli relativi al nome, all’organizzazione, al territorio di riferimento e alla categoria tematica (ove presente);
  2. Riorganizza i dati ad albero seguendo una gerarchia che può essere personalizzata di volta in volta. Al momento abbiamo optato per organizzare i dataset secondo la gerarchia:
    territorio -> tema -> organizzazione -> nome (e link al dataset).
  3. Trasmette i dati alla treemap usando il formato JSON utilizzato da D3.

Quando la treemap viene caricata nella pagina si limita a caricare il JSON e offre all’utente la possibilità di navigare l’albero. Il modello di treemap navigabile è ispirato ad una versione sviluppata da Mike Bostock (autore di D3) che aggiunge alcune caratteristiche importanti per un sito come dati.gov.it – vediamo quali:

  • utilizzo dei colori per la categorizzazione dei dataset (nello specifico il colore ora indica se un dataset ha valenza nazionale, comunale, regionale, provinciale o se appartenente ad un ente extra-territoriale)
  • impiego del formato vettoriale SVG per il rendering degli oggetti in pagina
  • dimensioni responsive della treemap, delle sottocomponenti e delle etichette testuali 
  • interattività per navigare in profondità i contenuti passando dal territorio al tema, e dall’organizzazione al singolo dataset

Sulla treemap sono stati poi effettuati i test di funzionamento cross-browser e cross-device che ci hanno portato  ad estendere la versione originale per supportare al meglio Safari ed Internet Explorer.

Ci siamo inoltre assicurati che il livello di accessibilità della treemap fosse WCAG 2.0 (Level AA) e che i colori non ponessero problemi a chi è affetto da daltonismo (di seguito alcuni dei risultati dei test).

colorblind-test-01

colorblind-test-02

La Treemap è Open Source

La zoomable Treemap è stata realizzata da Piero Savastano e la trovate sul GitHub di Insideout10: https://github.com/insideout10/zoomable-treemap

Continua … e nel prossimo articolo parleremo di harvesting e di come i metadati nel catalogo Italiano entreranno in contatto con il nuovo portale open data Europeo. 

L'immagine per questo post è una visualizzazione prodotta da un algoritmo di Alex D. (Ekisto) sui dati delle interazioni (watch, fork e follow) di GitHub.
 

Aiuta WordLift 3.0 e le imprese

Su 10 aziende fallite nel 2014, 8 non avevano il sito internet — detto aRimini, Festa della Rete di questo settembre 2015.

L’ 80% delle imprese fallite non aveva un sito internet ci suggerisce che: se non si è compresa la valenza degli infiniti aiuti che le reti digitali danno alle economie d’impresa è meglio non competere nel mondo dove queste sono fondamentali.

Sicuramente al raggiungimento di queste cifre hanno contribuito molte e tante altre dinamiche, ma se solo consideriamo la riduzione di tutti i tipi di costi d’impresa che si hanno con l’uso delle reti digitali, sia interni che per conoscere il proprio mercato, capiremmo molto di queste difficoltà economiche.

Vorrei poter aggiungere molto presto all’intro di questo post, diciamo entro il 2016:

su 10 Organizzazioni che hanno migliorato la conoscenza di se stesse e dei loro clienti, e aumentato del 30% la loro visibilità su internet nell’anno 2015, costruendo contemporaneamente con i propri contenuti dataset open riusabili, 8 usavano WordLift 3.0; l’editor semantico distribuito come plug in dalla piattaforma di CMS WordPress.

L’editor semantico WordLift 3.0 è molto utile alle imprese, alle Organizzazioni sia private che pubbliche, piccole, medie o grandi che siano, semplicemente perchè una volta personalizzato si adatta ai processi interni di acquisizione delle informazioni, alla pubblicazione delle stesse, e al web con le sue dinamiche di metadatazione.

WordLift 3.0 permette all’imprenditore di usare la rete internet senza dover rincorrere esperienze e tecnologie, perchè si pone come un filtro tra l’Organizzazione e le ormai quasi infinite relazioni e connessioni delle reti digitali. Questo significa non programmare la propria presenza in rete in relazione alle tecnologie disponibili, perchè sono in continua evoluzione e necessitano quindi di investimenti eccessivi per chi deve solo sfruttare il web come canale di comunicazione digitale.

WordLift 3.0 allega in automatico un set di metadati ai propri contenuti dando struttura ai propri archivi interni in modo che siano leggibili alle macchine e conformi con la cloud Linked Open Data.

 

WordLift 3.0 e le Smart Cities & Internet of Things

Le basi per un territorio intelligente sono: la pianificazione e la gestione. Dai primi anni del 2000 si discute nell’Urbanistica sull’approccio da dare allo sviluppo delle città introducendo concetti come cityness per indicare strategie e tendenze urbane che si riflettono sulla spazialità e territorialità.

Oggi queste metodologie sono poste alla base del confronto sui rapporti tra cittadini, spazio, comunità, sanità, sicurezza, cultura, arte, alimentazione, turismo, energia. E’ lo sviluppo della città e cittadinanza insieme come forma di rete e collaborazione. Un metodo per disegnare una pianificazione sensata e applicabile delle soluzioni di Smart City.

http://azarchitecture.com/blog/2014/04/defining-the-great-desert-city-part-two-of-four/

http://azarchitecture.com/blog/2014/04/defining-the-great-desert-city-part-two-of-four/

Affrontare e risolvere i problemi delle città diventa sempre più difficile; se ne sono accorti gli Architetti, o i Politici, o quelli più a diretto contatto con le difficoltà che sono i Funzionari Pubblici. La città non è più riconducibile ad un concetto unitario, ma poliedrico.

Pianificare l’uso, le economie e le regole delle città, conformemente ai bisogni della cittadinanza per migliorare la qualità della vita, è impossibile se non si riesce a recepire e confrontare i dati provenienti dal territorio, compresi quelli in risposta all’applicazione delle politiche sociali ed economiche.

Abbiamo bisogno di vedere tutti gli ambienti, che sono oggi aggregati e generalizzati in un’unica rappresentazione Urbanistica (comprese le infrastrutture di rete digitale), associati alla musica (rumore :), alle scienze e alle visioni, alle esperienze, alle condivisioni.

Organizzare l’uso dei sensori a tale scopo aiuterebbe l’affermazione: “stiamo costruendo una Smart City”. Organizzare in dataset la raccolta delle informazioni provenienti da ogni sensore secondo schemi e categorie diffuse nel mondo open data permetterebbe inoltre l’applicazione e il supporto alle Smart Grid di cui il Gruppo Enel è uno dei leader al mondo.

La pianificazione di città e territori necessita di sistemi complessi non riconducibili a modelli prestabiliti; ma detto questo chiariamo che sono diversi i modelli di Smart City basati o integrati con le tecnologie semantiche.

Gli approcci all’argomento sono sia up che down. Quì la presentazione di un data model basato sulla semantica elaborato dal CNR; e quì l’osservatorio italiano sulle best practice.

Se ad esempio prendiamo in considerazione il mondo del turismo (quì ultima inchiesta) notiamo che i colossi del web come Expedia, Hotel.com, Priceline, Trivago, TripAdvisor, lasciano ‘solo le briciole’ all’industria. Oggi prendono 1 miliardo di euro di provviggioni creando un fenomeno di delocalizzazione, che è di per se assurdo se consideriamo che il bene ha una sede fisica che non può essere spostata.

L’uso delle tecnologie semantiche Open Source per erogare un servizio territoriale e riproducibile potrebbe: sia spostare parte delle risorse e migliorare il prodotto turistico, che aiutare lo sviluppo di altre economie digitali legate alle Smart Cities.

WordLift 3.0 è un editor semantico, API e Plugin della piattaforma CMS WordPress che, una volta definiti i punti di aggregazione delle informazioni (things or nodes), può essere impiegato per costruire dataset open, cioè un insieme di dati riusabile, perchè è possibile la relazione con altri dataset.

WordLift 3.0 è una API per catalogare qualsiasi informazione sulla strada o città in cui viviamo, lavoriamo, viaggiamo, studiamo, per poi trasformarla in qualcos’altro.

 

WordLift 3.0 e le Smart Cities & Internet of Things

Le basi per un territorio intelligente sono: la pianificazione e la gestione. Dai primi anni del 2000 si discute nell’Urbanistica sull’approccio da dare allo sviluppo delle città introducendo concetti come cityness per indicare strategie e tendenze urbane che si riflettono sulla spazialità e territorialità.

Oggi queste metodologie sono poste alla base del confronto sui rapporti tra cittadini, spazio, comunità, sanità, sicurezza, cultura, arte, alimentazione, turismo, energia. E’ lo sviluppo della città e cittadinanza insieme come forma di rete e collaborazione. Un metodo per disegnare una pianificazione sensata e applicabile delle soluzioni di Smart City.

http://azarchitecture.com/blog/2014/04/defining-the-great-desert-city-part-two-of-four/

http://azarchitecture.com/blog/2014/04/defining-the-great-desert-city-part-two-of-four/

Affrontare e risolvere i problemi delle città diventa sempre più difficile; se ne sono accorti gli Architetti, o i Politici, o quelli più a diretto contatto con le difficoltà che sono i Funzionari Pubblici. La città non è più riconducibile ad un concetto unitario, ma poliedrico.

Pianificare l’uso, le economie e le regole delle città, conformemente ai bisogni della cittadinanza per migliorare la qualità della vita, è impossibile se non si riesce a recepire e confrontare i dati provenienti dal territorio, compresi quelli in risposta all’applicazione delle politiche sociali ed economiche.

Abbiamo bisogno di vedere tutti gli ambienti, che sono oggi aggregati e generalizzati in un’unica rappresentazione Urbanistica (comprese le infrastrutture di rete digitale), associati alla musica (rumore :), alle scienze e alle visioni, alle esperienze, alle condivisioni.

Organizzare l’uso dei sensori a tale scopo aiuterebbe l’affermazione: “stiamo costruendo una Smart City”. Organizzare in dataset la raccolta delle informazioni provenienti da ogni sensore secondo schemi e categorie diffuse nel mondo open data permetterebbe inoltre l’applicazione e il supporto alle Smart Grid di cui il Gruppo Enel è uno dei leader al mondo.

La pianificazione di città e territori necessita di sistemi complessi non riconducibili a modelli prestabiliti; ma detto questo chiariamo che sono diversi i modelli di Smart City basati o integrati con le tecnologie semantiche.

Gli approcci all’argomento sono sia up che down. Quì la presentazione di un data model basato sulla semantica elaborato dal CNR; e quì l’osservatorio italiano sulle best practice.

Se ad esempio prendiamo in considerazione il mondo del turismo (quì ultima inchiesta) notiamo che i colossi del web come Expedia, Hotel.com, Priceline, Trivago, TripAdvisor, lasciano ‘solo le briciole’ all’industria. Oggi prendono 1 miliardo di euro di provviggioni creando un fenomeno di delocalizzazione, che è di per se assurdo se consideriamo che il bene ha una sede fisica che non può essere spostata.

L’uso delle tecnologie semantiche Open Source per erogare un servizio territoriale e riproducibile potrebbe: sia spostare parte delle risorse e migliorare il prodotto turistico, che aiutare lo sviluppo di altre economie digitali legate alle Smart Cities.

WordLift 3.0 è un editor semantico, API e Plugin della piattaforma CMS WordPress che, una volta definiti i punti di aggregazione delle informazioni (things or nodes), può essere impiegato per costruire dataset open, cioè un insieme di dati riusabile, perchè è possibile la relazione con altri dataset.

WordLift 3.0 è una API per catalogare qualsiasi informazione sulla strada o città in cui viviamo, lavoriamo, viaggiamo, studiamo, per poi trasformarla in qualcos’altro.

 

WordLift 3.0 — Born for the internet

Al festival internazionale del giornalismo, aprile 2015, si è discusso del giornalismo digitale e della difficoltà a trovare un nuovo modello che permetta al giornalismo di essere pagato, e quindi sopravvivere.

Zero Calcare invitato al festival perchè con le striscie pubblicate su internazionale.it è stato in grado di coinvolgere i più giovani.

Anche uno scrittore che più influenza i pensieri degli americani riguardo al rapporto con i new media, Jonathan Franzen, ma non ho letto niente di Lui, dice che si ritiene fortunato perchè in quanto romanziere è pagato per i contenuti che produce; mentre chi lavora nel web fa fatica soprattutto se è un freelance.

A dirla tutta ha cattive opinioni sui nuovi tipi di professione di informatori digitali, perché: disinformano, opprimono e uniformano le opinioni. E si riferisce rispettivamente ai: leakers, citizen journalist, crowd sourcing, che danno solo opinioni personali e a volte violente.

Nel web ci sta tutto e personalmente diffido di chi addita come derive le “prove tecniche” sulle potenziali nuove professioni che da 20 anni circa vengono promosse dalla tecnologia, o domandano tecnologie per esprimersi. Sembrano come lamenti di una gioventù passata.

Nel corso del festival del giornalismo digitale un giornalista del Guardian, Aron Pilhofer, in un intervento illustra la loro esperienza, che ha dato come risultati alcune attività necessarie al ridisegno della professione di giornalista. Non si tratta solo di possibili risposte a domande tipo: quale potrebbe essere il nuovo business? come monetizzare, o quale è il valore economico della relazione con i propri lettori? Ma si parla della necessità di “ordinare la redazione”, “nuovo desk”, “live desk”, “visual desk”, e organizzare in: business, national, international la base del loro approccio al mercato.

Il dispositivo di lettura informazioni non è più cartaceo come si evince dalla vecchietta nella foto che segue.

Se si parla di circa 200mila quotidiani al giorno .. on line sono 120milioni (fonte The Guardian), abbiamo una stima dell’offerta di contenuti, ma anche della necessità di riordinare le redazioni digitali al fine di costruire i propri archivi interni in relazione ai temi trattati dalla testata, e che gli stessi siano conformi agli archivi open sul modello dbpedia di internet.

Dobbiamo allo stesso tempo ridare forza alla professione del giornalista dotando la redazione di strumenti in grado di supportare sia la fase di scrittura, che quella di pubblicazione dei contenuti senza richiedere skill tecnici al giornalista digitale. Proprio come auspicato dal compianto da poco David Carr del New York Times.

La personalizzazione dell’editor semantico WordLift 3.0 permette il nuovo design della redazione digitale conforme ai risultati dello studio del Guardian, ma solo per gli utenti della piattaforma di CMS WordPress.WordLIft 3.0 fa passare dall’informazione alla conoscenza evitando il complotto.

 Nota: post già pubblicato su medium/it