L’innovazione è uno strumento cruciale per creare industrie e società migliori, attraverso la creazione di nuovi prodotti, di nuovi servizi, nuovi processi di produzione e nuovi modelli di business. A partire dalla Seconda guerra mondiale, il finanziamento pubblico alle attività di ricerca è stato un motore significativo per il progresso di conoscenze e applicazioni innovative fondanti su basi scientifiche.

In passato, per quantificare l’impatto della ricerca si è utilizzato come indicatore prevalentemente la produttività scientifica. Recentemente si è visto come sia importante invece analizzare l’impatto della ricerca anche in termini di nuove tecnologie, applicazioni commerciali e risultati sociali prodotti. La logica sottostante presuppone che i progetti di ricerca sostenuti pubblicamente dovrebbero contribuire ai progressi tecnologici ed economici della società, in quanto generatori di nuove conoscenze scientifiche che sono alla base dello sviluppo tecnologico.

Per studiare la relazione tra ricerca scientifica e innovazione si è recentemente iniziato a studiare i collegamenti tra articoli scientifici e brevetti, questi ultimi considerati un output intermedio tra ricerca e commercializzazione. Un modo per fare ciò consiste nell’analizzare le citazioni di pubblicazioni scientifiche che sono contenute nei testi dei brevetti. Questo è possibile utilizzando tecniche di analisi del testo e sfruttando la maggiore disponibilità di database su larga scala di brevetti e pubblicazioni.

Una ricerca basata su questo approccio e incentrato sui brevetti legati ai finanziamenti del National Institutes of Health (NIH) degli Stati Uniti in un periodo di 27 anni, è stato rilevato che circa il 10% delle sovvenzioni NIH genera direttamente un brevetto, ma il 30% genera articoli che vengono successivamente citati da brevetti. Utilizzando un approccio simile, alcuni ricercatori hanno mostrato che quasi un terzo dei brevetti statunitensi si basa sulla ricerca federale.

Nel caso specifico dell’Europa, alcuni influenti studiosi hanno introdotto il concetto di “paradosso europeo”, per quanto riguarda la capacità delle istituzioni europee di generare risultati scientifici eccezionali e la loro debolezza osservata nel tradurli in innovazioni tecnologiche di successo. Manca tuttavia una ricerca strutturata che ne valuti estensivamente l’impatto.

Ed è qui che entra il gioco un progetto risalente a questa primavera, a cui abbiamo lavorato insieme al dipartimento di Scienze Aziendali dell’Università di Bologna. In questa collaborazione abbiamo utilizzato tecniche di NLP per studiare come gli investimenti pubblici nella ricerca scientifica (il nostro “case study” erano i fondi dell’European Research Council) impattino sulla produzione di innovazione tecnologica.

Abbiamo studiato gli effetti di un particolare tipo di finanziamento pubblico alla ricerca, quello del Consiglio Europeo della Ricerca (ERC) all’interno del programma FP7 nei domini scientifici (LS e PE), tra il 2007 e il 2013 (budget di circa 6 miliardi di euro). All’inizio abbiamo creato un database di tutti i progetti di ricerca finanziati (circa 3200) e di tutte le pubblicazioni scientifiche prodotte, partendo dai dati forniti dall’EU attraverso il portale Cordis. Il programma di finanziamento FP7 risale a vari anni fa e molte pubblicazioni derivate non sono presenti sul portale di divulgazione scientifica dell’Unione Europea. Per avere un database completo (o quasi) delle pubblicazioni abbiamo consultato fonti esterne come il database Scopus.

Abbiamo poi “matchato” queste pubblicazioni scientifiche all’interno del database di brevetti dell’European Patent Office, incrociando circa 100 mila pubblicazioni trovate, con la letteratura scientifica citata da milioni di brevetti nel database. I database sia delle pubblicazioni che dei brevetti non hanno uno standard di nomenclatura delle pubblicazioni e i dati sono spesso inseriti a mano in modo disomogeneo (e spesso impreciso). Per il match, abbiamo considerato le stringhe che potevano essere doi, autori, titolo, dopo aver normalizzato tutto per massimizzare le comparazioni.

Nel complesso, abbiamo troviamo che circa 12.000 brevetti citano pubblicazioni finanziate da questi ERC, e che circa il 30% dei progetti ERC ha almeno una ricerca successivamente menzionata da brevetti concessi. Questa quota è notevolmente superiore ai numeri in possesso dell’ERC, che tiene traccia solamente dei brevetti pubblicati all’interno del progetto finanziato stesso, ma non dei brevetti che indirettamente hanno beneficiato delle pubblicazioni prodotte.