De Europese Commissie zet stappen in de richting van wat de European Open Science Cloud genoemd wordt. In die titel ligt veel besloten: open, science en cloud om te beginnen. Maar ook een majeure transitie van bestaand naar nieuw, geïntegreerd beleid. Waar gaat dit over, wat is de bedoeling en wat zijn de stappen?

Wist je dat de Nederlandse universiteiten verbindingen hebben tot 100 Gbyte per seconde? Wist je dat het SKA-project (Square Kilometer Array) meer datatransport gaat vragen dan tienmaal het huidige mondiale internetverkeer bij elkaar?

Wist je dat Europa beschikt over een functionerende supercomputerinfrastructuur, bestaande uit meerdere TOP500-gerankte supercomputers, en dat er Europese data en grid-infrastructuren zijn voor de ondersteuning van de wetenschap in Europa?

Deel je de visie (pdf) van de High Level Expert Group van de Europese Commissie dat 90 procent van de data in de wereld in de afgelopen twee jaar is gegenereerd?

Misschien wel, misschien niet, maar dit zijn de uitgangspunten voor een majeure actie gericht op vergaande integratie van deze redelijk zelfstandige infrastructuren in één samenhangende infrastructuur, met het open delen van data als primaire leidraad.

Eén cloud

De term cloud heeft voor mensen en in bedrijfsomgevingen veel intuïtieve betekenis. Voor sommigen heeft het iets concreets: een dienstleverancier waar je een contract mee hebt; een faciliteit die je fysieke IT-omgeving vervangt; een oplossing voor groei of variaties in je workload-problemen. Maar het is tegelijk ook vaagheid troef. Iets wat letterlijk zo ongrijpbaar is als een wolk – totdat het regent.

Voor de European Open Science Cloud (EOSC) is dat niet heel erg anders. Integratie is mooi; een single sign-on voor de hele Europese infrastructuur is prachtig; naadloos kunnen schakelen tussen verschillende componenten van de infrastructuur en de ongehinderde toegang tot open data zijn mooi en concreet voorstelbaar als eindproduct.

Maar de weg ernaartoe is complex. Zowel technologisch en organisatorisch als sociaal. Een grid-infrastructuur is gebaseerd op het vrijwillig delen van elkaars resources, de supercomputer-infrastructuur (PRACE) bestaat bij de gratie van de vrijwillige inzet van aanzienlijke kapitalen door lidstaten, gevolgd door het vrijwillig delen van de beschikbare resources met niet- of minder betalende deelnemers.

EUDAT, voor Europese dataservices, levert supranationale datadiensten, maar wel op basis van de inzet en inbreng van de deelnemende landen. Met andere woorden: er is geen top-downgovernance die beleid kan afdwingen. Weliswaar stelt de Europese Commissie middelen ter beschikking om de samenwerking te steunen, nationale barrières te slechten en essentieel coördinatiewerk te financieren – zonder die steun waren deze infrastructuren niet van de grond gekomen. Maar het blijft wel een minderheidsbijdrage die het afdwingen van beleid moeilijk maakt. Toch is die coördinerende en stimulerende functie essentieel om de vele resource-eilandjes van de lidstaten, van de vele datasilo’s van onderzoeksgroepen en de soms ook specialistische expertises bijeen te krijgen.

De science-case

Een algemeen aanvaard model voor het verkrijgen van subsidie voor grote infrastructuren waar een breder, algemener belang mee wordt gediend dan de ondersteuning van een enkel domein, is het schrijven van een science-case: waarom is deze voorziening nodig en hoe wordt de wetenschap hiermee gesteund? Een dergelijke science-case ligt ten grondslag aan in ieder geval PRACE, EGI en EUDAT.

Voor de EOSC ligt dit een beetje anders. Na jarenlange steun van de Europese Commissie aan de verschillende individuele infrastructuren wil deze nu de samenhang afdwingen. Daar komt bij dat alom in de wetenschap en in het bedrijfsleven het concept ‘data’ (zowel in de context van big data als in de context van internet of things) dermate in belang is toegenomen, dat de data-invalshoek serieus als versneller voor wetenschappelijke ontdekkingen kan worden beschouwd.

En de uitkomsten van de wetenschap versnellen willen we allemaal. Daarom is nu, na uitgebreide consultatie, gekozen voor een meer top-down gerichte aanpak. Dat geldt nog niet voor de werkelijke implementatie. Wel zijn alle infrastructuurpartijen zich ervan bewust dat er belangrijke dingen gaan veranderen en dat zal ook in de financiering ervan tot uitdrukking komen.

Dat neemt niet weg dat er impliciet wel degelijk een science-case bestaat voor een open Europese cloud. In toenemende mate maken onderzoekers, links- of rechtsom, nu al gebruik van traditionele cloudservices. Niet omdat die goedkoper zouden zijn, maar vanwege het gebruiksgemak. Ook bestaat er een toenemende behoefte om data te delen.

De beoogde samenhang tussen de initiatieven

Maar geschikte voorzieningen daarvoor ontbreken vaak. Ook is het vertrouwen in ‘commerciële’ cloudvoorzieningen in termen van privacy en security en met betrekking tot echte garanties voor long-term storage, laag. Liever had men een cloudvoorziening die laagdrempelig en gebruiksgemakkelijk is, maar tegelijk veilig en duurzaam, en onder een regiem waarbinnen Europese wet- en regelgeving niet alleen van toepassing is, maar ook kan worden afgedwongen. Kortom, een goed toegeruste, cloudgebaseerde, geïntegreerde infrastructuur zou waarschijnlijk snel geaccepteerd worden en daarmee een drager worden voor de verdere versnelling van onderzoek.

Nieuw domein

Europa en de science community moeten klaar zijn voor het onderzoek van de toekomst. Zoals dat rond het SKA, waarmee dit verhaal begon. Maar de big sciences zijn niet de enige spelers in het veld. De ‘long tail’ in science (al het onderzoek dat niet onder een klein aantal grote noemers valt) is omvangrijk en complex, maar met een groot potentieel voor mainstreamtype cloudgebruik.

Denk daarbij aan de sociale en actuariële wetenschappen, rechtsgeleerdheid, theologie en geesteswetenschappen en ook veel onderzoeksdomeinen in de chemie, levenswetenschappen, techniek en aardwetenschappen. Domeinen die ook in toenemende mate voor hun vooruitgang afhankelijk zijn van een optimale inzet van alles wat IT en IT-infrastructuur kunnen bieden.

De nieuwe manieren om onderzoek te verrichten met een optimale inzet van IT en IT-infrastructuur vallen onder het domein eScience. Met de ‘e’ voor ‘enhanced’. In dit werkdomein werken onderzoekers uit alle wetenschapsgebieden, met een uitstekende en actuele kennis over wat er met IT en een holistische blik en gebruik van de IT-infrastructuur mogelijk is.

“Europa en de science-community moeten klaar zijn voor het onderzoek van de toekomst”

Intussen is ook wel duidelijk dat het hanteren van mooie principes, zoals open data (open waar het kan, gesloten waar het moet) vooral ook een kwestie is van sociaal-culturele aard. Iets waarvoor een verandering in mindset nodig is. Het delen van je eigen goudmijn (je data) met derden is niet per se iets wat je van nature doet. Maar het is wel iets wat van algemeen belang wordt, omdat het naar de inzichten van vandaag, de beste manier is om de resultaten en successen van onderzoek te versnellen.

EOSC Declaration

De consultaties van de Commissie over de toekomst van de infrastructuren zijn uitgemond in een officiële ‘EOSC Declaration’ die met de lidstaten gedeeld wordt. De kern hiervan is dat data open gedeeld kunnen worden en dat daartoe twee dingen nodig zijn: afspraken over de vindbaarheid en herbruikbaarheid van data in de breedste zin van het woord, én een infrastructuur die het open delen van data maximaal ondersteunt.
Het voert te ver om bij de Declaration ‘and more than 30 statements about EOSC’ uitgebreid stil te staan. Maar een indicatie past hier wel. In het format van de EOSC Pilot:

Governance model – A long-term, sustainable research infrastructure in Europe requires a strong and flexible governance model based on trust and increasing mutuality. As interdisciplinarity is one of the main objectives of the EOSC, the governance model should be based on representativity, proportionality, accountability, inclusiveness and transparency.

Governance framework – The EOSC governance framework will be co-designed, stakeholder driven and composed of three main layers: 1) institutional, including EU Member States and the European Commission; 2) operational, including a governance board and relevant working committees (e.g. thematic and functional) and 3) advisory, including a stakeholder forum.

Governance board– A governance board will coordinate the efforts of stakeholders endorsing the EOSC Declaration, with the broad mandate to reach practical agreements for the implementation of an EOSC Roadmap by 2020. The board will have an advisory role and an implementing role of the decisions by Member States and European Commission concerning the programming, financing and towards the setting up of a long-term governance and business model for the EOSC. It will make best use of the outcomes of past and current projects (e.g. EOSCpilot, eInfraCentral and EOSChub) and independent expert advice and studies.

Coordination structure – A coordination structure, funded by Horizon 2020, will help the governance board to manage the implementation, according to agreed rules and methods of stakeholder participation. The structure and its participating entities should be accountable for the responsibilities assumed, based on an objective assessment of their level of readiness in delivering the EOSC main functionalities.

Long-term sustainability – The European Commission, Member States and Research Funders will use existing and future resources strategically, to ensure long-term sustainability of open research data and research infrastructures, facilitating inter-disciplinarity.

Funding – Over time, a co-funding mechanism mixing different revenue streams for the EOSC will be set up, to increase the accountability of the governance, building trust, sharing resources and building long-term capacity for European research data. Early implementation of the EOSC will pilot innovative business models and support an integrated data and service platform for European research.

Global aspects – The EOSC will be European and open to the world, reaching out over time to relevant global research partners. It will increase the global value of open research data and support stakeholder engagement, including researchers and citizens. It will gradually widen the initiative to federated network of infrastructures and nodes from global research partners. The EOSC Stakeholder Forum will have an important role in this sense.

Cross DG

Een uitdaging bij de realisatie van de EOSC is dat twee grote actielijnen elkaar ontmoeten, namelijk de gedachte achter de EOSC, die vooral afkomstig is van het directoraat generaal (DG) voor Research en zich richt op het hogere doel (data-exchange en hergebruik), en die van de European Data Infrastructure (EDI), een concept van DG Connect dat vooral de technische hoofdinfrastructuur betreft (Exascale Computing, Geánt-netwerk en meer) en dat essentieel is voor het welslagen van de EOSC. Op de afbeelding uit een presentatie van de Europese Europese Commissie, is de beoogde samenhang te zien.

Frisse ambitie

‘Brussel’ zit over het algemeen niet verlegen om mooie woorden en teksten. Toch ademt de gestelde ambitie nieuw elan uit, na de introductie van de individuele Europese IT-infrastructuren als concept in de eerste millenniumjaren tot omstreeks 2015. Een elan dat aansluit op de moderne tijd en dat Europa kan helpen om de competitie uit de VS, Japan en de BRIC-landen, met name China, op het gebied van de research en innovatie te weerstaan.

LAAT EEN REACTIE ACHTER

Laat alsjeblieft een reactie achter!
Laat hier je naam achter