BGT als Linked Data gelanceerd

Op 10 november 2020 is tijdens een DiS Online sessie de BGT als Linked Data gelanceerd.

De Basisregistratie Grootschalige Topografie (BGT) is de laatste grote geo-basisregistratie bij het Kadaster dat nog niet beschikbaar is als Linked Data. 

Op initiatief van het Kadaster, Geonovum en de Provincie Noord-Holland, en in samenwerking met CROW en CGI, heeft er van 13 t/m 16 januari 2020 een High5* sessie plaatsgevonden. Uit deze High5 is gebleken dat het mogelijk is om de BGT als Linked Data beschikbaar te stellen. Er is aangetoond dat de BGT ook met andere bronnen te koppelen (‘linken’) is. Deze High5 was voor het Ministerie van BZK reden om aan Kadaster de opdracht te geven de volledige BGT als Linked Data beschikbaar te stellen.

Met deze lancering komt er ieder kwartaal een nieuwe publicatie van de BGT beschikbaar. De eerste publicatie heeft als actualiteit de peildatum 2 oktober 2020.

De toegevoegde waarde van deze nieuwe publicatie van de BGT als Linked Data zit met name in de mogelijkheid tot (eenvoudig) integraal bevragen. Dit in combinatie met andere geo-basisregistraties zoals de BAG, maar ook met andere (publieke- en domein) datasets zoals die van het CBS of de waterschappen.

De BGT als Linked Data – So what?

Het is mooi dat de BGT als Linked Data is gepubliceerd, maar het roept misschien ook wel de vraag op: wat kunnen we ermee? Immers, de BGT wordt al via andere zogenaamde GIS-formaten gepubliceerd. Wat is er dan nu anders? Een terechte vraag die een wat uitgebreider antwoord in twee delen verdient.

De Droom
Allereerst is het publiceren van Linked Data onderdeel van een lange termijn visie/droom. Die droom is als volgt: binnen DiS-Geo willen we onze data integraal bevraagbaar maken op een laagdrempelige manier. Hierbij richten we ons niet alleen op onze eigen (geo-)basisregistraties, maar kijken we ook naar de integratie met andere (open) (geo-)data in het publieke domein.

Er zijn twee zaken die noodzakelijk zijn voor de droom van het integraal bevraagbaar maken van data op het Web: De datasets moeten via de Linked Open Data aanpak gepubliceerd zijn en daarnaast ook aan elkaar gelinkt zijn in wat we vaak de gebruikers "Knowledge Graph" noemen. In deze Knowledge Graph zijn de individuele Linked Datasets aan elkaar "geknoopt" via administratieve relaties vanuit een gebruikersoogpunt.

Waarom Linked Data
Het grootste en eerste voordeel van Linked Data waar andere technologie/formaten geen alternatief bieden, is het integraal bevragen van data conform de standaarden van het "Web". Met integraal bedoelen we data uit meerdere datasets die in 1 analyse "query" bevraagd kunnen worden. Deze "queries" of vragen zijn niet vooraf gedefinieerd en zijn volledig vraag/gebruikers gestuurd. Dit is ook het onderscheid met de traditionele REST APIs die nagenoeg altijd aanbod gedreven zijn: de leverancier bepaalt (op basis van klantwensen en eigen beleid) op welke manier de data bevraagbaar is. Doordat Linked Data direct vindbaar en bruikbaar is op het web hoeven we niet langer datasets te kopiëren en te integreren, en kan het gebruikt worden voor iedereen met een internetbrowser.

Een tweede voordeel is dat in de filosofie van Linked Data ook de metadata, inclusief datamodel, gezien wordt als onderdeel van de dataset zelf. De tijd dat we metadata en datamodellen in andere systemen vastleggen en apart publiceren komt daarmee tot een eind. Dit brengt meerdere voordelen met zich mee, allereerst dat de dataset beter vindbaar wordt op het web (bv. Google), doordat de (meta)data door zoekengines indexeerbaar is. Daarnaast zijn de definities uit het semantische model slechts 1 klik verwijdert voor de developer/analist die met de BGT-data aan de slag is. Daarmee krijgt de ontwikkelaar meer mogelijkheden en zekerheid of de gewenste bevragingen ook tot het gewenste resultaat gaan leiden.

En nu
Door de BGT als Linked Open Data beschikbaar te stellen hebben we weer een belangrijke stap gezet; andere geo-basisregistraties, zoals de BAG en BRT zijn ook al als Linked Open Data gepubliceerd of volgen binnenkort. Daarmee is het fundament gelegd.  

Echter, de vervolg stap is nog niet gezet, zijnde het linken van de (linked) data sets in de gebruikers knowledge graph. We hopen hier in de nabije toekomst de volgende stap te kunnen zetten in het behalen van de lange termijnvisie.

Dit wil overigens niet zeggen dat er nu nog niets mogelijk is. Er zijn al verschillende gebruiksmogelijkheden door op het tweede voordeel van Linked Open Data te focussen: "conform de standaarden van het Web". Linked Data kan gezien worden als een "Database op het Web". Dat betekent dat je een database kan bevragen (query) zonder dat je eerst de database hoeft te kopiëren/aanleggen. Ook heb je geen specifieke Geo kennis nodig, maar maak je gebruik van de gestandaardiseerde query taal voor het web (SPARQL en GEOSPARQL voor geografische bevragingen). Een analyse op een type BGT-object dat aan bepaalde voorwaarden moet voldoen, is eenvoudig te formuleren als SPARQL query en direct uit te voeren. Voor gebruiksgemak kan een SPARQL Query vervolgens ook verpakt worden in een REST API, zodat je eigenlijk een vraag gestuurde maatwerk API hebt.

Conclusie
Enerzijds werken we dus aan een lange termijnvisie van het integraal bevragen van alle geodata. Met het publiceren van de BGT als Linked Open Data zetten we daarin een belangrijke en noodzakelijk stap. Maar we zijn er nog niet en willen vooral de volgende stap zetten richting de "Gebruikers Knowledge Graph". Anderzijds kunnen we nu al de mogelijkheden gebruiken van het uitvoeren van SPARQL queries op de BGT zonder eerst complexe data handelingen uit te voeren.

En hoe kan ik er dan mee aan de slag?

De (technische) ingang op de data is: bgt.basisregistraties.overheid.nl, en het SPARQL endpoint is te benaderen op: https://bgt.basisregistraties.overheid.nlsparql. Vaak is het daarbij handig om te weten hoe het datamodel eruitziet, inclusief de definities van de objecten, bijvoorbeeld een flitser:

https://bgt.basisregistraties.overheid.nl/bgt/def/Flitser. Ook is het handig om te weten hoe de object uri’s zijn opgesteld, bv. https://bgt.basisregistraties.overheid.nl/bgt/id/registratie/NL.IMGeo.G0141.9d5d61550d4088f2e0539905050aac09.2020-08-10T12-30-15.000Z

Bovenstaande is vooral wat een developer of data scientist nodig heeft om de BGT als LD te gebruiken, maar er is natuurlijk ook de business gebruiker met interesse in toepassingen en voorbeelden. De ingang op de voorbeeld data stories (mogelijke use cases) is: https://labs.kadaster.nl/cases/bgt-ld

Vragen over de BGT als Linked Data, kan via de reguliere BGT kanalen, of via het Geoforum, of door het Kadaster Data Science Team te benaderen (erwin.folmer@kadaster.nl). We helpen u graag op gang!