Open data over treinstoringen

Rijden de Treinen verzamelt sinds 2011 alle treinstoringen in het storingsarchief. Wil je deze data gebruiken voor onderzoeksdoeleinden, een journalistiek verslag, een innovatieve toepassing of een studieopdracht? Dan kun je deze data gratis downloaden als open data.

Ga naar:

Beschrijving van de data

Als je deze dataset gebruikt is het belangrijk om te beseffen dat deze data gaat over verstoringen die door NS gecommuniceerd zijn. Niet elke trein die vertraagd of opgeheven is wordt door NS gecommuniceerd als een verstoring; de vuistregel die NS hanteert is dat een verstoring gecommuniceerd wordt wanneer meerdere treinen vertraagd of opgeheven zijn (dus een grote impact op de treindienst).

Het is ook belangrijk om te beseffen dat er sinds 2017 meer verstoringen gecommuniceerd worden, omdat NS toen een nieuw systeem heeft geïntroduceerd waarmee ze verstoringen eerder kunnen aankondigen (wat resulteert in meer verstoringen met een korte duur). Het vergelijken van het aantal verstoringen van 2017 met het aantal verstoringen in de jaren daarvoor is daardoor niet mogelijk (tenzij je rekening houdt met de toename van korte verstoringen).

De bron voor de verstoringen is altijd NS; de afdeling reisinformatie van NS monitort 24 uur per dag de treindienst om te zien of er verstoringen zijn. De storingsberichten in de open data zijn dezelfde berichten als op de borden op het station, de stationsomroep en op de Rijden de Treinen website en app.

Kolommen

Deze dataset bevat de volgende kolommen:

  • rdt_id
    Uniek ID
    Het unieke ID dat Rijden de Treinen gebruikt voor een verstoring. Wanneer je een verstoring in het storingsarchief opent, kun je het ID vinden in de URL van de verstoringpagina. Zo is het ID voor deze storing tussen Amsterdam Zuid en Schiphol 12345.
  • ns_lines
    Getroffen trajecten (uit storingsbericht)
    Dit zijn de trajecten die door NS gekoppeld zijn aan een verstoring. Voor de verstoring in het voorbeeld is dit Schiphol-Almere C./Hilversum/Utrecht C.
  • rdt_lines
    Getroffen trajecten (gekoppeld door Rijden de Treinen)
    De trajecten die door Rijden de Treinen gekoppeld zijn aan een verstoring. Dit is altijd op basis van de lijst met trajecten van Rijden de Treinen, en de koppeling is gebaseerd op de stations waar een verstoring zich bevindt.

    In het voorbeeld is de verstoring tussen Amsterdam Zuid en Schiphol. Rijden de Treinen koppelt dan de trajecten Amersfoort-Schiphol, Lelystad-Schiphol en Utrecht-Schiphol. De trajecten worden altijd gekoppeld op alfabetische volgorde, gescheiden door een komma.
  • rdt_lines_id
    Traject-ID's van getroffen trajecten
    De ID's van de trajecten die door Rijden de Treinen gekoppeld zijn aan een verstoring, gescheiden door een komma.
  • rdt_station_names
    Getroffen stations (gekoppeld door Rijden de Treinen)
    Rijden de Treinen berekent op basis van de lijnkoppeling ook welke stations getroffen zijn door een verstoring. In deze kolom vind je de stationsnamen van de getroffen stations, gescheiden door een komma.
  • rdt_station_codes
    Stationcodes van getroffen stations
    Dit zijn de codes (afkortingen) van de getroffen stations, gescheiden door een komma. De stationcodes kun je vinden in de dataset met treinstations.
  • cause_nl
    Storingsoorzaak (in het Nederlands)
    Dit is de oorzaak van een verstoring, in het Nederlands. Wanneer de oorzaak van een verstoring door NS gewijzigd wordt tijdens een verstoring, wordt de laatst gebruikte oorzaak getoond in deze kolom.
  • cause_en
    Storingsoorzaak (in het Engels)
    De storingsoorzaak vertaald in het Engels.
  • statistical_cause_nl
    Statistische storingsoorzaak (in het Nederlands)
    Voor statistische doeleinden houdt Rijden de Treinen ook een statistische oorzaak bij. Wanneer de oorzaak van een verstoring gewijzigd wordt, gaat informatie over de daadwerkelijke oorzaak van een verstoring soms verloren.

    Zo wordt een verstoringsoorzaak soms gewijzigd naar de generieke een eerdere verstoring of werkzaamheden. Wanneer een meer beschrijvende verstoringsoorzaak beschikbaar is, wordt deze oorzaak opgeslagen als de statistische oorzaak.
  • statistical_cause_en
    Statistische storingsoorzaak (in het Engels)
    De statistische storingsoorzaak, maar dan vertaald in het Engels.
  • cause_group
    Storinggroep
    De groep waarin de verstoring ingedeeld is (in het Engels). Je kunt de groepen vinden in de lijst met storingsoorzaken.
  • start_time
    Starttijd
    De tijd waarop de verstoring begon.
  • end_time
    Eindtijd
    De tijd waarop de verstoring eindigde.
  • duration_minutes
    Duur (in minuten)
    De duur van de verstoring in minuten.

Downloads

De volgende datasets zijn beschikbaar:

Licentie en bronvermelding

CC BY 4.0

Deze data wordt vrijgegeven onder de Creative Commons Attribution 4.0-licentie. Dat houdt in dat je deze data voor alle doeleinden kunt gebruiken, zolang je Rijden de Treinen als bron vermeldt. Als je vragen hebt over de data, neem dan contact op.

Deze data wordt jaarlijks vernieuwd. Voor pers, media en professionele gebruikers is het mogelijk om een meer actuele versie van deze dataset te krijgen of een aangepaste selectie. Neem contact op voor meer informatie.

Rijden de Treinen heeft ook open data over: