Menno schreef :
Waar heb je dit bestand gedownload? En kan je het oude en nieuwe formaat hier uploaden (extentie aanpassen naar .txt)
Bestanden die ik bij RWS krijg lijken gewoon geldige CSV-bestanden, met een aantal bijzonder keuzes bij het formaat van sommige cellen.
Gehaald op
maps.rijkswaterstaat.nl/datare...e1-9624-fee9b784138c
Dit is ruwe data (1 regel) van 1 boei:
vaarweg_markering_drijvend.9930559,BOONTJES,VW-BO -0108,BO 2-VVG 1,01-01-2005,"149392,7398","566594,5625",LK2600 MM.,3,53.05.10.15,005.18.12.68,53.05.1691,005.18.2113,4,Pilaar,"6,2",Geel/zwart,1,Horizontaal,14,"2 Kegels, punten naar beneden",2,Zwart,L,X,26,very quick-flash plus long- fl,(6)(1),(6)(1),10,#,1,Wit,#,5.30352222,53.08615278,Pilaar Geel/zwart,2223,,,POINT (654270.7856999999 5884334.456700001)
Zo'n CSV is natuurlijk gewoon een txtfile met afspraken over scheiding tussen de velden.
In dit geval een komma.
Anders dan eerst (maanden geleden) is:
- "149392,7398","566594,5625" zijn de RD-coordinaten. Nu ineens tussen quotes en met overbodige komma's
- al die punten in sommige LAT en LON
- quotes rond de kleur-benaming "6,2")
- en die komma ertussen is nieuw
- quotes rond "2 Kegels, punten naar boven"
- ook die komma is nieuw
De 1e regel bevat de namen van de velden.
Daarmee wordt de file dus een matrix met in de 1e regel de kolomnamen:
FID,vaarwater,benam_cod,benaming,inbedrijf,x_rd,y_rd,obj_soort,iala_categorie,n_wgs_gms,e_wgs_gms,n_wgs_gm,e_wgs_gm,obj_vorm_c,obj_vorm,obj_kleur_,obj_kleur,kleurpatr_,kleurpatr,v_tt_c,tt_toptek,tt_kleur_c,tt_kleur,tt_pat_c,tt_klr_pat,sign_kar_c,sign_kar,sign_gr_c,sign_groep,sign_perio,racon_code,licht_kl_c,licht_klr,opgeheven,x_wgs84,y_wgs84,vorm_kleur,s57_id,se_anno_cad_data,gdb_geomattr_data,shape
Keurig met komma's 40 stuks. Dat geeft 41 datavelden.
En dan peuteren we die tekstregels uit elkaar met een split in Python.
Dat geeft 41 aparte data items (in een List) voor de kolomnamen.
En 43 data items voor de data, omdat er extra komma's in zitten die ook resulteren in een data item.
En als er dan ook nog een licht op de boei zit komt er een extra komma bij en schuiven alla data items nog een plekje op.