Changes between Initial Version and Version 1 of Catalogue/Minutes/2012_03_02


Ignore:
Timestamp:
Mar 6, 2012 4:37:23 PM (12 years ago)
Author:
Morris Swertz
Comment:

--

Legend:

Unmodified
Added
Removed
Modified
  • Catalogue/Minutes/2012_03_02

    v1 v1  
     1= Catalogue meeting 2012_03_02 =
     2[[TOC()]]
     3
     4= Catalogus workgroup meeting 2012_03_02 =
     5
     6Aanwezig: Marc Rietveld, Willem de Bruijn, Gerard van Grooteest, David van Enckvort, Linda Mook, Eric Vermeulen, Morris Swertz
     7Afwezig: Annet Sollie, Teun Oosterbaan, Erik van Mulligen
     8
     9Doel van deze bijeenkomst was kennismaking, benoemen van huidige activiteiten, vinden van samenwerkingspunten voor lopende biobank catalogus projecten. Met name is gesproken over systemen voor data opslag. Doel van deze werkgroep is concrete doelen en kansen vaststellen die eventueel in BBMRI-NL context een (regenboog)project kunnen worden.
     10
     11De agenda:
     12
     13== Introductie rondje ==
     14
     15Morris: werkt aan catalogi, research portals in LifeLines, BBMRI, NBIC, GEN2PHEN, BioShare, CTMM, BioMedBridges, EU-PANACEA,
     16Marc: Mondriaan, UMCU, samen met Annet Sollie, Research data warehouse binnen UMCU (SAS gebaseerd)
     17Willem: Mondriaan catalogus vullen met data
     18Gerard: GGZ data manager; beginnen nu met RP5 (catalogus workpackage)
     19David: biobank task force project leider, werkt met Morris aan catalogus BBMRI en LifeLines
     20Linda: PSI, graag aanhaken voor catalogus en research portal
     21Eric: RP6 omtrent communicatie met donor, hoe organiseren dat deelnemers toegang krijgen tot data, vanuit KUN governance patienten vereniging (Kees Smit)
     22
     23== Recap: welke nivo's catalogus ==
     24
     25In opvolgene mate van detail informatie:
     26
     271. lijst van cohorten -> bijv BBMRI-NL catalogus, BBMRI-EU catalogus
     282. lijst variabelen per cohort -> bijv LifeLines catalogus, PIM lijst variabelen, P3G catalogus, klinische bouwstenen/DCM
     293. geagregeerde data per cohort  -> bij PSI 'dashboard' (=plan)
     304. individu data per cohort -> bijv LifeLines research portal, Mondriaan catalogus, GGZ catalogus
     31
     32Tijdens de discussie kwamen er nog levels bij zoals:
     332b. mappings tussen variabelen zoals (a) conversies tussen bron systeme en (b) conversies per onderzoekstoepassing
     34
     35Iedereen verteld eea:
     36
     37== Morris / BBMRI-NL RP2 & NBIC-Biobanking task force ==
     38
     39Morris werkt met zijn team aan catalogi / databases op alle bovenstaande nivo's. Alle zijn gebaseerd op vier basis concepten, ontwikkeld samen met GEN2PHEN, P3G, EBI en anderen. Het resultaat is een generiek 'Observ-OM' data model dat werkt voor mens en model organismen. De concepten samengevat:
     40
     411. Features (kenmerken), hieronder vallen
     42  * Measurement (meetingen, 'wat is ...')
     43  * Characteristics (kenmerken, 'heeft ja/nee ...')
     44  * Variables (dus statistische factoren e.d.)
     452. Targets (materialen), hieronder vallen
     46  * panel: groep van mensen
     47  * individual: bijvoorbeeld patient
     48  * sample: een materiaal van een individue
     493. ObservedValue (de meetwaarden), hieronder vallen
     50  * meetwaarden per individue, zoals phenotypes, genotypes, gen expressie, etc.
     51  * geagregeerde data per cohort
     524. Protocol / ProtocolApplication (de procedure van meten), hieronder vallen
     53  * Questionnaires
     54  * Wet lab procedures zoals next generation sequencing
     55  * Analyse procedures zoals GWAS, epidemiologische associatie studies, prediction models
     56  * DCM is een bijzoner geval van een protocol
     57
     58Voorbeeld toepassingen relevant voor deze werkgroep:
     59- BBMRI-NL catalogus van biobanken
     60- BIOSHARE mapping van variabelen tussen biobanken
     61- LifeLines uitleveren van volledige data sets
     62- IBD research portal als pilot project voor parelsnoer
     63
     64== Marc & Willen /Mondriaan ==
     65
     66Patient georienteerde data (farma) samenvoegen.
     67* hoe krijg ik data over patientgroep (oa zorg, huisarts) bijeen
     68* standaard inclusie/exclusie criteria op panel van individuen
     69* dan moeten we data kunnen koppelen met bron systeem
     70* ontsluiten met info over de individuen (diagnose, medicijnen)
     71* groepje patienten kunnen identificeren zodat terug kunt voor trials
     72* controle groep maken met juist niet dat medicijn
     73* systeem met TTP (custodix) om te kunnen koppelen
     74* dus: catalogus is abstractie van de bron data
     75Per panel informatie:
     76* dekking, hoeveel gegevens heb ik (en wat heb ik gemist zoals farma)
     77* betrouwbaarheid van data (sommige bronnen onbetrouwbaar)
     78* verzamelen 'alles' waarbij herleidbaarheid gaat toenemen
     79* abstracties van meetwaarden (maar nog niet geimplementeerd, bijv 'regiocode zoals postcode4)
     80* data dictionary per bron (huisarts)
     81Kan PRIM toepassen (HL7)
     82* kan huisarts waarden mappen
     83* rapportage of export, zonodig bij huisarts gedepseudonomiseerd
     84* in de praktijk sjoemeen wel wat met PRIM
     85* mapping taaltje (DSL) om te mappen om specifieke kenmerken mappings maken, SNOMED code
     86
     87Hoe gaat dat inladen van huisarts systemen?
     88Exports lezen, mclient zorgt voor psuedonamisatie + data dictionary voor dat systeem. Standaard csv, via web server.
     89Data wordt in DMZ geladen en dan naar interne server. Data dictionary gaat de data dan parsen in SQL database.
     90'best known database' per individu (meestal laatste, maar kan zijn verdwenen)
     91
     92== Gerard / NESDA ==
     93
     94Gaat werken aan record linkage, maar dat moet nog beginnen.
     95
     96Werkt nu voor longitudinale studies GGZ. Aan de hand van NESDA voorbeel
     97* website met welke data er is (mooi!)
     98* aanvragen toestenning om data te downloaden
     99* bestanden nummeren (e.g. NESDA), nummering meeting (1A), 0-100 over datum, 100-200 psych kenmerken, >400 bio metingen
     100* vervolgemeting zelfde naam, hoger nummer. Bv: 'A_LENGTE', 'B_LENGTE' zodat je opeenvolgende protocollen kunt herkennen.
     101* gebruiker mag daarop inloggen als je geregistreerd ben aan onderzoek.
     102* leidt tot aanvraag: deze onderzoeker ingelogd, en deze data aangevraagd. Data manager kijkt dan in goedgekeurde analyse plannen en keurt goed.
     103* aanvrager krijgt bericht: die data zijn nu beschikbaar op de website. Bijv: bestand per thema.
     104* data wordt verzameld via vragenlijsten, laboratorium uitslagen; voordat op server is het eerst gecontroleerd (compleet, bestanden in hetzelfde format (patient no als eerste kolom, elke 'B' bestand heeft zelfde lengte).
     105* genetische data heeft sampleid (buiten website), alle phenotype bepalingen respondent id
     106
     107== Linda / Parelsnoer ==
     108
     109* PSI = Generieke gegevens sets; toestemming NFU om voor meer ziektebeelden parels op te zetten.
     110* Geharmoniseerd (maar in de details toch nog wel verschillen).
     111* De data aangeleverd aan centrale infrastructuur in PRIM format
     112* Sommige ziekenhuizen doen dat via Promis (6) en via connector naar PRIM
     113* Andere ziekenhuizen (2) sluiten direct aan op parelbox in PRIM format
     114* CI database is storage, tzt upgraden, gebaseerd op SQL en focus op verzameling
     115* Nu wekelijkse emails gebaseerd op CI op voortgang (zoveel dossiers aangeleverd per parel per huis)
     116* Hadden online catalogus: lijst van alle variablen (spreadsheet gebaseerd op PIM)
     117* Zijn nu ook bezig met verrijkingsgegevens (dus terugvloeien informatie)
     118* Ook behoefte aan dashboard per parel:
     119  * hoeveel patienten heb ik met Alzheimer (level 2 dus)
     120  * hoeveel patienten heb ik MRI beelden van
     121* Uitlevering aan onderzoekers, Excel formulier om aan te vragen (= lijst PIM), maar er mist nog data mart.
     122* Dus op dit moment wordt deze data uit Promis gehaald wordt... maar dan mis je PRIM format.
     123
     124Vraag: hoe wordt de data in Promis geladen? Is dat 1 dat model?
     125Nu ook E-zis (chipsoft) naar Promis stekker.
     126
     127Uitdaging is veranderingen in PIM -> moeten zaken veranderd in EPD (ideale oplossing is dat dus configureerbaar is).
     128Dus versies van Measurement. Besloten maximaal 2 versies ondersteunen. Heeft gevolgen voor bestaande.
     129Parelcoordinator geeft doorslag; dat botst soms met data manager of methodologische aspecten.
     130Om flexibiliteit te vergroten aan de gang met DCMs / klinische bouwstenen.
     131
     132Aanpalende discussies:
     133* TTP -> standaard service definitie (want kwetsbaar als per individu).
     134* filtering van patienten door TTP
     135
     136== Eric / RP6 =
     137
     138Met name geinteresseerd in hoe patientparticipatie de catalogus efforts raakt. Zal met name richting gevend zijn op dit aspect.
     139
     140== Close en actiepunten ==
     141
     142Actie punten voor volgende bijeenkomst:
     143* data model: iedere partner levert documentatie data structuur/syntax + voorbeeld. Bijvoorbeeld Observ-OM, PRIM
     144* data elementen: iedere partner levert voorbeeld hoe variabelen worden gedefinieerd. Bijvoorbeeld 'PIM', DCMs
     145* data mappings: zowel Morris als Marc verteld over 'mappings taaltje' in BioShare en Mondriaan. Dat zouden we kunnen harmoniseren.
     146* use cases: iedere partner levert use cases verzameld, zoals geagregeerde overzichten, zoekfuncties, etc.
     147* componenten voor samenwerking: we stellen vast waar we nog meer op samenwerken, bijvoorbeeld TTP of catalogus viewer
     148
     149Vervolgactie zal zijn om al deze zaken over elkaar heen te leggen om zo (a) van elkaar te leren en (b) technische oplossingen te laten convergeren. De gedachte is dat dit werk uiteindelijk onderdeel van BBMRI-NL regenboog kan worden. Dan kan ook worden gewerkt aan harmonisatie met externe partijen (met name EU en US projecten zoals caTissue, openClinica, transMart).
     150
     151Volgende meeting zal gaan over 'use cases' onder leiding van Annet en Teun