Modèle requête désignation mandataire ad hoc

| 0

La plupart des requêtes ad hoc de bases de données cliniques ont porté sur les requêtes centrées sur le patient. Le Web-accessible Columbia-Presbyterian Medical Center Query Builder, 14 par exemple, travaille sur le référentiel de données du centre médical et génère à la fois le niveau de santé 7 et Arden Syntax15 pour plusieurs catégories de données, p. ex., démographie des patients, laboratoire médicaments et les Diagnostics. Les descriptions détaillées des véritables entrepôts de données cliniques (qui stockent plusieurs types de données cliniques, éventuellement combinées à des données non cliniques, dans la même base de données) n`ont pas été publiées jusqu`à présent. Le projet d`entrepôt de données de soins de santé Intermountain déploie un certain nombre de «Data Marts» distincts, chacun contenant une catégorie particulière de données. 16 (la différence entre un Mart et un entrepôt est l`une des dimensions et de la portée. Un Data Mart, qui contient un sous-ensemble des données de l`entreprise, est spécialisé pour répondre aux requêtes spécifiques à ce sous-ensemble. Un entrepôt contient toutes les données de l`organisation.) Le noyau de requête génère SQL en fonction des critères de sélection, des attributs de sortie et des options spécifiées par l`utilisateur pour récupérer les données de manière appropriée. Plusieurs de ses opérations utilisent des tables sur le serveur et le client avec une structure prédéterminée: ces tables détiennent des résultats intermédiaires et sont vidées avant d`être réutilisées. Comme il est bien connu, la force traditionnelle de la technologie de base de données relationnelle sur les approches non relationnelles a été «l`autonomisation» des utilisateurs relativement non sophistiqués en ce qui concerne la requête ad hoc (par exemple, avec des outils graphiques). Toutefois, dans le cas de bases de données cliniques hétérogènes, cette autonomisation est illusoire en raison de la complexité du codage requis.

Une certaine forme d`assistance électronique est clairement nécessaire pour améliorer la facilité (et donc le débit) de la composition des requêtes. Dans ACT/DB, le composant qui aide la requête centrée sur les attributs est appelé noyau de requête (QK). Avant de passer à l`opération de QK, nous examinons d`abord comment l`architecture EAV de base peut être adaptée pour améliorer l`efficacité de la requête centrée sur les attributs. La requête ad hoc du kernel Query peut être mieux comprise par analogie. Considérez un simple fichier plat contenant un ID de patient et un grand nombre d`attributs. Pour extraire des données sur un sous-ensemble de patients à partir d`un tel fichier, l`opération de base (comme formulé dans SQL) est: le temps d`exécution pour les requêtes s`exécute actuellement de 30 s à 2 min, mais ces chiffres s`appliquent uniquement aux requêtes exécutées isolément. L`exécution de la requête est sérialisée: une fois qu`une requête commence à s`exécuter, elle verrouille les ressources du serveur Web jusqu`à ce qu`elle soit terminée, afin qu`une autre requête doive attendre la fin de la requête précédente. Notre conception actuelle du système a supposé une concurrence faible, car seuls quelques administrateurs privilégiés et formés sont autorisés à effectuer une requête ad hoc. Nom de l`attribut. Comme indiqué au début de cette discussion sur “ad hoc query”, les champs ID patient et horodatage seront toujours générés de manière appropriée dans la sortie, et ne doivent donc pas être spécifiés. Le processus de requête ad hoc en effet crée l`illusion d`une table de données patient unique contenant un très grand nombre d`attributs, avec leurs horodatages associés.

L`utilisateur spécifie les critères de sélection et (éventuellement) les attributs de sortie. Le noyau de requête utilise les critères de sélection pour identifier un ensemble (sous-groupe) de patients. Si aucun attribut de sortie n`est spécifié (c.-à-d. que seul l`ID du patient est désiré), aucune table en sortie n`est créée et l`ensemble d`ID est enregistré sous un nom spécifié par l`utilisateur pour une utilisation ultérieure. Un tel ensemble est généralement utilisé dans l`opération d`extraction de données, où l`extraction peut être limitée à un ensemble particulier de patients.