Unité d'Enseignement Bases de Données
TP5/TP6

 

L'objectif de ce TP est de manipuler la version simplifiée de la base de données SWISS-2DPAGE (Two-dimensional polyacrylamide gel electrophoresis database) à l'aide de SQL.

Recopiez la base de données bioinfo_sql.mdb dans un dossier tp5 que vous aurez créé.

Pour visualiser la structure globale de la base de données, regardez les relations mises en place dans cette base (cf mise en place de contraintes d'intégrité référentielle sous ACCESS)

Sur les tables de cette base, construisez les requêtes SQL ci-dessous (donnez un nom différent à chacune des requêtes et enregistrez les dans votre base) :

  1. Lister les espèces par ordre alphabétique (visualiser le résultat)
  2. Lister les espèces eucaryotes (visualiser le résultat)
  3. Donnez toutes les informations sur les espèces de mammifères (visualiser le résultat)
  4. Compter le nombre de protéines dans la base bioinfo, c'est-à-dire le nombre d'enregistrements de la table T_entries (visualiser le résultat)
  5. Compter le nombre de protéines humaines dans la base bioinfo, c'est-à-dire le nombre d'enregistrements de la table T_entries dont le code d'espèce est "HUMAN"
  6. (visualiser le résultat)
  7. Afficher les nom et description des protéines de l'espèce Dictyostelium discoideum, dans l'ordre alphabétique de la description
  8. (visualiser le résultat)
  9. Afficher, par ordre alphabétique, les noms des protéines ayant au moins une AC dans la table T_entries
  10. (visualiser le résultat)
  11. Rechercher, dans la table T_refs, les références disponibles pour l'auteur 'HOCHSTRASSER'. Afficher pour ces références le numéro Medline, les 50 premiers caractères des auteurs, et la localisation; classer par ordre alphabétique de la localisation
  12. (visualiser le résultat)
  13. Combien existe-t-il de références, dans la table T_refs, dont le premier auteur est 'SANCHEZ J.-C.' ?
  14. (visualiser le résultat)
  15. Dans la table T_refs, afficher les 50 premiers caractères des auteurs, le titre et la localisation des références où les auteurs 'SANCHEZ' et 'TONELLA' apparaissent conjointement (visualiser le résultat)
  16. Lister les releases (table T_release) par ordre chronologique (visualiser le résultat)
  17. Afficher le nombre de protéines identifiées pour chaque master, c'est-àdire le nombre de champ AC1 différents pour chaque nom de master différents de la table T_master
  18. (visualiser le résultat)
  19. A partir de la table T_crossref, afficher les différentes bases de données cross-référencées par SWISS-2DPAGE, afficher pour chacune le nombre de cross-références disponibles
  20. (visualiser le résultat)
  21. A partir de la table T_spots, afficher le nombre de spots identifiés pour les masters de souris, les classer dans l'ordre croissant
  22. (visualiser le résultat)
  23. Afficher le nombre de releases par année
  24. (visualiser le résultat)
  25. Compter le nombre de protéines par espèce, et le pourcentage correspondant
  26. (visualiser le résultat)

  27. A partir de la table T_refs, lister le rang et la localisation des références bibliographiques pour la protéine ayant un AC1 de P00938 dans la table T_coderef
  28. (visualiser le résultat)
  29. Donner la liste des codes d'espèce, de la table T_entries, pour les protéines identifiées par 'MICROSEQUENCING' dans le champ mapping de la table T_mapping (visualiser le résultat)
  30. Quelles sont les espèces (champ code_espece de la table T_entries) etudiées par l'auteur YAN de la table T_refs (vous aurez également besoin de la table T_coderef) ?
  31. (visualiser le résultat)
  32. Pour chacune des espèces présentent dans la table T_entries, afficher l'organisme correspondant de la table T_especes, le nombre de protéines de cette espèce dans la table T_entries et le pourcentage correspondant, les classer par ordre décroissant de pourcentage
  33. (visualiser le résultat)
  34. Compter le nombre de protéines créées à la release 10. Donner la répartition par espèce
  35. (visualiser le résultat)
  36. Même requête que précédemment mais afficher dans le résultat l'organisme
  37. (visualiser le résultat)
  38. Donner la répartition par espèce (afficher l'organisme) du nombre de protéines créées depuis 1999
  39. (visualiser le résultat)
  40. Quelles sont les AC1 des proteines identifiées dans les masters ECOLI5-6 et ECOLI4.5-5.5 ?
  41. (visualiser le résultat)
  42. Quelles sont les AC1 des protéines ayant une cross-référence dans les bases de données PHCI-2DPAGE et SIENA-2DPAGE (champ DBNAME de la table T_crossrefs égaux à PHCI-2DPAGE et SIENA-2DPAGE)?
  43. (visualiser le résultat)
  44. Même requête que précédemment, mais afficher le AC1 et le nom des protéines (champ prot_name de la table T_entries) dans l'ordre alphabétique des noms de protéines
  45. (visualiser le résultat)
  46. Créer une table nommée T_sprot qui ne contient que les protéines qui ont une cross-référence vers SWISS-PROT
  47. Calculer la répartition du nombre de protéines créées par année, pour les protéines ayant un lien vers SWISS-PROT (visualiser le résultat)