Expressions XPath
Nous allons à nouveau
utiliser xmllint
. Utilisez l'option
--shell
(et le manuel d'aide man
xmllint
). Vous entrez dans un interprète Xpath qui vous
permettra de vous déplacer dans votre document. La commande
xpath exprXpath
vous permet d'évaluer une
expression XPath, et cd exprXPath
de vous
déplacer dans le document XML. Utilisez la
commande help
pour connaître toutes les
commandes disponibles.
On se sert maintenant du document Grand Prix.
Ecrire les expressions XPath qui retournent (le noeud contextuel est la racine) :
- tous les noeuds éléments de nom
attr
oudescendant::attr
//attr
- tous les noeuds éléments qui ont un attribut
order
descendant::*[@order]
- le fils de nom
attr
decast
descendant::cast/attr
- le premier fils de nom
name
d'unComposer
oudescendant::Composer/name[position()=1]
descendant::Composer/name[1]
- le noeud attribut de nom
Crew
(attribut defilmography
)descendant::filmography/@Crew
- le quatrième fils de
filmography
descendant::filmography/*[4]
- les quatre premiers fils de
filmography
descendant::filmography/*[position()<=4]
- les noeuds attributs de nom
order
descendant::*/@order
- le noeud contextuel étant maintenant
remainder
, retournez le sous-arbre de racineEditor
parent::node()/Editors
- le nombre d'acteurs de premier plan (cité dans
cast
)count(//cast/name)
- le nombre total de comédiens
(
cast
,remainder
,miscellaneous
)
oucount(//cast/name)+count(//remainder/name)+count(//Miscellaneous/name)
count(//Editors/following::name)
- une chaîne de caractères présentant le
film : titre (année) - réalisateur
concat(//title," (",//year,") - ",//Director/name)
- l'ensemble des intervenants dont le prénom est Bob
//name[starts-with(.,"Bob ")]
Sur le document
Spaghetti à la Bolognaise,
utilisez l'interprète XPath de xmllint
pour
obtenir les éléments suivants :
- ensemble des éléments
ingredient
//ingredient
- les commentaires de la partie
preparation
//preparation//comment()
- les deux derniers commentaires du document
//comment()[position()>= last()-1]
- quel est le nombre de noeuds suivant la première
phase de préparation ?
count(//phase[1]/following::node())
- quels sont les noeuds suivants la fiche technique ? les
noeuds précédents ?
//fiche-technique/following::node() //fiche-technique/preceding::node()
- combien y-a-t-il de phases de préparation dont le texte
contient moins de 180 caractères ?
count(//phase[string-length(.) >= 180])
Vous trouverez en annexe un document de recettes de cuisine danoise.
Donnez les expressions XPath qui retournent (à partir du noeud racine, sauf indication contraire) :
- les noeuds éléments dont le nom est preparation;
//preparation
- les ingrédients de la tarte à la ricotta (ricotta pie) dont l'unité de mesure
est la petite cuiller (teaspoon);
/descendant::recipe[title="Ricotta Pie"]/descendant::ingredient[@unit="teaspoon"]
- le nombre d'étapes de préparation de la recette de la tarte à la
ricotta ;
count(/descendant::recipe[title="Ricotta Pie"]/descendant::step)
- le nom du quatrième ingrédient de la garniture
(filling) de la tarte à la ricotta.
/descendant::recipe[title="Ricotta Pie"]/ingredient[@name="filling"]/ingredient[4]
- à partir du noeud ingredient de la ricotta
(name="ricotta cheese"), les autres ingrédients de le
recette de la tarte à la ricotta dont la
quantité est supérieure ou
égale à 2;
ancestor::recipe/descendant::ingredient[@amount >= 2]
- tous les titres des recettes dont le
nombre de calories est inférieure à 1200;
/descendant::recipe[nutrition/@calories < 1200]/title
- le nom du quatrième ingrédient de la pâte
(dough) de la tarte à la ricotta;
/descendant::ingredient[@name="dough"]/ingredient[4]
- toutes les étapes (step) qui
contiennent le mot bake.
/descendant::step[contains(text(),"bake")]
- le nombre de calories
moyen d'une recette.
sum(//@calories) div count(//recipe)
- le nombre moyen d'oeufs par recette
(attention, il s'agit de retrouver les ingrédients qui
contiennent le mot eggs).
sum(//ingredient[contains(@name,"egg")]/@amount) div count(//recipe)
Vous trouverez en annexe un document listant des titres de bandes dessinées.
Donnez les expressions XPath qui retournent (à partir de la racine /) :
- le troisième commentaire
//comment()[3]
- les titres des bandes dessinnées dont le résumé contient
le mot village (on veut le texte du titre)
//bd/titre[contains(../resume,"village")]/text()
- les titres des albums de la série Le retour à la
terre
//bd[../titreserie="Le retour à la terre"]/titre
- les titres des albums qui ne font pas partie d'une série
//*[name(.)!="serie"]/bd/titre/text()
- les noms des différents illustrateurs (on ne veut pas de
répétition)
//personne[@id = //illustrateur/@ref]/nom/text()
- le nombre moyen d'albums publiés par auteur
count(//bd) div count(//personne[@id=//auteur/@ref])
- toutes les zones de texte, commentaires ou attributs qui
contiennent le nom Sattouf
//text()[contains(.,"Sattouf")] | //comment()[contains(.,"Sattouf")] | //attribute::*[contains(.,"Sattouf")]
Reprenez le document oiseaux.xml.
Donnez les expressions XPath qui retournent (à partir de la racine /) les informations suivantes. Attention! Il y en a deux qui ne peuvent pas être retournées par une expression XPath. Lesquelles ?
- toutes les zones de texte qui contiennent le mot
terril
//text()[contains(.,"terril")]
- tous les noeuds éléments de nom espece qui contiennent
une photo d'au moins 90 pixels de large et 70 pixels de haut;
//espece[number(photo/@width)>=90 and number(photo/@height)>=70]
- toutes les fiches d'observation qui contiennent une observation
d'un Turdidé
//fiche-observations[espece/famille="Turdidés"]
- les noms de tous les ornithologues
//@auteur
- le nom de la deuxième espèce observée dans la troisième
fiche
//fiche-observations[3]/espece[2]/@nom
- la taille moyenne en pixels des images proposées (la taille
d'une photo est donnée par sa largeur multipliée par sa
hauteur)
Erreur! ne peut pas être exprimé en XPath. Pour cela il faudrait une expression Xpath qui multiplie la hauteur d'une photo par sa largeur. L'opération * devrait alors être à la racine de cette expression, mais on ne pourra pas avoir une expression à gauche et une expression à droite qui désignent la même image.
- le nombre moyen d'espèces observées pour une fiche
(count(//espece)) div (count(//fiche-observations))
- les noms de lieux concernés par au moins deux fiches
d'observation
//lieu[following::lieu=.]/text()
- les noms de lieux concernés par au moins trois fiches
d'observation
//lieu[following::lieu=.][preceding::lieu=.]/text()
- les noms de lieux concernés par au moins quatre fiches
d'observation
Erreur! ne peut pas être exprimé en XPath.
- retournez le nombre d'espèces
observées dans la troisième fiche après la deuxième espèce
de cette fiche
//fiche-observations[3]/espece[2]/following-sibling::espece/@nom
- retournez les noms des familles
de toutes les fiches suivant l'observation des cinq loriots
pour lesquelles on a vu plus
de 10 individus dans une même observation.
//fiche-observations/espece[@nom="loriot"]/following::famille[number(../@nbre)>10]/text()