Pyquery -installasjon
For å installere Pyquery i Ubuntu, bruk kommandoen som er spesifisert nedenfor:
$ sudo apt install python3-pyquery
Du kan også installere den siste versjonen av Pyquery fra “Pip” Package Manager ved å kjøre følgende to kommandoer etter hverandre:
$ sudo apt install python3-pip
$ pip3 installer pyquery
For å installere Pyquery i andre Linux -distribusjoner, installer “PIP3” fra Package Manager og kjør den andre kommandoen som er nevnt ovenfor.
Opprette et parsabelt dokumenttre
Før du kan analysere og trekke ut data fra et HTML -dokument, må du opprette et dokumenttre. Du kan opprette et dokumenttre fra en enkel HTML -markering ved å bruke kodeprøven nedenfor:
Fra Pyquery Import Pyquery som PQDen første uttalelsen importerer "Pyquery" -klassen fra "Pyquery" -modulen. Deretter opprettes en ny forekomst av Pyquery Class. Etter å ha kjørt kodeprøven ovenfor, bør du få følgende utdata:
Hei Verden !!Legg merke til den andre linjen i utgangen. Her "Dokument", som er en forekomst av "Pyquery" -klassen, returnerer ikke et strengtypeobjekt. Du kan raskt spørre om alle metodene som er tilgjengelige for "dokument" -forekomst ved å legge til følgende ekstra linje i kodeprøven ovenfor:
Fra Pyquery Import Pyquery som PQDu kan også bla gjennom API for Pyquery Class Online.
For å opprette dokumenttre fra en URL, bruk følgende kode i stedet (erstatt “URL” med din egen ønsket adresse):
Fra Pyquery Import Pyquery som PQFor å opprette et dokumenttre fra lokal HTML -fil, bruk koden nedenfor (erstatt verdien av "filnavn" i henhold til dine behov):
Fra Pyquery Import Pyquery som PQNå som du har et dokumenttre, kan du begynne å analysere det.
Manipulere dokumenttreet
Du kan trekke ut data og manipulere dokumenttrær ved hjelp av en rekke metoder. Noen av de vanligste metodene er listet opp nedenfor med prøver. For alle brukbare metoder, se API som er tilgjengelig her.
Du kan bruke "tekst" -metode for å få tekstinnhold i et element:
Fra Pyquery Import Pyquery som PQHei Verden !!
")Du kan velge en spesifikk tag / element ved å gi navnet sitt som argument til "dokument" -forekomsten. Etter å ha kjørt ovennevnte kodeprøve, bør du få følgende utdata:
Hei Verden !!
Du kan få attributter til en tag ved å bruke “attr” -metoden. For å gjøre det, velg en tag du vil analysere ('P' i dette tilfellet) og oppgi attributtnavnet som et argument ('id' i dette tilfellet) eller bruk prikknotasjon.
Fra Pyquery Import Pyquery som PQHei Verden !!
")Etter å ha kjørt ovennevnte kodeprøve, bør du få følgende utdata:
Hei Verden !!
Du kan manipulere CSS ved hjelp av “CSS” -metoden. Å legge CSS -stiler til
eller hvilken som helst annen tag, kan du bruke følgende kode:
Fra Pyquery Import Pyquery som PQHei Verden !!
")Erstatt ““ Color ”:“ Red ”” -del med dine egne tilpassede stiler. Etter å ha kjørt ovennevnte kodeprøve, bør du få følgende utdata og kan bekrefte at CSS har blitt brukt riktig:
Hei Verden !!
Hvis du har en forhåndsstil klasse, kan du bare bruke "addclass" -metoden for å bruke eksisterende stiler.
Fra Pyquery Import Pyquery som PQHei Verden !!
")Du kan legge til og forberede din egen tilpassede markering ved å bruke kodeprøven nedenfor:
Fra Pyquery Import Pyquery som PQHei Verden !!
")Hei
")Ha det
")Erstatte argumenter i metoden "prepend" og "legge til" med dine egne verdier. Etter å ha kjørt ovennevnte kodeprøve, bør du få følgende utdata:
Hei
Hei Verden !!Ha det
For å fjerne innholdet i et element, bruk den "tomme" metoden.
Fra Pyquery Import Pyquery som PQHei Verden !!
")Etter å ha kjørt ovennevnte kodeprøve, bør du få følgende utdata:
Du kan bruke "filter" -metoden for å velge spesifikke elementer når det er flere tagger av samme type. For eksempel henter koden nedenfor en "
”Tag som har en“ id ”som“ hei ”:
Fra Pyquery Import Pyquery som PQHallo
Verden !!
")Etter å ha kjørt ovennevnte kodeprøve, bør du få følgende utdata:
Hallo
Du kan finne flere tagger / elementer samtidig ved å bruke "Finn" -metode:
Fra Pyquery Import Pyquery som PQHallo
Verden !!
")Gi taggen / elementnavnet som argument til "finn" -metoden. Etter å ha kjørt ovennevnte kodeprøve, bør du få følgende utdata:
Hallo
Verden !!
Du kan veksle mellom “XML” og “HTML” -parsere ved å bruke et ekstra “Parser” -argument:
Fra Pyquery Import Pyquery som PQHallo
Verden !!
", parser =" html ")Hvis du trenger ytterligere hjelp med Pyquery, se den offisielle dokumentasjonen og eksemplene som er tilgjengelige her.
Konklusjon
Pyquery lar deg raskt analysere HTML -dokumenter ved å skrive minimumskode, da det inkluderer mange hjelperfunksjoner som fullstendig utelater behovet for å skrive tilpasset kode. Dens "jQuery" som syntaks og struktur hjelper også med å velge elementer og noder uten å gå dypere inn i dokumenttreet, spesielt når det er mye nestet markering.