Ez a cikk egy tükör gépi fordítás, kérjük, kattintson ide, hogy ugorjon az eredeti cikkre.

Nézet: 75|Válasz: 0

Használd az XPath-ot XML, HTML dokumentumtartalom letöltésére

[Linket másol]
Közzétéve3 napja | | | |
Az XPath egy olyan technológia, amely pontosan és hatékonyan határozza meg és nyeri ki a szükséges információkat a fa szerkezeti adataiból, például a HTML-ből és XML-ből.

XPath áttekintés

Az XPath egy olyan nyelv, amelyet bizonyos elemek és attribútumok meghatározására és kinyerésére használnak egy XML vagy HTML dokumentumfában. Mivel a weboldalak gyakran HTML-ből állnak, az XPath-ot széles körben használják különböző helyzetekben, például webes kaparásban, adatkeresésben és XML adatkeresésben.

A tipikus használat a következő:

  • Adatkivonás webkutatókban: Az XPath automatikusan letölthet bizonyos adatokat, például termékinformációkat e-kereskedelmi weboldalakon vagy cikkcímeket hírportálokon.
  • XML adatkeresés és feldolgozás: Üzleti rendszerekben és adatkapcsolat-feldolgozásban gyakran XML formátumban cserélnek adatokat. Az XPath használatával hatékonyan nyerheted ki a szükséges információkat nagy mennyiségű XML adatból.
  • API válaszok elemzése (XML formátum): XML-alapú API-k, például a SOAP használatakor az XPath segítségével választ sűrnek fel válaszadatok. Ez lehetővé teszi, hogy gyorsan megszerezd a konkrét állapotkódokat és eredményadatokat, javítva a rendszerintegráció és az automatizált feldolgozás pontosságát.

Eszközajánlás

Az XPath tanulás és használat során a gyakori eszközök a következők:

Chrome fejlesztői eszközök: Egy hatékony eszköz, amely a Chrome böngészővel jár, az F12 gomb megnyomásával hívhatod meg. Az "Elemek" panelen gyorsan megtalálhatod a HTML elemeket egy weboldalon leemeléssel és kattintással, és egy elemre jobb kattintással közvetlenül lemásolhatod az XPath kifejezést az egyszerű ellenőrzés és tesztelés érdekében. Például egy e-kereskedelmi termékoldal elemzésekor Chrome fejlesztői eszközökkel gyorsan megszerezheted az XPath-ot a terméknevekhez, árakhoz és egyéb elemekhez.
Firefox fejlesztői eszközök: A böngészővel is együtt jár, hasonlóan a Chrome fejlesztői eszközökhöz. Emellett könnyen megtalálhatod az oldalak elemeit, valamint megtekintheted és tesztelheted az XPath kifejezéseket. Ez jó választás azoknak a fejlesztőknek, akik hozzászoktak a Firefox böngészőhöz.
Online XPath tesztelő eszközök: Az olyan online eszközök, mint az "XPath Tester", telepítés nélkül is használhatók, weboldal megnyitásával is használhatók. Egyszerűen illesztsd be egy XML vagy HTML dokumentum tartalmát, írj be egy XPath kifejezést, és nézd meg valós időben az egyezés-eredményeket. Ez az eszköz különösen alkalmas kezdőknek, hogy gyorsan elkezdhessék és egyszerű XPath gyakorlatokat végezzenek.
XPath Helper Plugin: Például a Chrome böngészőt, miután telepítette az XPath Helper bővítményt, a böngésző felületéhez egy lebegő ablakot ad hozzá a webes böngészéskor, megjelenítve az aktuális egér-áthelyező elem XPath útvonalát, és közvetlenül az ablakban szerkesztheted és tesztelheted az XPath kifejezéseket, ami jelentősen javítja a fejlesztési hatékonyságot.

XPath absztrakt szintaxis

Válassz egy csomópontot

Az XPath útkifejezéseket használ csomópontok kiválasztására egy XML dokumentumban. A csomópontokat egy út vagy lépés követésével választják ki. A leghasznosabb útkifejezések az alábbiakban találhatók:
kifejezés
leírás
CsomópontnévKiválasztja az összes gyermekcsomópontot ebből a csomópontból.
/Válassz a gyökércsomópontból (vegyük a gyermekcsomópontot).
//Kiválasztja a dokumentumban a jelenlegi pontból a megfelelő csomópontot, függetlenül a helyüktől (vegyük az utódcsomópontokat).
.Válaszd ki a jelenlegi csomópontot.
..Válaszd ki a jelenlegi csomópont szülőcsomópontját.
@Válassz egy attribútumot.

Az alábbi táblázatban néhány útkifejezést soroltunk fel az adott kifejezések eredményeivel együtt:
Útkifejezések
eredmény
könyvesboltVálassz ki minden könyvesbolt nevű csomópontot.
/bookstore
Válaszd a root element könyvesboltot.
Megjegyzés: Ha az út egy előrehaladó lecsapással ( / ) kezdődik, akkor ez az út mindig egy abszolút útvonalat képvisel egy elemhez!
Könyvesbolt/KönyvKiválasztja az összes könyvelemet, amely a könyvesbolt gyermekelemei.
//bookMinden könyv alelemet kiválaszt, függetlenül attól, hogy hol foglalják a dokumentumban.
Könyvesbolt//könyvVálaszd ki azokat a könyvelemeket, amelyek a könyvesbolt elem leszármazottai, függetlenül attól, hogy hol találhatók a könyvesbolt alatt.
@langVálassz ki az összes lang nevű tulajdonságot.

Predikátumok

Egy predikátumot használnak egy adott csomópont vagy egy meghatározott értéket tartalmazó csomópont megtalálására.
A predikátum négyzet zárójelben van beágyazva.
Az alábbi táblázatban néhány útkifejezést sorolunk predikátumokkal, valamint az adott kifejezések eredményeit:
Útkifejezések
eredmény
/bookstore/book[1]Válaszd ki az első könyvelemet, amely a könyvesbolt gyerekelemének része.
/bookstore/book[last()]Kiválasztja az utolsó könyv elemet, amely a könyvesbolt alelem része.
/bookstore/book[last()-1]Kiválasztja az utolsó előtti könyvelemet, amely a könyvesbolt gyermek eleméhez tartozik.
/bookstore/book[position()<3]Válaszd ki az első két könyvelemet, amelyek a könyvesbolt elemének gyermekelemei.
Cím[@lang]Kiválasztja az összes cím elemet, amelynek van lang nevű tulajdonsága.
cím[@lang='eng']Kiválasztja az összes cím elemet, amelynek lang attribútuma van eng.
/bookstore/book[price>35.00]Kiválasztja a könyvesbolt elem összes könyvelemét, és az ár értékének nagyobbnak kell lennie 35,00-nál.
/bookstore/book[price>35.00]//titleKiválasztja a könyvesbolt elem összes címelemet, és az ár értékének nagyobbnak kell lennie 35,00-nál.

Válasszon ismeretlen csomópontot

Az XPath wildcard-okkal ismeretlen XML elemeket lehet felvenni.
Helyettesítő
leírás
*Bármely elemcsomóponthoz illeszkedik.
@*Bármely attribútumcsomóponthoz egyezik.
node()Bármilyen típusú csomóponthoz illeszkedik.

Az alábbi táblázatban felsorolunk néhány útkifejezést és ezek eredményeit:
Útkifejezések
eredmény
/bookstore/*Kiválasztja a könyvesbolt elemének összes gyermek elemét.
//*Kiválasztja a dokumentum összes elemét.
cím[@*]Minden címelemet kiválaszt, amelyeknek attribútuma van.

Válassz több útvonalat

Az útkifejezésben a "|" használatával Üzemeltetők, több útvonalat választhattok.

Az alábbi táblázatban felsorolunk néhány útkifejezést és ezek eredményeit:
Útkifejezések
eredmény
//book/title | //book/priceKiválasztja a könyv minden cím- és árelemét.
cím | árVálaszd ki a dokumentumban található összes cím- és árelemet.
/bookstore/book/title | //priceKiválasztja a könyv elemének minden címelemet, amelyek a könyvesbolt eleméhez tartoznak, valamint az összes árelemet a dokumentumban.

XPath funkció

Az alábbiakban az XPath-specifikus kiegészítések kommentált listája található az XPath alapvető függvények és az XSLT alapján, beleértve a leírásokat, szintaxist, paraméterlistákat, eredménytípusokat és forrásokat a megfelelő W3C ajánlásokban.

  • boolean()
  • mennyezet()
  • choose()
  • concat()
  • tartalmazza()
  • count()
  • current() XSLT-specifikus
  • document() XSLT-specifikus
  • elem-elérhető()
  • hamis()
  • floor()
  • format-number() XSLT-specifikus
  • function-available()
  • generat-id() XSLT-specifikus
  • id()
  • key() XSLT-specifikus
  • lang()
  • last()
  • helyi név()
  • name()
  • namespace-uri()
  • normalize-space()
  • not()
  • number()
  • pozíció()
  • round()
  • kezdődik()
  • string()
  • húrhossz()
  • substring()
  • alstring-after()
  • alstring-before()
  • sum()
  • system-property() XSLT-specifikus
  • fordíta()
  • true()
  • unparsed-entity-url() XSLT-specifikus

Gyakorlati vizsgák

Nyisd meg a Chrome-ot, és a következő parancs segítségével kapd meg az összes A tablinket tartalmazó szövegtartalmat:
Ahogy az alábbiakban látható:



Utalás:A hiperlink bejelentkezés látható.




Előző:[Drámaíró] (3) Automatikus tesztelés hibakivételek elkapására
Következő:.NET/C# hívja az Azure Translator text translation interface szolgáltatást
Lemondás:
A Code Farmer Network által közzétett összes szoftver, programozási anyag vagy cikk kizárólag tanulási és kutatási célokra szolgál; A fenti tartalmat nem szabad kereskedelmi vagy illegális célokra használni, különben a felhasználók viselik az összes következményet. Az oldalon található információk az internetről származnak, és a szerzői jogi vitáknak semmi köze ehhez az oldalhoz. A fenti tartalmat a letöltés után 24 órán belül teljesen törölni kell a számítógépéről. Ha tetszik a program, kérjük, támogassa a valódi szoftvert, vásároljon regisztrációt, és szerezzen jobb hiteles szolgáltatásokat. Ha bármilyen jogsértés történik, kérjük, vegye fel velünk a kapcsolatot e-mailben.

Mail To:help@itsvse.com