Semalt: Elementattribute. Alles, was Sie wissen müssen

Das Document Object Model (DOM) ist eine Anwendungsprogrammierschnittstelle (Application Programming Interface, API) für gut strukturierte XML- und HTML-Dokumente. Die API definiert die endgültige Struktur von Dokumenten, wie auf sie zugegriffen wird und wie Web-Scraper auf Dokumente im Web zugreifen und diese kratzen.

DOM ruft Attribute ab, die in HTML-Elementen vorhanden sind, und ändert sie. Mit Dom können Sie auf Elementattribute und -stile zugreifen, die in einem bestimmten Dokument verwendet werden. Mit wenigen Scraping-Techniken können Sie das Hintergrundbild des Zieldokuments abrufen.

HTML-DOM-Knoten

Wenn es um JavaScript geht, wird DOM als W3C-Standard (World Wide Web Consortium) bezeichnet. Dom wird verwendet, um einen Standard für den Zugriff auf Dokumente zu definieren und zu veranschaulichen. Das Modell ermöglicht es Skripten und Programmen, die zum Schreiben eines Dokuments verwendete Struktur zu aktualisieren und darauf zuzugreifen.

Wenn es um HTML-DOM geht, kann alles als Knoten betrachtet werden. Zum Beispiel:

  • Alle HTML-Attribute sind Attributknoten.
  • Kommentare sind Kommentarknoten.
  • Alle HTML-Elemente sind Elementknoten.
  • Das Dokument selbst wird als Dokumentknoten bezeichnet.

Das Dokumentobjektmodell wird verwendet, um auf Elemente in XML- und HTML-Dokumenten zuzugreifen und diese zu bearbeiten. Elemente werden in einer Datenstruktur (baumartig) organisiert und verwaltet, die zur Navigation und Änderung leicht durchlaufen werden kann. Sie können DIV-, Body- oder HTML-Elementen mithilfe von Cascading Style Sheets (CSS) Klassen hinzufügen oder mithilfe von JS mit den Elementen interagieren.

Was Sie über Attributeigenschaften wissen müssen

Auf Knoten kann mit ihren jeweiligen Indexnummern zugegriffen und diese bearbeitet werden, wobei der Mindestindex "0" ist. Die Attribute-Eigenschaft gibt eine detaillierte Sammlung der Attribute eines bestimmten Knotens zurück, z. B. das NamedNodeMap-Objekt. Beachten Sie, dass die numerische Indizierung Ihnen beim Durchlaufen eines Elementattributs hilft.

Elementattribut

Die Elementattributeigenschaft gibt eine gültige Sammlung aller Attributknoten zurück, die für einen bestimmten Knoten registriert sind. In einfachen Worten, es ist eine NamedNodeMap. Daher fehlen Array-Methoden. Die Attributknoten (ein Paar von Zeichenfolgen, die Daten zu dem angegebenen Attribut darstellen) können je nach verwendetem Browser unterschiedlich sein.

In diesem Beitrag steht NamedNodeMap Object für die unstrukturierte Auflistung eines bestimmten Elementattributknotens. Sie müssen in dem von Ihnen verwendeten Browser nicht in Panik geraten. Das NamedNodeMap-Objekt und das Attribute-Objekt werden in den wichtigsten Webbrowsern unterstützt.

Das NamedNodeMap-Objekt besteht aus einer Längeneigenschaft, mit der Sie die genaue Anzahl der Attribute ermitteln können. Nachdem Sie die Gesamtzahl der Attribute in einem Dokument ermittelt haben, durchlaufen Sie die Attributknoten und extrahieren Sie Ihre Zielinformationen. Beachten Sie beim Abrufen von Daten aus einem Text, dass HTML-Attribute auch als Attributknoten bezeichnet werden, die Eigenschaften für Ihr Attributobjekt enthalten.

Für Internet Explorer-Enthusiasten müssen Sie beachten, dass die Attribute-Eigenschaft tendenziell eine detaillierte Sammlung der möglichen Attribute für ein bestimmtes Element zurückgibt. Sobald ein DOM-Knoten für ein bestimmtes HTML-Element generiert wurde, beziehen sich viele der Attribute auf Attribute mit demselben Namen. Bei der Entwicklung eines HTML-Quellcodes können Sie die Attribute Ihrer HTML-Elemente definieren. Sobald Ihr Browser Ihr Skript analysiert, wird ein entsprechendes DOM mit einem ähnlichen Knoten erstellt. Der entsprechende Knoten wird als Objekt bezeichnet.