Quelltext einer Webseite mit C# auslesen
Mit dem folgenden kleinen Snippet könnt ihr den Quelltext einer Webseite auslesen und in einem string speichern.
Solch eine Funktion eignet sich zum Beispiel, wenn man einzelne Informationen aus einer Webseite parsen und anderweitig benutzen will.
Damit das Snippet funktioniert, müsst ihr eurem Quelltext folgende beide Using-Direktiven hinzufügen.
using System.Net;
using System.IO;
//Snippet von www.code-bude.net
Die Funktion zum Download des Quelltextes sieht dann wie folgt aus:
public string getHTML(string url)
{
//Anfrage an die Übergebene URL starten
HttpWebRequest request = (HttpWebRequest)HttpWebRequest.Create(url);
//Antwort-Objekt erstellen
HttpWebResponse response = (HttpWebResponse)request.GetResponse();
//Antwort Stream an Streamreader übergeben
StreamReader sr = new StreamReader(response.GetResponseStream());
//Antwort (HTML Code) auslesen
string html = sr.ReadToEnd();
//Streamreader und Webanfrage schließen
sr.Close();
response.Close();
//Quellcode zurückgeben
return html;
}
//Snippet von www.code-bude.net
Ein Aufruf der Funktion könnte zum Beispiel so aussehen:
getHTML("http://www.code-bude.net");
//Snippet von www.code-bude.net
Solltet ihr Verbesserungsvorschläge oder sogar Probleme mit dem Snippet haben, schreibt mir einen Kommentar.
Viele Grüße,
Raffi