Quelltext einer Webseite mit C# auslesen

Veröffentlicht von Raffael am 16. Juni 20114. Januar 2013 Veröffentlicht in C#.Net Tagged C#, HTML, HttpWebRequest, Quelltext

Mit dem folgenden kleinen Snippet könnt ihr den Quelltext einer Webseite auslesen und in einem string speichern.
Solch eine Funktion eignet sich zum Beispiel, wenn man einzelne Informationen aus einer Webseite parsen und anderweitig benutzen will.
Damit das Snippet funktioniert, müsst ihr eurem Quelltext folgende beide Using-Direktiven hinzufügen.

using System.Net;
using System.IO;

//Snippet von www.code-bude.net

Die Funktion zum Download des Quelltextes sieht dann wie folgt aus:

public string getHTML(string url)
{
//Anfrage an die Übergebene URL starten
HttpWebRequest request = (HttpWebRequest)HttpWebRequest.Create(url);

//Antwort-Objekt erstellen
HttpWebResponse response = (HttpWebResponse)request.GetResponse();

//Antwort Stream an Streamreader übergeben
StreamReader sr = new StreamReader(response.GetResponseStream());

//Antwort (HTML Code) auslesen
string html = sr.ReadToEnd();

//Streamreader und Webanfrage schließen
sr.Close();
response.Close();

//Quellcode zurückgeben
return html;
}

//Snippet von www.code-bude.net

Ein Aufruf der Funktion könnte zum Beispiel so aussehen:

getHTML("http://www.code-bude.net");

//Snippet von www.code-bude.net

Solltet ihr Verbesserungsvorschläge oder sogar Probleme mit dem Snippet haben, schreibt mir einen Kommentar.
Viele Grüße,
Raffi