Erweiterte Verwendung editierbarer Dokumente

Einführung

Wenn Sie ein .NET-Entwickler sind und Ihre Dokumentbearbeitungsfunktionen verbessern möchten, bietet GroupDocs.Editor für .NET eine leistungsstarke Suite an Tools. Diese umfassende Anleitung führt Sie durch die erweiterte Verwendung bearbeitbarer Dokumente mit GroupDocs.Editor und erläutert jeden Schritt im Detail, damit Sie das volle Potenzial nutzen können.

Voraussetzungen

Bevor Sie in die erweiterten Funktionen eintauchen, stellen Sie sicher, dass Sie über Folgendes verfügen:

  • Visual Studio ist auf Ihrem Entwicklungscomputer installiert.
  • .NET Framework kompatibel mit GroupDocs.Editor.
  • GroupDocs.Editor für .NET-Bibliothek. Sie könnenhier herunterladen.
  • Eine gültige GroupDocs.Editor-Lizenz. Sie erhalten eineKostenlose Testphase oder kaufen Sie einvorläufige Lizenz.

Namespaces importieren

Stellen Sie zunächst sicher, dass Sie die erforderlichen Namespaces in Ihr .NET-Projekt importieren:

using System;
using System.Collections.Generic;
using System.IO;
using GroupDocs.Editor.HtmlCss.Resources;
using GroupDocs.Editor.HtmlCss.Resources.Fonts;
using GroupDocs.Editor.HtmlCss.Resources.Images;
using GroupDocs.Editor.HtmlCss.Resources.Textual;
using GroupDocs.Editor.Options;

Schritt 1: Erstellen einer EditableDocument-Instanz

Zuerst müssen Sie eine Instanz vonEditableDocument durch Laden und Bearbeiten eines Eingabedokuments eines unterstützten Formats.

string inputFilePath = "YourSampleDocument.docx";
Editor editor = new Editor(inputFilePath, delegate { return new WordProcessingLoadOptions(); });
EditableDocument beforeEdit = editor.Edit(new WordProcessingEditOptions());

In diesem Schritt laden wir das Eingabedokument und bereiten es für die Bearbeitung vor.

Schritt 2: Dokumentressourcen extrahieren

DerEditableDocument enthält verschiedene Ressourcen, die extrahiert und manipuliert werden können. Lassen Sie uns diese aufschlüsseln:

Schritt 2.1: Gesamtes Dokument als HTML extrahieren

Sie können eine einzelne Zeichenfolge generieren, die das gesamte Dokument mit allen seinen als HTML eingebetteten Ressourcen enthält.

string allAsHtmlInsideOneString = beforeEdit.GetEmbeddedHtml();

Diese Zeichenfolge wird ziemlich groß sein, da sie in Base64 codierte Stylesheets, Bilder und Schriftarten enthält.

Schritt 2.2: Alle Bilder extrahieren

Extrahieren Sie alle Bilder aus dem Dokument.

List<IImageResource> allImages = beforeEdit.Images;

Schritt 2.3: Alle Schriftarten extrahieren

Extrahieren Sie alle im Dokument verwendeten Schriftarten.

List<FontResourceBase> allFonts = beforeEdit.Fonts;

Schritt 2.4: Alle Stylesheets extrahieren

Extrahieren Sie alle Stylesheets in ein Textformat.

List<CssText> allStylesheets = beforeEdit.Css;

Schritt 2.5: Alle Ressourcen sammeln

Sammeln Sie alle Ressourcen in einem Anruf.

List<IHtmlResource> allResources = beforeEdit.AllResources;

Hierzu zählen Bilder, Schriftarten und Stylesheets.

Schritt 2.6: HTML-Markup abrufen

Holen Sie sich die HTML-Auszeichnung des Dokuments ohne eingebettete Ressourcen.

string htmlMarkup = beforeEdit.GetContent();

Manchmal müssen Sie externe Links anpassen, damit sie auf einen benutzerdefinierten Ressourcenhandler verweisen. So geht’s:

Schritt 3.1: Benutzerdefinierte Präfixe vorbereiten

Bereiten Sie Präfixe vor, die den ursprünglichen externen Links vorangestellt werden.

string customImagesRequesthandlerUri = "http://beispiel.com/ImagesHandler/id=";
string customCssRequesthandlerUri = "http://beispiel.com/CssHandler/id=";
string customFontsRequesthandlerUri = "http://beispiel.com/FontsHandler/id=";

Schritt 3.2: Präfixiertes HTML-Markup generieren

Generieren Sie HTML-Markup mit angepassten Links.

string prefixedHtmlMarkup = beforeEdit.GetContent(customImagesRequesthandlerUri, customCssRequesthandlerUri);

Schritt 3.3: Nur-Text-HTML-Inhalt abrufen

Einige WYSIWYG-Editoren verarbeiten nur reines HTML-Markup ohne Header.

string onlyBodyContent = beforeEdit.GetBodyContent();

Schritt 3.4: Nur-Text-Inhalte mit Präfix

Generieren Sie Nur-Text-Inhalte mit benutzerdefinierten Bildpräfixen.

string prefixedBodyContent = beforeEdit.GetBodyContent(customImagesRequesthandlerUri);

Schritt 3.5: Stylesheets extrahieren

Extrahieren Sie im Dokument verwendete Stylesheets.

List<string> stylesheets = beforeEdit.GetCssContent();

Schritt 3.6: Präfixierte Stylesheets

Extrahieren Sie Stylesheets mit benutzerdefinierten Präfixen.

List<string> prefixedStylesheets = beforeEdit.GetCssContent(customImagesRequesthandlerUri, customFontsRequesthandlerUri);

Schritt 4: Dokument als HTML speichern

Speichern Sie das bearbeitete Dokument inklusive seiner Ressourcen als HTML-Datei.

string htmlFilePath = Path.Combine("output", Path.GetFileNameWithoutExtension(inputFilePath) + ".html");
beforeEdit.Save(htmlFilePath);

Diese Methode erstellt ein separates Verzeichnis für Ressourcen wie Stylesheets, Bilder und Schriftarten.

Schritt 5: EditableDocument entsorgen

EditableDocument implementiertIDisposable und bietet die Möglichkeit zu überprüfen, ob die Instanz entsorgt wurde.

Console.WriteLine("EditableDocument is {0} disposed", !beforeEdit.IsDisposed ? "not" : "already");

Schritt 5.1 Verarbeiten des Dispose-Ereignisses

Sie können sich auch für die Veräußerungsaktion anmelden.

EventHandler someMethod = delegate { Console.WriteLine("Disposing event was spotted!"); };
beforeEdit.Disposed += someMethod;

Schritt 6: Editierbares Dokument aus HTML erstellen

Erstellen Sie eine Instanz von EditableDocument aus einem HTML-Dokument.

Schritt 6.1: Aus einer HTML-Datei

EditableDocument afterEditFromFile = EditableDocument.FromFile(htmlFilePath, null);

Schritt 6.2: Aus HTML-Markup

EditableDocument afterEditFromMarkup = EditableDocument.FromMarkup(htmlMarkup, allResources);

Diese Instanzen (afterEditFromFile und afterEditFromMarkup) sind identisch mit dem Original (beforeEdit).

Schritt 7: Manuelle Entsorgung

Entsorgen Sie Ihre EditableDocument-Instanzen manuell.

beforeEdit.Dispose();
afterEditFromFile.Dispose();
afterEditFromMarkup.Dispose();
editor.Dispose();

Dadurch wird eine ordnungsgemäße Bereinigung der Ressourcen sichergestellt.

Abschluss

GroupDocs.Editor für .NET bietet robuste Tools zum programmgesteuerten Bearbeiten von Dokumenten. Indem Sie dieser Schritt-für-Schritt-Anleitung folgen, können Sie Dokumentinhalte, Ressourcen und Ausgabeformate effizient verwalten. Egal, ob Sie Ressourcen einbetten, externe Links anpassen oder Dokumente in HTML konvertieren, GroupDocs.Editor stattet Sie mit der Funktionalität aus, die Sie für die erweiterte Dokumentbearbeitung benötigen.

Häufig gestellte Fragen

Welche Formate unterstützt GroupDocs.Editor?

GroupDocs.Editor unterstützt verschiedene Formate, darunter DOCX, XLSX, PPTX und mehr.

Kann ich GroupDocs.Editor ohne Lizenz verwenden?

Ja, Sie können es mit einemKostenlose Testphase oder einvorläufige Lizenz.

Wie extrahiere ich bestimmte Ressourcen aus einem Dokument?

Sie können Bilder, Schriftarten und Stylesheets mit den bereitgestellten Methoden extrahieren, wieImages, Fonts , UndCss.

Ja, Sie können externe Links anpassen, indem Sie benutzerdefinierte Präfixe für Bilder, CSS und Schriftarten angeben.

Wie speichere ich ein bearbeitetes Dokument als HTML-Datei?

Verwenden Sie dieSave Methode derEditableDocumentKlasse, um das Dokument einschließlich seiner Ressourcen als HTML-Datei zu speichern.