रूपांतरण और अनुकूलन
परिवर्तन और अनुकूलन
Aspose.PDF FOSS for .NET PDFs को HTML,
Markdown, SVG, और साधारण टेक्स्ट में बदलने के लिए कन्वर्टर्स प्रदान करता है। ऑप्टिमाइज़ेशन सबसिस्टम फ़ाइल आकार को कम करता है
और PdfFormatConversionOptions के माध्यम से PDF/A अनुपालन सुनिश्चित करता है।
PDF से HTML
PdfToHtmlConverter PDF पृष्ठों को HTML दस्तावेज़ों के रूप में निर्यात करता है।
var converter = new PdfToHtmlConverter();
converter.SaveAsHtml("input.pdf", "output.html");
// Or save each page separately
converter.SaveAllPagesAsHtml("input.pdf", "output_dir");HtmlSaveOptions छवि संभाल, फ़ॉन्ट एम्बेडिंग, और लेआउट रणनीति पर नियंत्रण प्रदान करता है।
PDF से Markdown
PdfToMarkdownConverter PDF सामग्री को Markdown पाठ के रूप में निर्यात करता है।
var converter = new PdfToMarkdownConverter("input.pdf");
converter.SaveAsMarkdown("output.md");
// Single page
converter.SavePageAsMarkdown(1, "page1.md");PDF से SVG
PdfToSvgConverter प्रत्येक पृष्ठ को स्केलेबल वेक्टर ग्राफ़िक के रूप में रेंडर करता है।
var converter = new PdfToSvgConverter();
converter.SaveAllPagesAsSvg("input.pdf", "output_dir");PDF को टेक्स्ट में
PdfToTextConverter PDF पृष्ठों से साधारण पाठ निकालता है।
var converter = new PdfToTextConverter();
converter.SaveAsText("input.pdf", "output.txt");PDF/A अनुपालन
PdfFormatConversionOptions दस्तावेज़ों को PDF/A मानकों के अनुसार मान्य करता है और परिवर्तित करता है।
using var doc = Document.Open(pdfBytes);
var options = new PdfFormatConversionOptions(
"log.xml",
PdfFormat.PDF_A_1B,
ConvertErrorAction.Delete);
doc.Convert(options);
doc.Save("pdfa.pdf");हेडिंग-स्तर नियंत्रण
HeadingLevels HTML या Markdown रूपांतरण के दौरान पहचाने जाने वाले शीर्षक स्तरों को कॉन्फ़िगर करता है।
var levels = new HeadingLevels();
levels.AddLevels(1, 3); // Recognize H1 through H3टिप्स और सर्वोत्तम प्रथाएँ
- वेब प्रकाशन के लिए
PdfToHtmlConverterका उपयोग करें और दस्तावेज़ीकरण कार्यप्रवाहों के लिएPdfToMarkdownConverterका उपयोग करें। - PDF/A रूपांतरण मानक का उल्लंघन करने वाली सुविधाओं (JavaScript, encryption) को हटा सकता है —
ConvertErrorAction.DeleteयाConvertErrorAction.Noneका उपयोग करें। - बड़े दस्तावेज़ों के लिए, मेमोरी प्रबंधन हेतु पृष्ठ-दर-पृष्ठ रूपांतरण करें।
HtmlSaveOptionsयह नियंत्रित करता है कि छवियां इनलाइन एम्बेड की जाएँ या बाहरी फ़ाइलों के रूप में सहेजी जाएँ।- व्यक्तिगत पृष्ठों के उच्च-रिज़ॉल्यूशन प्रदर्शन के लिए SVG आउटपुट आदर्श है।
सामान्य समस्याएँ
| Issue | Cause | Fix |
|---|---|---|
| HTML आउटपुट में छवियां गायब हैं | छवियां एम्बेड नहीं हैं; बाहरी पथ गलत हैं | HtmlSaveOptions को एम्बेडेड छवियों के लिए कॉन्फ़िगर करें |
| PDF/A रूपांतरण एनोटेशन हटाता है | लक्षित PDF/A प्रोफ़ाइल में एनोटेशन की अनुमति नहीं है | PDF/A-2 या PDF/A-3 का उपयोग करें जो एनोटेशन की अनुमति देते हैं |
| टेक्स्ट एक्सट्रैक्शन फ़ॉर्मेटिंग खो देता है | सादा-टेक्स्ट आउटपुट में डिजाइन के अनुसार कोई फ़ॉर्मेटिंग नहीं होती | इसके बजाय HTML या Markdown रूपांतरण का उपयोग करें |
अक्सर पूछे जाने वाले प्रश्न
कौन से PDF/A प्रोफ़ाइल समर्थित हैं?
PDF/A-1A, PDF/A-1B, PDF/A-2A, PDF/A-2B, PDF/A-3A, और PDF/A-3B प्रोफ़ाइल PdfFormat एन्यूमरेशन मानों के माध्यम से समर्थित हैं।
क्या मैं एक पृष्ठ को HTML में परिवर्तित कर सकता हूँ?
हाँ। PdfToHtmlConverter.SavePageAsHtml का उपयोग करें।
क्या Markdown रूपांतरण तालिकाओं को संरक्षित करता है?
कनवर्टर तालिका संरचनाओं को मार्कडाउन तालिकाओं के रूप में रेंडर करने का प्रयास करता है, लेकिन जटिल लेआउट को पोस्ट‑प्रोसेसिंग की आवश्यकता हो सकती है।
API रेफ़रेंस सारांश
| Class / Method | Description |
|---|---|
PdfToHtmlConverter | PDF को HTML में बदलें |
PdfToHtmlConverter.SaveAsHtml | पूरे दस्तावेज़ को HTML के रूप में निर्यात करें |
PdfToMarkdownConverter | PDF को Markdown में बदलें |
PdfToSvgConverter | PDF पृष्ठों को SVG में बदलें |
PdfToTextConverter | PDF से साधारण टेक्स्ट निकालें |
HtmlSaveOptions | HTML निर्यात के विकल्प (छवियां, फ़ॉन्ट, लेआउट) |
HeadingLevels | पहचाने गए शीर्षक स्तरों को कॉन्फ़िगर करें |
PdfFormatConversionOptions | PDF/A सत्यापन और रूपांतरण विकल्प |