रूपांतरण और अनुकूलन

रूपांतरण और अनुकूलन

परिवर्तन और अनुकूलन

Aspose.PDF FOSS for .NET PDFs को HTML, Markdown, SVG, और साधारण टेक्स्ट में बदलने के लिए कन्वर्टर्स प्रदान करता है। ऑप्टिमाइज़ेशन सबसिस्टम फ़ाइल आकार को कम करता है और PdfFormatConversionOptions के माध्यम से PDF/A अनुपालन सुनिश्चित करता है।


PDF से HTML

PdfToHtmlConverter PDF पृष्ठों को HTML दस्तावेज़ों के रूप में निर्यात करता है।

var converter = new PdfToHtmlConverter();
converter.SaveAsHtml("input.pdf", "output.html");

// Or save each page separately
converter.SaveAllPagesAsHtml("input.pdf", "output_dir");

HtmlSaveOptions छवि संभाल, फ़ॉन्ट एम्बेडिंग, और लेआउट रणनीति पर नियंत्रण प्रदान करता है।


PDF से Markdown

PdfToMarkdownConverter PDF सामग्री को Markdown पाठ के रूप में निर्यात करता है।

var converter = new PdfToMarkdownConverter("input.pdf");
converter.SaveAsMarkdown("output.md");

// Single page
converter.SavePageAsMarkdown(1, "page1.md");

PDF से SVG

PdfToSvgConverter प्रत्येक पृष्ठ को स्केलेबल वेक्टर ग्राफ़िक के रूप में रेंडर करता है।

var converter = new PdfToSvgConverter();
converter.SaveAllPagesAsSvg("input.pdf", "output_dir");

PDF को टेक्स्ट में

PdfToTextConverter PDF पृष्ठों से साधारण पाठ निकालता है।

var converter = new PdfToTextConverter();
converter.SaveAsText("input.pdf", "output.txt");

PDF/A अनुपालन

PdfFormatConversionOptions दस्तावेज़ों को PDF/A मानकों के अनुसार मान्य करता है और परिवर्तित करता है।

using var doc = Document.Open(pdfBytes);

var options = new PdfFormatConversionOptions(
    "log.xml",
    PdfFormat.PDF_A_1B,
    ConvertErrorAction.Delete);

doc.Convert(options);
doc.Save("pdfa.pdf");

हेडिंग-स्तर नियंत्रण

HeadingLevels HTML या Markdown रूपांतरण के दौरान पहचाने जाने वाले शीर्षक स्तरों को कॉन्फ़िगर करता है।

var levels = new HeadingLevels();
levels.AddLevels(1, 3);  // Recognize H1 through H3

टिप्स और सर्वोत्तम प्रथाएँ

  • वेब प्रकाशन के लिए PdfToHtmlConverter का उपयोग करें और दस्तावेज़ीकरण कार्यप्रवाहों के लिए PdfToMarkdownConverter का उपयोग करें।
  • PDF/A रूपांतरण मानक का उल्लंघन करने वाली सुविधाओं (JavaScript, encryption) को हटा सकता है — ConvertErrorAction.Delete या ConvertErrorAction.None का उपयोग करें।
  • बड़े दस्तावेज़ों के लिए, मेमोरी प्रबंधन हेतु पृष्ठ-दर-पृष्ठ रूपांतरण करें।
  • HtmlSaveOptions यह नियंत्रित करता है कि छवियां इनलाइन एम्बेड की जाएँ या बाहरी फ़ाइलों के रूप में सहेजी जाएँ।
  • व्यक्तिगत पृष्ठों के उच्च-रिज़ॉल्यूशन प्रदर्शन के लिए SVG आउटपुट आदर्श है।

सामान्य समस्याएँ

IssueCauseFix
HTML आउटपुट में छवियां गायब हैंछवियां एम्बेड नहीं हैं; बाहरी पथ गलत हैंHtmlSaveOptions को एम्बेडेड छवियों के लिए कॉन्फ़िगर करें
PDF/A रूपांतरण एनोटेशन हटाता हैलक्षित PDF/A प्रोफ़ाइल में एनोटेशन की अनुमति नहीं हैPDF/A-2 या PDF/A-3 का उपयोग करें जो एनोटेशन की अनुमति देते हैं
टेक्स्ट एक्सट्रैक्शन फ़ॉर्मेटिंग खो देता हैसादा-टेक्स्ट आउटपुट में डिजाइन के अनुसार कोई फ़ॉर्मेटिंग नहीं होतीइसके बजाय HTML या Markdown रूपांतरण का उपयोग करें

अक्सर पूछे जाने वाले प्रश्न

कौन से PDF/A प्रोफ़ाइल समर्थित हैं?

PDF/A-1A, PDF/A-1B, PDF/A-2A, PDF/A-2B, PDF/A-3A, और PDF/A-3B प्रोफ़ाइल PdfFormat एन्यूमरेशन मानों के माध्यम से समर्थित हैं।

क्या मैं एक पृष्ठ को HTML में परिवर्तित कर सकता हूँ?

हाँ। PdfToHtmlConverter.SavePageAsHtml का उपयोग करें।

क्या Markdown रूपांतरण तालिकाओं को संरक्षित करता है?

कनवर्टर तालिका संरचनाओं को मार्कडाउन तालिकाओं के रूप में रेंडर करने का प्रयास करता है, लेकिन जटिल लेआउट को पोस्ट‑प्रोसेसिंग की आवश्यकता हो सकती है।


API रेफ़रेंस सारांश

Class / MethodDescription
PdfToHtmlConverterPDF को HTML में बदलें
PdfToHtmlConverter.SaveAsHtmlपूरे दस्तावेज़ को HTML के रूप में निर्यात करें
PdfToMarkdownConverterPDF को Markdown में बदलें
PdfToSvgConverterPDF पृष्ठों को SVG में बदलें
PdfToTextConverterPDF से साधारण टेक्स्ट निकालें
HtmlSaveOptionsHTML निर्यात के विकल्प (छवियां, फ़ॉन्ट, लेआउट)
HeadingLevelsपहचाने गए शीर्षक स्तरों को कॉन्फ़िगर करें
PdfFormatConversionOptionsPDF/A सत्यापन और रूपांतरण विकल्प

और देखें

 हिन्दी