המרה ואופטימיזציה

המרה ואופטימיזציה

המרה ואופטימיזציה

Aspose.PDF FOSS for .NET מספק ממירים להמרת קבצי PDF ל-HTML, Markdown, SVG, וטקסט פשוט. תת‑מערכת האופטימיזציה מצמצמת את גודל הקובץ ומבטיחה תאימות ל-PDF/A דרך PdfFormatConversionOptions.


PDF ל-HTML

PdfToHtmlConverter מייצא דפי PDF כקבצי HTML.

var converter = new PdfToHtmlConverter();
converter.SaveAsHtml("input.pdf", "output.html");

// Or save each page separately
converter.SaveAllPagesAsHtml("input.pdf", "output_dir");

HtmlSaveOptions מספק שליטה על טיפול בתמונות, הטמעת גופנים, ואסטרטגיית פריסה.


PDF ל-Markdown

PdfToMarkdownConverter מייצא תוכן PDF כטקסט Markdown.

var converter = new PdfToMarkdownConverter("input.pdf");
converter.SaveAsMarkdown("output.md");

// Single page
converter.SavePageAsMarkdown(1, "page1.md");

PDF ל‑SVG

PdfToSvgConverter מציג כל דף כגרפיקה וקטורית ניתנת להרחבה.

var converter = new PdfToSvgConverter();
converter.SaveAllPagesAsSvg("input.pdf", "output_dir");

PDF לטקסט

PdfToTextConverter מחלץ טקסט פשוט מדפי PDF.

var converter = new PdfToTextConverter();
converter.SaveAsText("input.pdf", "output.txt");

תאימות ל-PDF/A

PdfFormatConversionOptions מאמת וממיר מסמכים לתקני PDF/A.

using var doc = Document.Open(pdfBytes);

var options = new PdfFormatConversionOptions(
    "log.xml",
    PdfFormat.PDF_A_1B,
    ConvertErrorAction.Delete);

doc.Convert(options);
doc.Save("pdfa.pdf");

בקרת רמת כותרת

HeadingLevels מגדיר אילו רמות כותרת מזוהות במהלך המרת HTML או Markdown.

var levels = new HeadingLevels();
levels.AddLevels(1, 3);  // Recognize H1 through H3

טיפים ושיטות עבודה מומלצות

  • השתמשו בPdfToHtmlConverter לפרסום אינטרנטי ובPdfToMarkdownConverter לתהליכי תיעוד.
  • המרת PDF/A עשויה להסיר תכונות (JavaScript, הצפנה) שמפרות את הסטנדרט — השתמשו בConvertErrorAction.Delete או בConvertErrorAction.None.
  • עבור מסמכים גדולים, המר כל עמוד בנפרד כדי לנהל את הזיכרון.
  • HtmlSaveOptions שולט האם התמונות משובצות באופן פנימי או נשמרות כקבצים חיצוניים.
  • פלט SVG אידיאלי לתצוגה ברזולוציה גבוהה של דפים בודדים.

בעיות נפוצות

בעיהסיבהפתרון
פלט HTML חסר תמונותהתמונות לא משובצות; נתיבים חיצוניים שגוייםהגדר HtmlSaveOptions לתמונות משובצות
המרת PDF/A מסירה הערותהערות אינן מותרות בפרופיל PDF/A היעדהשתמש ב‑PDF/A-2 או PDF/A-3 המאפשרים הערות
חילוץ טקסט מאבד עיצובפלט טקסט פשוט אינו כולל עיצוב בכוונההשתמש בהמרת HTML או Markdown במקום

שאלות נפוצות

אילו פרופילי PDF/A נתמכים?

פרופילי PDF/A-1A, PDF/A-1B, PDF/A-2A, PDF/A-2B, PDF/A-3A ו-PDF/A-3B נתמכים באמצעות ערכי המונה PdfFormat.

האם אני יכול להמיר דף יחיד ל‑HTML?

כן. השתמש בPdfToHtmlConverter.SavePageAsHtml.

האם המרת Markdown משמרת טבלאות?

הממיר מנסה להציג מבני טבלאות כטבלאות Markdown, אך פריסות מורכבות עשויות לדרוש עיבוד נוסף.


סיכום התיעוד של API

Class / MethodDescription
PdfToHtmlConverterהמרת PDF ל‑HTML
PdfToHtmlConverter.SaveAsHtmlייצוא המסמך המלא כ‑HTML
PdfToMarkdownConverterהמרת PDF ל‑Markdown
PdfToSvgConverterהמרת דפי PDF ל‑SVG
PdfToTextConverterחילוץ טקסט פשוט מ‑PDF
HtmlSaveOptionsאפשרויות לייצוא HTML (תמונות, גופנים, פריסה)
HeadingLevelsהגדרת רמות כותרת מזוהות
PdfFormatConversionOptionsאפשרויות אימות והמרת PDF/A

ראה גם

 עברית