המרה ואופטימיזציה
המרה ואופטימיזציה
Aspose.PDF FOSS for .NET מספק ממירים להמרת קבצי PDF ל-HTML,
Markdown, SVG, וטקסט פשוט. תת‑מערכת האופטימיזציה מצמצמת את גודל הקובץ
ומבטיחה תאימות ל-PDF/A דרך PdfFormatConversionOptions.
PDF ל-HTML
PdfToHtmlConverter מייצא דפי PDF כקבצי HTML.
var converter = new PdfToHtmlConverter();
converter.SaveAsHtml("input.pdf", "output.html");
// Or save each page separately
converter.SaveAllPagesAsHtml("input.pdf", "output_dir");HtmlSaveOptions מספק שליטה על טיפול בתמונות, הטמעת גופנים, ואסטרטגיית פריסה.
PDF ל-Markdown
PdfToMarkdownConverter מייצא תוכן PDF כטקסט Markdown.
var converter = new PdfToMarkdownConverter("input.pdf");
converter.SaveAsMarkdown("output.md");
// Single page
converter.SavePageAsMarkdown(1, "page1.md");PDF ל‑SVG
PdfToSvgConverter מציג כל דף כגרפיקה וקטורית ניתנת להרחבה.
var converter = new PdfToSvgConverter();
converter.SaveAllPagesAsSvg("input.pdf", "output_dir");PDF לטקסט
PdfToTextConverter מחלץ טקסט פשוט מדפי PDF.
var converter = new PdfToTextConverter();
converter.SaveAsText("input.pdf", "output.txt");תאימות ל-PDF/A
PdfFormatConversionOptions מאמת וממיר מסמכים לתקני PDF/A.
using var doc = Document.Open(pdfBytes);
var options = new PdfFormatConversionOptions(
"log.xml",
PdfFormat.PDF_A_1B,
ConvertErrorAction.Delete);
doc.Convert(options);
doc.Save("pdfa.pdf");בקרת רמת כותרת
HeadingLevels מגדיר אילו רמות כותרת מזוהות במהלך המרת HTML או Markdown.
var levels = new HeadingLevels();
levels.AddLevels(1, 3); // Recognize H1 through H3טיפים ושיטות עבודה מומלצות
- השתמשו ב
PdfToHtmlConverterלפרסום אינטרנטי ובPdfToMarkdownConverterלתהליכי תיעוד. - המרת PDF/A עשויה להסיר תכונות (JavaScript, הצפנה) שמפרות את הסטנדרט — השתמשו ב
ConvertErrorAction.Deleteאו בConvertErrorAction.None. - עבור מסמכים גדולים, המר כל עמוד בנפרד כדי לנהל את הזיכרון.
HtmlSaveOptionsשולט האם התמונות משובצות באופן פנימי או נשמרות כקבצים חיצוניים.- פלט SVG אידיאלי לתצוגה ברזולוציה גבוהה של דפים בודדים.
בעיות נפוצות
| בעיה | סיבה | פתרון |
|---|---|---|
| פלט HTML חסר תמונות | התמונות לא משובצות; נתיבים חיצוניים שגויים | הגדר HtmlSaveOptions לתמונות משובצות |
| המרת PDF/A מסירה הערות | הערות אינן מותרות בפרופיל PDF/A היעד | השתמש ב‑PDF/A-2 או PDF/A-3 המאפשרים הערות |
| חילוץ טקסט מאבד עיצוב | פלט טקסט פשוט אינו כולל עיצוב בכוונה | השתמש בהמרת HTML או Markdown במקום |
שאלות נפוצות
אילו פרופילי PDF/A נתמכים?
פרופילי PDF/A-1A, PDF/A-1B, PDF/A-2A, PDF/A-2B, PDF/A-3A ו-PDF/A-3B נתמכים באמצעות ערכי המונה PdfFormat.
האם אני יכול להמיר דף יחיד ל‑HTML?
כן. השתמש בPdfToHtmlConverter.SavePageAsHtml.
האם המרת Markdown משמרת טבלאות?
הממיר מנסה להציג מבני טבלאות כטבלאות Markdown, אך פריסות מורכבות עשויות לדרוש עיבוד נוסף.
סיכום התיעוד של API
| Class / Method | Description |
|---|---|
PdfToHtmlConverter | המרת PDF ל‑HTML |
PdfToHtmlConverter.SaveAsHtml | ייצוא המסמך המלא כ‑HTML |
PdfToMarkdownConverter | המרת PDF ל‑Markdown |
PdfToSvgConverter | המרת דפי PDF ל‑SVG |
PdfToTextConverter | חילוץ טקסט פשוט מ‑PDF |
HtmlSaveOptions | אפשרויות לייצוא HTML (תמונות, גופנים, פריסה) |
HeadingLevels | הגדרת רמות כותרת מזוהות |
PdfFormatConversionOptions | אפשרויות אימות והמרת PDF/A |