Koda pārvaldība
Kodolpārvaldība
Document klase ir galvenā API Word dokumentu ielādei un to konvertēšanai uz citām formātām. Šajā lapā aplūkoti formātu konvertēšanas darbplūsmas, saglabāšanas opciju konfigurācija un teksta izguve.
Ielāde un saglabāšana
Ielādējiet dokumentu ar Document() un izsauciet save() ar SaveFormat konstantu, lai konvertētu starp formātiem. Atbalstītie ievades formāti: DOCX, DOC, RTF, TXT, Markdown. Atbalstītie izvades formāti: PDF, DOCX, DOC, Markdown, TXT.
import aspose.words_foss as aw
doc = aw.Document("input.docx")
doc.save("output.md", aw.SaveFormat.MARKDOWN)
doc.save("output.pdf", aw.SaveFormat.PDF)
doc.save("output.txt", aw.SaveFormat.TEXT)Izsauciet save() vairākas reizes uz tā paša Document, lai radītu vairākus izvades formātus, nepārlādējot.
PDF eksportēšana ar PdfSaveOptions
Lai iegūtu noklusējuma PDF izvadi, nododiet SaveFormat.PDF. Lai veiktu smalku vadību, izmantojiet PdfSaveOptions objektu:
import aspose.words_foss as aw
from aspose.words_foss.saving import PdfSaveOptions
doc = aw.Document("input.docx")
# Default PDF export
doc.save("default.pdf", aw.SaveFormat.PDF)
# Customized PDF export with save options
doc.save("custom.pdf", PdfSaveOptions())PdfSaveOptions pieņem iestatījumus JPEG attēla kvalitātei (0–100, noklusējuma 100) un PDF standartu atbilstības līmenim (noklusējuma PDF/1.7).
Markdown eksportēšana ar MarkdownSaveOptions
Noklusējuma Markdown izvadei, nododiet SaveFormat.MARKDOWN. Izmantojiet MarkdownSaveOptions, kad jums ir jākontrolē formatēšanas uzvedība:
import aspose.words_foss as aw
from aspose.words_foss.saving import MarkdownSaveOptions
doc = aw.Document("input.docx")
# Default Markdown export
doc.save("default.md", aw.SaveFormat.MARKDOWN)
# Customized Markdown export with save options
doc.save("with_options.md", MarkdownSaveOptions())MarkdownSaveOptions atbalsta apakšsvītras formatējuma saglabāšanas kontroli izvades rezultātā.
Teksta izguve
Izgūstiet vienkāršu tekstu no jebkura ielādēta dokumenta, izmantojot get_text():
import aspose.words_foss as aw
doc = aw.Document("input.docx")
text = doc.get_text()Teksta faila izvadei izmantojiet SaveFormat.TEXT:
doc.save("output.txt", aw.SaveFormat.TEXT)Biežāk sastopamās problēmas
| Issue | Cause | Fix |
|---|---|---|
ModuleNotFoundError | Pakotne nav instalēta | Izpildiet pip install aspose-words-foss>=26.4.0 |
Tukšs teksts no get_text() | Ievades fails ir tukšs vai bojāts | Pārbaudiet, vai ievades fails atveras pareizi teksta apstrādātājā |
| PDF izvadei trūkst attēlu | Attēla formāts nav atbalstīts pārveidotājā | Izmantojiet DOCX ievadi ar standarta iegultajiem attēliem |
API atsauces kopsavilkums
| Klase / Metode | Apraksts |
|---|---|
Document | Ielādēt Word dokumentus no DOCX, DOC, RTF, TXT vai Markdown |
Document.save() | Saglabāt kā PDF, Markdown, DOCX, DOC vai vienkāršu tekstu |
Document.get_text() | Izvilkt vienkārša teksta saturu |
SaveFormat | Konstantes: PDF, MARKDOWN, TEXT, DOC, DOCX |
PdfSaveOptions | Konfigurēt PDF atbilstību un JPEG kvalitāti |
MarkdownSaveOptions | Konfigurēt pasvītrojuma formatēšanas eksportu |