Koda pārvaldība

Kodolpārvaldība

Document klase ir galvenā API Word dokumentu ielādei un to konvertēšanai uz citām formātām. Šajā lapā aplūkoti formātu konvertēšanas darbplūsmas, saglabāšanas opciju konfigurācija un teksta izguve.


Ielāde un saglabāšana

Ielādējiet dokumentu ar Document() un izsauciet save() ar SaveFormat konstantu, lai konvertētu starp formātiem. Atbalstītie ievades formāti: DOCX, DOC, RTF, TXT, Markdown. Atbalstītie izvades formāti: PDF, DOCX, DOC, Markdown, TXT.

import aspose.words_foss as aw

doc = aw.Document("input.docx")
doc.save("output.md", aw.SaveFormat.MARKDOWN)
doc.save("output.pdf", aw.SaveFormat.PDF)
doc.save("output.txt", aw.SaveFormat.TEXT)

Izsauciet save() vairākas reizes uz tā paša Document, lai radītu vairākus izvades formātus, nepārlādējot.


PDF eksportēšana ar PdfSaveOptions

Lai iegūtu noklusējuma PDF izvadi, nododiet SaveFormat.PDF. Lai veiktu smalku vadību, izmantojiet PdfSaveOptions objektu:

import aspose.words_foss as aw
from aspose.words_foss.saving import PdfSaveOptions

doc = aw.Document("input.docx")

# Default PDF export
doc.save("default.pdf", aw.SaveFormat.PDF)

# Customized PDF export with save options
doc.save("custom.pdf", PdfSaveOptions())

PdfSaveOptions pieņem iestatījumus JPEG attēla kvalitātei (0–100, noklusējuma 100) un PDF standartu atbilstības līmenim (noklusējuma PDF/1.7).


Markdown eksportēšana ar MarkdownSaveOptions

Noklusējuma Markdown izvadei, nododiet SaveFormat.MARKDOWN. Izmantojiet MarkdownSaveOptions, kad jums ir jākontrolē formatēšanas uzvedība:

import aspose.words_foss as aw
from aspose.words_foss.saving import MarkdownSaveOptions

doc = aw.Document("input.docx")

# Default Markdown export
doc.save("default.md", aw.SaveFormat.MARKDOWN)

# Customized Markdown export with save options
doc.save("with_options.md", MarkdownSaveOptions())

MarkdownSaveOptions atbalsta apakšsvītras formatējuma saglabāšanas kontroli izvades rezultātā.


Teksta izguve

Izgūstiet vienkāršu tekstu no jebkura ielādēta dokumenta, izmantojot get_text():

import aspose.words_foss as aw

doc = aw.Document("input.docx")
text = doc.get_text()

Teksta faila izvadei izmantojiet SaveFormat.TEXT:

doc.save("output.txt", aw.SaveFormat.TEXT)

Biežāk sastopamās problēmas

IssueCauseFix
ModuleNotFoundErrorPakotne nav instalētaIzpildiet pip install aspose-words-foss>=26.4.0
Tukšs teksts no get_text()Ievades fails ir tukšs vai bojātsPārbaudiet, vai ievades fails atveras pareizi teksta apstrādātājā
PDF izvadei trūkst attēluAttēla formāts nav atbalstīts pārveidotājāIzmantojiet DOCX ievadi ar standarta iegultajiem attēliem

API atsauces kopsavilkums

Klase / MetodeApraksts
DocumentIelādēt Word dokumentus no DOCX, DOC, RTF, TXT vai Markdown
Document.save()Saglabāt kā PDF, Markdown, DOCX, DOC vai vienkāršu tekstu
Document.get_text()Izvilkt vienkārša teksta saturu
SaveFormatKonstantes: PDF, MARKDOWN, TEXT, DOC, DOCX
PdfSaveOptionsKonfigurēt PDF atbilstību un JPEG kvalitāti
MarkdownSaveOptionsKonfigurēt pasvītrojuma formatēšanas eksportu
 Latviešu