Ydinhallinta
Ydinhallinta
Document-luokka on keskeinen API Word-asiakirjojen lataamiseen ja niiden muuntamiseen muihin formaatteihin. Tämä sivu käsittelee formaattimuunnoksen työnkulkuja, tallennusasetusten konfigurointia ja tekstin poimintaa.
Lataaminen ja tallentaminen
Lataa asiakirja Document() avulla ja kutsu save() SaveFormat-vakiolla muuntaaksesi formaattien välillä. Tuetut syötteet: DOCX, DOC, RTF, TXT, Markdown. Tuetut tulosteet: PDF, DOCX, DOC, Markdown, TXT.
import aspose.words_foss as aw
doc = aw.Document("input.docx")
doc.save("output.md", aw.SaveFormat.MARKDOWN)
doc.save("output.pdf", aw.SaveFormat.PDF)
doc.save("output.txt", aw.SaveFormat.TEXT)Kutsu save() useita kertoja samassa Document tuottaaksesi useita tulostusformaatteja ilman uudelleenlatausta.
PDF-vienti PdfSaveOptionsilla
Oletus‑PDF‑tulostusta varten anna SaveFormat.PDF. Hienojakoista hallintaa varten käytä PdfSaveOptions‑objektia:
import aspose.words_foss as aw
from aspose.words_foss.saving import PdfSaveOptions
doc = aw.Document("input.docx")
# Default PDF export
doc.save("default.pdf", aw.SaveFormat.PDF)
# Customized PDF export with save options
doc.save("custom.pdf", PdfSaveOptions())PdfSaveOptions hyväksyy asetukset JPEG-kuvan laadulle (0–100, oletus 100) ja PDF-standardeihin noudattamisen tasolle (oletus PDF/1.7).
Markdown‑vienti MarkdownSaveOptionsilla
Oletus‑Markdown‑tulosteen saamiseksi anna SaveFormat.MARKDOWN. Käytä MarkdownSaveOptions, kun sinun täytyy hallita muotoilukäyttäytymistä:
import aspose.words_foss as aw
from aspose.words_foss.saving import MarkdownSaveOptions
doc = aw.Document("input.docx")
# Default Markdown export
doc.save("default.md", aw.SaveFormat.MARKDOWN)
# Customized Markdown export with save options
doc.save("with_options.md", MarkdownSaveOptions())MarkdownSaveOptions tukee alleviivan muotoilun säilyttämisen hallintaa tulosteessa.
Tekstin poiminta
Poimi tavallinen teksti mistä tahansa ladatusta asiakirjasta get_text():
import aspose.words_foss as aw
doc = aw.Document("input.docx")
text = doc.get_text()Tekstitiedoston tulostukseen käytä SaveFormat.TEXT:
doc.save("output.txt", aw.SaveFormat.TEXT)Yleiset ongelmat
| Ongelma | Syy | Korjaus |
|---|---|---|
ModuleNotFoundError | Pakettia ei ole asennettu | Suorita pip install aspose-words-foss>=26.4.0 |
Tyhjä teksti lähteestä get_text() | Syötetiedosto on tyhjä tai vioittunut | Varmista, että syötetiedosto avautuu oikein tekstinkäsittelyohjelmassa |
| PDF-tulosteesta puuttuvat kuvat | Kuvamuoto ei ole muunninta tukema | Käytä DOCX-syötettä, jossa on tavallisia upotettuja kuvia |
API-viitteiden yhteenveto
| Luokka / Metodi | Kuvaus |
|---|---|
Document | Lataa Word-asiakirjoja DOCX-, DOC-, RTF-, TXT- tai Markdown-muodoista |
Document.save() | Tallenna PDF-, Markdown-, DOCX-, DOC- tai tavalliseen tekstiin |
Document.get_text() | Poimi tavallinen tekstisisältö |
SaveFormat | Vakiot: PDF, MARKDOWN, TEXT, DOC, DOCX |
PdfSaveOptions | Määritä PDF-yhteensopivuus ja JPEG-laatu |
MarkdownSaveOptions | Määritä alleviivauksen muotoilun vienti |