Ydinhallinta

Ydinhallinta

Document-luokka on keskeinen API Word-asiakirjojen lataamiseen ja niiden muuntamiseen muihin formaatteihin. Tämä sivu käsittelee formaattimuunnoksen työnkulkuja, tallennusasetusten konfigurointia ja tekstin poimintaa.


Lataaminen ja tallentaminen

Lataa asiakirja Document() avulla ja kutsu save() SaveFormat-vakiolla muuntaaksesi formaattien välillä. Tuetut syötteet: DOCX, DOC, RTF, TXT, Markdown. Tuetut tulosteet: PDF, DOCX, DOC, Markdown, TXT.

import aspose.words_foss as aw

doc = aw.Document("input.docx")
doc.save("output.md", aw.SaveFormat.MARKDOWN)
doc.save("output.pdf", aw.SaveFormat.PDF)
doc.save("output.txt", aw.SaveFormat.TEXT)

Kutsu save() useita kertoja samassa Document tuottaaksesi useita tulostusformaatteja ilman uudelleenlatausta.


PDF-vienti PdfSaveOptionsilla

Oletus‑PDF‑tulostusta varten anna SaveFormat.PDF. Hienojakoista hallintaa varten käytä PdfSaveOptions‑objektia:

import aspose.words_foss as aw
from aspose.words_foss.saving import PdfSaveOptions

doc = aw.Document("input.docx")

# Default PDF export
doc.save("default.pdf", aw.SaveFormat.PDF)

# Customized PDF export with save options
doc.save("custom.pdf", PdfSaveOptions())

PdfSaveOptions hyväksyy asetukset JPEG-kuvan laadulle (0–100, oletus 100) ja PDF-standardeihin noudattamisen tasolle (oletus PDF/1.7).


Markdown‑vienti MarkdownSaveOptionsilla

Oletus‑Markdown‑tulosteen saamiseksi anna SaveFormat.MARKDOWN. Käytä MarkdownSaveOptions, kun sinun täytyy hallita muotoilukäyttäytymistä:

import aspose.words_foss as aw
from aspose.words_foss.saving import MarkdownSaveOptions

doc = aw.Document("input.docx")

# Default Markdown export
doc.save("default.md", aw.SaveFormat.MARKDOWN)

# Customized Markdown export with save options
doc.save("with_options.md", MarkdownSaveOptions())

MarkdownSaveOptions tukee alleviivan muotoilun säilyttämisen hallintaa tulosteessa.


Tekstin poiminta

Poimi tavallinen teksti mistä tahansa ladatusta asiakirjasta get_text():

import aspose.words_foss as aw

doc = aw.Document("input.docx")
text = doc.get_text()

Tekstitiedoston tulostukseen käytä SaveFormat.TEXT:

doc.save("output.txt", aw.SaveFormat.TEXT)

Yleiset ongelmat

OngelmaSyyKorjaus
ModuleNotFoundErrorPakettia ei ole asennettuSuorita pip install aspose-words-foss>=26.4.0
Tyhjä teksti lähteestä get_text()Syötetiedosto on tyhjä tai vioittunutVarmista, että syötetiedosto avautuu oikein tekstinkäsittelyohjelmassa
PDF-tulosteesta puuttuvat kuvatKuvamuoto ei ole muunninta tukemaKäytä DOCX-syötettä, jossa on tavallisia upotettuja kuvia

API-viitteiden yhteenveto

Luokka / MetodiKuvaus
DocumentLataa Word-asiakirjoja DOCX-, DOC-, RTF-, TXT- tai Markdown-muodoista
Document.save()Tallenna PDF-, Markdown-, DOCX-, DOC- tai tavalliseen tekstiin
Document.get_text()Poimi tavallinen tekstisisältö
SaveFormatVakiot: PDF, MARKDOWN, TEXT, DOC, DOCX
PdfSaveOptionsMääritä PDF-yhteensopivuus ja JPEG-laatu
MarkdownSaveOptionsMääritä alleviivauksen muotoilun vienti
 Suomi