핵심 관리

핵심 관리

Document 클래스는 Word 문서를 로드하고 다른 형식으로 변환하기 위한 핵심 API입니다. 이 페이지에서는 형식 변환 워크플로, 저장 옵션 구성 및 텍스트 추출에 대해 다룹니다.


로드 및 저장

Document()을(를) 사용하여 문서를 로드하고 save()을(를) SaveFormat 상수와 함께 호출하여 형식 간 변환을 수행합니다. 지원되는 입력: DOCX, DOC, RTF, TXT, Markdown. 지원되는 출력: PDF, DOCX, DOC, Markdown, TXT.

import aspose.words_foss as aw

doc = aw.Document("input.docx")
doc.save("output.md", aw.SaveFormat.MARKDOWN)
doc.save("output.pdf", aw.SaveFormat.PDF)
doc.save("output.txt", aw.SaveFormat.TEXT)

save()를 동일한 Document에서 여러 번 호출하여 다시 로드하지 않고 여러 출력 형식을 생성합니다.


PdfSaveOptions를 사용한 PDF 내보내기

기본 PDF 출력의 경우 SaveFormat.PDF을 전달하십시오. 세밀한 제어를 위해서는 PdfSaveOptions 객체를 사용하십시오:

import aspose.words_foss as aw
from aspose.words_foss.saving import PdfSaveOptions

doc = aw.Document("input.docx")

# Default PDF export
doc.save("default.pdf", aw.SaveFormat.PDF)

# Customized PDF export with save options
doc.save("custom.pdf", PdfSaveOptions())

PdfSaveOptions은 JPEG 이미지 품질(0–100, 기본값 100) 및 PDF 표준 준수 수준(기본값 PDF/1.7)에 대한 설정을 허용합니다.


MarkdownSaveOptions를 사용한 Markdown 내보내기

기본 Markdown 출력을 위해서는 SaveFormat.MARKDOWN를 전달하십시오. 서식 동작을 제어해야 할 경우에는 MarkdownSaveOptions를 사용하십시오:

import aspose.words_foss as aw
from aspose.words_foss.saving import MarkdownSaveOptions

doc = aw.Document("input.docx")

# Default Markdown export
doc.save("default.md", aw.SaveFormat.MARKDOWN)

# Customized Markdown export with save options
doc.save("with_options.md", MarkdownSaveOptions())

MarkdownSaveOptions은 출력에서 밑줄 서식 보존을 제어하는 기능을 지원합니다.


텍스트 추출

get_text()을 사용하여 로드된 모든 문서에서 일반 텍스트를 추출합니다:

import aspose.words_foss as aw

doc = aw.Document("input.docx")
text = doc.get_text()

텍스트 파일 출력에는 SaveFormat.TEXT을 사용하십시오:

doc.save("output.txt", aw.SaveFormat.TEXT)

일반적인 문제

IssueCauseFix
ModuleNotFoundError패키지가 설치되지 않음pip install aspose-words-foss>=26.4.0 실행
get_text()에서 빈 텍스트입력 파일이 비어 있거나 손상됨워드 프로세서에서 입력 파일이 올바르게 열리는지 확인
PDF 출력에 이미지 누락이미지 형식이 변환기에서 지원되지 않음표준 삽입 이미지가 포함된 DOCX 입력 사용

API 참조 요약

클래스 / 메서드설명
DocumentDOCX, DOC, RTF, TXT 또는 Markdown에서 Word 문서를 로드합니다
Document.save()PDF, Markdown, DOCX, DOC 또는 일반 텍스트로 저장합니다
Document.get_text()일반 텍스트 콘텐츠를 추출합니다
SaveFormat상수: PDF, MARKDOWN, TEXT, DOC, DOCX
PdfSaveOptionsPDF 규격 및 JPEG 품질을 구성합니다
MarkdownSaveOptions밑줄 서식 내보내기를 구성합니다
 한국어