기능
기능
Aspose.Words FOSS for Python은 Word 문서용 문서 변환 및 텍스트 추출 라이브러리입니다. 전체 공개 API는 Document 클래스를 중심으로 구축되었습니다.
지원되는 입력 형식
Document 클래스는 파일 확장자를 기반으로 이러한 형식의 파일을 자동으로 로드합니다:
| 형식 | 확장자 |
|---|---|
| 워드 문서 | .docx, .doc |
| 리치 텍스트 | .rtf |
| 플레인 텍스트 | .txt |
| 마크다운 | .md |
출력 형식 및 저장 옵션
빠른 변환을 위해 Document.save()을 SaveFormat 상수와 함께 호출하거나, 세밀한 제어를 위해 저장 옵션 객체를 전달하십시오.
| 출력 | SaveFormat 상수 | 저장 옵션 클래스 |
|---|---|---|
SaveFormat.PDF | PdfSaveOptions — 준수 수준 및 JPEG 품질 구성 | |
| Markdown | SaveFormat.MARKDOWN | MarkdownSaveOptions — 밑줄 서식 내보내기 제어 |
| Plain Text | SaveFormat.TEXT | — |
| Word (DOCX) | SaveFormat.DOCX | — |
| Word (DOC) | SaveFormat.DOC | — |
코드 예제 및 저장 옵션 구성 세부 사항은 Core Management를 참조하십시오.
텍스트 추출
Document.get_text()은 로드된 문서의 전체 평문 내용을 디스크에 쓰지 않고 반환합니다.
이미지 지원
임베드된 이미지가 포함된 문서는 모든 지원되는 출력 형식으로 변환할 수 있습니다. 변환 파이프라인은 내보내기 과정에서 이미지 콘텐츠를 보존합니다.
API 요약
| 클래스 / 메서드 | 역할 |
|---|---|
Document | 문서 로드, 형식 변환, 텍스트 추출 |
SaveFormat | 출력 형식 상수 (PDF, MARKDOWN, TEXT, DOC, DOCX) |
PdfSaveOptions | PDF 내보내기 구성 |
MarkdownSaveOptions | Markdown 내보내기 구성 |