Bộ chuyển đổi
Aspose.Words FOSS for Python sử dụng các lớp chuyển đổi chuyên biệt để chuyển đổi mô hình tài liệu nội bộ sang các định dạng đầu ra. ParagraphConverter xử lý văn bản và định dạng, TableConverter xử lý cấu trúc bảng, và ListHandler quản lý định dạng danh sách.
Trình chuyển đổi đoạn văn
ParagraphConverter chuyển đổi các đoạn văn của tài liệu sang định dạng đầu ra mục tiêu. Nó kiểm tra định dạng đoạn, định dạng cấp run và nội dung nội tuyến.
| Phương thức | Mô tả |
|---|
ParagraphConverter.get_paragraph_info() | Trích xuất thông tin định dạng từ một đoạn văn |
ParagraphConverter.get_run_formatting() | Lấy chi tiết định dạng cho một đoạn văn bản |
ParagraphConverter.format_text() | Áp dụng định dạng cho nội dung văn bản |
Trình chuyển đổi bảng
TableConverter chuyển đổi các bảng tài liệu sang định dạng đích (chẳng hạn như các bảng Markdown).
| Phương thức | Mô tả |
|---|
TableConverter.convert() | Chuyển đổi một phần tử bảng sang định dạng đầu ra |
Trình xử lý danh sách
ListHandler quản lý trạng thái danh sách trong quá trình chuyển đổi tài liệu, theo dõi việc lồng danh sách, các dấu đánh dấu và định dạng.
| Phương thức | Mô tả |
|---|
ListHandler.set_reader() | Đặt trình đọc tài liệu cho ngữ cảnh danh sách |
ListHandler.reset() | Đặt lại trạng thái theo dõi danh sách |
ListHandler.get_list_info() | Lấy chi tiết mục danh sách cho một đoạn văn |
ListHandler.format_list_item() | Định dạng mục danh sách với dấu đánh dấu và thụt lề |
ListHandler.break_list() | Báo hiệu kết thúc chuỗi danh sách |
Mẹo và Thực hành Tốt nhất
- Các bộ chuyển đổi được sử dụng nội bộ trong quy trình xuất — hầu hết các nhà phát triển tương tác với
Document.save() thay thế ParagraphConverter.format_text() tôn trọng ngữ cảnh khối mã để tránh áp dụng định dạng nội tuyến trong các đoạn mãListHandler duy trì trạng thái qua các đoạn danh sách liên tiếp — gọi reset() khi bắt đầu một phần tài liệu mới
Các vấn đề thường gặp
| Vấn đề | Nguyên nhân | Cách khắc phục |
|---|
| Cột bảng không căn chỉnh đúng | Bảng đầu vào có các ô được ghép | TableConverter xử lý các bảng đơn giản; các ô ghép có thể tạo ra kết quả không mong muốn |
| Đánh số danh sách bị lỗi | Trạng thái danh sách không được đặt lại giữa các phần | Gọi ListHandler.reset() tại ranh giới các phần |
Tóm tắt Tham chiếu API
| Class / Method | Mô tả |
|---|
ParagraphConverter.get_paragraph_info() | Trích xuất định dạng đoạn văn |
ParagraphConverter.get_run_formatting() | Lấy định dạng cấp run |
ParagraphConverter.format_text() | Áp dụng định dạng cho văn bản |
TableConverter.convert() | Chuyển đổi bảng sang định dạng đầu ra |
ListHandler.set_reader() | Đặt ngữ cảnh trình đọc tài liệu |
ListHandler.get_list_info() | Lấy chi tiết mục danh sách |
ListHandler.format_list_item() | Định dạng một mục danh sách |