Bộ chuyển đổi

Bộ chuyển đổi

Bộ chuyển đổi

Aspose.Words FOSS for Python sử dụng các lớp chuyển đổi chuyên biệt để chuyển đổi mô hình tài liệu nội bộ sang các định dạng đầu ra. ParagraphConverter xử lý văn bản và định dạng, TableConverter xử lý cấu trúc bảng, và ListHandler quản lý định dạng danh sách.


Trình chuyển đổi đoạn văn

ParagraphConverter chuyển đổi các đoạn văn của tài liệu sang định dạng đầu ra mục tiêu. Nó kiểm tra định dạng đoạn, định dạng cấp run và nội dung nội tuyến.

Phương thứcMô tả
ParagraphConverter.get_paragraph_info()Trích xuất thông tin định dạng từ một đoạn văn
ParagraphConverter.get_run_formatting()Lấy chi tiết định dạng cho một đoạn văn bản
ParagraphConverter.format_text()Áp dụng định dạng cho nội dung văn bản

Trình chuyển đổi bảng

TableConverter chuyển đổi các bảng tài liệu sang định dạng đích (chẳng hạn như các bảng Markdown).

Phương thứcMô tả
TableConverter.convert()Chuyển đổi một phần tử bảng sang định dạng đầu ra

Trình xử lý danh sách

ListHandler quản lý trạng thái danh sách trong quá trình chuyển đổi tài liệu, theo dõi việc lồng danh sách, các dấu đánh dấu và định dạng.

Phương thứcMô tả
ListHandler.set_reader()Đặt trình đọc tài liệu cho ngữ cảnh danh sách
ListHandler.reset()Đặt lại trạng thái theo dõi danh sách
ListHandler.get_list_info()Lấy chi tiết mục danh sách cho một đoạn văn
ListHandler.format_list_item()Định dạng mục danh sách với dấu đánh dấu và thụt lề
ListHandler.break_list()Báo hiệu kết thúc chuỗi danh sách

Mẹo và Thực hành Tốt nhất

  • Các bộ chuyển đổi được sử dụng nội bộ trong quy trình xuất — hầu hết các nhà phát triển tương tác với Document.save() thay thế
  • ParagraphConverter.format_text() tôn trọng ngữ cảnh khối mã để tránh áp dụng định dạng nội tuyến trong các đoạn mã
  • ListHandler duy trì trạng thái qua các đoạn danh sách liên tiếp — gọi reset() khi bắt đầu một phần tài liệu mới

Các vấn đề thường gặp

Vấn đềNguyên nhânCách khắc phục
Cột bảng không căn chỉnh đúngBảng đầu vào có các ô được ghépTableConverter xử lý các bảng đơn giản; các ô ghép có thể tạo ra kết quả không mong muốn
Đánh số danh sách bị lỗiTrạng thái danh sách không được đặt lại giữa các phầnGọi ListHandler.reset() tại ranh giới các phần

Tóm tắt Tham chiếu API

Class / MethodMô tả
ParagraphConverter.get_paragraph_info()Trích xuất định dạng đoạn văn
ParagraphConverter.get_run_formatting()Lấy định dạng cấp run
ParagraphConverter.format_text()Áp dụng định dạng cho văn bản
TableConverter.convert()Chuyển đổi bảng sang định dạng đầu ra
ListHandler.set_reader()Đặt ngữ cảnh trình đọc tài liệu
ListHandler.get_list_info()Lấy chi tiết mục danh sách
ListHandler.format_list_item()Định dạng một mục danh sách
 Tiếng Việt