在Java中,如果需要讀取docx和doc文件內容,可以使用Apache POI庫。使用POI庫需要先在項目中添加相關依賴。
import java.io.File;
import java.io.FileInputStream;
import org.apache.poi.hwpf.HWPFDocument; // 讀取doc文件
import org.apache.poi.hwpf.extractor.WordExtractor; // 讀取doc文件
import org.apache.poi.xwpf.usermodel.XWPFDocument; // 讀取docx文件
import org.apache.poi.xwpf.extractor.XWPFWordExtractor; // 讀取docx文件
public class ReadWordFile {
public static void readDocFile(String filePath) {
try {
FileInputStream fis = new FileInputStream(new File(filePath));
HWPFDocument document = new HWPFDocument(fis);
WordExtractor extractor = new WordExtractor(document);
String text = extractor.getText();
System.out.println(text);
extractor.close();
fis.close();
} catch (Exception e) {
e.printStackTrace();
}
}
public static void readDocxFile(String filePath) {
try {
FileInputStream fis = new FileInputStream(new File(filePath));
XWPFDocument document = new XWPFDocument(fis);
XWPFWordExtractor extractor = new XWPFWordExtractor(document);
String text = extractor.getText();
System.out.println(text);
extractor.close();
fis.close();
} catch (Exception e) {
e.printStackTrace();
}
}
public static void main(String[] args) {
String docFilePath = "test.doc";
String docxFilePath = "test.docx";
readDocFile(docFilePath);
readDocxFile(docxFilePath);
}
}
以上代碼演示了如何讀取docx和doc文件內容,先使用FileInputStream讀取文件,然后再使用HWPFDocument、WordExtractor和XWPFDocument、XWPFWordExtractor來解析文件并獲取文件內容。POI庫還支持對文檔進行修改、創建等操作。
下一篇css圖片的外邊距