论坛首页 » Java,C/C++,Shell,Php,Web 交流区 » Java » Word格式转文本文件.
RSS WAP
统计:回贴:0   阅读:196   最后更新:2007-12-21 00:00
标题: Word格式转文本文件.
admin

头衔:灭天使者
等级:一级用户
精华:9
帖子:9 / 8
积分:0

在线时间:4067分
注册时间:2007-01-01 00:00
最后登录:2008-12-14 20:56
鲜花(24)   鸡蛋(34)
#1
Word格式转文本文件.
本来想实现word to html的,小弟的水平比较差,呵呵, 只能转txt了.


代码
=======================
import java.io.*;
import org.textmining.text.extraction.*;

public class WordToTxt
{

    public static void main(String[] args)
    {

        String paths = new String("D:\\com\\wordtohtml\\doc\\doc.doc");
        try
        {
            FileInputStream in = new FileInputStream(paths);
            WordExtractor extractor = new WordExtractor();
            System.out.println(in.available());
            String str = extractor.extractText(in);
            System.out.println(str);

            java.io.FileWriter fw=new java.io.FileWriter("doc.txt");
            fw.write(str);
            fw.close();
        } catch (Exception e)
        {
            e.printStackTrace();
        }
    }
}

本贴相关附件如下:

tm-extractors-0.4.jar


搜索更多相关主题的帖子:
发表于:2007-12-21 00:32