关于网友提出的“用JAVA实现对PDF内容的搜索以及提取相关内容”问题疑问,本网通过在网上对“用JAVA实现对PDF内容的搜索以及提取相关内容”有关的相关答案进行了整理,供用户进行参考,详细问题解答如下:
问题:用JAVA实现对PDF内容的搜索以及提取相关内容
描述:
我想要实现用java对一系列pdf文档进行搜索,同时把包含Keyword的相应上下文内容都显示出来。
目前,我用PDFBOX把内容提取出来进行搜索(只提取了文本用于lucene索引和搜索)
问题是:把搜索出来的Keyword上下文内容做成PDF显示出来(格式就跟原有文档一样,但只有关键字的上下文,可以含有图片等)。怎么实现???pdfbox能实现么?还是要用到其他api?
希望知道的朋友给点建议。相关的代码或者思路都行。如果说要用PDF的格式规范的话,请给我一个很简单的例子。
拜谢!!
以上介绍了“用JAVA实现对PDF内容的搜索以及提取相关内容”的问题解答,希望对有需要的网友有所帮助。
本文网址链接:http://www.codes51.com/itwd/1151181.html