关于网友提出的“ 对于这样的网页上的一个table,有没有好的办法解析出来生成数据表。劳烦各位!”问题疑问,本网通过在网上对“ 对于这样的网页上的一个table,有没有好的办法解析出来生成数据表。劳烦各位!”有关的相关答案进行了整理,供用户进行参考,详细问题解答如下:
问题: 对于这样的网页上的一个table,有没有好的办法解析出来生成数据表。劳烦各位!
描述: http://www.gzzb.gd.cn/cms/wz/view/wskb/WskbDetailServlet?zbsqid=6DD87570-1191-11E4-B570-91FD2A329A7E
网页如上面这个,解析网页的源码好像很难啊。。。各位有无好的方法,感谢!
解决方案1: 看数据排列是有规律的,优先考虑用innerText的方式,如果用POS网页源码应该更复杂而且容易出错
解决方案2: 其实两种方法你自己都想到了。
第一种方法就是你自己说的,用WebBrowser打开,操作它的BOM,一层一层打开,这是最容易的,几乎不必用到pos,copy;
第二种方法,用TIDHttp等控件,取回全部html原始码。再来就是分析html:
分析HTML不是用你说的pos,copy,
而是写状态机:
用一个状态变量,比如 TStatus = (..............................);
然后用
for i:=1 to length(str)
c:=str[i];
来遍历,
当分析到每一个char时,判断它,然后变更status值,
当status时正确时,newstr:=newstr+c; 即获得一个正确的分割字符串;
此时将newstr加以处理,然后清空newstr,继续遍历直到str尾端.
大体如此。
解决方案3: 真实数据啊。。。。。。。。。。。。
解决方案4: 看html源码,还是很有规律的嘛:
20
| 广东南方建设工程有限公司
| 完好
| 是
| 有
| 项目保证金
| 300000
| 28066567.22 |
4318567.90
| 1084305.01 |
601702.99
| 谢湛常 粤144121321197
| 谢湛常 粤144121321197 |
黄伟 粤建安C(2013)0007930
| 黄伟 粤建安C(2013)0007930
| 300日历天
| 按招标文件的要求
| 有
| 有
| 否 |
|
简单的字符串定位就行了
解决方案5: 还有一种办法,就是分批,拷贝表的内容,这样可以排除不必要的数据,然后通过分析粘贴板中的数据,分解字条串的办法,加入到数据库中。
以上介绍了“ 对于这样的网页上的一个table,有没有好的办法解析出来生成数据表。劳烦各位!”的问题解答,希望对有需要的网友有所帮助。
本文网址链接:http://www.codes51.com/itwd/2188685.html