Nodejs ·

nodejs解析xml文件

xml作为一种重要的数据交换格式,在使用nodejs中也需要对其进行解析,这里所使用的解析模块是xmlreader。其作用是将xml根据节点解析为一个JSON对象,里面包含了一系列的方法,下面来看具体的使用方法。

首先是安装xmlreader模块

npm install xmlreader -S

然后就是引用了

var express = require('express');
var router = express.Router();
var http = require('http');
var https = require('https');
var readXml = require('xmlreader');
/* GET users listing. */
router.get('/readSitemap', function(req, res) {


var options = {
    hostname: 'www.oecom.cn',       
    path: '/sitemap.xml',    
    method: 'GET'    
};    
    
var clientReq = https.request(options, function (clientRes) { 
var xmlData = '';  
var xmlURLArray = []; 
    console.log('STATUS: ' + clientRes.statusCode);    
    console.log('HEADERS: ' + JSON.stringify(clientRes.headers));    
    clientRes.setEncoding('utf8');    
    clientRes.on('data', function (chunk) {    
        //console.log('BODY: ' + chunk);
        xmlData+=chunk;
    });  
    clientRes.on('end', function (chunk) {
    	readXml.read(xmlData, function(errors, xmlResponse){  
		    if(null !== errors ){  
		        console.log(errors)  
		        return;  
		    }
		    console.log(xmlResponse);
		    xmlResponse.urlset.url.array.map(item=>{
		    	 xmlURLArray.push(item.loc.text());
		    });
		   
		    res.end(JSON.stringify(xmlResponse.urlset.url.array[0]));
		});  
       
    });    
});    
    
clientReq.on('error', function (e) {    
    console.log('problem with request: ' + e.message);    
});    
    
clientReq.end();  
});

上述示例代码是通过一个接口来实现的,通过打印到控制台,我们可以看到其格式化后的数据。

nodejs解析xml文件

上图是直接将xmlResponse输出,url作为xml的一个节点,其内容为一个array数组,接下来来看一下输出array其中一个的结果

nodejs解析xml文件

通过上图我们可以看出,基本上包含以下几种方法,各方法含义如下:

1、attributes:获取所有属性。

2、parent:获取父节点。

3、count:获取数目。

4、at:获取下标为指定值的节点。

5、each:遍历,参数为一个函数。

6、text:获取节点内的文本,仅当前节点的文本,不包含子节点的文本。

如果想获取其中的内容,只需要调用text方法即可。

参与评论