中文字幕第五页-中文字幕第页-中文字幕韩国-中文字幕最新-国产尤物二区三区在线观看-国产尤物福利视频一区二区

如何實現node.js基于cheerio的爬蟲工具-創新互聯

這篇文章主要介紹如何實現node.js基于cheerio的爬蟲工具,文中介紹的非常詳細,具有一定的參考價值,感興趣的小伙伴們一定要看完!

成都一家集口碑和實力的網站建設服務商,擁有專業的企業建站團隊和靠譜的建站技術,10多年企業及個人網站建設經驗 ,為成都上1000+客戶提供網頁設計制作,網站開發,企業網站制作建設等服務,包括成都營銷型網站建設,品牌網站設計,同時也為不同行業的客戶提供做網站、成都網站制作的服務,包括成都電商型網站制作建設,裝修行業網站制作建設,傳統機械行業網站建設,傳統農業行業網站制作建設。在成都做網站,選網站制作建設服務商就選創新互聯公司

先上代碼

'use strict';
// 引入模塊
const superagent = require('superagent');
const cheerio = require('cheerio');
const Excel = require('exceljs');
var baseUrl = '';
var Cookies = 'PHPSESSID=1c948cafb361cb5dce87122846e649cd'; //偽裝的cookie
let pageDatas = [];
let count = 1;
let limit = 3;
for (count; count < limit; count++) { 
  baseUrl = `http://bxjd.henoo.com/policy/policyList?page=${count}`;
  loadPage(baseUrl); 
}
function loadPage(baseUrl) { 
   getPageLoad(baseUrl);
} 
async function getPageLoad(baseUrl) {
  try {
    let body = await superagent.get(baseUrl)
      .set("Cookie", Cookies)
    var $ = cheerio.load(body.text);
    var trList = $("#tableList").children("tr");  
      for (var i = 0; i < trList.length; i++) { 
        let item = {};
        var tdArr = trList.eq(i).find("td");
        var id = tdArr.eq(0).text();
        item.sortId = id;
        var detailUrl = `http://bxjd.henoo.com/policy/view?id=${id}`;
        item.policyId = tdArr.eq(1).text();
        item.policyProductName = tdArr.eq(2).text();
        item.policyName = tdArr.eq(3).text();
        item.policyMoney = tdArr.eq(4).text();
        let detailBody = await superagent.get(detailUrl)
          .set("Cookie", Cookies);
        var $$ = cheerio.load(detailBody.text);
        var detailT = $$(".table-view");     
        //投保人證件號
        item.policyIdNum = detailT.find("tr").eq(11).find("td").eq(1).text();
        //投保人手機號
        item.policyPhone = detailT.find("tr").eq(10).find("td").eq(1).text();
        //被保人手機號
        item.bePoliciedPhone = detailT.find("tr").eq(16).find("td").eq(1).text();      
        //被保人姓名
        item.bePoliciedName = detailT.find("tr").eq(13).find("td").eq(1).text();
        console.log(item.bePoliciedName)
        //被保人證件號
        item.bePoliciedIdNum = detailT.find("tr").eq(17).find("td").eq(1).text();
        pageDatas = [...pageDatas,item];
      }
    if (pageDatas.length / 15 == (count - 1)) { 
      writeXLS(pageDatas)
    }
  } catch (error) {
  }
}
function writeXLS(pageDatas) {
  const workbook = new Excel.Workbook();
  const sheet = workbook.addWorksheet('My Sheet');
  const reColumns=[
    {header:'序號',key:'sortId'},
    {header:'投保單號',key:'policyId'},
    {header: '產品名稱', key: 'policyProductName'},
    {header: '投保人姓名', key: 'policyName' },
    {header: '投保人手機號', key: 'policyPhone' },
    {header: '投保人證件號', key: 'policyIdNum'},
    {header: '被保人姓名', key: 'bePoliciedName' },
    {header: '被保人手機號', key: 'bePoliciedPhone' },
    {header: '被保人證件號', key: 'bePoliciedIdNum' },
    {header:'保費',key:'policyMoney'},
  ];
  sheet.columns = reColumns;
  for(let trData of pageDatas){
    sheet.addRow(trData);
  }
  const filename = './projects.xlsx';
  workbook.xlsx.writeFile(filename)
  .then(function() {
   console.log('ok');
  }).catch(function (error) { 
     console.error(error); 
  });
 }

代碼使用方式

一、npm install 相關的依賴二、代碼修改

1、修改為自己的baseUrl

2、如果不需要攜帶cookie時將set("Cookie", Cookies)代碼去掉

3、修改自己的業務代碼

三、運行 node index四、部分代碼說明

所有代碼不過90行不到,操作了表格數據獲取和單條數據詳情的獲取

如何實現node.js基于cheerio的爬蟲工具

接口請求的框架使用superagent的原因是拼接偽裝的cookie的操作比較簡單。因為有的時候我們需要獲取登錄后的頁面數據。

這個時候可能需要請求是攜帶登錄cookie信息。返回后的body對象通過cheerio.load之后就能拿到一個類似jquery的文檔對象。

后面就可以很方便的使用jquery的dom操作方式去拿到頁面內自己想要的數據了。

如何實現node.js基于cheerio的爬蟲工具

數據寫入到excel中。

五、結果

如何實現node.js基于cheerio的爬蟲工具

如何實現node.js基于cheerio的爬蟲工具

以上是“如何實現node.js基于cheerio的爬蟲工具”這篇文章的所有內容,感謝各位的閱讀!希望分享的內容對大家有幫助,更多相關知識,歡迎關注創新互聯行業資訊頻道!

文章標題:如何實現node.js基于cheerio的爬蟲工具-創新互聯
網址分享:http://m.2m8n56k.cn/article22/dpojcc.html

成都網站建設公司_創新互聯,為您提供全網營銷推廣品牌網站建設關鍵詞優化網站設計公司網站改版自適應網站

廣告

聲明:本網站發布的內容(圖片、視頻和文字)以用戶投稿、用戶轉載內容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網站立場,如需處理請聯系客服。電話:028-86922220;郵箱:[email protected]。內容未經允許不得轉載,或轉載時需注明來源: 創新互聯

綿陽服務器托管
主站蜘蛛池模板: 91成人在线免费观看 | 波多野结衣一区在线观看 | 国产区一区二区三区 | 精品国产免费久久久久久 | 亚洲国产成人最新精品资源 | 色拍拍在精品视频69影院在线 | 国内精品免费一区二区观看 | 一级视频在线观看 | 亚洲精品国产拍拍拍拍拍 | 亚洲人成片在线观看 | 鸥美性生交xxxxx久久久 | 国产理论最新国产精品视频 | 成人在线网站 | 久久精品在线免费观看 | 国产理论最新国产精品视频 | 亚洲 自拍 欧美 综合 | 狠狠色丁香婷婷久久综合考虑 | 亚洲区一区 | 日韩成人黄色片 | 天堂素人搭讪系列嫩模在线观看 | 毛片免费高清免费 | 亚洲欧洲国产精品 | 一级毛片免费观看视频 | 手机看黄av免费网址 | 欧美成人免费全网站大片 | 男人和女人的做刺激性视频 | 欧美日韩亚洲一区二区三区在线观看 | 亚洲欧美国产高清va在线播放 | 久久久黄色片 | 成人做爰视频www在线观看 | 亚洲情a成黄在线观看动 | 国产美女精品一区二区三区 | 中文字幕一区二区三区在线观看 | 久久频这里精品香蕉久久 | 成人免费一级在线播放 | 久久久久18 | 欧美精品一二三区 | 国产末成年女噜噜片 | 九一精品 | 一本色道久久88亚洲综合 | 久久精品国产一区二区三区日韩 |