Authored by shuaiguo

爬虫

... ... @@ -8,12 +8,42 @@
[http://git.yoho.cn/fe/spider-ufo](http://git.yoho.cn/fe/spider-ufo)
数据爬取原理:
- 目前只用到比价功能(price-task),神箭手废弃
```
// 每天的凌晨1点10分触发,全量更新毒的价格数据
// 仅生成productId对应关系,并存到数据库
schedule.scheduleJob('0 10 1 * * *', () => {
logger.info('[process]task start priceTask');
priceTask()
});
// 整点执行对应关系表中所有商品的价格对比
schedule.scheduleJob('0 0 * * * *', () => {
logger.info('[process]task start spiderAllTask'); // 比价任务-all
spiderAllTask(dayjs().unix());
});
// 每隔15分钟获取固定对应关系的商品数据
// /data/skns.json
schedule.scheduleJob('0 */15 * * * *', () => {
logger.info('[process]task start spiderTask'); // 比价任务
spiderTask(dayjs().unix());
});
```
## 需求
我们用户量少,价格不透明,为了防止恶意出价,需要与有一定权威的出价比对。
DU app用户量多,自然形成了市场经济。所以有了爬虫项目。
## 数据爬取原理
```
du APP商品的spuId从0递增,故目前实现方案是
du APP商品的spuId从0递增,故目前实现方案是遍历访问Du H5详情页
https://m.poizon.com/router/product/ProductDetail?spuId=249&sourceName=shareDetail
获取商品数据,根据商品编号相同获取对应关心
// 预估,需要手动递增
let productIds = 82000;
... ... @@ -26,7 +56,7 @@ for(let i=0; i<productIds; i++) {
```
## 稍微修改的潜在bug
## 发布时需要修改的潜在bug
```
... ...