...
|
...
|
@@ -8,12 +8,42 @@ |
|
|
|
|
|
[http://git.yoho.cn/fe/spider-ufo](http://git.yoho.cn/fe/spider-ufo)
|
|
|
|
|
|
数据爬取原理:
|
|
|
- 目前只用到比价功能(price-task),神箭手废弃
|
|
|
```
|
|
|
// 每天的凌晨1点10分触发,全量更新毒的价格数据
|
|
|
// 仅生成productId对应关系,并存到数据库
|
|
|
schedule.scheduleJob('0 10 1 * * *', () => {
|
|
|
logger.info('[process]task start priceTask');
|
|
|
priceTask()
|
|
|
});
|
|
|
|
|
|
// 整点执行对应关系表中所有商品的价格对比
|
|
|
schedule.scheduleJob('0 0 * * * *', () => {
|
|
|
logger.info('[process]task start spiderAllTask'); // 比价任务-all
|
|
|
spiderAllTask(dayjs().unix());
|
|
|
});
|
|
|
|
|
|
// 每隔15分钟获取固定对应关系的商品数据
|
|
|
// /data/skns.json
|
|
|
schedule.scheduleJob('0 */15 * * * *', () => {
|
|
|
logger.info('[process]task start spiderTask'); // 比价任务
|
|
|
spiderTask(dayjs().unix());
|
|
|
});
|
|
|
|
|
|
```
|
|
|
|
|
|
## 需求
|
|
|
|
|
|
我们用户量少,价格不透明,为了防止恶意出价,需要与有一定权威的出价比对。
|
|
|
DU app用户量多,自然形成了市场经济。所以有了爬虫项目。
|
|
|
|
|
|
## 数据爬取原理
|
|
|
|
|
|
```
|
|
|
|
|
|
du APP商品的spuId从0递增,故目前实现方案是
|
|
|
du APP商品的spuId从0递增,故目前实现方案是遍历访问Du H5详情页
|
|
|
https://m.poizon.com/router/product/ProductDetail?spuId=249&sourceName=shareDetail
|
|
|
获取商品数据,根据商品编号相同获取对应关心
|
|
|
|
|
|
// 预估,需要手动递增
|
|
|
let productIds = 82000;
|
...
|
...
|
@@ -26,7 +56,7 @@ for(let i=0; i<productIds; i++) { |
|
|
|
|
|
```
|
|
|
|
|
|
## 稍微修改的潜在bug
|
|
|
## 发布时需要修改的潜在bug
|
|
|
|
|
|
|
|
|
```
|
...
|
...
|
|