崔秉龙于2020年大年初五学习计划
1.把前期做的代理池修改一下
(预计完成时间为0.75天)
修改主要有以下几点:
- 爬出来的数据在保存的时候写入什么时候保存(
存入日期) - 不要一连不上就抛弃,需要在在保存数据内增加
失败次数,超过某个测试失败次数的才抛弃,只要有一次链接成功则失败次数归0 - 看是否增加把更多的内容放进
配置文件
其中前期路径如下:
2.在腾讯云服务器上配置PM2
(预计完成时间为0.5天)
找 PM2 相关的操作信息,并在云服务器上设置该 NodeJS 项目管理。
配置好并测试。
3.找寻 Python 爬虫相关包及方法
(预计完成时间为0.3天)
4.思考关键字舆情该怎么保存
(预计完成时间为0.5天)
尝试给出流程图,并按照写出保存表格、字段等信息。
5.吃个好早餐
(预计完成时间为0.1天)