崔秉龙于2020年大年初五学习计划
1.把前期做的代理池修改一下
(预计完成时间为0.75天)
修改主要有以下几点:
- 爬出来的数据在保存的时候写入什么时候保存(
存入日期
) - 不要一连不上就抛弃,需要在在保存数据内增加
失败次数
,超过某个测试失败次数
的才抛弃,只要有一次链接成功则失败次数
归0 - 看是否增加把更多的内容放进
配置文件
其中前期路径如下:
2.在腾讯云服务器上配置PM2
(预计完成时间为0.5天)
找 PM2
相关的操作信息,并在云服务器
上设置该 NodeJS
项目管理。
配置好并测试。
3.找寻 Python 爬虫相关包及方法
(预计完成时间为0.3天)
4.思考关键字舆情该怎么保存
(预计完成时间为0.5天)
尝试给出流程图
,并按照写出保存表格
、字段
等信息。
5.吃个好早餐
(预计完成时间为0.1天)