Python 脚本自启动及定时任务

爬虫脚本定时运行(crontab)

https://www.jianshu.com/p/5cd74add11ba 没有采用简书的方案,上面的博客方案更加清晰。以下是我的笔记(重点是环境变量,路径,scp的使用方法)

不需要root,执行以下命令:
crontab -e
编辑:
#注意这里最好把环境变量写上
PATH=/sbin:/bin:/usr/sbin:/usr/bin:/home/chen/miniconda3/bin/
MAILTO=root
#测试:两分钟执行一次
*/2 * * * * echo "crontab test" >> /home/chen/ctest.txt
#写的python脚本每5分钟执行一次(注意python脚本中文件路径必须是绝对路径,否则报错)
*/5 * * * * /home/chen/miniconda3/bin/python /home/chen/CoV_copy2.py 
#scp python脚本产生的HTML到博客服务器(这里用了密钥而不是密码)。注意:所有的路径都#使用绝对路径,否则无效。
* * * * * scp -i /home/chen/.ssh/do248 -P 4705 /home/chen/2019-nCov数据一览2.html [email protected]:/home/wwwroot/geoseis.cn/CoV.html >> /home/chen/cov.log
# For details see man 4 crontabs

# Example of job definition:
# .---------------- minute (0 - 59)
# |  .------------- hour (0 - 23)
# |  |  .---------- day of month (1 - 31)
# |  |  |  .------- month (1 - 12) OR jan,feb,mar,apr ...
# |  |  |  |  .---- day of week (0 - 6) (Sunday=0 or 7) OR sun,mon,tue,wed,thu,fri,sat
# |  |  |  |  |
# *  *  *  *  * user-name  command to be executed

linux定时执行失败的处理方法就是查看 /var/spool/mail/ ,一般root里都有日志,可以看到哪里出错了。

这个爬虫脚本放到vpn后需要更新很多:

  • 文件路径必须为绝对路径
  • pyecharts的Geo函数bug:遇到不存在的地点Geo函数就会使程序退出,即使用了except也不行,和笔记本环境不一样。笔记本里运行程序不会退出。解决方案就是复制了旧版本的一些.py程序到相应的目录
  • proxy在VPN中没有设置好,因为笔记本里用的SSR代理的(5个VPN)。这个脚本五分钟执行一次不需要代理也可以

scp的使用

scp推荐使用密钥传输,更加安全。密钥产生后我直接append到目标服务器的/home/chen/.ssh/authorized_keys,然后scp -i 就可以无密码传输了。

运行 ssh-keygen -t dsa 时最好设置密码,否则密钥没有密码也不安全。

参考:

It’s better to set up ssh to used key-based authentication rather than trying to figure out how to send text to the login process with something like expect.

Take a look at:

https://help.ubuntu.com/community/SSH/OpenSSH/Keys

So, basically, run ssh-keygen -t dsa on the machine that will run your script. When it asks you for a passphrase, hit ENTER to accept a blank. You will get two files. If you followed the default suggestions, the files will be ~/.ssh/id_dsa and ~/.ssh/id_dsa.pub. The first one is the private key. The second one is the public key.

Copy the public key to the second server using ssh-copy-id [email protected]. This will add the public key to the authorized_keys file of the user on server2.

You should now be able to run ssh from the first machine and log in without a password.

For copying the files, scp or rsync are fine. It depends on what you’re doing. rsync will use ssh by default, so will use the key-based authentication you just set up

和ssh不能不说的故事

简单说,ssh看似简单实则到处是坑儿。

本来自己的谷歌服务器ssh用密钥登录都设置好了,不知怎么搞的又不行了,还以为自己把密钥登录设置错了。今天看了下,终于明白了,原来denyhosts把自己的ip给封了

实际上ip解封我也趟过很多浑水,因为denhosts有很多设置,找了个脚本设置了下,现在可以一键解封了。

ssh现在我习惯于在服务器上运行ssh-keygen生成服务器的密钥对,然后scp到客户端电脑上,在pc端用puttygen转化成适合xshell,putty, winscp用的密钥格式。

当然反过来也是可以的,pc客户端用puttygen生成pc的密钥对,然后在服务器端注册好。记得曾经用到过ssh-id-copy和设置authorized_keys。

今天查了下日志,有几百条暴力攻击破解ssh的非法ip,估计是因为前阵子开放了密码登录和root登录,安全措施不严密。

预计今天之后应该就没有类似的ssh暴力破解了,这个行为会把服务器拖得很慢。

centos添加用户并赋予root权限

开始试过很多次通过加入wheel这个group来赋予普通用户root权限,但是都失败了。后来看了下面的帖子才搞定。/etc/sudoers这个文件下找到 ## Allow root to run any commands anywhere ,在这里添加和 root ALL=(ALL) ALL 相似的命令行即可

https://www.yundashi168.com/articles/2019/04/02/1554195417834.html

即这篇文章里的方法二: https://blog.csdn.net/yeizisn/article/details/53300991