作者 | 行者自远
责编 | 夕颜
出品 | CSDN博客
本文中,我们将一起来学习Linux**和数据流的操作,比如过滤文本,统计文本、重定向、管道流、**操作等,当然只是谈谈常用的命令以及参数,如果想详细看的话可以man command,利用Linux自带的命令手册去查看一下你想查的命令。文章比较有趣,相信大家看了以后会很有收获的!当然,如果说里面有什么问题的话,欢迎和博主华山论剑。
数据处理
1.grep:进行数据的过滤与筛选。我们平时处理文件时,肯定想查找或者过滤一下我们感兴趣的信息,那么我们就会用到这个东东了。
用法:
grep text file:这个就是在file文件中查找text文本内容了
这个就是在test.csv文件里面查找Jane内容了,查找到了就会打印出来它所在的行,并且会给它点颜色看看。
当然,我们查找的文本如果没有空格可以直接输入,如果说有空格的话就要用双引号包起来。
grep -i text file:查找文本内容的时候忽略大小写,其中的i选项就是ignore的意思嘛,忽略大小写。
查找jane的时候忽略大小写,因此查到了Jane。
grep -n text file:n表示number的意思,查找文本内容的时候显示对应行号 :
这个就把查找内容对应的行号显示出来了。
grep -v text file:v表示invert,即颠倒的意思,查找与文本无关的内容。
这个说好了查找80,结果颠倒过来不听话给出来和80无关的行内容。
grep -r text file:r表示recursive,即递归的意思,在子目录,子文件当中查找文本内容,file一般为目录。如果你不知道你要查找的文本在哪个内容,就可以一气呵成干脆点,目录里面全盘搜索。
不小心在系统根目录里面查了个80,结果一堆和80有关的,看来是全局搜索没错了。
grep搭配正则表达式:接参数E。看看一些常用并且**的正则表达式符号:
来试试:
这个就是利用符号^来查,就是查找开头为Jane的文本行内容,你看这不打印出来了嘛。对于其它的符号,大家都可以试试。
2.sort:对文本行内容进行排序。如果说你在操作文件的时候,感觉好杂乱无章,你想让它更好看一些,就可以排序一下。
用法:
sort sort.txt:对文本行内容排序,默认的是对文本行的首字母进行升序排序:
sort -o new_file file:给file文件排序,将排序以后的结果存入到新文件中,如果说没有这个文件,那么就会创建。
sort -r file:有人可能会问,咦,为什么只能升序排呢?不能倒序。我想说这个就是倒序了,r就是reverse的意思嘛,按照行内容首字母倒序排序。
sort -R file:随机排序,这个看心情吧,它想怎么排就怎么,很叛逆。
sort -n file:既然有根据首字母来排序的,那么遇到数字怎么办,那就用这个,n就是number,数字的意思,对数字排序
当然,以上所有的参数都可以搭配使用,比如说对数字倒序排序:sort -r -n file。灵活变通就行啦。
3.wc:这个可不是我们平时说的WC,用处可大了,可以统计我们文本当中的行数,单词数,字节数等等。
用法:
wc file:统计file文件的行数,单词数,字节数(从左至右显示列数)。
wc -l file:只统计行数,l就是line嘛。
wc -w file:只统计单词数,w就是word。
wc -c file:只统计字节数,c就是count嘛。
wc -m file:只统计字符数。
4.uniq:uniq一看就直到是unique,与众不同嘛,那么就允许重复的出现,这个就是为了删除文件中的重复内容。
uniq repeat.txt:删除该文件中的重复内容,打印出处理后的内容
uniq repeat.txt new.txt :把处理后的内容放到一个新文件中
uniq -c repeat :显示重复的行数,比如说1重复了3行,那么显示3 1
uniq -d repeat:d就是duplicated,即重复的,只显示重复的行的值
5.cut:剪切文件内容,可以做到提取部分我们想要的内容。
用法:
cut -c 2-4 file:每一行只保留第2到4个字符,-c就是根据字符剪切。
输出重定向
我们输入一个命令以后,它的结果一般有三个去处:
终端
文件(把结果放到文件中)
其它命令的输入(它的输出可以作为其它命令的输入)
我们之前看到的有终端,文件的,接下来博主会介绍一种新的,即去往其它命令的输入(管道的时候会说)。
1.>: 把输出内容重定向到一个文件中,并且如果这个文件已经存在并且有内容则会覆盖。
cat命令的结果最终重定向输出到test文件中去了,如果多次重定向到这个文件,那么就会覆盖之前的内容。
2.>>: 这个就和上面有点差别,虽然也是重定向输出到文件但是不会覆盖,只是会继续接到后面。
3. 2>:上面那几个都是**输出的重定向,前提在于那些命令是对的,不会报错,但是这个命令就和上面不一样了,虽然用法一样,但是这个是**错误输出的重定向,如果说命令错误了,那么错误信息就可以用这个来重定向输出。
4. 2>>: 这个也和上面介绍的>>差不多,只不过也是错误输出的重定向,不会覆盖。
5. 2>&1: 把错误和**输出都重定向到文件中,一般放最后面,和>,>>一起搭配使用。
比如说:
cat not_exist_file.csv > results.txt 2>&1
这个就是**输出,错误输出都会重定向到results.txt文件中。
输入重定向
1.<: 文件输入,从文件中读取,以文件内容作为输入:
cat test.csv:就是以这个文件本身作为输入进行处理,也就是要先打开文件,再打印文件内容
而cat < test.csv:这个是将test.csv当中的内容作为输入进行打印
2.<<: 键盘输入,例:
cat << quit:就是打印键盘输入的内容,其中键盘输入以输入quit时截止
3.管道 | :把一个命令的输出重定向到一个命令的输入,命令与命令之间建立管道,可以多个。
这个就是把键盘输入的内容,进行cat打印的输出,重定向到sort的输入,二者建立管道。
为什么用管道,管道能够更加简单,多个命令一起用嘛, 比如说du,就是深入遍历每一个目录:
但是这样的话时间花那么久,而且列出来的杂乱无章,因此可以利用其它命令一起处理一下下:
这样的话打印出来的文件目录就可以按照大小进行排序了,看起来就很舒服了。nice!!!
查看系统活动与**
1.w:查看当前系统有哪些用户登录了以及用户的具体信息
从左到右看:
当前时间为01:25:36,运行正常(up表示正常),已经运行了两小时24分钟了,只有一个用户,之后的load average表示负载,三个数值分别表示:
1 分钟以内的平均负载(0.01)
5 分钟之内的平均负载(0.02)
15 分钟之内的平均负载(0.02)
之后两行就是登录的用户列表,分别为用户名,登录的终端名称,用户连接到的服务器的IP地址(由于这个是本机,因此是:0),刚开始登录的时间,用户多久没活跃了,该终端所有相关**使用CPU的时间,当下**使用CPU的时间以及当下运行的**。
2.ps:列出运行的**
对于ps命令:如果说不加任何参数,直接使用,就是列出当前用户在当前终端正在运行的**(从左到右依次为**ID,**运行的终端,运行时间,产生这个**的程序名):
ps -ef:列出所有用户所有终端正在运行的**
ps -efH:以乔木状列出所有**
ps -u 用户名 :列出此用户运行的**
ps -aux :通过CPU和内存使用来过滤**
ps tree :以树形结构来显示**,父子**也有
列出的有:用户名 **ID 父**ID 产生**的程序名等等。
但是ps命令有一个缺点,就是静态的,只能记录当下那一刻的**,不会实时监控。
3.top:解决ps的缺点,可以动态查看,实时监控,但是至少显示前面几个最消耗处理器的**,占满终端一页就行了。
当然,top还是可交互的,进入top后,还可以输入命令进行控制:
q:退出top
h:查看top内部命令
s:改变刷新时间,默认是3s
u:过滤**,查看用户
k:杀掉某个**,后面接ID
当然还有一些更好的,比如说:glances,htop这些查看**的软件,需要的可以下载并且使用。
**操作与系统重启
这个就比较简单了,就不做过多赘述了。
1.杀掉**:
ctrl+C:快捷键可以终止终端中正在运行的程序
扩展:ctrl+shift+c可以复制,ctrl+shift+v可以粘贴
kill命令杀掉**:
kill 7800:杀掉PID为7800的**(当然可以同时加上多个**PID,同时杀掉多个**)
但是kill杀掉**比较温和,有些**不会马上结束。
如果需要马上杀掉,就输入:kill -9 7800
killall 程序名:杀掉多个**,且程序名为find
2.系统方面:
halt:关闭系统
reboot:重启系统
前后台**切换
1.&:在后台运行**,比如说:ls &:这个命令就可以在后台运行ls**,我们不必要等他结束再输入下一个命令了。
但是这个和当前终端相关联,因此关闭终端以后,该后台**也会结束。
但是nohup可以避免这个问题,让**和终端分离:nohup command,放最前面。
这样ls就变成了后台**,不需要等它列完,我们可以直接再输入命令。
2.ctrl+z:转到后台**,并且暂停运行,也就是说这个**还在,到后台去了:
之前运行了top命令,那么top就会占据整个终端,除非我们按q退出这个**,否则不能继续输入其它命令(除了top内部的交互外),因此按下ctrl+z就可以把这个**放到后台,然后暂停,我们就可以继续输入命令了(记住!!!**没有退出,只是到后台!暂停了!)
3.bg:background的意思,背景后台嘛。转到后台**运行,并不会暂停,如果说已经是后台,但是暂停,则会运行。
如果单独使用则针对最近的一个**,一般是后面接**标号
4.jobs:显示后台**状态
这个就是我们之前的top后台**了。从左到右依次为:后台**标号 **状态 命令。这个就代表着:top**状态为Stopped,**标号为1.
5.fg:既然可以转为后台**,那么必然可以转为前台**了,这个命令就是的,用法和bg一样。
来看看这几个命令之间的关系吧:
定时和延时执行
1.at:延时执行一个程序(sudo apt install at,要下载):
用法:
at 时刻,之后就会叫我们输入命令,我们输入的命令就会在我们设置的这个时刻执行,这个命令会叫你不断输入,直到你Ctrl + D 打住为止。
at now + 时间间隔:就是在现在开始的多少时间后执行
这个就是从现在开始的一分钟之后执行ls,ps -ef命令,并且定义为at任务3.
当然还有其它时间关键字,分别为:
minutes:表示“分钟”;
hours:表示“小时”;
days:表示“天”;
weeks:表示“星期”;
months:表示“月”;
years:表示“年”
2.atq和atrm:
atq:列出正在等待执行的at任务
正在等待执行的at任务是2号,在对应的时间执行。
atrm:删除正在等待执行的at任务,rm就是移除嘛!
我的atrm移除了那个任务,因此atq之后没有at任务
3.sleep:休息一下再执行
这个就是先创建一个文件,暂停10秒后再删掉,暂停期间不能输入其它命令,和at不一样,at是过一段时间执行,但是输入完后,还是可以输入其它命令的。
后面接的数字默认为秒,但是还有其它的:
h:hour 的缩写,表示“小时”;
d:day 的缩写,表示“天”。
m:minute 的缩写,表示“分钟”;
比如说touch file.txt ; sleep 15m ; rm file.txt //这个就是暂停15分钟了
拓展:
上面的命令直接用分号分隔,其实就是命令的先后顺序,前面的执行完后,执行后面的,直接意义上,并没有关联性,不像管道那样。当然还有&&和||分隔符,看看它们和分号的区别:
&&:&& 号前的命令执行成功,才会执行后面的命令。
||:|| 号前的命令执行失败,才会执行后面的命令。
分号:不论分号前的命令执行成功与否,都执行分号后的命令。前后命令之间没有相关性。
以后你想一口气执行完你需要的命令就可以利用这些分隔符来。
4…crontab:定时执行程序
at是过一段时间执行一次命令,而这个是定时重复多次。
而crontab这个命令其实就是用来读取和修改名为crontab的文件,这个文件包含了我们要定时执行的程序列表,还有执行的时刻。
用法:
显示crontab文件:crontab -l
当然,刚开始是没有这些文件的,要我们自己去创建。
既然没有就去创建:
crontab -e:输入之后会进入一个编辑器界面(开始我们地选择什么编辑器,我选择了nano,就是1),这就是我们创建的crontab文件,我们只要输入我们要定时在什么时候执行我们的命令就行了。
格式:
定时时间 命令:定时时间分为五个区域,依次分别为分钟 小时 日 月份 星期几,如果说不想输入,就输入*代替就行了。
这就是我们编辑的定时命令:在每天的10点01分的时候执行ls命令。输入完以后保存就行了:
crontab -r:当然,如果我们不喜欢这个命令了就可以删除掉,这个就是来删除crontab文件的。
当然这里还有其它关于crontab文件里面的命令的相关举例:
版权声明:本文为CSDN博主「行者自远」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/weixin_44346470/article/details/106263706
☞程序员在这些地方敲代码,普通笔记本根本扛不住
☞怒肝 8 个月源码,我成为了 Spring 开源贡献者
☞可怕!CPU 竟成了黑客的帮凶
☞Gary Marcus:因果熵理论的荒诞和认知科学带给AI的11个启示 | 文末赠书
☞这 10 个云计算错误,会让你的业务一蹶不振
☞好扑科技结合区块链行业**趋势,重磅推出“好扑区块链合伙人”计划