首页 / LINUX / Linux-Awk：来自一个文本文件的单词频率,如何输出到myFile.txt？

Linux-Awk：来自一个文本文件的单词频率,如何输出到myFile.txt？

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了Linux-Awk：来自一个文本文件的单词频率,如何输出到myFile.txt？，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含1405字，纯文字阅读大概需要3分钟。

内容图文

Linux-Awk：来自一个文本文件的单词频率,如何输出到myFile.txt？

给定.txt文件,这些文件之间用空格分隔,例如：

But where is Esope the holly Bastard
But where is

和Awk函数：

cat /pathway/to/your/file.txt | tr ' ' '\n' | sort | uniq -c | awk '{print $2"@"$1}'

我在控制台中得到以下输出：

1 Bastard
1 Esope
1 holly
1 the
2 But
2 is
2 where

如何进入打印到myFile.txt中？
我实际上有300.000行,近200万个单词.最好将结果输出到文件中.

编辑：使用的答案(通过@Sudo_O)：

$awk '{a[$1]++}END{for(k in a)print a[k],k}' RS=" |\n" myfile.txt | sort > myfileout.txt

解决方法:

您的管道效率不是很高,您应该用awk来完成整个工作：

awk '{a[$1]++}END{for(k in a)print a[k],k}' RS=" |\n" file > myfile

如果要按排序顺序输出：

awk '{a[$1]++}END{for(k in a)print a[k],k}' RS=" |\n" file | sort > myfile

管道给出的实际输出为：

$tr ' ' '\n' < file | sort | uniq -c | awk '{print $2"@"$1}'
Bastard@1
But@2
Esope@1
holly@1
is@2
the@1
where@2

注意：在这里使用cat是没有用的,我们只能使用<重定向输入. awk脚本也没有意义,它只是反转单词和单词频率的顺序,并用@分隔它们.如果我们删除awk脚本,则输出将更接近所需的输出(但是请注意前面的间距,并且未排序)：

$tr ' ' '\n' < file | sort | uniq -c 
      1 Bastard
      2 But
      1 Esope
      1 holly
      2 is
      1 the
      2 where

我们可以再次排序以sed删除前导空格：

$tr ' ' '\n' < file | sort | uniq -c | sort | sed 's/^\s*//'
1 Bastard
1 Esope
1 holly
1 the
2 But
2 is
2 where

但是就像我在一开始提到的那样,让awk处理它：

$awk '{a[$1]++}END{for(k in a)print a[k],k}' RS=" |\n" file | sort
1 Bastard
1 Esope
1 holly
1 the
2 But
2 is
2 where

内容总结

以上是互联网集市为您收集整理的Linux-Awk：来自一个文本文件的单词频率,如何输出到myFile.txt？全部内容，希望文章能够帮你解决Linux-Awk：来自一个文本文件的单词频率,如何输出到myFile.txt？所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/949279.html

来源：【匿名】

【上一篇】linux-在makefile中,将假目标声明为通配符【下一篇】Linux下安装GD

更多 ►

【Linux-Awk：来自一个文本文件的单词频率,如何输出到myFile.txt？】教程文章相关的互联网学习教程文章

Linux下如何高效删除一个几十G的文本文件的最后一行或几行

当我们在服务器端记录日志或文本数据时，有时候会有需要删除一个大文件的最后几行，这时如何才能高效实现。上网浏览终于找到dd命令，亲测如下，删除一个32GB的日志文件最后100行仅需要4分钟[root@game1_10 tmp]# dd of=sqq_jobs_run.log.bak seek=1 bs=$(($(stat -c%s sqq_jobs_run.log.bak)-$(tail -1 sqq_jobs_run.log.bak|wc -c)))sqq_jobs_run.log.bak要操作的大文件， tail -n #n代表要删掉最后的几行，这里是删掉最后一行。...

【Linux】将终端的命令输出保存为txt文本文件【图】

Linux中的终端很方便，可以直接复制粘贴的。之后开一个gedit文本编辑器，把复制到的内容粘贴就可以的。不像windows的cmd控制台，需要先右键标题栏，选择编辑->全选/标记，在右键标题栏，选择复制，这么复制。cmd搞不好，鼠标不小心一点，还可能把鼠标的一抖，辛辛苦苦标记的东西就消失了。当然，以上仅仅是是Linux存在图形界面的情况，如果在某些纯命令行界面，没有复制粘贴，需要将某条终端命令保存到一个txt文本文件的话，你仅仅...

【Linux】将终端的命令输出保存为txt文本文件【图】

本来这不是一个问题，因为Linux中的终端很方便，可以直接复制粘贴的。之后开一个gedit文本编辑器，把复制到的内容粘贴就可以的。不像windows的cmd控制台，需要先右键标题栏，选择编辑->全选/标记，在右键标题栏，选择复制，这么复制。cmd搞不好，鼠标不小心一点，还可能把鼠标的一抖，辛辛苦苦标记的东西就消失了。当然，以上仅仅是是Linux存在图形界面的情况，如果在某些纯命令行界面，没有复制粘贴，需要将某条终端命令保存到一个...

新手必学linux文本文件编辑命令 vi vim.....【图】

作为一名Linux新手小白，今天就和大家简单地了解一下Linux的Vim文本编辑器的使用。Vim文本编辑器 vim编辑器的三大模式——命令模式、编辑模式和末行模式命令模式：控制光标的移动，可以对文本进行删除、复制、粘贴和查找等作用。编辑模式：正常的文本编辑。末行模式：保存或退出文本文档。图片内容含借鉴成分 ...

linux命令之----sort命令用于将文本文件内容加以排序

1、sort命令作用sort命令用于将文本文件内容加以排序,将输入行按照键值字段与数据类型选项以及locale排序。一个可预期的记录次序，会让用户的查看使用更方便：书的索引、字典、目录以及电话簿等，如果没有次序依据就毫无价值，排序后的记录更易于程序化，也更有效率。2、sort命令语法语法 sort [options] [file(s)]参数：-b 忽略开头的空白-c 检查输入是否已正确的排序。如果输入未经排序，返回退出码非零值-d 字典顺序：仅文字...

第二十二章 Linux文件比较，文本文件的交集、差集与求差：comm命令【代码】

第二十二章 Linux文件比较，文本文件的交集、差集与求差：comm命令名词解释comm 命令可以用于两个文件之间的比较，它有一些选项可以用来调整输出，以便执行交集、求差、差集操作。交集：打印两个文件所共有的行求差：打印出指定文件所包含的其不相同的行。差集：打印出包含在一个文件中，但不包含在其他指定文件中的行。语法comm(选项)(参数)选项-1 ：不显示在第一个文件出现的内容；-2 ：不显示在第二个文件中出现的内容；-3 ：...

解决“在windows里的记事本里编辑的汉字文本文件，上传到linux服务器上出现乱码“问题【代码】

目录一.前期准备二.编码转换一.前期准备1.首先在windows环境下打开记事本，然后创建一个包含汉字和英文的文本文件，输入内容“测试在windows里的记事本里编辑的文本文件，上传到linux服务器上会不会出现乱码？test!”。文件名为“测试乱码文件.txt”。2.使用xftp上传此文件到linux服务器，在linux环境下查看内容，发现输出内容是乱码。[root@node5 ~]# cat 测试乱码文件.txt 2??windowsoμ??±?o±?μ???τ?t￡??′?μ?linux·t?????...

Linux---vim编辑文本文件【图】

1.vim工作模式普通模式：该模式下可以快速移动光标位置，能够执行对文本的快捷编辑，但是不能够在文本中输入内容；插入模式：该模式主要用于在文本中插入内容，是文本输入时最常使用的模式；命令模式：该模式下没有对文本的编辑功能，只能执行一些常用命令，如存盘、退出等。2.移动光标快捷键3.快捷编辑键 4.插入快捷键 5.常用命令原文：https://www.cnblogs.com/nxf-rabbit75/p/11718981.html

终于搞定了从Linux下加载文本文件到数据库CLOB字段上

背景：搞些监控脚本SHELL 后发现每天登上服务器很麻烦，而且服务器越来越多了。本来想用系统SendMail功能发，可公司说为了安全不可以。只好用应用系统发邮件功能！然而该功能的邮件表内容是CLOB字段。从盖国强前辈网站看到的 http://www.eygle.com/arch背景：搞些监控脚本SHELL 后发现每天登上服务器很麻烦，而且服务器越来越多了。本来想用系统SendMail功能发，可公司说为了安全不可以。只好用应用系统发邮件功能！然而该...

sql-server – 用于将SQL Server架构转储到文本文件的Linux cli工具【代码】

您知道一个可靠的命令行工具能够将SQL Server架构导出到文本文件吗？解决方法:您可以使用mssql-scripter执行此操作.通过下载 – pip install mssql-scripter. 您要使用的命令如下：$mssql-scripter -S serverName -d databaseName -U user > ./my-schema.sql 默认值仅为架构(您还可以指定–schema-and-data和–data-only).命令行将提示您输入密码. 你现在可以管道到stdout,sed或.sql文件.这是GitHub页面,因为这是一个OSS仓库 – ...

[转载]Linux中记录终端（Terminal）输出到文本文件

一，如何把命令运行的结果保存到文件当中?　　这个问题太简单了，大家都知道，用 > 把输出转向就可以了　　例子: [lhd@hongdi ~]$ ls > ls.txt　　[lhd@hongdi ~]$ cat ls.txt　　1.gtkrc-2.0　　2009　　a　　amsn_received　　a.tar.gz　　说明: > 是把输出转向到指定的文件，如文件已存在的话也会重新写入，文件原内容不会保留 >> 是把输出附向到文件的后面，文件原内容会保留下来二，如何能在输出信息的同时把信息记...

解决“在windows里的记事本里编辑的汉字文本文件，上传到linux服务器上出现乱码“问题【代码】

目录一.前期准备二.编码转换一.前期准备 1.首先在windows环境下打开记事本，然后创建一个包含汉字和英文的文本文件，输入内容“测试在windows里的记事本里编辑的文本文件，上传到linux服务器上会不会出现乱码？test!”。文件名为“测试乱码文件.txt”。 2.使用xftp上传此文件到linux服务器，在linux环境下查看内容，发现输出内容是乱码。 [root@node5 ~]# cat 测试乱码文件.txt 2??windowsoμ??±?o±?μ???τ?t￡??′?μ?linux·t...

关闭导致分段错误的文本文件,并在Linux下在Linux下检测到“ glibc”【代码】

我有一个日志类,该类包含一个定义为：流日志文件的流和一个互斥体,以确保每次只有一个线程写入文件(程序是多线程的).该类定义为：#define LOG_NAME "log.txt"using namespace std;class Log { private:pthread_mutex_t mutex_write;ofstream logfile;public:Log();~Log();void Write (string txt); };构造函数是：Log::Log() {pthread_mutex_init (&mutex_write,NULL);pthread_mutex_lock (&mutex_write);logfile.open(LOG_NAME, i...

linux-删除文本文件中的特定行【代码】

我正在研究一个选项,如果用户键入准确的标题和作者,它将能够删除指定的行. 但是,我将无法使其工作. 我的函数内容如下所示fnRemoveBook() { echo"Title: " read Title echo"Author: " read Authorif grep -Fqe "$Title:$Author" BookDB.txt; thensed -i '/"$Title:$Author"/ d' BookDB.txtecho "Book removed successfully!" elseecho "Error! Book does not exist!" fi }BookDB的内容如下所示Hello World:Andreas:10:5:2 Teaching:...

linux-提取匹配项并与2个巨大的文本文件不同【代码】

我有2个大文本文件file1: aaa@email.com bbb@email.com ccc@email.com ddd@email.com ...file2: abc@email.com bbb@email.com cnd@email.com sds@email.com ...我想显示以下内容： >将file1和file2之间的电子邮件匹配到file3> file1到file4中不匹配的电子邮件> file5中file2中不匹配的电子邮件解决方法:使用排序和联接.请参阅下面的bash示例,该示例利用了流程替换join -o 1.1 <(sort file1) <(sort file2) > file3 join -o 1.1 -v ...

LINUX - 最热教程

Xrdp - 通过Windows的RDP连接Linux远程...VMware中Linux虚拟机挂载主机共享文件夹...Linux双网卡配置虚拟机下Linux安装好Nginx后，宿主机无...linux下安装postgresql并配置远程图形桌...Linux命令--exportfs命令详解 linux 终端printf打印显示乱码问题修正 Linux下Shell的for循环语句N种写法 Linux下创建nginx脚本-start、stop、re...SUSELinux安装MySQL

首页 / LINUX / Linux-Awk：来自一个文本文件的单词频率,如何输出到myFile.txt？

Linux-Awk：来自一个文本文件的单词频率,如何输出到myFile.txt？

内容导读

内容图文

内容总结

内容备注

内容手机端

【Linux-Awk：来自一个文本文件的单词频率,如何输出到myFile.txt？】教程文章相关的互联网学习教程文章

Linux下如何高效删除一个几十G的文本文件的最后一行或几行

【Linux】将终端的命令输出保存为txt文本文件【图】

【Linux】将终端的命令输出保存为txt文本文件【图】

新手必学linux文本文件编辑命令 vi vim.....【图】

linux命令之----sort命令用于将文本文件内容加以排序

第二十二章 Linux文件比较，文本文件的交集、差集与求差：comm命令【代码】

解决“在windows里的记事本里编辑的汉字文本文件，上传到linux服务器上出现乱码“问题【代码】

Linux---vim编辑文本文件【图】

终于搞定了从Linux下加载文本文件到数据库CLOB字段上

sql-server – 用于将SQL Server架构转储到文本文件的Linux cli工具【代码】

[转载]Linux中记录终端（Terminal）输出到文本文件

解决“在windows里的记事本里编辑的汉字文本文件，上传到linux服务器上出现乱码“问题【代码】

关闭导致分段错误的文本文件,并在Linux下在Linux下检测到“ glibc”【代码】

linux-删除文本文件中的特定行【代码】

linux-提取匹配项并与2个巨大的文本文件不同【代码】

LINUX - 相关标签

LINUX - 最新教程

LINUX - 最热教程