text-processing


在zip文件中是否有用于正则表达式匹配的python模块

我有超过一百万个文本文件压缩成 个zip文件。 我还有一个大约 个手机型号名单。 我想找出文本文件中提到的特定模型的次数。 是否有任何python模块可以对文件进行正则表达式匹配而不解压缩它。 有没有解压这个问题的简单方法而不解压缩

python regex zip text-processing
如何从Unix上的文本文件中提取预定范围的行?

我有一个 行的SQL转储包含几个数据库的数据。 我需要提取此文件的某个部分 即单个数据库的数据 并将其放在一个新文件中。 我知道我想要的数据的起始行和结束行号。 有没有人知道一个Unix命令 或一系列命令 从第 和 行之间的文件中提取所有行,然后将它们重定向到一个新文件

unix command-line sed text-processing
如何使用sed仅替换文件中的第一个匹配项?

我想在任何现有的 includes之前使用额外的include指令更新大量的C 源文件。 对于此类任务,我通常使用带有sed的小型bash脚本来重写文件。 我该如何sed更换只是一个字符串的第一次出现在文件中,而不是替换每个发生 如果我用 它替换所有的 includes。 也欢迎实现相同目标的替代

command-line sed text-processing
如何在文本文件中替换$ {}占位符?

我想将 模板 文件的输出通过管道传递到MySQL,该文件中散布着 dbName 类的变量。 替换这些实例并将输出转储到标准输出的命令行实用程序是什么

bash command-line text-processing templating
如何在Java中识别文本文档的语言?

是否有现有的Java库可以告诉我String是否包含英语语言文本 例如,我需要能够区分法语或意大利语文本 该函数需要为法语和意大利语返回false,对于英语是真的

java text dictionary text-processing
从大型结构化文本文件中提取信息

我需要读取一些大文件 从 万行到 万行 ,这些文件以空行分隔成组。 每个组以相同的模式 No. dd mm yyyy ZZZ 开始。 这是一些示例数据。 No. 山梨SUZANO PAPEL E CELULOSE SA BR BA CNPJ CIC N INPI: 检察官:MARCELLO DO

python text-processing
如何计算单词出现在文件中或某个范围内的次数

有时我想看看在文件或代码块中调用某个函数的次数。 你是怎样做的 我正在使用Vim . 。 我认为你必须使用 wc或其他一些。

vim vi text-processing
使用程序而不是Perl进行文本处理

我有一个.plist文件,看起来像这样: 我想向plist添加更多信息,例如座右铭和昵称。 它们的格式如下: 我正在考虑进行一些搜索和替换以添加更多信息。 我还可以编写一个perl脚本来读取昵称并将其添加到plist中。 但是,是否有一个文本处理程序可以让我迭代这些值并将它们插入正确的位置 我一直

xml plist text-processing
通过grep删除文本文件中的空行

FILE : 如何删除此FILE中的所有空白行 命令输出: FILE :

linux grep text-processing
如何一行中读取A到B列中的所有字符

给定一个具有 行的文件,在Python中是否有可能,所有文件都具有以下结构: , ,xvfrt ert a fsfs df f fdfd , 或类似的方法,读取整个字符串,然后将第 列到第 列中的所有字符 包括空格 存储在另一个字符串中,因此新字符串应为 xvfrt ert a 非常感谢

python text-processing