用python获取txt文件中关键字的数量

站长资源 2024/12/24 佚名

2 0 1

缘起：

　　开发人员需要tomcat中一个项目在一个月的访问请求量，因其他原因只剩下查找tomcat请求日志的方法获取，刚好最近在学习python，于是就用python摸索了下；

大体思路：

1.把相应tomcat的日志文件拷到有python环境的机器

　　　　　2.用os.listdir()获取到目录下所有文件名称的列表，再用for循环遍历列表加上字符串拼接得到已文件名的具体路径

　　　　　3.用open()读取文件，下面代码中for line in f:是按行读取txt文件的内容(一行一行的读，不会加载全部文件内容)

　　　　　4.用count()方法统计以项目为名的关键字(字符串)

知识点：

文件的读取和count()方法

　　Python count() 方法用于统计字符串里某个字符出现的次数。可选参数为在字符串搜索的开始与结束位置。

　　count()方法语法：str.count(sub, start= 0,end=len(string))

　　参数：

sub -- 搜索的子字符串
start -- 字符串开始搜索的位置。默认为第一个字符,第一个字符索引值为0。
end -- 字符串中结束搜索的位置。字符中第一个字符的索引为 0。默认为字符串的最后一个位置。

代码如下

(如果文件过多可以加工作队列（gevent库）)：

import os

# 打開日誌文件并计数
def read_log(url,keyword):
  count = 0
  with open(url,'r',encoding='utf-8') as f:  # 打开文件
  for line in f:                  # 按行读取txt文件
    count += line.count(keyword,53,64)  # count()方法计数,keyword为传入的关键字(字符串)
return count

path= 'E:\\python\\vscode\\工作\\log\\80\\'
dirlist = os.listdir(path)  # 获取path路径下的所有txt文件名

sum = 0
for name in dirlist: 　　　　　　# 遍历获取txt文件名
  url = path + name
  num = read_log(url,keyword)
  print(str(name) + ' 文件中个数为: ' + str(num))
  sum += num
print('关键字总个数： ' + str(sum))

以上就是用python获取txt文件中关键字的数量的详细内容，更多关于python 获取关键字的资料请关注其它相关文章！

python,获取关键字,python,获取txt文件

广告合作：本站广告合作请联系QQ：858582 申请时备注：广告合作（否则不回）
免责声明：本站资源来自互联网收集,仅供用于学习和交流,请遵循相关法律法规,本站一切资源不代表本站立场,如有侵权、后门、不妥请联系本站删除！

评论“用python获取txt文件中关键字的数量”

暂无评论...

www.wwsws.com 伏龙阁资源网

39,976影音资源

44,792技术资源

21,817软件资源

651,128站长资源

最新文章

转载一个别人收藏的精典网站Ruby,HIBERNATE

2024/12/24

可与Spreadsheets媲美的在线表格系统:EditG

2024/12/24

cygwin使用心得

2024/12/24

脚本的DVD开发

2024/12/24

局域网设置自动配置脚本文件的写法与用途

2024/12/24

一句话新闻

一口气升级7个大模型SaaS应用，百度智能云：突出一个“开箱即用” - 2024/12/24

这一波大模型产业落地浪潮里，不少企业其实处在 “干瞪眼“的状态。

一种情况是，很多大模型产品看得见却摸不着，在台上一个个遥遥领先——今天Sora技精四座，明天英伟达的机器人又赢得满堂彩，可是到了台下一问：啥时候能用上啊？答曰：遥遥无期。

另一种情况是，企业想用上大模型，却又难免瞻前顾后——既要考虑场景融合，又得兼顾安全性，还要考虑打通现有系统，再加上各种部署成本和繁琐的采购流程……最后只能拂袖：罢了，再等等吧。

稳了！魔兽国服回归的3条重磅消息！官宣时间再确认！

昨天有一位朋友在大神群里分享，自己亚服账号被封号之后居然弹出了国服的封号信息对话框。

这里面让他访问的是一个国服的战网网址，com.cn和后面的zh都非常明白地表明这就是国服战网。
而他在复制这个网址并且进行登录之后，确实是网易的网址，也就是我们熟悉的停服之后国服发布的暴雪游戏产品运营到期开放退款的说明。这是一件比较奇怪的事情，因为以前都没有出现这样的情况，现在突然提示跳转到国服战网的网址，是不是说明了简体中文客户端已经开始进行更新了呢？

更新日志

2024年12月24日

用python获取txt文件中关键字的数量

缘起：

大体思路：

知识点：

代码如下

用python计算文件的MD5值

python中lower函数实现方法及用法讲解

评论“用python获取txt文件中关键字的数量”

稳了！魔兽国服回归的3条重磅消息！官宣时间再确认！

更新日志

友情链接