本文实例为大家分享了python统计序列中元素的具体代码,供大家参考,具体内容如下

问题1:

       随机数列[12,5,8,7,8,9,4,8,5,...] 中出现次数最高的3个元素,他们出现的次数

问题2:

       对某英文文章的单词,进行词频统计,找出出现次数最搞得10个单词,他们出现的次数是多少?

上面问题都是以字典的形式保存结果

如何解决问题1?

方法1:

#!/usr/bin/python3
 
from random import randint
 
 
def count_seq(data):
  
 # 初始化统计结果字典,data中的key作为结果字典的key,0作为每个key的初始值
 result_c = dict.fromkeys(data, 0)
  
 # 循环data,对字典中中碰到的值进行 +1 ,循环完成后就是结果
 for x in data:
  result_c[x] += 1
 return result_c
 
if __name__ == '__main__':
 # 生成20个随机数
 data = [randint(0, 20) for _ in range(20)]
 print(data)
  
 # 结果
 result_c = count_seq(data)
 for i in result_c:
  print(i, result_c[i])

方法2:

使用 collections下Counter对象

#!/usr/bin/python3
 
from random import randint
from collections import Counter
 
 
def count_seq(data):
  
 # 创建Counter对象,并把打他传递进去
 median_c = Counter(data)
  
 # 返回统计最大的3个数
 return median_c.most_common(3)
 
if __name__ == '__main__':
 # 生成20个随机数
 data = [randint(0, 20) for _ in range(20)]
 print(data)
  
 # 结果
 result_c = count_seq(data)
 print(result_c, dict(result_c))

问题2如何解决?

import re
from collections import Counter
 
 
def count_words():
 # 读取文件
 with open('english_article', 'r', encoding='utf-8') as data:
  print()
  # 文件单词分割
  data_list = re.split('\W+', data.read())
 # 单词统计
 words = Counter(data_list)
 # 取单词统计最大的10个值
 return words.most_common(10)
 
if __name__ == '__main__':
 result = count_words()
 print(result)

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持。

广告合作:本站广告合作请联系QQ:858582 申请时备注:广告合作(否则不回)
免责声明:本站资源来自互联网收集,仅供用于学习和交流,请遵循相关法律法规,本站一切资源不代表本站立场,如有侵权、后门、不妥请联系本站删除!

稳了!魔兽国服回归的3条重磅消息!官宣时间再确认!

昨天有一位朋友在大神群里分享,自己亚服账号被封号之后居然弹出了国服的封号信息对话框。

这里面让他访问的是一个国服的战网网址,com.cn和后面的zh都非常明白地表明这就是国服战网。

而他在复制这个网址并且进行登录之后,确实是网易的网址,也就是我们熟悉的停服之后国服发布的暴雪游戏产品运营到期开放退款的说明。这是一件比较奇怪的事情,因为以前都没有出现这样的情况,现在突然提示跳转到国服战网的网址,是不是说明了简体中文客户端已经开始进行更新了呢?