首先说明一下需要使用的工具以及技术:python3 + selenium
selenium安装方法:pip install selenium
前提:获取自己的qq群成员信息,自己必须是群主或者管理员,然后通过管理页面进入到成员高级管理网页端,就可以对数据进行爬取了!
步骤:
①:首先安装环境 selenium库,selenium是一个自动化库,但是使用它必须用到浏览器驱动,不同的浏览器有不同的驱动,所以需自行下载,我这里是chrome浏览器。
②:运行 程序,然后会需要点击一键登录按钮,点击即可,点击完后,整个页面还未加载全所有的成员信息,所以需要将滚动条下拉至底。
③:等待运行结束,结束后 同目录下就会出现一个xslx文档,里面就是所有的群成员信息
话不多说,上代码就完了!
from selenium import webdriver from time import sleep #1.创建Chrome浏览器对象,这会在电脑上在打开一个浏览器窗口 browser = webdriver.Chrome(executable_path ="D:\chromedownload\chromedriver") #2.通过浏览器向服务器发送URL请求 browser.get("https://qun.qq.com/member.html#gid=951192978") sleep(20) #browser.sleep(3) all_number_nickname = browser.find_elements_by_xpath('//*[@class="list"]/tr/td[3]/span[1]') all_number_name = browser.find_elements_by_xpath('//*[@class="list"]/tr/td[4]/span[1]') all_number_order = browser.find_elements_by_class_name('td-no') all_number_qq = browser.find_elements_by_xpath('//*[@class="list"]/tr/td[5]') all_number_sex = browser.find_elements_by_xpath('//*[@class="list"]/tr/td[6]') all_number_qqage = browser.find_elements_by_xpath('//*[@class="list"]/tr/td[7]') all_number_intime = browser.find_elements_by_xpath('//*[@class="list"]/tr/td[8]') all_number_marks = browser.find_elements_by_xpath('//*[@class="list"]/tr/td[9]') all_number_lastsaytime = browser.find_elements_by_xpath('//*[@class="list"]/tr/td[10]') # for i in [all_number_qq,all_number_nickname,all_number_name,all_number_order,all_number_sex,all_number_qqage,all_number_intime,all_number_marks,all_number_lastsaytime]: # for j in i: # print(j.text) list=[] for k in range(len(all_number_qq)): list.append([]) list[k].append(all_number_qq[k].text) list[k].append(all_number_nickname[k].text) list[k].append(all_number_name[k].text) list[k].append(all_number_order[k].text) list[k].append(all_number_sex[k].text) list[k].append(all_number_qqage[k].text) list[k].append(all_number_intime[k].text) list[k].append(all_number_marks[k].text) list[k].append(all_number_lastsaytime[k].text) import openpyxl def write_excel_xlsx(path, sheet_name, value): index = len(value) workbook = openpyxl.Workbook() sheet = workbook.active sheet.title = sheet_name for i in range(0, index): for j in range(0, len(value[i])): sheet.cell(row=i+1, column=j+1, value=str(value[i][j])) workbook.save(path) print("xlsx格式表格写入数据成功!") book_name_xlsx = 'python小白交流群成员.xlsx' sheet_name_xlsx = 'python小白交流群成员' value = list write_excel_xlsx(book_name_xlsx, sheet_name_xlsx, value)
总结
以上所述是小编给大家介绍的Python获取统计自己的qq群成员信息的方法,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对网站的支持!
如果你觉得本文对你有帮助,欢迎转载,烦请注明出处,谢谢!
广告合作:本站广告合作请联系QQ:858582 申请时备注:广告合作(否则不回)
免责声明:本站资源来自互联网收集,仅供用于学习和交流,请遵循相关法律法规,本站一切资源不代表本站立场,如有侵权、后门、不妥请联系本站删除!
免责声明:本站资源来自互联网收集,仅供用于学习和交流,请遵循相关法律法规,本站一切资源不代表本站立场,如有侵权、后门、不妥请联系本站删除!
暂无评论...
更新日志
2024年11月25日
2024年11月25日
- 凤飞飞《我们的主题曲》飞跃制作[正版原抓WAV+CUE]
- 刘嘉亮《亮情歌2》[WAV+CUE][1G]
- 红馆40·谭咏麟《歌者恋歌浓情30年演唱会》3CD[低速原抓WAV+CUE][1.8G]
- 刘纬武《睡眠宝宝竖琴童谣 吉卜力工作室 白噪音安抚》[320K/MP3][193.25MB]
- 【轻音乐】曼托凡尼乐团《精选辑》2CD.1998[FLAC+CUE整轨]
- 邝美云《心中有爱》1989年香港DMIJP版1MTO东芝首版[WAV+CUE]
- 群星《情叹-发烧女声DSD》天籁女声发烧碟[WAV+CUE]
- 刘纬武《睡眠宝宝竖琴童谣 吉卜力工作室 白噪音安抚》[FLAC/分轨][748.03MB]
- 理想混蛋《Origin Sessions》[320K/MP3][37.47MB]
- 公馆青少年《我其实一点都不酷》[320K/MP3][78.78MB]
- 群星《情叹-发烧男声DSD》最值得珍藏的完美男声[WAV+CUE]
- 群星《国韵飘香·贵妃醉酒HQCD黑胶王》2CD[WAV]
- 卫兰《DAUGHTER》【低速原抓WAV+CUE】
- 公馆青少年《我其实一点都不酷》[FLAC/分轨][398.22MB]
- ZWEI《迟暮的花 (Explicit)》[320K/MP3][57.16MB]