很多人喜欢玩抖音,我也喜欢看抖音小姐姐,可拿着手机一个个找视频太费劲。作为一个程序员,如何能在电脑前一边编程一边轻松地看抖音小姐姐呢?
下面利用Python,简单的三个步骤就可以将你喜欢的抖音小姐姐的视频自动下载下来了。
Charles
Charles是一个App抓包工具,与Filddler的功能相似,利用它可以得到App运行过程中发生的所有网络请求和响应内容。
在电脑端下载安装完Charles后,需要配置证书,最后开启SSL监听。
手机端则是需要与电脑在同一网络下,比如都连接家里的Wi-Fi,然后在手机的Wi-Fi高级选项里使用Charles代理,输入电脑的IP地址,端口8888,最后为证书命名。
连好以后,手机打开抖音App,随着操作App的动作,可以获取到视频的请求信息。
通过多次实验,发现链接的后面是会不停的改变,只有链接的前头始终不变,即「http://v1-dy」「http://v6-dy」「http://v9-dy」不变。
所以在写脚本的时候,可以用这些信息做为链接开头。
MitmProxy
利用MitmProxy中的mitmdump组件,对接Python脚本,用Python实现监听后的处理。
这里我只是利用脚本获取链接,并没有直接利用脚本下载视频。
因为我是在mitmdump.exe文件所在的文件夹运行脚本,脚本里导入不了requests模块。
不想配置环境变量了,所以只获取链接。
利用链接再去下载视频,视频链接需要去重,因为可能会有重复的。
Python脚本如下:
def response(flow): urls = ['http://v1-dy', 'http://v3-dy', 'http://v6-dy', 'http://v9-dy'] # 对url进行筛选,只选取视频的url for url in urls: if url in flow.request.url: print('\n\n抖音视频\n\n') with open('douyin.csv', 'a+', encoding='utf-8-sig') as f: f.write(flow.request.url + '\n')
配置抖音的Appium参数:
点击蓝色按钮,手机自动启动抖音App。接着操作手机,然后点击Appium的刷新键,获取元素定位代码。
通过本次的实践发现Appium有时并不能很好的获取元素的定位,针对找不到的元素,我直接对手机屏幕位置进行点击。
由于大家手机屏幕大小不同,这个参数肯定是会变化的,所以存在弊端,无法通用。
左右滑动切换图片
大致操作如上图。UP主的主页图漏了,请自行脑补,Python代码如下:
import time import random from appium import webdriver from selenium.webdriver.common.by import By from selenium.webdriver.support.ui import WebDriverWait from appium.webdriver.common.touch_action import TouchAction from selenium.webdriver.support import expected_conditions as EC def main(): # 设置驱动配置 server = 'http://localhost:4723/wd/hub' desired_caps = { 'platformName': 'Android', 'deviceName': 'STF_AL00', 'appPackage': 'com.ss.android.ugc.aweme', 'appActivity': '.main.MainActivity', # 关闭手机软键盘 'unicodeKeyboard': True, 'resetKeyboard': True } driver = webdriver.Remote(server, desired_caps) wait = WebDriverWait(driver, 60) # 同意用户隐私协议,点击 button_1 = wait.until(EC.presence_of_element_located((By.ID, 'com.ss.android.ugc.aweme:id/q6'))) button_1.click() # 禁止电话权限,点击 button_2 = wait.until(EC.presence_of_element_located((By.ID, 'com.android.packageinstaller:id/permission_deny_button'))) button_2.click() # 禁止位置权限,点击 button_3 = wait.until(EC.presence_of_element_located((By.ID, 'com.android.packageinstaller:id/permission_deny_button'))) button_3.click() time.sleep(2) # 向上滑动,进入抖音视频播放页面 TouchAction(driver).press(x=515, y=1200).move_to(x=515, y=1000).release().perform() # 这里需要设置一个较长时间的延迟,因为抖音有引导操作和提示,需等待片刻 time.sleep(20) # 点击抖音"喜欢"处,以此进入登录界面 TouchAction(driver).press(x=950, y=800).release().perform() # 点击密码登录 button_4 = wait.until(EC.presence_of_element_located((By.ID, 'com.ss.android.ugc.aweme:id/afg'))) button_4.click() # 输入账号 button_5 = wait.until(EC.presence_of_element_located((By.ID, 'com.ss.android.ugc.aweme:id/ab_'))) button_5.send_keys('你的账号') # 输入密码 button_6 = wait.until(EC.presence_of_element_located((By.ID, 'com.ss.android.ugc.aweme:id/aes'))) button_6.send_keys('你的密码') time.sleep(2) # 因为会跳出软键盘,会遮挡登录按钮,需点击软键盘取消 TouchAction(driver).press(x=980, y=1850).release().perform() time.sleep(2) # 点击登录按钮 button_7 = wait.until(EC.presence_of_element_located((By.ID, 'com.ss.android.ugc.aweme:id/abb'))) button_7.click() time.sleep(2) # 登录成功,进入抖音视频界面,点击下方标题栏 "我" TouchAction(driver).press(x=990, y=1850).release().perform() # 进入个人主页,点击关注处 button_8 = wait.until(EC.presence_of_element_located((By.ID, 'com.ss.android.ugc.aweme:id/a_7'))) button_8.click() # 进入关注栏,点击第二个关注 button_9 = wait.until(EC.presence_of_element_located((By.XPATH, ' /hierarchy/android.widget.FrameLayout/android.widget.LinearLayout/android.widget.FrameLayout/android.widget.RelativeLayout/android.widget.LinearLayout/android.widget.FrameLayout/android.view.ViewGroup/android.widget.LinearLayout/android.support.v7.widget.RecyclerView/android.widget.RelativeLayout[2]/android.widget.RelativeLayout[1]'))) button_9.click() # 进入UP主主页,点击第一个视频 button_10 = wait.until(EC.presence_of_element_located((By.ID, 'com.ss.android.ugc.aweme:id/aqm'))) button_10.click() # 不断下滑页面,直到底部 while True: TouchAction(driver).press(x=515, y=1247).move_to(x=515, y=1026).release().perform() time.sleep(float(random.randint(5, 10))) if __name__ == '__main__': main()
下载视频代码,需要对视频链接去重:
import pandas as pd import requests import os num = 0 dom = [] folder_path = "F:/video/" os.makedirs(folder_path) df = pd.read_csv('douyin.csv', header=None, names=["url"]) # 对链接去重及去除刚进入抖音获取的视频链接 for i in df['url'][2:]: if i not in dom: dom.append(i) # 下载视频 for j in dom: url = j num += 1 response = requests.get(url, stream=True) filename = str(num) + '.mp4' with open('F:\\video\\' + filename, 'ab+') as f: f.write(response.content) f.flush() print(filename + '下载完成')
最后成功获取小姐姐们的全部视频:
我打算将视频里喜欢的妹子全剪辑出来,做一个「最美瞬间」系列的视频,分享给大家!
源码地址:
https://github.com/Tobby-star/douyin
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持。
免责声明:本站资源来自互联网收集,仅供用于学习和交流,请遵循相关法律法规,本站一切资源不代表本站立场,如有侵权、后门、不妥请联系本站删除!
RTX 5090要首发 性能要翻倍!三星展示GDDR7显存
三星在GTC上展示了专为下一代游戏GPU设计的GDDR7内存。
首次推出的GDDR7内存模块密度为16GB,每个模块容量为2GB。其速度预设为32 Gbps(PAM3),但也可以降至28 Gbps,以提高产量和初始阶段的整体性能和成本效益。
据三星表示,GDDR7内存的能效将提高20%,同时工作电压仅为1.1V,低于标准的1.2V。通过采用更新的封装材料和优化的电路设计,使得在高速运行时的发热量降低,GDDR7的热阻比GDDR6降低了70%。
更新日志
- 凤飞飞《我们的主题曲》飞跃制作[正版原抓WAV+CUE]
- 刘嘉亮《亮情歌2》[WAV+CUE][1G]
- 红馆40·谭咏麟《歌者恋歌浓情30年演唱会》3CD[低速原抓WAV+CUE][1.8G]
- 刘纬武《睡眠宝宝竖琴童谣 吉卜力工作室 白噪音安抚》[320K/MP3][193.25MB]
- 【轻音乐】曼托凡尼乐团《精选辑》2CD.1998[FLAC+CUE整轨]
- 邝美云《心中有爱》1989年香港DMIJP版1MTO东芝首版[WAV+CUE]
- 群星《情叹-发烧女声DSD》天籁女声发烧碟[WAV+CUE]
- 刘纬武《睡眠宝宝竖琴童谣 吉卜力工作室 白噪音安抚》[FLAC/分轨][748.03MB]
- 理想混蛋《Origin Sessions》[320K/MP3][37.47MB]
- 公馆青少年《我其实一点都不酷》[320K/MP3][78.78MB]
- 群星《情叹-发烧男声DSD》最值得珍藏的完美男声[WAV+CUE]
- 群星《国韵飘香·贵妃醉酒HQCD黑胶王》2CD[WAV]
- 卫兰《DAUGHTER》【低速原抓WAV+CUE】
- 公馆青少年《我其实一点都不酷》[FLAC/分轨][398.22MB]
- ZWEI《迟暮的花 (Explicit)》[320K/MP3][57.16MB]