当前位置:首页 > AI技术 > 正文内容

骡子快跑怎么采集短视频 骡子快跑视频采集方法实战案例|Duuu笔记

admin3周前 (03-29)AI技术20

骡子快跑的Computer模式最稳,本质是提供7×24小时云端Linux虚拟机,需自行编写或运行爬虫脚本;预装python3.11、curl、ffmpeg,禁用Selenium等GUI依赖;推荐requests+execjs解密+ffmpeg合成,绕过抖音/快手/B站签名校验;定时采集后mv视频至Drive,避免rsync和硬编码Cookie;超级智能体模式不适用长周期采集,易超时且无法续传。

直接用「Computer 模式」跑爬虫脚本最稳

骡子快跑

本身不提供“一键采集短视频”的按钮,它不封装垂直功能,而是给你一台 7×24 小时在线的云端虚拟机——你让它执行什么,它就执行什么。所以采集短视频,本质是让它运行你写的或选中的爬虫逻辑。

常见错误现象:

Permission denied

(没权限调用

curl

ffmpeg

)、

ModuleNotFoundError: No module named 'requests'

(依赖没装)、视频链接 403(反爬拦截)。

优先用官方预装环境:骡子快跑的

Computer

模式默认已装好

python3.11

pip

curl

ffmpeg

,不用自己配环境

别写需要 GUI 或浏览器渲染的脚本(比如 Selenium + Chrome):骡子快跑的虚拟机无图形界面,

chromedriver

会直接报错

no display server

推荐方案:用

requests

+

execjs

(解密 signature)+

ffmpeg

合并音频视频流,比模拟点击更轻、更快、更稳

怎么绕过抖音/快手/B站的签名校验

几乎所有主流平台的短视频真实地址都带时效性

sign

tt_params

,直接扒网页源码里的

src

属性基本是废链。骡子快跑没法帮你“自动逆向”,但它能稳定执行你提供的解密逻辑。

使用场景:你已有 Python 解密函数(比如从某开源项目抄来的

get_sign

),只需把它塞进脚本里,再让骡子快跑定时跑。

把解密逻辑封装成独立函数,例如

gen_video_url(video_id, user_agent)

,避免和请求逻辑耦合

注意时间戳精度:部分平台要求毫秒级

ts

,用

int(time.time() * 1000)

,不是

time.time()

别硬编码 Cookie:骡子快跑每次会话隔离,

Cookie

无法跨任务复用;改用设备指纹参数(如

device_id

iid

)配合 sign 算法更可持续

定时采集 + 自动存到 Drive 的完整链路

骡子快跑的

Drive

是你的专属云盘,所有任务生成的文件默认存在

/home/user/output/

,但不会自动同步过去——得你显式移动。

聚好用AI

可免费AI绘图、AI音乐、AI视频创作,聚集全球顶级AI,一站式创意平台

下载

性能影响:频繁写入大视频文件(>500MB)可能触发 I/O 限频,导致任务卡在

cp

阶段超时。

采集脚本末尾加一句:

mv /tmp/downloaded.mp4 /home/user/output/shorts_$(date +%Y%m%d_%H%M%S).mp4

crontab -e

设置定时(如每 2 小时跑一次):

0 */2 * * * cd /home/user/scripts && python3 tiktok_crawler.py

别用

rsync

同步整个目录:

Drive

不支持硬链接,且会重复上传未变文件;只

mv

新生成的成品文件即可

为什么不用「超级智能体模式」直接问“帮我下100个短视频”

因为那模式是面向一次性交付设计的,底层走的是 SOP + 大模型混合调度,适合“写 PPT”“生成研报”这类目标明确、步骤收敛的任务。短视频采集属于长周期、状态依赖、易中断、需重试的流程型工作,大模型容易在中间环节 hallucinate 出假 URL 或跳过重试逻辑。

容易踩的坑:

超级智能体模式

会主动终止长时间运行的任务(默认超时 6 分钟),而下载一个 3 分钟视频 + 解密 + 合并,很可能超时;一旦中断,进度不保存,重跑就得从头来。

真想省事:先用

超级智能体模式

生成初始爬虫脚本(提示词写清楚平台、字段、反爬要点),再把产出的代码复制到

Computer

模式里手动优化运行

别信“自动识别验证码”:骡子快跑目前不开放图像识别 API 调用权限,遇到滑块或点选,脚本会卡死,必须提前规避

骡子快跑不是黑盒采集工具,它是你远程的一台永不关机的 Linux 电脑——你得告诉它怎么连、怎么算、怎么存。最复杂的从来不是“怎么下”,而是“怎么让下得稳、断了能续、错了能查”。

相关文章

一文讲清神经网络、BP神经网络、深度学习的关系

人工神经网络中的顶级代表。往往说《神经网络》就是指《BP神经网络》。 大家研究着各种神经网络,研究得不亦乐乎, 来了两个家伙Romelhart 和Mcclelland,...

前端开发实战详解:骡子快跑怎么注册账号 骡子快跑账号注册流程最佳实践|Duuu笔记

骡子快跑注册仅需1分钟,但激活码需从Discord指定频道获取,输错3次将锁账户24小时;积分与注册邮箱强绑定且不可更换;部分地区即使注册成功也无法运行Agent。 ☞☞☞AI 智能聊天, 问答助手...

深入理解前端开发:Minimax视频生成黑科技:复杂动作模拟完全指南|Duuu笔记

为精准模拟复杂动作,需采用分帧提示词构建、骨骼关键点引导注入和多阶段动作蒸馏三法:一、将动作拆解为带空间姿态的关键帧序列并加物理约束;二、注入2D/3D关键点坐标锚定关节位置;三、通过粗生成→特征提取...

深入理解前端开发:零基础教程:怎么用 Gemini 自动生成短视频脚本与拍摄大纲完全指南|Duuu笔记

需明确输入指令、理解输出逻辑并合理拆解内容:一、构建含角色/任务/格式等要素的提示词;二、追加分镜与时间轴约束优化专业性;三、转译为带道具编号与颜色标记的执行清单;四、用Gemini校验注意力断点并迭...

前端开发实战详解:骡子快跑如何生成会议纪要 骡子快跑语音转文字整理技巧最佳实践|Duuu笔记

使用听脑AI转写、骡子快跑生成纪要、影子跟读校验、自定义术语词典及EcomGPT-CNN情绪风险分析,五步实现会议纪要高效精准产出。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量...

前端开发高级应用:基础全攻略:教你玩转 Gemini 对话、写作与分析的三大秘籍实战案例|Duuu笔记

提升Gemini使用效能需践行三大路径:一、精准构建提示词,明确任务类型、输出格式与背景信息;二、分层拆解写作任务,依大纲、扩展、风格、校验四步迭代;三、结构化驱动分析,指定维度、标准与溯源要求。...

发表评论

访客

看不清,换一张

◎欢迎参与讨论,请在这里发表您的看法和观点。