保险视频归档系统

Deep-Research 驱动的 YouTube 保险相关视频采集 · youtube.sinogenomics.com

采集运行中

目标:系统性归档 YouTube 上与保险相关的高价值视频

面向宏泰国际保险业务(美国/跨境年金与寿险、代理人展业培训、中文保险科普)。先用「深度调研」方式系统测绘整个保险视频版图,再有组织地批量下载、附带字幕与元数据,便于后续做内容、培训与合规研究。

已完成视频
含合并 mp4
字幕文件
中英文/自动字幕
已入库频道
按频道分目录
占用空间
720p 上限
137
调研命中频道
≥3 次检索命中
1571+91
目标规模
命中视频 + 整频道

采集进度

加载中…

深度调研方法(Deep Research)

🧭

5 路并行调研代理

分别测绘「美国寿险与年金 / 跨境·香港·华人美国保险 / 代理人销售培训 / 中文保险科普 / 险企官方与行业合规」五大版块,网络检索 + 结构化输出,得到约 83 个权威频道。

🔎

30 组中英检索扫描

用 30 条中英文关键词在 YouTube 直接枚举,命中 1571 个去重视频、覆盖 760 个频道,补齐调研漏掉的高价值号(Doug Andrew、吉力说、奶爸保、紫荆保险规划…)。

⚖️

双源合并 + 频道分级

把「检索命中」与「调研频道」合并去重;以检索命中频次给频道分级,保险专精号整频道收录,泛财经/泛销售号只取命中视频,避免跑题。

🎞️

统一采集规格

每个视频 ≤720p mp4 + 信息 JSON + 封面 + 中英文字幕(含自动字幕,利于转写);共享归档清单可断点续传、自动去重;磁盘低于 200GB 自动停采。

采集进展 · 实况

环境就绪安装 yt-dlp + ffmpeg,验证本机可直连 YouTube(约 100 MiB/s),905GB 可用空间。
深度调研完成5 代理 + 30 组检索 → 1571 命中视频、137 个保险专精频道、91 个整频道目标。
遇到 YouTube 反爬封禁密集请求触发数据中心 IP 的「Sign in to confirm you're not a bot」。先期已稳拿 147 个视频,随后被临时限流约 1 小时。
自愈式限速恢复加装重限速(视频间 5–15 秒)+ 自驱动重试循环:封禁解除后自动续采,无需人工干预;如投放 cookies 可切换近满速。
持续采集中正在按频道有序续采,附字幕与元数据…
提速选项(可选):把一份 YouTube cookies.txt 放到 /Disk01/insurance-youtube/cookies.txt,系统数分钟内自动识别并解除限速、冲刺至近 100% 完成。建议用小号导出,无 cookies 也会在限流解除后持续恢复。

频道矩阵(按版块)

下载量 Top 频道(实时)

频道视频数

最新入库(实时)