[AI 奇技淫巧] 第十九期
— 无限记忆:Stash 媒体库与向量搜索,打造你的私人 Netflix —
■ 前言
1024,各位榴友。
经过前几期的折腾,我们学会了画图、炼丹、换脸、生视频。
相信现在你的硬盘已经红了:
到处都是 `sfg-001.mp4`、`video_final_2.mp4` 这种神秘文件。
想找“上次生成的那个穿红衣服的图”,翻了半小时文件夹都没找到。
同一个视频下载了三次,分布在三个不同的文件夹里占空间。
我们需要的不再是更大的硬盘,而是一个“智能管家”。
今天,我们要把那一堆冷冰冰的文件,变成一个有海报、有预览、能搜脸、能搜姿势的私人 Netflix。 ![]()
🛑 特别说明:三种搜索,别搞混了 🛑
很多兄弟以为装了 Stash 就能随便搜,其实它有三层境界:| 搜索层级 | 搜什么 | 依赖技术 | 门槛 |
| L1. 关键词搜索 | 搜片名、番号、演员名 | 元数据 (Metadata) | 必须刮削。如果你的文件名是乱码且没刮削,这招完全失效。 |
| L2. 视觉/向量搜索 | 搜画面内容 (如"白衬衫") | Vector Search | 吃算力。不需要文件名,AI 直接看画面。 |
| L3. 人脸搜索 | 搜特定的人 (如"三上") | Face Recognition | 吃算力。AI 自动提取视频里出现的每一张脸。 |
![]()
一、 奇 | 视觉抽脂:Video-Duplicate-Finder (VDF)★【看点:文件名不一样也能去重?】看点解析硬盘瘦身是搭建媒体库的第一步。
传统去重软件只能找“完全一样的文件”。但如果:
* 文件 A:`video.mp4` (4K无水印)
* 文件 B:`ad_video.mkv` (720p有澳门赌场广告)
* 文件 C:`temp_123.avi` (文件名完全随机)
传统软件会认为这是三个文件。但 VDF 能够识别出它们是同一个视频。
* 原理: 感知哈希 (Perceptual Hashing)。它不看文件名,而是提取画面的“指纹”。只要画面相似度超过 95%(水印不影响),它就会把它们揪出来。
* 作用:在入库前,先把那些重复下载的、画质差的垃圾清理掉。扯扯蛋:这就像你的硬盘“抽脂手术”。你会惊讶地发现,你居然存了 5 个不同版本的同一个片子,白白浪费了几十 G 空间。![]()
[b]二、 技 | 私人 Netflix:Stash★【看点:地表最强成人媒体库】看点解析Stash 是目前这个领域生态最完善的工具。
* 可视化: 像浏览 Pornhub 一样浏览你的本地硬盘。鼠标悬停会有动态预览图(Scrubbing)。
* 刮削 (Scraping):它能根据番号或标题,自动去“某巴士”、“某DB”抓取封面、简介和标签。让你的 `SSNI-xxx` 瞬间变成精美海报。
* Web 端:部署在电脑上,你在床上用手机、iPad 就能直接访问观看,进度条还能多端同步。★【避坑:文件名随机怎么办?】如果你的文件全是 `wx_camera_123.mp4` 这种随机乱码:
1. 刮削器会失效: 因为它不知道去网上搜什么。
2. 补救: Stash 支持指纹匹配。如果是网上下载的标准资源,它可能通过文件 Hash 匹配到信息。但如果是你自己拍的/乱七八糟的,请务必手动重命名(至少带个关键词),否则只能靠 AI 视觉搜索。![]()
三、 淫 | 以意搜图:Vector & Face Search★【看点:告别文件名,AI 懂你在找什么】看点解析当你不想整理文件名,或者想找“某种感觉”时,这两个插件是神技。
* Vector Search (向量搜索):
你在搜索框输入:`kneeling, white shirt, office` (跪姿,白衬衫,办公室)。
Stash 不会去搜文件名,而是用 CLIP 模型去理解视频画面。哪怕文件名叫 `123.mp4`,只要画面里有这些元素,它就能找出来。
* Face Recognition (人脸搜索):
它会自动扫描库里所有视频的封面和预览图,提取出几千张人脸。
你点击某张脸,它就会列出所有包含这个人的视频。扯扯蛋:以后找片不用背番号了。直接跟 AI 描述:“我要看那个在海边穿比基尼的”,它马上把货给你端上来。
四、 巧 | 施工蓝图:从零搭建流水线>>> ⚠ 硬件要求:扫描视频非常吃 CPU,建议 16G 内存起步。 <<<>>> ⚠ 网络要求:刮削必须有梯子(代理),否则封面下载失败。 <<<Step 1: 瘦身 (VDF 去重)| 操作 | 详解 |
| 1. 扫描 | 下载 Video-Duplicate-Finder (GitHub 搜,免安装绿色版)。添加你的资源文件夹,点击 Scan。 |
| 2. 清理 | 扫描结束后,它会列出相似视频。手动保留画质最好的那个,删掉其他的垃圾版本。 |
Step 2: 部署 (Stash)| 路线 | 操作 |
路线 A (推荐) | Pinokio 一键安装: 打开 引用 7098897:第 10 期 的 Pinokio,搜索 `Stash` 并安装。全自动配置环境。 |
路线 B (备选) | Windows 绿色版: 去 GitHub 下载 `stash-win.exe`。解压后双击即用。 |
Step 3: 入库与网络 (关键配置)| 步骤 | 操作 |
| 1. 导入 | 启动 Stash,浏览器访问 `localhost:9999`。在初始化向导里添加你的资源文件夹路径,点击“扫描”。 |
2. 代理 (必做) | 进入 Stash 界面 的 `Settings` -> `System`。找到 Proxy (代理) 选项。 * 填入你的梯子地址 (如 `http://127.0.0.1:7890`)。 * 不填这个,刮削器全是红字报错。 |
Step 4: 刮削 (变美)| 操作 | 详解 |
| 1. 配置 | 进入 Stash 界面 的 `Settings` -> `Metadata Providers`。 启用社区推荐的刮削源 (如 `ThePornDB`, `JavBus`)。 |
| 2. 运行 | 回到首页,点击视频 -> `Scrape`。如果文件名包含番号(如 `SSNI-123`),封面和简介会自动填好。 |
Step 5: 赋能 (开启 AI)| 操作 | 详解 |
| 1. 开启预览 | 进入 Stash 界面 的 `Settings` -> `Tasks`。 启用 Generate Sprites (生成预览缩略图)。必须开,否则人脸识别没素材。 |
| 2. 装插件 | 进入 `Settings` -> `Plugins`。安装 Face Recognition 和 Vector Search 插件。 |
| 3. 跑任务 | 点击任务栏的“Start”,让电脑挂机跑一晚上。第二天醒来,你的媒体库就有了“智慧”。 |
![]()
■【避雷针】/ Troubleshooting
搭建媒体库容易踩的 4 个大坑:1.
裸奔风险 (高危): *
现象: Stash 默认是没有密码的。如果你在宿舍、公司局域网,或者开启了公网访问,别人输你 IP 就能看你的“珍藏”。
*
解法: 务必进入 `Settings` -> `Security`,开启
Authentication 并设置强密码!
2.
乱点鸳鸯谱 (匹配错误): *
现象: 刮削器把“妈妈”匹配成了“班主任”,或者把这个女优认成了那个。
*
解法: 别慌。在刮削界面,手动复制正确影片在 `ThePornDB` 或 `JavBus` 上的
URL 链接,粘贴到 Stash 的搜索框里,强制锁定正确 ID。
3.
刮削失败: *
原因: 没挂梯子,或者 Stash 里没填代理地址。
*
解法: 检查 Step 3 的网络配置。确保你的梯子开启了“允许局域网连接”。
4.
CPU 爆炸: *
现象: 刚导入视频时,CPU 100% 满载,电脑卡死。
*
原因: Stash 正在生成预览图和转码。建议睡前进行。
老司机语录: 整理资源是一场修行。当你看着几千个文件变成一面整齐的“海报墙”时,那种成就感,比看片本身还要爽。
■ 结语
至此,我们已经完成了从“创造”(生图/视频)到“管理”(媒体库)的全部流程。
你的 AI 军火库已经初具规模:有兵工厂(WebUI/ComfyUI),有手术台(FaceFusion),有后勤仓库(Stash)。
但是,我们一直在“视觉”和“听觉”上打转。
能不能让 AI 帮你写点东西?比如...帮你写代码、写小说、甚至陪你聊一些不可描述的话题?
我们需要一个更强的大脑——大语言模型 (LLM)。
下一期,我们将进入“认知篇”。
下期预告:【第 20 期(上)】赛博伴侣:部署本地 LLM,打造懂你的灵魂伴侣。
关键词索引:GitHub 搜 "Stash" / "Video-Duplicate-Finder"
温馨提示:请定期备份 Stash 的数据库文件,以防崩坏。
——— 关于通用软件的碎碎念 ———
这时候肯定有人要问:“为什么不用 Plex / Emby / Jellyfin?”
兄弟,如果你是想管理《肖申克的救赎》或者《复仇者联盟》,请出门左转用它们,体验极佳。
但如果你想管理“学习资料”,想按“体位”、“欧派大小”、“颜值打分”来筛选...
信我,除了 Stash,其他都是弟弟。
站内翻阅往期(技术底座与路线):
7098897 [置顶底座] 引用 7098897:[AI 奇技淫巧][2016.01.12]从零打造你的本地化AI全能作战平台「实操向」
7105338 引用 7105338:[AI 奇技淫巧][第十八期]动态影像:SVD 图生视频与 AnimateDiff 导演实战
7104644 引用 7104644:[AI 奇技淫巧][第十七期]炼丹工坊:从“用别人的模型”进化到“创造自己的模型”
赞(22)