.:. 草榴社區 » 技術討論區 » [AI 奇技淫巧][第十九期]无限记忆:Stash 媒体库与向量搜索,打造你的私人 Netflix
--> 本頁主題: [AI 奇技淫巧][第十九期]无限记忆:Stash 媒体库与向量搜索,打造你的私人 Netflix 字體大小 寬屏顯示 只看樓主 最新點評 熱門評論 時間順序
shepherd


級別:精靈王 ( 12 )
發帖:5989
威望:696 點
金錢:2471 USD
貢獻:59278 點
註冊:2011-12-02


[AI 奇技淫巧][第十九期]无限记忆:Stash 媒体库与向量搜索,打造你的私人 Netflix



[AI 奇技淫巧] 第十九期

— 无限记忆:Stash 媒体库与向量搜索,打造你的私人 Netflix —




■ 前言


  1024,各位榴友。
  经过前几期的折腾,我们学会了画图、炼丹、换脸、生视频。
  相信现在你的硬盘已经红了:
  到处都是 `sfg-001.mp4`、`video_final_2.mp4` 这种神秘文件。
  想找“上次生成的那个穿红衣服的图”,翻了半小时文件夹都没找到。
  同一个视频下载了三次,分布在三个不同的文件夹里占空间。

  我们需要的不再是更大的硬盘,而是一个“智能管家”
  今天,我们要把那一堆冷冰冰的文件,变成一个有海报、有预览、能搜脸、能搜姿势的私人 Netflix。




🛑 特别说明:三种搜索,别搞混了 🛑


很多兄弟以为装了 Stash 就能随便搜,其实它有三层境界:
搜索层级搜什么依赖技术门槛
L1. 关键词搜索搜片名、番号、演员名元数据 (Metadata)必须刮削。如果你的文件名是乱码且没刮削,这招完全失效。
L2. 视觉/向量搜索搜画面内容 (如"白衬衫")Vector Search吃算力。不需要文件名,AI 直接看画面。
L3. 人脸搜索搜特定的人 (如"三上")Face Recognition吃算力。AI 自动提取视频里出现的每一张脸。




一、 奇 | 视觉抽脂:Video-Duplicate-Finder (VDF)
★【看点:文件名不一样也能去重?】
看点解析
硬盘瘦身是搭建媒体库的第一步。
传统去重软件只能找“完全一样的文件”。但如果:
* 文件 A:`video.mp4` (4K无水印)
* 文件 B:`ad_video.mkv` (720p有澳门赌场广告)
* 文件 C:`temp_123.avi` (文件名完全随机)
传统软件会认为这是三个文件。但 VDF 能够识别出它们是同一个视频
* 原理: 感知哈希 (Perceptual Hashing)。它不看文件名,而是提取画面的“指纹”。只要画面相似度超过 95%(水印不影响),它就会把它们揪出来。
* 作用:在入库前,先把那些重复下载的、画质差的垃圾清理掉。

扯扯蛋:这就像你的硬盘“抽脂手术”。你会惊讶地发现,你居然存了 5 个不同版本的同一个片子,白白浪费了几十 G 空间。




[b]二、 技
| 私人 Netflix:Stash
★【看点:地表最强成人媒体库】
看点解析
Stash 是目前这个领域生态最完善的工具。
* 可视化: 像浏览 Pornhub 一样浏览你的本地硬盘。鼠标悬停会有动态预览图(Scrubbing)。
* 刮削 (Scraping):它能根据番号或标题,自动去“某巴士”、“某DB”抓取封面、简介和标签。让你的 `SSNI-xxx` 瞬间变成精美海报。
* Web 端:部署在电脑上,你在床上用手机、iPad 就能直接访问观看,进度条还能多端同步。


★【避坑:文件名随机怎么办?】
如果你的文件全是 `wx_camera_123.mp4` 这种随机乱码:
1.  刮削器会失效: 因为它不知道去网上搜什么。
2.  补救: Stash 支持指纹匹配。如果是网上下载的标准资源,它可能通过文件 Hash 匹配到信息。但如果是你自己拍的/乱七八糟的,请务必手动重命名(至少带个关键词),否则只能靠 AI 视觉搜索。




三、 淫 | 以意搜图:Vector & Face Search
★【看点:告别文件名,AI 懂你在找什么】
看点解析
当你不想整理文件名,或者想找“某种感觉”时,这两个插件是神技。
* Vector Search (向量搜索):
    你在搜索框输入:`kneeling, white shirt, office` (跪姿,白衬衫,办公室)。
    Stash 不会去搜文件名,而是用 CLIP 模型去理解视频画面。哪怕文件名叫 `123.mp4`,只要画面里有这些元素,它就能找出来。
* Face Recognition (人脸搜索):
    它会自动扫描库里所有视频的封面和预览图,提取出几千张人脸。
    你点击某张脸,它就会列出所有包含这个人的视频。

扯扯蛋:以后找片不用背番号了。直接跟 AI 描述:“我要看那个在海边穿比基尼的”,它马上把货给你端上来。


四、 巧 | 施工蓝图:从零搭建流水线
>>> ⚠ 硬件要求:扫描视频非常吃 CPU,建议 16G 内存起步。 <<<
>>> ⚠ 网络要求:刮削必须有梯子(代理),否则封面下载失败。 <<<

Step 1: 瘦身 (VDF 去重)
操作详解
1. 扫描下载 Video-Duplicate-Finder (GitHub 搜,免安装绿色版)。添加你的资源文件夹,点击 Scan
2. 清理扫描结束后,它会列出相似视频。手动保留画质最好的那个,删掉其他的垃圾版本。

Step 2: 部署 (Stash)
路线操作
路线 A
(推荐)
Pinokio 一键安装: 打开 引用 7098897:第 10 期 的 Pinokio,搜索 `Stash` 并安装。全自动配置环境。
路线 B
(备选)
Windows 绿色版: 去 GitHub 下载 `stash-win.exe`。解压后双击即用。

Step 3: 入库与网络 (关键配置)
步骤操作
1. 导入启动 Stash,浏览器访问 `localhost:9999`。在初始化向导里添加你的资源文件夹路径,点击“扫描”。
2. 代理
(必做)
进入 Stash 界面 的 `Settings` -> `System`。找到 Proxy (代理) 选项。
* 填入你的梯子地址 (如 `http://127.0.0.1:7890`)。
* 不填这个,刮削器全是红字报错。


Step 4: 刮削 (变美)
操作详解
1. 配置进入 Stash 界面 的 `Settings` -> `Metadata Providers`。
启用社区推荐的刮削源 (如 `ThePornDB`, `JavBus`)。
2. 运行回到首页,点击视频 -> `Scrape`。如果文件名包含番号(如 `SSNI-123`),封面和简介会自动填好。


Step 5: 赋能 (开启 AI)
操作详解
1. 开启预览进入 Stash 界面 的 `Settings` -> `Tasks`。
启用 Generate Sprites (生成预览缩略图)。必须开,否则人脸识别没素材。
2. 装插件进入 `Settings` -> `Plugins`。安装 Face RecognitionVector Search 插件。
3. 跑任务点击任务栏的“Start”,让电脑挂机跑一晚上。第二天醒来,你的媒体库就有了“智慧”。




■【避雷针】/ Troubleshooting


搭建媒体库容易踩的 4 个大坑:
1.  裸奔风险 (高危):
    * 现象: Stash 默认是没有密码的。如果你在宿舍、公司局域网,或者开启了公网访问,别人输你 IP 就能看你的“珍藏”。
    * 解法: 务必进入 `Settings` -> `Security`,开启 Authentication 并设置强密码!
2.  乱点鸳鸯谱 (匹配错误):
    * 现象: 刮削器把“妈妈”匹配成了“班主任”,或者把这个女优认成了那个。
    * 解法: 别慌。在刮削界面,手动复制正确影片在 `ThePornDB` 或 `JavBus` 上的 URL 链接,粘贴到 Stash 的搜索框里,强制锁定正确 ID。
3.  刮削失败:
    * 原因: 没挂梯子,或者 Stash 里没填代理地址。
    * 解法: 检查 Step 3 的网络配置。确保你的梯子开启了“允许局域网连接”。
4.  CPU 爆炸:
    * 现象: 刚导入视频时,CPU 100% 满载,电脑卡死。
    * 原因: Stash 正在生成预览图和转码。建议睡前进行。

老司机语录: 整理资源是一场修行。当你看着几千个文件变成一面整齐的“海报墙”时,那种成就感,比看片本身还要爽。


■ 结语


  至此,我们已经完成了从“创造”(生图/视频)到“管理”(媒体库)的全部流程。
  你的 AI 军火库已经初具规模:有兵工厂(WebUI/ComfyUI),有手术台(FaceFusion),有后勤仓库(Stash)。
  但是,我们一直在“视觉”和“听觉”上打转。
  能不能让 AI 帮你写点东西?比如...帮你写代码、写小说、甚至陪你聊一些不可描述的话题?
  我们需要一个更强的大脑——大语言模型 (LLM)。
  下一期,我们将进入“认知篇”。
  下期预告:【第 20 期(上)】赛博伴侣:部署本地 LLM,打造懂你的灵魂伴侣。



关键词索引:GitHub 搜 "Stash" / "Video-Duplicate-Finder"


温馨提示:请定期备份 Stash 的数据库文件,以防崩坏。




——— 关于通用软件的碎碎念 ———
这时候肯定有人要问:“为什么不用 Plex / Emby / Jellyfin?”
兄弟,如果你是想管理《肖申克的救赎》或者《复仇者联盟》,请出门左转用它们,体验极佳。
但如果你想管理“学习资料”,想按“体位”、“欧派大小”、“颜值打分”来筛选...
信我,除了 Stash,其他都是弟弟。




站内翻阅往期(技术底座与路线):
7098897 [置顶底座] 引用 7098897:[AI 奇技淫巧][2016.01.12]从零打造你的本地化AI全能作战平台「实操向」
7105338 引用 7105338:[AI 奇技淫巧][第十八期]动态影像:SVD 图生视频与 AnimateDiff 导演实战
7104644 引用 7104644:[AI 奇技淫巧][第十七期]炼丹工坊:从“用别人的模型”进化到“创造自己的模型”



赞(22)
DMCA / ABUSE REPORT | TOP Posted: 01-17 00:20 樓主 引用 | 發表評論
特瑞思商


級別:俠客 ( 9 )
發帖:2493
威望:250 點
金錢:6863 USD
貢獻:1 點
註冊:2023-06-13


技术大拿
TOP Posted: 01-17 00:23 #1樓 引用 | 點評
苏筱熙


級別:天使 ( 14 )
發帖:128606
威望:54335 點
金錢:101467 USD
貢獻:69 點
註冊:2012-09-01

感谢分享
------------------------
7
TOP Posted: 01-17 00:49 #2樓 引用 | 點評
天不冷


級別:新手上路 ( 8 )
發帖:673
威望:68 點
金錢:2077 USD
貢獻:0 點
註冊:2025-04-28

不明觉厉
TOP Posted: 01-17 04:51 #3樓 引用 | 點評
乱羽乱舞


級別:新手上路 ( 8 )
發帖:30
威望:4 點
金錢:479 USD
貢獻:19 點
註冊:2021-10-09

感谢分享
TOP Posted: 01-17 06:16 #4樓 引用 | 點評
随机劫个色


級別:精靈王 ( 12 )
發帖:4738
威望:914 點
金錢:372 USD
貢獻:4650 點
註冊:2025-02-08

感谢分享
TOP Posted: 01-17 07:02 #5樓 引用 | 點評
小乐啊


級別:新手上路 ( 8 )
發帖:14
威望:2 點
金錢:23 USD
貢獻:0 點
註冊:2026-01-16

感谢分享
TOP Posted: 01-17 07:02 #6樓 引用 | 點評
安文


級別:禁止發言 ( 8 )
發帖:1827
威望:153 點
金錢:2902 USD
貢獻:0 點
註冊:2024-03-12

1024
TOP Posted: 01-17 07:20 #7樓 引用 | 點評
性生活大爆炸


級別:騎士 ( 10 )
發帖:4144
威望:420 點
金錢:21667 USD
貢獻:30 點
註冊:2020-06-03

感谢分享
TOP Posted: 01-17 08:02 #8樓 引用 | 點評
这是个问题啊


級別:風雲使者 ( 13 )
發帖:64588
威望:6514 點
金錢:2 USD
貢獻:104888 點
註冊:2021-01-01

发帖辛苦
TOP Posted: 01-17 17:00 #9樓 引用 | 點評
沉睡的木玛


級別:風雲使者 ( 13 )
發帖:64588
威望:6514 點
金錢:2 USD
貢獻:104888 點
註冊:2018-11-16

支持发帖
TOP Posted: 01-17 17:00 #10樓 引用 | 點評
鸭打鹅


級別:風雲使者 ( 13 )
發帖:55509
威望:5524 點
金錢:2 USD
貢獻:28763 點
註冊:2022-02-02


感谢分享
TOP Posted: 01-17 17:01 #11樓 引用 | 點評
万法唯识


級別:精靈王 ( 12 )
發帖:11908
威望:1217 點
金錢:20771 USD
貢獻:0 點
註冊:2022-05-08

感谢分享
TOP Posted: 01-17 20:08 #12樓 引用 | 點評
可乐渴了


級別:聖騎士 ( 11 )
發帖:4119
威望:796 點
金錢:26677 USD
貢獻:0 點
註冊:2023-01-12

感谢分享
TOP Posted: 01-18 16:29 #13樓 引用 | 點評
操做系捅


級別:俠客 ( 9 )
發帖:1322
威望:133 點
金錢:2025 USD
貢獻:51 點
註冊:2011-07-26

感谢分享
TOP Posted: 01-20 09:01 #14樓 引用 | 點評
一视同仁


級別:騎士 ( 10 )
發帖:3447
威望:345 點
金錢:11796 USD
貢獻:0 點
註冊:2011-11-01

感谢分享
TOP Posted: 01-20 09:48 #15樓 引用 | 點評
莲香西欲


級別:騎士 ( 10 )
發帖:10619
威望:373 點
金錢:1668 USD
貢獻:3386 點
註冊:2024-02-01

感谢分享
TOP Posted: 01-20 10:38 #16樓 引用 | 點評
莲香西欲


級別:騎士 ( 10 )
發帖:10619
威望:373 點
金錢:1668 USD
貢獻:3386 點
註冊:2024-02-01


感谢分享
TOP Posted: 01-20 10:49 #17樓 引用 | 點評

.:. 草榴社區 -> 技術討論區

快速回帖 頂端
內容
HTML 代碼不可用

使用簽名
Wind Code自動轉換

按 Ctrl+Enter 直接提交