群晖Video Station豆瓣刮削器插件(改)

终于我还是弃坑了。在我写了半天TMDB的东西之后,发现Video Station本来就是用的TMDB接口啊(摔!自带得搜索不能用的原因是TMDB接口地址被墙了。但我调试api的时候发现了一个不正规地址z4vrpkijmodhwsxzc.stoplight-proxy.io。遵循如下步骤修改就可以使用自带搜索了。

  • ssh 登录群晖
  • 执行命令 cd /var/packages/VideoStation/target/plugins
  • 编辑 util_themoviedb.php 文件
  • 修改其中的api.themoviedb.org 为 z4vrpkijmodhwsxzc.stoplight-proxy.io

另外还可以通过修改dns来解决。 https://www.v2ex.com/t/647000

我自己对刮削没有那么多要求,能有名字,有海报就可以了,所以这个后面应该不会再更新了。

好了,没事了,大家散了吧。

下面的内容已经弃坑

前段时间搞了一个星际蜗牛 D 款,做了一点散热改装之后,装了黑群晖已经正常服役了两个多月了。用的最多应该就是下载和 Video Station,本来也是为了这个来的,省的老是要帮对象找各种在线资源。
Video Station 原生的刮削器只支持国外一些网站,速度慢不说很多国内的内容也没有信息。有一位老哥做了豆瓣得刮削器补丁,试用了一下。一开始感觉还不错,用了一段时间之后,发现数据有时候回滞后,豆瓣上明明有内容,通过插件却查找不到。
之后稍微研究了一下源代码,发现原作者是自己写了一组 API 供插件调用,可能是为了避免豆瓣得反爬虫屏蔽,API 内容应该是做缓存的。有一个现象是,有一个关键词一开始搜不出内容,但是搜索过一次过段时间之后就有内容了。所以猜测是通过搜索来触发缓存的异步更新了。
虽然用用也可以,但是总是不放心。一个是缓存策略导致数据滞后,另外就是万一哪天老哥把 API 停了就不能用了。反正代码也是 PHP 的的老本行就直接拿来改成了直接抓取豆瓣网页了。顺便把代码部署到了 github,安装相关说明直接安装即可使用。

synology_video_station_douban_plugin

目前仅修改了电影数据的抓取代码,但是把搜索器也开放给了电视数据,所有理论上都是能搜索的了。还有一个问题是豆瓣的反扒比较严格,如果发现搜不到内容了,很可能是 ip 被封了,这时候建议直接重新拨号。
有问题可以在这里留言或者提 issue,让我们愉快得玩耍吧。

2020-02-23更新

找到了代理服务器的替代方案--cloudflare workers 更新后使用即可。目前worker是用的我的worker, 免费版本10w请求每天。如果后面免费量不够了或者我弃坑了,我会写一下替换worker的地址,现在懒得写了。 安装脚本也更新了,所以安装的时候要记得重新下载。

2020-04-01更新

  1. 删除了其他搜索源,只保留了豆瓣源
  2. 封面图片也通过cf-worker获取
  3. 修复部分数据抓取错误的bug
  4. 安装脚本更新,从master分支下载最新代码。以后更新不用重新下载安装脚本了。

2020-04-09更新

  1. 修改安装脚本自定义cf-worker地址.cf-worker部署说明:地址

synology_video_station_douban_pluginsynology_video_station_douban_plugin


121 thoughts on “群晖Video Station豆瓣刮削器插件(改)

  1. 大佬好,按照你的方法安装后,仍然无法搜索到信息,无论是自动还是手动搜索,语言切换到了英文也不行。 我不清楚是否因为IP被封了,但是个人本身是公网IP,比较难变动,请问有什么解决方法吗?

  2. 你好,按照你的方法安装后,仍然无法自动搜到信息,手动搜索也无法搜索,请问是怎么解决?

  3. 大佬,安装过你这个刮削器,但群晖索引文件太夸张,几天了,一只在处理。另外,看到别的文章,群晖的索引服务器被墙了,正好家里路由可以出去。想还原到DS video station 安装豆瓣刮削器之前的状态,如何操作?谢谢!

  4. 谢谢LZ更新!
    4.1版重新安装后 总算是可以自行搜刮匹配了,准确率也挺高…

    但刚正常搜索匹配了一阵后,问题就出来了,搜索出来的全部合并到“未知”文件夹里,先前已经匹配成功的没有问题,手动搜索出来的结果框里也全部都是未知,目前为止电影和电视剧都是如此,是不是worker负荷过载了??

          1. 不行哦,输入中文<地久天长>搜索也是一样的。其他影片的搜索结果也是时有时无,大部分是时候没有。

      1. 请问,为什么安装完,我试了一下电视剧可以搜索了,但是我关闭PUTTY后,在搜索就什么都搜索不到了?原来电影能搜索出来现在电影也不行了。。。

  5. 老哥, 这个如何删除其他的搜索通道呢? 只保留你这个豆瓣的渠道,很迷,我的搜索出来都是英文的, 但是我确定我选择了中文, 求解~

    1. 自动处理的时候默认是取搜索结果的第一个。如果自动处理的不对,可以手动修改

      1. 意思是例如 变形金刚系列中的变5、碟中谍系列的碟中谍6
        自动索引的结果显示剧名‘未知’ 评分、演员、编剧、导演等信息都是没有的,海报图片也是没有
        只有摘要信息是有的

  6. 我按github内写的三步操作完,也成功了。但在videostation和plex内,都没效果??我是不是少了什么步骤??

  7. api.9hut.cn不能访问,造成“文件格式不对”无法保存。图片地址直接访问douban才OK .

  8. 辛苦老哥!很需要这个!试用之后有个问题,选择的视频库为 电影,语言为简体中文,发现大部分影视自动搜索出来的信息都为英文,而且发现英文信息并不是来自豆瓣(而是来自TheMoviedb上的英文信息,从评分和介绍可以对比出);只有少部分影视自动搜索出来的信息是中文,且信息与豆瓣网页上相同。

    但是自动搜索出来为英文信息的那些影视,通过手动搜索名字 且能搜出来自豆瓣的中文信息,可以手动搜索后保存。

    请问老哥也是这样的吗?能否修改为自动搜索出来的信息都是信息,不要英文的?

    1. 这个还真没遇到过。目前对于群晖的自动搜索到底怎么走通道我还是很迷。包括之前那个电视剧搜索出来有问题的也是一样。后面我打算直接把别的通道删了先,只留下豆瓣,再来看看。目前只能先麻烦一点手动修正了。

      1. 我又测试了几遍,发现如果电影文件的文件名或者文件夹名中有电影的英文名字,自动搜索出来的信息就是TheMoviedb上的英文信息;
        如果把文件名和文件夹名中的英文名字删掉,只留下电影中文名,自动搜索出来的信息则是豆瓣上的中文信息。
        只有偶尔一两个电影还显示英文,但多自动搜两次也可以正确显示为中文的信息。

      2. 其他通道确实可以删了,群晖官方已回复tmdb国内被墙,目前正在与豆瓣对接相关事宜

  9. 有考虑用https://github.com/zce/douban-api-proxy里的https://douban.uieee.com/作为代理吗?
    另外,中文+英文是代码中原本就存在的。是不是考虑有部分用户用过之前的搜刮器里只存在中文,考虑只显示中文部分(或者空格前半部分)呢。。

    1. 我改动的初衷就是希望可以尽量不依赖第三方服务,不然用老哥的原始版本就行了。用CloudFlare worker不违背这个原则因为每个人都可以自己部署。
      后面一部分没有看懂。

      1. 演员,导演,作者,这几个内容,豆瓣的格式是“中文名 英文名”,而之前一直都是中文名,可以直接获取前面半部分么。库存电影多了。一个一个换成新的工作量有点大啊。。

    1. addEventListener('fetch', event => {
      event.respondWith(handleRequest(event.request))
      })

      async function handleRequest(request) {
      targetUrl = request.url.split('-----')[1]
      return await fetch(targetUrl)
      }

      查询都是get方式的,所以没啥特别的代码。

  10. 剧集的信息数据搜取开始出现问题,几天前已经匹配好的剧集信息又混乱了,开始自行匹配一些毫无相干的剧集甚至是电影的信息;
    而电影的搜取比较正常,不过仍然存在零星几个无法匹配

  11. 试了下,刮削的信息标语栏还有影片类型
    还有,能不能标题以及演职人员信息不显示英文啊

  12. 你好,Video Station自带的刮削器除了海报外,还有背景图,这样首页的横幅上就会同时显示海报和背景,请问作者后期是否考虑把背景图也加上?

  13. 博主你好,尝试了几次后,终于装上了,但我有比较多的电影和电视剧,部署前右下角显示479个项目,部署后,索引有点慢,并且右下角显示的电影数变少了,现在显示392个项目,请问是什么原因?

发表评论

邮箱地址不会被公开。 必填项已用*标注

此站点使用Akismet来减少垃圾评论。了解我们如何处理您的评论数据