易大師采集器使用技巧【圖文教程】

來源：本站原創(chuàng)　瀏覽：1233次　時間：2017-08-10

1、停止采集器

檢查采集器

ps axu | grep java

輸入 kill 5756 注釋：5756是采集器運行ID 每一次都會不同,！

2,、更換采集規(guī)則

采集器規(guī)則下載地址：http://www.yispider.com

用winscp軟件上傳新的采集規(guī)則--規(guī)則的目錄是rules

然后編輯采集器目錄中的collect.ini

將 rule_name=23zw.xml 注釋：填寫新的規(guī)則名稱

3、啟動采集器

先輸入cd進入根目錄,，再 cd /usr/local/yispider 到采集器目錄

再輸入啟動采集器的命令 java -jar spider.jar -ca &

1. 不帶參數(shù)啟動,，默認為采集規(guī)則中指定的所有小說，即同-ca參數(shù)
2. 正常采集規(guī)則中指定的所有小說使用參數(shù) -ca啟動
3. 如果只采集部分小說,，可使用-c 111,222,333 或者-c 111-222啟動采集器,，前者意思為采集目標站章節(jié)號為111,222,333的小說，后者意思為采集目標站章節(jié)號從111到222之間的所有小說
4. 如果采集中出現(xiàn)了一些空章節(jié),，或者小說封面,、簡介、進度,、分類錯誤,，可以使用修復采集 -ra啟動，可指定修復內(nèi)容
5. 如果只修復部分小說,，可使用-r 111,222,333 或者-c 111-222啟動采集器,，參數(shù)含義類似-c，只是-c為采集指定小說,， -r為修復指定小說
6. 使用-r或-ra進行修復采集時可同時制定需要修復的選項,， -cover,-intro,-top,-sub,-keywords,-degree,-etxt,-txt，以上參數(shù)分別對應封面圖片,，小說簡介,，小說大類，小說細類,，關鍵詞,，寫作進度，空章節(jié)(只修復空章節(jié)),， txt文本(無論本地是否存在對應的章節(jié)內(nèi)容,，只要指定txt則重新采集)
7. 如果啟動需要單獨指定采集時使用的規(guī)則，可使用-rule xxxx.xml參數(shù)(必須同時制定-ca -c -ra -r四個命令之一),，其中xxxx.xml為rules文件夾下的規(guī)則名,，注意這里的參數(shù)需要使用文件全名，即帶了后綴的,，如果不知道怎么看文件后綴,，請使用谷歌或者度娘

注意：退出采集器,，一定要輸入 exit 回車，不然容易造成采集器驟停,！

4、建立默認封面

進入根目錄,，建一個cover文件夾

在這個文件夾里面放一張封面大小的jpg圖片,，同時將該圖片命令為nocover.jpg

5、首頁推薦

在區(qū)塊里面可以修改各類小說的展示形式,，可以自定義,，也可以選擇標準小說，然后按排行,、推薦等方式展示,，具體的視頻已經(jīng)做了演示。

6,、語言包的更改

語言包如有變動,，需要重啟TOMCAT

重啟的命令就是 service tomcat restart