1、停止采集器
檢查采集器
ps axu | grep java
輸入 kill 5756 注釋:5756是采集器運行ID 每一次都會不同,!
2,、更換采集規(guī)則
采集器規(guī)則下載地址:http://www.yispider.com
用winscp軟件上傳新的采集規(guī)則--規(guī)則的目錄是rules
然后編輯采集器目錄中的collect.ini
將 rule_name=23zw.xml 注釋:填寫新的規(guī)則名稱
3、啟動采集器
先輸入cd進入根目錄,,再 cd /usr/local/yispider 到采集器目錄
再輸入啟動采集器的命令 java -jar spider.jar -ca &
1. 不帶參數(shù)啟動,, 默認為采集規(guī)則中指定的所有小說, 即同-ca參數(shù)
2. 正常采集規(guī)則中指定的所有小說使用參數(shù) -ca啟動
3. 如果只采集部分小說,, 可使用-c 111,222,333 或者-c 111-222啟動采集器,, 前者意思為采集目標站章節(jié)號為111,222,333的小說, 后者意思為采集目標站章節(jié)號從111到222之間的所有小說
4. 如果采集中出現(xiàn)了一些空章節(jié),, 或者小說封面,、簡介、進度,、分類錯誤,, 可以使用修復采集 -ra啟動, 可指定修復內(nèi)容
5. 如果只修復部分小說,, 可使用-r 111,222,333 或者-c 111-222啟動采集器,, 參數(shù)含義類似-c, 只是-c為采集指定小說,, -r為修復指定小說
6. 使用-r或-ra進行修復采集時可同時制定需要修復的選項,, -cover,-intro,-top,-sub,-keywords,-degree,-etxt,-txt,以上參數(shù)分別對應封面圖片,, 小說簡介,, 小說大類,小說細類,, 關鍵詞,, 寫作進度, 空章節(jié)(只修復空章節(jié)),, txt文本(無論本地是否存在對應的章節(jié)內(nèi)容,, 只要指定txt則重新采集)
7. 如果啟動需要單獨指定采集時使用的規(guī)則, 可使用-rule xxxx.xml參數(shù)(必須同時制定-ca -c -ra -r四個命令之一),, 其中xxxx.xml為rules文件夾下的規(guī)則名,, 注意這里的參數(shù)需要使用文件全名, 即帶了后綴的,, 如果不知道怎么看文件后綴,, 請使用谷歌或者度娘
注意:退出采集器,,一定要輸入 exit 回車,不然容易造成采集器驟停,!
4、建立默認封面
進入根目錄,,建一個cover文件夾
在這個文件夾里面放一張封面大小的jpg圖片,,同時將該圖片命令為nocover.jpg
5、首頁推薦
在區(qū)塊里面可以修改各類小說的展示形式,,可以自定義,,也可以選擇標準小說,然后按排行,、推薦等方式展示,,具體的視頻已經(jīng)做了演示。
6,、語言包的更改
語言包如有變動,,需要重啟TOMCAT
重啟的命令就是 service tomcat restart