企業建網站特征知識庫的建立
日期 : 2021-09-02 21:28:28
特征知識庫的建立。機器學習中最重要的是特征選擇。只有選擇合適的特征,訓練有素的分類器才能具有良好的分類效果。
特征集合是網頁掛馬特征值的集合,當網頁被掛馬之后,將網頁源碼中一處或者多處掛馬特征提取出來,作為網頁漏洞的特征,加入待檢測特征知識庫便于后續模塊的檢測。
特征提取模板是整個系統的核心,它的實現由兩部分組成,分別是HTML unit和Rhino,特征提取是由Rhino模塊負責進行提取。然后對提取到的HTML頁面中的腳本代碼進行解析,是通過HTML unit模塊實現對DOM樹形結構的訪問,將提取的待檢測網頁的所有特征,形成完整的特征記錄,并加入待檢測特征知識庫中,為檢測模塊提供使用。
特征集合是網頁掛馬特征值的集合,當網頁被掛馬之后,將網頁源碼中一處或者多處掛馬特征提取出來,作為網頁漏洞的特征,加入待檢測特征知識庫便于后續模塊的檢測。
特征提取模板是整個系統的核心,它的實現由兩部分組成,分別是HTML unit和Rhino,特征提取是由Rhino模塊負責進行提取。然后對提取到的HTML頁面中的腳本代碼進行解析,是通過HTML unit模塊實現對DOM樹形結構的訪問,將提取的待檢測網頁的所有特征,形成完整的特征記錄,并加入待檢測特征知識庫中,為檢測模塊提供使用。
上一篇:企業建網站網頁掛馬檢測技術
下一篇:企業建網站我國高校圖書館網站創客空間宣傳方式