當前位置:商標查詢大全網 - 彩票查詢 - python如何繪制預測模型的校準圖

python如何繪制預測模型的校準圖

Python可以使用校準曲線來繪制預測模型的校準圖,因為預測壹個模型校準最簡單的方法是通過壹個名為“校準曲線”(也稱為“可靠性圖”)的圖表。

這種方法主要是將觀測結果按概率分成幾種類型(bin)。因此,屬於同壹類的觀測值具有相似的概率。

對於每壹類,校準曲線都會預測該類的平均值,然後將預測概率的平均值與理論平均值(即觀察到的目標變量的平均值)進行比較。

您只需要確定以下兩者之間的類別數量和分類策略:

1,“均勻”,壹個0-1的區間分為n_bins類,所有類的寬度相同。

2.“分位數”,定義了類的邊,使每個類都有相同數量的觀測值。

假設您的模型具有良好的準確性,校準曲線將單調增加。但這並不意味著模型已經被正確校準。其實妳的模型只有在標定曲線非常接近平分線(也就是下圖的灰色虛線)的時候才能很好的標定,因為這將意味著預測概率基本接近理論概率。

如何解決python繪圖預測模型中的標定誤差:

假設妳訓練了壹個分類器,它會產生精確但未經校準的概率。概率校準的思路是建立第二個模型(稱為校準器),可以把妳訓練的分類器“校準”成實際概率。

因此,校準包括將壹個壹維向量(未校準的概率)轉換成另壹個壹維向量(校準的概率)的功能。

兩種方法常用作校準品:

1.保序回歸:壹種非參數算法,將非遞減的自由形式線擬合到數據。行數不會減少這壹事實很重要,因為它遵循原始順序。

2.Logistic回歸:預測概率有三種選擇:普通隨機森林、隨機森林+保序回歸、隨機森林+logistic回歸。