sklearn.metrics.pairwise.cosine_similarity?

sklearn.metrics.pairwise.cosine_similarity(X, Y=None, dense_output=True)

源碼

計算X和Y中樣本之間的余弦相似度。

余弦相似度或余弦內核將相似度計算為X和Y的標準化點積:

K(X,Y)=<X,Y>/(||X||*||Y||)

在L2歸一化的數據上,此函數等效于linear_kernel。

用戶指南中閱讀更多內容。

參數 說明
X ndarray or sparse array, shape: (n_samples_X, n_features)
輸入數據。
Y ndarray or sparse array, shape: (n_samples_Y, n_features)
輸入數據。如果為None,則輸出將為X中所有樣本之間的成對相似性。
dense_output boolean (optional), default True
是否即使輸入稀疏也返回密集輸出。如果為False,則兩個輸入數組均為稀疏時,輸出為稀疏。
版本0.17中的新功能:用于密集輸出的參數density_output。
返回值 說明
kernel matrix array
形狀為(n_samples_X,n_samples_Y)的數組。