因此,我們的要求是用盡可能少的資源完成每秒 300 萬次的預測。值得慶幸的是,這是一種比較簡單的推薦系統模型,即多臂老虎機(MAB)。多臂老虎機通常涉及從 Beta 分佈 等分佈中取樣。這也是花費時間最多的地方。如果我們能同時做盡可能多的採樣,我們就能很好地利用資源。最大限度地提高資源利用率是減少模型所需總體資源的關鍵。 我們目前的預測服務是用 Python 編寫的微服務,它們遵循以下一般結構: ⌘ Read more
因此,我們的要求是用盡可能少的資源完成每秒 300 萬次的預測。值得慶幸的是,這是一種比較簡單的推薦系統模型,即多臂老虎機(MAB)。多臂老虎機通常涉及從 Beta 分佈 等分佈中取樣。這也是花費時間最多的地方。如果我們能同時做盡可能多的採樣,我們就能很好地利用資源。最大限度地提高資源利用率是減少模型所需總體資源的關鍵。 我們目前的預測服務是用 Python 編寫的微服務,它們遵循以下一般結構: ⌘ Read more