[译] 数据科学中必须熟知的 5 种聚类算法

聚类算法是机器学习中涉及对数据进行分组的一种算法。在给定的数据集中,我们可以通过聚类算法将其分成一些不同的组。 … Continue reading “[译] 数据科学中必须熟知的 5 种聚类算法”

机器学习之类别不平衡问题:从数据集角度处理不平衡问题(二)

上一篇我们介绍了常用的过采样的方法,本篇主要介绍常用的欠采样的方法 。   1、 欠 采样 &nbs … Continue reading “机器学习之类别不平衡问题:从数据集角度处理不平衡问题(二)”

一文尽览近似最近邻搜索中的哈希与量化方法

编者按:最近邻搜索算法能够帮助人们在海量数据中快速搜索到有效内容,但是想要将其应用于实际,则需要解决如何缩短搜 … Continue reading “一文尽览近似最近邻搜索中的哈希与量化方法”