基于TensorFlow理解三大降维技术:PCA、t-SNE 和自编码器
在我们开始之前,先看一个问题:如果你要为以下案例选择一种降维技术,你会怎么选?
1. 你的系统可以使用余弦相似度测量距离,但你需要将其可视化,以便不懂技术的董事会成员也能理解,这些人可能甚至从来没听说过余弦相似度;你会怎么做?
2. 你有必要将数据的维度压缩到尽可能最低,你的限制是要保留大约 80% 的数据,你会怎么做?
3. 你有一个数据库,其中的数据是耗费了大量时间收集的,而且还时不时有新的(相似类型的)数据加入。你需要降低你已有数据的维度,并且还要给到来的新数据降维,你会选择什么方法?
这篇文章的目的是希望能帮助你更好地了解降维,以便你能轻松应对类似这样的问题。
https://www.sohu.com/a/157563698_465975