Python手写肘部法则确定Kmeans聚类算法中的K值
上次手写了Kmeans算法,但是关于分类数目K的取值,只是固定了两类,这次就手写一下Kmeans算法中K值的确定方法——肘部法则。
1409 字
|
7 分钟
Python手写Kmeans聚类算法
Kmeans算法是选取数据的中心点,将数据按照距离中心点的距离进行分类,从而将数据分成K类。是一个聚类算法。
243 字
|
1 分钟
Python Selenium Headless模式下爬虫的一些反爬方法
在使用Selenium设计爬虫的过程中,其实很多时候浏览器是不用打开的,但是为了方便调试,我们往往会在本地打开浏览器,如果确实不需要打开浏览器,我们可以把浏览器设置为Headless模式,这样就可以避免打开浏览器,节省资源,但是有时候,目标网站会检测到你的爬虫,导致爬虫无法正常运行,本文就此问题介绍解决方法。
686 字
|
3 分钟
Python自动化测试Selenium读取用户配置信息的方法
使用 selenium方法进行自动化测试或爬虫中,会遇到很多网页需要用户登录的情况。
570 字
|
3 分钟
tqdm进度条
在开发过程中,尤其是深度学习或者时数据处理时,程序长时间的运行总是会让广大程序员产生怀疑、后怕、自卑、发毛的情绪。因此,在程序设计中加入进度条就显得很有必要了。
468 字
|
2 分钟
Cover Image of the Post
Hexo插入图片路径出错的处理方法
使用Hexo搭建个人博客时,插图片总是无法被读取。在网上查找了很多资料,都是让你安装hexo-asset-image插件,并且将根目录下的配置文件中的post_asset_folder设置为true。然而,我的亲身实践经历证实了这并不管用。
481 字
|
2 分钟