首先通过爬虫采集链家网上所有南京二手房的房源数据,并对采集到的数据进行清洗;然后,对清洗后的数据进行可视化分析,探索隐藏在大量数据背后的规律;最后,采用一个聚类算法对所有二手房数据进行聚类分析,并根据聚类分析的结果,将这些房源大致 ...
最近,有研发的朋友遇到了一个难题:在晶圆做完cp测试后,在切割编带时,需要cp测试的map作为编带的依据,即符合cp测试标准的就编带,不符合cp测试标准的就留在切割完的晶圆上不编带。但是,cp标准是在probe上设定好的,导出的map图也都是根据probe上设定的 ...
在 2023 年底的时候,我开始准备记录自己每天的时间是怎么安排的。 其实对于我自己来说,最大的驱动力来自记录自己的睡眠。毕竟作为「研究生」,平时也没有白天一定要做什么事情的需求(除了开会),生物钟经常颠倒,睡觉也睡的不好。如果能够自己统计 ...
导读:如果你的代码是用 Python 编写的,你应该使用 Textual 来帮助你编写 TUI(文本用户界面)。 本文字数:24584,阅读时长 ...
Customer stories Events & webinars Ebooks & reports Business insights GitHub Skills ...
词云图想必大家都见过,是一种形式新颖的查看文本中出现最多词汇的图。 我使用Python的第三方库stylecloud来分别生成了 2 张词云图,读者可以猜一猜以下词云图的出处来自于哪里。 中文博大精深,jieba对中文切词的准确性问题,可通过自定义添加词汇解决。