设备电脑监控 - 有趣的数据分析
文章目录
主要内容:
- 提出问题
- 清洗数据
- 相关性验证
- 一些结论
提出问题
- 测试时间是否和电脑的配置和性能相关?
数据清洗
测试时间
- 抓取UIlog,并使用脚本computer_test_log.py筛选测试log,并生成csv文件
- 测试时间平均值,剔除两端异常数据,EXCEL函数TRIMMEAN(array,percent)
- 测试时间相对值,将测试时间平均值/各站平均值的平均值
电脑配置和性能数据
- Memory/ CPU/ Disk Score直接可以透过捞取历史数据获取
- 平均温度,捞取3天数据中温度最高的50个值的平均值,测试时温度高,不测试时温度低
- 平均CPU Loading,捞取3天数据中CPU最高的50个值的平均值,测试时CPU高,不测试时CPU低
- 平均Memory Loading,通过手动分析Memory貌似不跟随停线状况变化,故捞取3天数据中Memory最低的100个值的平均值
数据清洗结果
相关性验证
- 使用jupyter Notbook工具和corr方法分析不够直观
- 使用R语言,生成热力图更直观,参考链接:https://www.jianshu.com/p/bb3c55abafe4
|
|
所有数据
CT站
CU站
DK站
TT站
一些结论
- CT站测试时间和CPU Loading成强相关
- CU站测试时间和CPU分数成中等相关
- DK站数据过少,测试时间和CPU Score、CPU Loading、CPU温度、Memory Score、剩余memory成强相关
- TT站测试时间和CPU Score、CPU温度、CPU Loading成中等相关
- 整体来看不太容易发现测试时间和电脑性能和配置的相关性,只是和CPU分数成中等相关
参考资料
相关系数:
- 0.8-1.0 极强相关
- 0.6-0.8 强相关
- 0.4-0.6 中等程度相关
- 0.2-0.4 弱相关
- 0.0-0.2 极弱相关或无相关
参考链接:
文章作者 Charles Miao
上次更新 2020-09-09