Python百宝箱

1.对Json数据的读取、存入

json数据存储为Python字典格式,python模块中有json.pickle两个模块负责json数据的处理
json模块:dumps、dump、loads、load
pickle模块:dumps、dump、loads、load
json dumps把数据类型转换成字符串 dump把数据类型转换成字符串并存储在文件中 loads把字符串转换成数据类型 load把文件打开从字符串转换成数据类型
参考博客
json.dump(file,list) //写入数据
json.load(file,list) //读取数据

2.Python绘图工具matplotlib学习

matplotlib安装:pipinstall matplotlib
导入模块: from matplotlib import pyplot as plt
绘图:

x = [1,2,3]
y1 = [1,2,3]
plt.plot(x,y1,'r--')  //线段颜色和形状
// plot.show()   //  分开写则显示是两张图
y2 = [1,3,5]
plt.plot(x,y2,'g--')
plt.show()  // 显示图片,两个线段显示在一张图上

3. python包管理工具anaconda

anaconda是强大的python包管理工具,包含python常用的工具包,同时包含python环境,直接下载安装anaconda就可以使用python。
使用anaconda时,pycharm应配置anaconda虚拟环境才可以使用。
具体步骤如下:

  1. 点击File选项。
  2. 点击Settings选项。
  3. 点击Project选项。
  4. 点击Project Interpreter选项。
  5. 在右面Project Interpreter方框里面则是现在pycharm所使用的python环境,如若添加anaconda环境,点击方框右边设置按钮,点击Add。
  6. 在弹出来的框里面,第一行虚拟环境选项中选择右方已存在环境这一选项,即Existing envirment选项,在Interpreter方框中选择anaconda安装路径,例如: D:\anaconda\python.exe,点击确定
    7.关掉当前页面,返回上一级,在方框中选择刚刚添加的anaconda路径,点击应用即可。
  7. 验证是否环境配置成功:点击pycharm下面Python解释器即Python Console,若Python解释器显示python路径为刚刚设置的anaconda路径则代表配置成功。

4. 排序函数sort(),sorted()

python中自带的列表排序函数有sort()sorted(),两个的区别在于sort()函数直接对原list进行排序并改动,不生成新的list,sorted()函数对原list不做任何改动,直接生成新的的list
用法如下:

a = [3,2,1]
//sort()函数对a进行改动
a.sort()  
a    //此时a为[1,2,3]

a = [3,2,1]
//sorted()函数对a不改动,生成新的list
b = sorted(a)
a    //a仍然为[3,2,1]
b    //b为[1,2,3]

若对二维list进行排序,或者逆排序,语法如下:

a = [[3,2,1], [1,2,3], [2,1,3]]
//  reverse 代表逆序,即从大到小排序, x[0]代表将二维list的第一列进行排序 
a.sort(key=lambda x: x[0], reverse=True) 
a   //  a = [[3,2,1], [2,1,3], [1,2,3]]

5. 第三方数据分析工具包: scikit-learn

scikit-learn是Python的一个开源机器学习模块,它建立在NumPy,SciPy和matplotlib模块之上能够为用户提供各种机器学习算法接口,可以让用户简单、高效地进行数据挖掘和数据分析。
安装sklearn之前,需要安装numpy, scipy和matplotlib三个包,三个包安装好以后,直接使用pip安装sklearn就可以 pip install scikit-learn
使用sklearn:
使用k-means聚类:

//使用sklearn.cluster.KMeans 
from sklearn import metrics   //评分
from sklearn.cluster import KMeans as km   //k-means
cluster_data = ...  //聚类数据有n个,一共m个特征,则cluster_data数组应为n行,m列
result = km(n_clusters=5).fit_predict(k)  //使用kmeans进行聚类并预测所属类别
//  可以通过score函数对聚类结果进行评分,评分越高代表聚类效果越好
score = metrics.calinski_harabaz_score(cluster_data,result) 

KMeans类的主要参数有:
1、 n_clusters: 即我们的k值,一般需要多试一些值以获得较好的聚类效果。k值好坏的评估标准在下面会讲。
2、max_iter: 最大的迭代次数,一般如果是凸数据集的话可以不管这个值,如果数据集不是凸的,可能很难收敛,此时可以指定最大的迭代次数让算法可以及时退出循环。
3、n_init:用不同的初始化质心运行算法的次数。由于K-Means是结果受初始值影响的局部最优的迭代算法,因此需要多跑几次以选择一个较好的聚类效果,默认是10,一般不需要改。如果你的k值较大,则可以适当增大这个值。
4、init: 即初始值选择的方式,可以为完全随机选择'random',优化过的'k-means++'或者自己指定初始化的k个质心。一般建议使用默认的'k-means++'。
5、algorithm:有“auto”, “full” or “elkan”三种选择。"full"就是我们传统的K-Means算法, “elkan”是我们原理篇讲的elkan K-Means算法。默认的"auto"则会根据数据值是否是稀疏的,来决定如何选择"full"和“elkan”。一般数据是稠密的,那么就是 “elkan”,否则就是"full"。一般来说建议直接用默认的"auto"

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 159,117评论 4 362
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 67,328评论 1 293
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 108,839评论 0 243
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 44,007评论 0 206
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 52,384评论 3 287
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 40,629评论 1 219
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 31,880评论 2 313
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 30,593评论 0 198
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 34,313评论 1 243
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 30,575评论 2 246
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 32,066评论 1 260
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 28,392评论 2 253
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 33,052评论 3 236
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 26,082评论 0 8
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 26,844评论 0 195
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 35,662评论 2 274
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 35,575评论 2 270

推荐阅读更多精彩内容

  • Python 面向对象Python从设计之初就已经是一门面向对象的语言,正因为如此,在Python中创建一个类和对...
    顺毛阅读 4,165评论 4 16
  • 高阶函数:将函数作为参数 sortted()它还可以接收一个key函数来实现自定义的排序,reversec参数可反...
    royal_47a2阅读 627评论 0 0
  • 原文链接 《Python数据分析》(Python for Data Analysis, 2nd Edition)第...
    李绍俊阅读 8,086评论 0 5
  • # Python 资源大全中文版 我想很多程序员应该记得 GitHub 上有一个 Awesome - XXX 系列...
    aimaile阅读 26,294评论 6 428
  • 跟曾经的自己告别, 告别苍白无力的岁月, 清晨余晖洒过的大街, 残留青春的味觉。 跟曾经的理想重逢, 重逢那昔日的...
    张小贝_阅读 143评论 0 1