本文共 14289 字,大约阅读时间需要 47 分钟。
引言——在Python中,通过数据结构来保存项目中重要的数据信息。Python语言内置了多种数据结构,例如列表,元组,字典和集合等。本堂课我们来讲一讲Python中举足轻重的一大数据结构——字典。
在Python程序设计中,字典是一种比较特别的数据类型。它以大括号“{ }”包围,并且以“键:值”对的方式声明存在的数据集合。字典与列表相比,最大的不同在于字典是无序的,其成员位置只是象征性的,在字典中我们需要通过键来访问成员,而不能通过其位置来访问成员。
小考点——字典是python中唯一内建的映射类型哦!
那么,同学们,究竟什么是字典呢?难道是我们提笔忘字的时候拿出的那厚厚的一本《新华字典》吗?我可以很肯定的告诉同学们不是哦!不过呢?我们接下来要讲的字典跟这个大家印象里的字典有那么一些共同点哦!希望同学们学完之后能给我讲出来哦!
好了好了!同学们收收心,开始正式上课啦——在第一小节课老师会带领大家认识什么是字典&字典里的增删改查操作哦!好好听讲哦各位!!!
在我们的Python程序设计中,字典可以存储任意类型对象。字典的每个键值“key:value”对之间必须用冒号“:”分割,每个键值对之间用逗号“,”分隔,整个字典包括在大括号“{}”中。
干讲定义过于晦涩难懂,所以老师下面给大家举个粟子:
假如咱们班的Python期末考试成绩公布了,其中第一名小红同学成绩非常优秀,我们学习准备给予奖励。下面我们使用字典保存小红同学的3科成绩,第一个键值对是“线代”:“99”,表示小红同学的线代成绩是“99”;第二个键值对是“数据分析”:“98”,第三个键值对是“概率论”:“99”,分别表示小红同学的数据分析成绩是98,概率论成绩是99。上代码:dict = { '线代': "99", "数据分析": "99", "概率论": "98"}
当然我们也可以对上述字典中的两个键值对进行分解,通过如下代码创建字典:
dict1 = { '线代': "99"}dict2 = { "数据分析": "99"}dict3 = { "概率论": "98"}
知识补给站:如何创建一个空字典?a = { }
第一个:使用dict()函数创建字典!
同学们是不是感觉上面那种创建字典的方式B格不够,那么老师接下来为大家介绍一种使用函数创建字典的方法:dict语法:class dict(**kwarg)class dict(mapping, **kwarg)class dict(iterable, **kwarg)# dict函数作用:通过其他映射(比如其他字典)或者(键,值)对的序列建立字典。
dict1 = dict(a='a', b='b', t='t') # 传入关键字print(dict1)dict2 = dict(zip(['one', 'two', 'three'], [1, 2, 3])) # 映射函数方式来构造字典print(dict2)dict3 = dict([('one', 1), ('two', 2), ('three', 3)]) # 可迭代对象方式来构造字典print(dict3)
重点: 使用dict()函数,dict值必须一一对应。 使用dict()函数,必须每个元组里的成比例。才能将元组转成 key:value
第二个:使用fromkeys()函数创建字典!
语法:dict.fromkeys(seq[, value])参数:seq -- 字典键值列表。value -- 可选参数, 设置键序列(seq)的值。返回值:该方法返回一个新字典。fromkeys() 函数用于创建一个新字典,以序列 seq 中元素做字典的键,value 为字典所有键对应的初始值。
上代码:
dict3 = dict.fromkeys(['name','age'])print(dict3)dict4 = dict.fromkeys(['name','age'],10)print(dict4)
需要注意的是:
fromkeys 方法只用来创建新字典,不负责保存。当通过一个字典来调用 fromkeys 方法时,如果需要后续使用一定记得给他复制给其他的变量。如果要想获取字典中某个键的值,可以通过访问键的方式来显示对应的值。上代码:
dict = { '线代': "99", "数据分析": "99", "概率论": "98"} # 创建字典print('小红同学的线代成绩是:',dict['线代']) # 输出线代成绩print('小红同学的线代成绩是:',dict['数据分析']) # 输出数据分析成绩print('小红同学的线代成绩是:',dict['概率论']) # 输出概率论成绩
(1) get 获取指定key 对应的value,如果key不存在返回none——语法:字典名.get(key)
上代码:a = { '干干': 11, 'age': 11}print(a.get('age'))
(2)keys 取出所有的key——用法:字典名.keys()
上代码:a = { '干干': 11, 'age': 11}print(a.keys())
(3)values 取出所有的值——用法:字典名.values()
上代码:a = { '干干': 11, 'age': 11}print(a.values())(4) items 取出所有的键值对——用法:字典名.items()
上代码:
a = { '干干': 11, 'age': 11}print(a.items())(5)setdefault(key) 有此键则查,无则增! 上代码:
di2 = { 'name':'干干','age':18,'sex':'男'}print(di2.setdefault('name'))di2.setdefault('name2')print(di2)
同学们是不是发现——此字典(python程序中的字典)确实非彼字典(《新华字典》),不过确实有那么些共同之处呢!比如:我们查字典的时候,就是查某个字,然后会查出来这个字对应的含义及例词一系列信息;而我们现在用的这个字典,如果我们想要查某个键的值,也是通过查键的方式来显示对应的值呢!大家好好深入思考思考哦!
答案显而易见——肯定在执行后会报错,但是我们就是要来看看这会报的什么类型的错!就是倔!!!
dict = { '线代': "99", "数据分析": "99", "概率论": "98"} # 创建字典print("dict['语文成绩']:",dict['语文成绩'])
知识补给站:在python程序中——键是唯一的,但是值可以重复!
同学们需要了解的是——在Python程序中,字典是一种动态结构,可以随时在其中添加“键值”对。
具体的在字典中添加数据的操作是:
首先指定字典名,然后用中括号将键括起来,最后写明这个键的值。我们使用此方法给我们的小红同学的数学和英语成绩也添加上去:
dict = { '线代': "99", "数据分析": "99", "概率论": "98"} # 创建字典dict['数学'] = 100 # 添加字典1dict['英语'] = 99 # 添加字典2print(dict) # 输出字典dict中的值print('小红同学的数学成绩是:',dict['数学']) # 显示数学成绩
注意注意注意:“键值”对的排列顺序与添加顺序不同。因为python不关心键值对的添加顺序,而只关心键和值之间的关联关系!!!
**首先指定字典名,然后使用中括号把要修改的键和新值对应起来。**眼睛亮的同学是不是发现这和字典中添加数据好像一样呢!其实可以很肯定的告诉大家,确实是完全一模一样的,所以可以总结出一句顺口溜:有这个键则修改,无则添加!
老师突然发现——我在给小红同学批改线代试卷的时候有个地方批改错了,她应该是100分的,所以我们现在要来修改字典中小红的线代成绩为100分。上代码:
dict = { '线代': "99", "数据分析": "99", "概率论": "98"} # 创建字典dict['线代'] = 100print('小红同学真正的线代成绩是:',dict['线代'])print(dict)
** update 更新字典、将原字典和新字典整合,key重复的话则新的覆盖老的!**
上代码:dict = { 'name':'干干','age':18,'sex':'男'}dict.update({ 'height': 195, 'age': 20})print(dict)
在Python程序中,对于字典中不再需要的信息,可以使用del语句将相应的“键值”对信息彻底删除。
具体操作: 在使用del语句删除字典中数据时,必须指定字典名和要删除的键。现在我们不需要统计小红同学的线代成绩了,看看我如何将这个键值对删除。上代码:
dict = { '线代': "99", "数据分析": "99", "概率论": "98"} # 创建字典del dict['线代'] # 删除键 '线代' print(dict) # 显示字典dict中的元素
(1)clear 清空字典——用法:字典名.clear()
上代码:dict = { 'name':'干干','age':18,'sex':'男'}dict.clear()print(dict)(2) pop 弹出指定key的键值对——用法:字典名.pop(key)
上代码:
dict = { 'name':'干干','age':18,'sex':'男'}a = dict.pop('name')print('弹出的键对应的值为:', a)print(dict)
(3) popitem 返回并删除字典中的最后一对键和值——用法:字典名.popitem()
上代码:dict = { 'name':'干干','age':18,'sex':'男'}a = dict.popitem() # #相当于栈出,不过每次出的是一个键值对print('删除字典中最后一对键值对:',a)print(dict)
在Python程序中,可以创建将某个键映射到多个值的字典,即一键多值字典[multidict]。
具体操作: 为了能方便地创建映射多个值的字典,可以使用内置模块collections中的defaultdict()函数来实现。(这个函数一个主要特点是当所访问的键不存在的时候,可以实例化一个值作为默认值,也就是说我们在使用这个函数创建字典时就只需要关注添加元素即可。)比如如下字典d和e就是两种典型的一键多值字典,那么,如何使用defaultdict()函数来实现呢?d = { 'a': [1, 2, 3],}e = { 'a': { 1, 2, 3},}
上代码:
from collections import defaultdictd = defaultdict(list)d['a'].append(1)d['a'].append(2)d['a'].append(3)print(d)print(d['a']) # 字典中的查操作依旧同我们第一小节课讲的那样。d = defaultdict(set)d['a'].add(1)d['a'].add(2)d['a'].add(3)print(d)
但是,我们使用函数defaultdict()会自动创建字典表项以待后面使用。如果不想要这个功能的话,老师现在再教你们一种新的方法:
我们可以在普通的字典上调用函数setdefault()来取代此处用的defaultdict()函数。上代码:
d = { }d.setdefault('a', []).append(1)d.setdefault('a', []).append(2)d.setdefault('b', []).append(3)print(d)
知识补给站:
dict =defaultdict( factory_function) # defaultdict接受一个工厂函数作为参数这个factory_function可以是list,str,set,int,作用是当字典里的key不存在但被查找时,返回的不是keyError而是一个默认值(工厂函数的默认值),而这个默认值分别为:list对应[ ],str对应的是空字符串,set对应set( ),int对应0,from collections import defaultdictdict1 = defaultdict(int)dict2 = defaultdict(set)dict3 = defaultdict(str)dict4 = defaultdict(list)dict1[2] = 'nice' #无则增!# 这样会正常显示dict1字典里key为2对应的value。print(dict1[2])# 我们访问的是通过defaultdict()函数创建的四个字典的key为1对应的值,# 但是这个key在这四个字典中都并不存在哦,所以返回相应的默认值!print(dict1[1]) print(dict2[1])print(dict3[1])print(dict4[1])# 输出:nice0set()[]
知识补给站升级:该函数除了接受类型名称作为初始化函数的参数之外,还可以使用任何不带参数的可调用函数,到时该函数的返回值则作为默认值,这样使得默认值的取值更加灵活。下面用一个例子来说明,如何用自定义的不带参数的函数zero()作为初始化函数的参数:from collections import defaultdictdef zero(): return 0dict = defaultdict(zero)print(dict)print(dict['first'])print(dict)
在Python程序中,我们可以对字典中的数据执行各种数学运算,比如:求最大值,最小值和排序等。为了能对字典中的内容实现有用的计算操作,通过会利用内置函数zip()将字典的键和值反转过来。而对字典中的数据进行排序操作——可以利用函数zip()和sorted()实现。
知识补给站:函数zip()可以将可迭代对象作为参数,将对象中对应的元素打包成一个元组,然后返回由这些元组组成的列表。如果各个迭代器的元素个数不一致,则返回的列表长度与最短对象的相同。利用星号“*”操作符,可以将元组解压为列表
函数zip()语法格式:zip([iterable,...]参数:iterable表示一个或多个迭代器。
项目实战演示如何分别获取字典中最大值和最小值——上代码:
price = { '小米': 899, '华为': 1999, '三星': 3999, '谷歌': 4999, '酷派': 599, 'iPhone': 5000,}min_price = min(zip(price.values(), price.keys())) # 获取字典中手机价格最小的手机print(min_price)max_price = max(zip(price.values(), price.keys())) # 获取字典中手机价格最大的手机print(max_price)price_sorted = sorted(zip(price.values(), price.keys())) # 将字典中手机按价格从低到高排序print(price_sorted)
需要注意的是:我们使用zip()函数创建的是一个迭代器,所以其产生的数据只能被消耗一次,如果二次使用就会报错!如下:price = { '小米': 899, '华为': 1999, '三星': 3999, '谷歌': 4999, '酷派': 599, 'iPhone': 5000,}price_and_names = zip(price.values(), price.keys())print((min(price_and_names)))print (max(price_and_names)) # 报错error zip()创建了迭代器,内容只能被消费一次如果有时候我们的需求是单独获取字典中最大值/最小值的键和值,那么我们又该怎么做呢?
price = { '小米': 899, '华为': 1999, '三星': 3999, '谷歌': 4999, '酷派': 599, 'iPhone': 5000,}# 这种直接使用min()和max()函数明显不对哦!这就是按key排序了!print(min(price))print(max(price))print(min(price.values()))print(max(price.values()))print(min(price, key=lambda k: price[k]))print(max(price, key=lambda k: price[k]))
字典推导式和类似,只是将列表中的中括号修改为字典中的大括号而已。
项目实战一:使用字典推导式实现合并大小写key!
上代码:mcase = { 'a': 10, 'b': 34, 'A': 7, 'Z': 3}mcase_frequency = { k.lower(): mcase.get(k.lower(), 0) + mcase.get(k.upper(), 0) for k in mcase.keys() if k.lower() in ['a','b']}print (mcase_frequency)项目实战二:使用字典推导式快速更换字典中key和value的值! 上代码:
dict = { 'a': 10, 'b': 34}dict_end = { v: k for k, v in dict.items()}print(dict_end)项目实战三:使用字典推导式从字典中提取子集! 上代码:
prices = { 'ASP.NET': 49.9, 'Python': 69.9, 'Java': 59.9, 'C语言': 45.9, 'PHP': 79.9}p1 = { key: value for key, value in prices.items() if value > 50} # 提取字典prices的子集(value大于50)print(p1)tech_names = { 'Python', 'Java', 'C语言'}p2 = { key: value for key, value in prices.items() if key in tech_names} # 提取字典prices的子集(key存在在集合tech_names里的)print(p2)
需要注意的是: 虽然在python程序中,大部分可以用字典推导式解决的问题也可以通过创建元组序列,然后将它们传给dict()函数来完成,但是使用字典推导式的方案更加清晰,而且实际运行速度也快很多(速度快也是项目选用此方案的原因!),以下面代码为例测试——同学们可以想办法如何显示二者运行速度!
prices = { 'ASP.NET': 49.9, 'Python': 69.9, 'Java': 59.9, 'C语言': 45.9, 'PHP': 79.9}tech_names = { 'Python', 'Java', 'C语言'}p3 = dict((key, value) for key, value in prices.items() if value > 50) # 慢print(p3)p4 = { key: prices[key] for key, value in prices.items() if value > 50} # 慢print(p4)
如何寻找并获取两个字典中相同的键值对——通过keys()或items()函数执行基本的集合操作即可实现!
知识补给站:函数keys() 在python字典中,函数keys()返回keys-view对象,其中显示所有的键。字典中的键可以支持常见的集合操作,例如求并集,交集和差集。所以,如果需要对字典中的键进行常见的集合操作,可以直接使用keys-view对象来实现,而无须先将它们转换为集合。函数items() 在Python字典中,函数items()返回由键值对组成的items-view对象。这个对象支持类似的集合操作,可以用于找出两个字典中有哪些键值对有相同之处。
项目实战——获取两个字典中相同键值对——上代码:
a = { 'x': 1, 'y': 2, 'z': 3}b = { 'x': 11, 'y': 2, 'w': 10}print(a.keys() & b.keys()) print(a.keys() - b.keys()) print(a.items() & b.items()) c = { key: a[key] for key in a.keys() - { 'z', 'w'}} # 使用字典推导式实现,能够修改或过滤掉字典中的内容。print(c)
项目需求:如果存在一个字典列表,如何根据一个或多个字典中的值来对列表进行排序?
操作:
使用operator模块中的内置函数itemgetter()。功能:获取对象中指定域的值;参数:一些序号(即需要获取的数据在对象中的序号)上代码理解:
from operator import itemgettera = [1,2,3]b=itemgetter(1) # 获取对象的第1个域的值print(b(a))b=itemgetter(1,0) # 获取对象的第1个域和第0个的值print(b(a))
需要注意的是函数itemgetter()获取的不是值,而是定义一个函数,通过把该函数作用到对象上才能获取值哦!
项目实战——使用函数itemgetter()排序字典中的值! 上代码:from operator import itemgetterrows = [ { 'fname': 'AAA', 'lname': 'ZHANG', 'uid': 1001}, { 'fname': 'BBB', 'lname': 'ZHOU', 'uid': 1002}, { 'fname': 'CCC', 'lname': 'WU', 'uid': 1004}, { 'fname': 'DDD', 'lname': 'LI', 'uid': 1003}]#分别根据所有字典共有的字段fname和uid进行排序rows_by_fname = sorted(rows, key=itemgetter('fname')) rows_by_uid = sorted(rows, key=itemgetter('uid'))print(rows_by_fname)print(rows_by_uid)# itemgetter()函数接收多个键!rows_by_lfname = sorted(rows, key=itemgetter('lname', 'fname'))print(rows_by_lfname)# 使用lambda表达式代替itemgetter()函数的功能!# 注意:少用lambda表达式,使用itemgetter()函数会运行更快!考虑程序性能问题的话要用itemgetter()函数!rows_by_fname = sorted(rows, key=lambda r: r['fname'])rows_by_lfname = sorted(rows, key=lambda r: (r['fname'], r['lname']))print(rows_by_fname)print(rows_by_lfname)# 拓展:itemgetter()函数同样可以用于操作min()和max()函数哦!print(min(rows, key=itemgetter('uid')))print(max(rows, key=itemgetter('uid')))
输出为:[{ 'fname': 'AAA', 'lname': 'ZHANG', 'uid': 1001}, { 'fname': 'BBB', 'lname': 'ZHOU', 'uid': 1002}, { 'fname': 'CCC', 'lname': 'WU', 'uid': 1004}, { 'fname': 'DDD', 'lname': 'LI', 'uid': 1003}][{ 'fname': 'AAA', 'lname': 'ZHANG', 'uid': 1001}, { 'fname': 'BBB', 'lname': 'ZHOU', 'uid': 1002}, { 'fname': 'DDD', 'lname': 'LI', 'uid': 1003}, { 'fname': 'CCC', 'lname': 'WU', 'uid': 1004}][{ 'fname': 'DDD', 'lname': 'LI', 'uid': 1003}, { 'fname': 'CCC', 'lname': 'WU', 'uid': 1004}, { 'fname': 'AAA', 'lname': 'ZHANG', 'uid': 1001}, { 'fname': 'BBB', 'lname': 'ZHOU', 'uid': 1002}][{ 'fname': 'AAA', 'lname': 'ZHANG', 'uid': 1001}, { 'fname': 'BBB', 'lname': 'ZHOU', 'uid': 1002}, { 'fname': 'CCC', 'lname': 'WU', 'uid': 1004}, { 'fname': 'DDD', 'lname': 'LI', 'uid': 1003}][{ 'fname': 'AAA', 'lname': 'ZHANG', 'uid': 1001}, { 'fname': 'BBB', 'lname': 'ZHOU', 'uid': 1002}, { 'fname': 'CCC', 'lname': 'WU', 'uid': 1004}, { 'fname': 'DDD', 'lname': 'LI', 'uid': 1003}]{ 'fname': 'AAA', 'lname': 'ZHANG', 'uid': 1001}{ 'fname': 'CCC', 'lname': 'WU', 'uid': 1004}
先来个开胃小菜——同学们!调动起你们的小脑袋!!!
知识补给站:函数sum():求和运算。语法格式:sum(iterable,[,start])参数:iterable:可迭代对象,如列表。start:指定相加的参数,如果没有设置默认为0.简单使用:>>>sum([0,1,2])3>>>sum([0,1,2,3,4],2) # 列表计算合后再加212
一个项目实战告诉你如何对字典或列表中的数据同时进行转换和换算【常用的换算函数有:sum(),min(),max()】操作!
上代码:(下面实战在函数参数中使用生成器表达式来实现将数据的换算和转换结合一起!)nums = [1,2,3,4,5]s = sum(x*x for x in nums)print(s)import osfiles = os.listdir('.idea')if any (name.endswith('.py') for name in files): print('这是一个Python文件!')s = ('RMB',50,128.88)print(','.join(str(x) for x in s))portfolio = [ { 'name': 'AAA', 'shares': 50}, { 'name': 'BBB', 'shares': 65}, { 'name': 'CCC', 'shares': 40}, { 'name': 'DDD', 'shares': 35}]min_shares = min(s['shares'] for s in portfolio)print(min_shares)
项目背景:
如果在python程序中有多个字典或映射,想要在逻辑上将它们合并为一个单独的映射结构,并且依此执行某些特定的操作,例如查找某个值或检查某个键是否存在,可以考虑将多个映射合并为单个映射。具体操作:
利用collections模块中的ChainMap来实现。 ChainMap可以接收多个映射,这样可以在逻辑上让它们表现为一个单独的映射结构。但是需要知道的是:这些映射在字面上并不会合并在一起。相反,ChainMap只是简单地维护一个记录底层映射关系的列表,然后重定义常见的字典操作来扫描这个列表。上代码:
a = { 'x': 1, 'z': 3 }b = { 'y': 2, 'z': 4 }from collections import ChainMapc = ChainMap(a,b)print(c['x']) # Outputs 1 (from a)print(c['y']) # Outputs 2 (from b)print(c['z']) # Outputs 3 (from a)print(len(c))print(list(c.keys()))print(list(c.values()))c['z'] = 10c['w'] = 40del c['x']print(a)
值得注意的是: 如果有重复的键,那么将会使用第一个映射中对应的值。所以代码里c[‘z’]总是应用字典a中的值,而不是字典b中的值。实现修改映射的操作总会作用在列出的第一个映射结构上哦!
同学们一看到这个标题是不是很惊讶——会不会以为是老师我写错了!刚上课的时候老师不是刚讲的字典是无序的吗?老师现在怎么又说创建有序列表了
其实呢?我们现在就要用到数据结构里的双向链表了,不过——同学们不要怕,虽然我们还没学到它,对它深感陌生,但是我们伟大的python已经为我们封装了一个函数OrderedDict(),我们只需要使用它就可以创建出有序字典了!是不是很神奇呢!!!下面让我们一起来研究研究!实战创建有序字典:(注意:此处的有序是指——先加入的元素放在最前面,后来的以此类推!)
import collectionsdic = collections.OrderedDict()dic['k1'] = 'v1'dic['k2'] = 'v2'dic['k3'] = 'v3'print(dic)
拓展骚操作:使用函数popitem()按照后进先出的原则,删除最后加入的元素并返回键值对!
import collectionsdic = collections.OrderedDict()dic['k1'] = 'v1'dic['k2'] = 'v2'dic['k3'] = 'v3'print(dic.popitem(),dic)print(dic.popitem(),dic)
知识补给站:在python的OrderedDict内部维护了一个双向链表(后面老师会着重讲这些数据结构哦!),它会根据元素加入的顺序来排列键的位置。第一个新加入的元素被放置在链表的末尾,接下来会对已存在的键重新赋值而不会改变键的顺序。但是!!!OrderedDict的大小是普通字典的两倍多!!!这是由于额外创建的链表所致。所以如果你想构建一个涉及大量OrderedDict实例的数据结构(如从CSV文件中读取10000行内容到OrderedDict列表中),那么需要认真对应用做需求分析,看看因为使用OrderedDict所能带来的好处是否能大过因额外的内存开销带来的损失。
转载地址:http://hzlzi.baihongyu.com/